Command Palette
Search for a command to run...
Wiki
機械学習用語集:主要なAIおよびML概念の定義と説明を探索
Search for a command to run...
機械学習用語集:主要なAIおよびML概念の定義と説明を探索
クラス内分散行列は、平均を中心とした各サンプル ポイントの分散を表します。
わかりやすさとは、何かの理解しやすさ、主に読者にとっての理解しやすさを指します。
極性検出は、自然言語におけるテキストの感情的な極性を分類するプロセスです。
活性化関数は、ニューロンが他のニューロンの活動に基づいて活性化値をどのように変更するかを定義する、ニューラル ネットワーク モデルでよく使用される動的原理です。 一般的な活性化関数はネットワーク内の重みに依存するため、非線形要素が導入される可能性があり、線形方程式では解決できない問題を解決するためによく使用されます。
解析木は具体構文木とも呼ばれ、構文解析結果の表現形式の一つであり、言語の文法構造をツリー状に表現したものです。
Structure は、ニューラル ネットワークの分野で通常使用される、ニューラル ネットワークのトポロジー図を表示する方法です。 ニューラル ネットワークでは、変数はニューロン接続の重みと活性化値になります。
分析勾配とは、バックプロパゲーションを使用して、ニューラル ネットワーク アルゴリズムの各パラメーターに関する目的関数の勾配を計算することを指します。
近似または近似とは、あるものが別のものに似ているが、まったく同じではないことを意味します。
近似ベイズ計算 (ABC) は、モデル パラメーターの事後分布を推定するために使用できるベイズ統計に基づく計算手法です。
近似推論手法とは、大量のデータをサンプリングして学習し、仮説検証ロジックを使用して実際のモデルを継続的に近似することを指します。
数学における距離行列は、一連の点間の距離を含む行列 (つまり、2 次元配列) です。
Plug and Play Generative Network (PPGN) は、2016 年に Nguyen らによって提案されたモデルです。
列名属性はデータの「名前関連」特性を指し、対応する値は何らかのシンボルまたは物の名前です。
累積誤差バックプロパゲーションは、ターゲットの負の勾配の方向にパラメータを調整する勾配降下ベースの戦略を採用するニューラル ネットワーク アルゴリズムであり、その目標はトレーニング エラーを最小限に抑えることです。 「逆伝播アルゴリズム」とも呼ばれ、「BP アルゴリズム」とも呼ばれます。
関連するサンプルをグループにグループ化することは、通常、教師なし学習に使用されます。すべてのサンプルがグループ化されると、関係者はオプションで各クラスターに意味を割り当てることができます。 クラスタリング アルゴリズムは多数あります。たとえば、K 平均法アルゴリズムは、以下の図に示すように、重心への近さに基づいてサンプルをクラスタリングします。その後、研究者は次のことができます。
絶対多数決方式とは、有効投票数の半分以上の承認を必要とする投票方式であり、複数の分類器で特定のカテゴリを予測した場合、全体の半分を超える部分のみを予測します。 式で表すと次のようになります。 $latex {H{ \left( {x} \right) }\text{ […]
多様体学習はパターン認識の基本的な方法であり、観察された現象に基づいて物事の本質とデータを生成する固有の法則を見つけます。 多様体学習は、線形多様体学習アルゴリズムと非線形多様体学習アルゴリズムの 2 種類に分けられます。非線形多様体学習アルゴリズムには、アイソメトリック マッピング Isomap とラプラシアン固有マップ L が含まれます。
平均二乗誤差は、推定量と真の量の間の差異の程度を反映する期待値であり、データの変化の程度を評価し、データの精度を予測するためによく使用されます。 パラメータ $latex { \theta }$ があり、その推定関数が $latex {T}$ であると仮定し、次に $latex {MSE […]
機械翻訳は、コンピューターを使用してさまざまな言語を、通常はソース言語からターゲット言語に変換することです。 翻訳プロセス 人間による翻訳から機械翻訳を見ると、翻訳プロセスは次のように分類できます。ソース テキストの意味を解釈し、解析されたテキストの意味をターゲット言語に再コンパイルします。 翻訳方法 一般的な機械翻訳の手順 […]
多様体仮定は半教師あり学習でよく使用される仮定であり、もう 1 つはクラスタリング仮定です。 多様体仮定は、通常は小さな局所領域内にある類似の特性を持つ例を指し、したがって、決定関数の局所的な滑らかさを反映するラベル付けが非常に類似しています。 全体的な特性に焦点を当てるクラスタリング仮説とは異なり、多様体仮説はモデルの […]
最尤推定は、モデルの観測値を最終的な選択肢として最大化する可能性のあるデータを見つけて、モデル パラメーターを決定するために主に使用される推定方法です。 最尤推定におけるサンプリングは、独立かつ同一の分布という仮定を満たしており、その目的は、既知のサンプル結果を使用して、関連する結果をもたらすパラメータ値を最大の確率で推測することです。
遅延学習は、テスト サンプルを受信しながらトレーニングするトレーニング セットの処理方法です。これに対し、熱心な学習は、トレーニング フェーズ中にサンプルから学習を開始します。 タスク データが頻繁に変更される場合は、遅延学習方法を使用できます。最初にトレーニングは実行されず、予測リクエストを受信した後、現在のデータに基づいて予測が行われます。
類推学習は、2 つの種類の物事や状況を比較して、オブジェクトレベルでの類似の関係を見つけ、それを基礎として物事と状況の間の関係を適切に整理/交換する認知的思考と推測の方法です。別のものに対応して、対応する解決策を取得します。 類推学習の分類方法には次のようなものがあります […]
ホールドアウト法は、データセット D を 2 つの相互に排他的なセットに分割するモデル評価方法です。一方のセットがトレーニング セット S で、もう一方のセットがテスト セット T であると仮定すると、D = S ∪ T , S ∩ となります。 T = ∅ トレーニング/テスト セットの分割では、[…]
クラス内分散行列は、平均を中心とした各サンプル ポイントの分散を表します。
わかりやすさとは、何かの理解しやすさ、主に読者にとっての理解しやすさを指します。
極性検出は、自然言語におけるテキストの感情的な極性を分類するプロセスです。
活性化関数は、ニューロンが他のニューロンの活動に基づいて活性化値をどのように変更するかを定義する、ニューラル ネットワーク モデルでよく使用される動的原理です。 一般的な活性化関数はネットワーク内の重みに依存するため、非線形要素が導入される可能性があり、線形方程式では解決できない問題を解決するためによく使用されます。
解析木は具体構文木とも呼ばれ、構文解析結果の表現形式の一つであり、言語の文法構造をツリー状に表現したものです。
Structure は、ニューラル ネットワークの分野で通常使用される、ニューラル ネットワークのトポロジー図を表示する方法です。 ニューラル ネットワークでは、変数はニューロン接続の重みと活性化値になります。
分析勾配とは、バックプロパゲーションを使用して、ニューラル ネットワーク アルゴリズムの各パラメーターに関する目的関数の勾配を計算することを指します。
近似または近似とは、あるものが別のものに似ているが、まったく同じではないことを意味します。
近似ベイズ計算 (ABC) は、モデル パラメーターの事後分布を推定するために使用できるベイズ統計に基づく計算手法です。
近似推論手法とは、大量のデータをサンプリングして学習し、仮説検証ロジックを使用して実際のモデルを継続的に近似することを指します。
数学における距離行列は、一連の点間の距離を含む行列 (つまり、2 次元配列) です。
Plug and Play Generative Network (PPGN) は、2016 年に Nguyen らによって提案されたモデルです。
列名属性はデータの「名前関連」特性を指し、対応する値は何らかのシンボルまたは物の名前です。
累積誤差バックプロパゲーションは、ターゲットの負の勾配の方向にパラメータを調整する勾配降下ベースの戦略を採用するニューラル ネットワーク アルゴリズムであり、その目標はトレーニング エラーを最小限に抑えることです。 「逆伝播アルゴリズム」とも呼ばれ、「BP アルゴリズム」とも呼ばれます。
関連するサンプルをグループにグループ化することは、通常、教師なし学習に使用されます。すべてのサンプルがグループ化されると、関係者はオプションで各クラスターに意味を割り当てることができます。 クラスタリング アルゴリズムは多数あります。たとえば、K 平均法アルゴリズムは、以下の図に示すように、重心への近さに基づいてサンプルをクラスタリングします。その後、研究者は次のことができます。
絶対多数決方式とは、有効投票数の半分以上の承認を必要とする投票方式であり、複数の分類器で特定のカテゴリを予測した場合、全体の半分を超える部分のみを予測します。 式で表すと次のようになります。 $latex {H{ \left( {x} \right) }\text{ […]
多様体学習はパターン認識の基本的な方法であり、観察された現象に基づいて物事の本質とデータを生成する固有の法則を見つけます。 多様体学習は、線形多様体学習アルゴリズムと非線形多様体学習アルゴリズムの 2 種類に分けられます。非線形多様体学習アルゴリズムには、アイソメトリック マッピング Isomap とラプラシアン固有マップ L が含まれます。
平均二乗誤差は、推定量と真の量の間の差異の程度を反映する期待値であり、データの変化の程度を評価し、データの精度を予測するためによく使用されます。 パラメータ $latex { \theta }$ があり、その推定関数が $latex {T}$ であると仮定し、次に $latex {MSE […]
機械翻訳は、コンピューターを使用してさまざまな言語を、通常はソース言語からターゲット言語に変換することです。 翻訳プロセス 人間による翻訳から機械翻訳を見ると、翻訳プロセスは次のように分類できます。ソース テキストの意味を解釈し、解析されたテキストの意味をターゲット言語に再コンパイルします。 翻訳方法 一般的な機械翻訳の手順 […]
多様体仮定は半教師あり学習でよく使用される仮定であり、もう 1 つはクラスタリング仮定です。 多様体仮定は、通常は小さな局所領域内にある類似の特性を持つ例を指し、したがって、決定関数の局所的な滑らかさを反映するラベル付けが非常に類似しています。 全体的な特性に焦点を当てるクラスタリング仮説とは異なり、多様体仮説はモデルの […]
最尤推定は、モデルの観測値を最終的な選択肢として最大化する可能性のあるデータを見つけて、モデル パラメーターを決定するために主に使用される推定方法です。 最尤推定におけるサンプリングは、独立かつ同一の分布という仮定を満たしており、その目的は、既知のサンプル結果を使用して、関連する結果をもたらすパラメータ値を最大の確率で推測することです。
遅延学習は、テスト サンプルを受信しながらトレーニングするトレーニング セットの処理方法です。これに対し、熱心な学習は、トレーニング フェーズ中にサンプルから学習を開始します。 タスク データが頻繁に変更される場合は、遅延学習方法を使用できます。最初にトレーニングは実行されず、予測リクエストを受信した後、現在のデータに基づいて予測が行われます。
類推学習は、2 つの種類の物事や状況を比較して、オブジェクトレベルでの類似の関係を見つけ、それを基礎として物事と状況の間の関係を適切に整理/交換する認知的思考と推測の方法です。別のものに対応して、対応する解決策を取得します。 類推学習の分類方法には次のようなものがあります […]
ホールドアウト法は、データセット D を 2 つの相互に排他的なセットに分割するモデル評価方法です。一方のセットがトレーニング セット S で、もう一方のセットがテスト セット T であると仮定すると、D = S ∪ T , S ∩ となります。 T = ∅ トレーニング/テスト セットの分割では、[…]