Command Palette
Search for a command to run...
Wiki
機械学習用語集:主要なAIおよびML概念の定義と説明を探索
知識蒸留は、事前トレーニングされた大規模なモデル (「教師モデル」) の学習結果をより小規模な「生徒モデル」に転送するように設計された機械学習手法です。
YOLOv10 は、計算オーバーヘッドを大幅に削減しながら、最先端のパフォーマンスを実現します
Infrastructure as a Service (IaaS) は、必要なコンピューティング、ストレージ、ネットワーク リソースを従量課金制で提供するクラウド コンピューティング サービスです。
NAS は、ネットワークに接続され、コンピュータ システムにファイル アクセス サービスを提供するストレージ デバイスを指します。
データ レイクは、オブジェクト ストレージを活用したフラット アーキテクチャを利用してファイルのメタデータを維持するという点で、データ ウェアハウスやサイロとは異なります。
一般データ保護規則 (GDPR) は、世界で最も厳格なプライバシーとセキュリティに関する法律です。
ハイパー コンバージド インフラストラクチャ (HCI) は、サーバーとストレージを分散インフラストラクチャ プラットフォームに結合し、インテリジェントなソフトウェアを使用して柔軟なビルディング ブロックを作成し、個別のサーバー、ストレージ ネットワーク、ストレージ アレイで構成される従来のインフラストラクチャを置き換えます。
エクサスケールとは、少なくとも「1 秒あたり 10 18 IEEE 754 倍精度 (64 ビット) 演算 (乗算および/または加算) (エクサ FLOPS)」を計算できるコンピューティング システムを指し、スーパーコンピューターのパフォーマンスの尺度です。 エクサスケール コンピューティングはコンピューティングです […]
HyperNetworks は、従来のニューラル ネットワークと比較して、モデルのパラメーター化にいくつかの違いがあるニューラル ネットワーク構造です。 2016 年に Google Brain によって出版された論文「HyperNetworks」では、Hyper […]
予測コーディング (PC) は認知科学の理論的枠組みであり、人間の脳は視覚世界の時空間予測を通じて認知を処理すると考えられています。
拡散確率モデルは、拡散確率モデルと PC 理論との関係を示します。
DQ-LoRe フレームワークは、「デュアル クエリ (DQ) と低ランク近似再ランキング (LoRe)」を利用して、コンテキスト学習のサンプルを自動的に選択します。
対照学習は、サンプルを互いに対照する原理を使用して、データ クラス間で共通し、あるデータ クラスを別のデータ クラスから区別するプロパティを学習することにより、視覚的タスクのパフォーマンスを向上させる手法です。
従来の LSTM の制限に対処し、指数関数的ゲート、行列メモリ、並列化可能なアーキテクチャなどの新しいコンポーネントを組み込むことにより、xLSTM は LLM の新しい可能性を開きます。
点群は、3 次元の形状またはオブジェクトを表すことができる空間内の点のデータ セットであり、通常は 3D スキャナによって取得されます。
参照画像セグメンテーション (略して RIS、参照セグメンテーションとも呼ばれます) は、自然言語表現によって参照されるターゲット オブジェクトをセグメント化することを目的としています。ただし、以前の方法は、文が画像内のオブジェクトを説明する必要があるという強い前提に依存していました […]
複数ドラフトモデルは、ダニエル・デネットによって提案された、認知主義に基づく意識の物理主義理論です。この理論は、心を情報処理の観点から考察します。デネットの 1991 年の著書『コンシオ』 […]
KAN: Kolmogorov-Arnold Networks この論文は、Kolmogorov-Arnold Networks (KAN) と呼ばれる多層パーセプトロン (MLP) の有望な代替案を提案しています。 KANの名前の由来は […]
コルモゴロフ-アーノルド表現定理により、複雑な力学システムの解析が容易になります
アクション モデルの学習には、人工知能の分野における複雑なプロセスが含まれており、基本的に環境におけるエージェントのアクションの影響を予測するためにモデルが開発されます。
真陽性率 (TPR) は、統計、機械学習、医療診断で二項分類モデルのパフォーマンスを評価するために使用される尺度です。これは、モデルによって正しく識別または陽性として分類された実際の陽性症例の割合を表します。 TPR は、感度、リコール、ヒットとも呼ばれます […]
グリッチトークンとは、大規模言語モデルにおいて、モデルの円滑な動作を助けるはずの単語が、異常な出力を引き起こすことです。華中科技大学、南洋理工大学などの大学の研究チームは、2024年に「[…]におけるグリッチトークン」と題した研究を発表しました。
マルチモーダル大規模言語モデルは、自然言語処理 (NLP) の能力と画像、オーディオ、ビデオなどの他のモダリティを組み合わせます。
専門家の混合を使用する他の LLM アップグレード方法と比較して、DUS は効率的にトレーニングおよび推論するために複雑な変更を必要としません。
知識蒸留は、事前トレーニングされた大規模なモデル (「教師モデル」) の学習結果をより小規模な「生徒モデル」に転送するように設計された機械学習手法です。
YOLOv10 は、計算オーバーヘッドを大幅に削減しながら、最先端のパフォーマンスを実現します
Infrastructure as a Service (IaaS) は、必要なコンピューティング、ストレージ、ネットワーク リソースを従量課金制で提供するクラウド コンピューティング サービスです。
NAS は、ネットワークに接続され、コンピュータ システムにファイル アクセス サービスを提供するストレージ デバイスを指します。
データ レイクは、オブジェクト ストレージを活用したフラット アーキテクチャを利用してファイルのメタデータを維持するという点で、データ ウェアハウスやサイロとは異なります。
一般データ保護規則 (GDPR) は、世界で最も厳格なプライバシーとセキュリティに関する法律です。
ハイパー コンバージド インフラストラクチャ (HCI) は、サーバーとストレージを分散インフラストラクチャ プラットフォームに結合し、インテリジェントなソフトウェアを使用して柔軟なビルディング ブロックを作成し、個別のサーバー、ストレージ ネットワーク、ストレージ アレイで構成される従来のインフラストラクチャを置き換えます。
エクサスケールとは、少なくとも「1 秒あたり 10 18 IEEE 754 倍精度 (64 ビット) 演算 (乗算および/または加算) (エクサ FLOPS)」を計算できるコンピューティング システムを指し、スーパーコンピューターのパフォーマンスの尺度です。 エクサスケール コンピューティングはコンピューティングです […]
HyperNetworks は、従来のニューラル ネットワークと比較して、モデルのパラメーター化にいくつかの違いがあるニューラル ネットワーク構造です。 2016 年に Google Brain によって出版された論文「HyperNetworks」では、Hyper […]
予測コーディング (PC) は認知科学の理論的枠組みであり、人間の脳は視覚世界の時空間予測を通じて認知を処理すると考えられています。
拡散確率モデルは、拡散確率モデルと PC 理論との関係を示します。
DQ-LoRe フレームワークは、「デュアル クエリ (DQ) と低ランク近似再ランキング (LoRe)」を利用して、コンテキスト学習のサンプルを自動的に選択します。
対照学習は、サンプルを互いに対照する原理を使用して、データ クラス間で共通し、あるデータ クラスを別のデータ クラスから区別するプロパティを学習することにより、視覚的タスクのパフォーマンスを向上させる手法です。
従来の LSTM の制限に対処し、指数関数的ゲート、行列メモリ、並列化可能なアーキテクチャなどの新しいコンポーネントを組み込むことにより、xLSTM は LLM の新しい可能性を開きます。
点群は、3 次元の形状またはオブジェクトを表すことができる空間内の点のデータ セットであり、通常は 3D スキャナによって取得されます。
参照画像セグメンテーション (略して RIS、参照セグメンテーションとも呼ばれます) は、自然言語表現によって参照されるターゲット オブジェクトをセグメント化することを目的としています。ただし、以前の方法は、文が画像内のオブジェクトを説明する必要があるという強い前提に依存していました […]
複数ドラフトモデルは、ダニエル・デネットによって提案された、認知主義に基づく意識の物理主義理論です。この理論は、心を情報処理の観点から考察します。デネットの 1991 年の著書『コンシオ』 […]
KAN: Kolmogorov-Arnold Networks この論文は、Kolmogorov-Arnold Networks (KAN) と呼ばれる多層パーセプトロン (MLP) の有望な代替案を提案しています。 KANの名前の由来は […]
コルモゴロフ-アーノルド表現定理により、複雑な力学システムの解析が容易になります
アクション モデルの学習には、人工知能の分野における複雑なプロセスが含まれており、基本的に環境におけるエージェントのアクションの影響を予測するためにモデルが開発されます。
真陽性率 (TPR) は、統計、機械学習、医療診断で二項分類モデルのパフォーマンスを評価するために使用される尺度です。これは、モデルによって正しく識別または陽性として分類された実際の陽性症例の割合を表します。 TPR は、感度、リコール、ヒットとも呼ばれます […]
グリッチトークンとは、大規模言語モデルにおいて、モデルの円滑な動作を助けるはずの単語が、異常な出力を引き起こすことです。華中科技大学、南洋理工大学などの大学の研究チームは、2024年に「[…]におけるグリッチトークン」と題した研究を発表しました。
マルチモーダル大規模言語モデルは、自然言語処理 (NLP) の能力と画像、オーディオ、ビデオなどの他のモダリティを組み合わせます。
専門家の混合を使用する他の LLM アップグレード方法と比較して、DUS は効率的にトレーニングおよび推論するために複雑な変更を必要としません。