Wiki
Machine Learning Glossary: Explore definitions and explanations of key AI and ML concepts
推論時間のスケーリングは、推論フェーズ中に計算リソースを増やすことで大規模言語モデル (LLM) のパフォーマンスを向上させる方法です。
スロー知覚は、知覚プロセスを分割することで幾何学的図形の詳細な知覚を実現し、視覚的推論タスクにおける大規模なマルチモーダル モデルのパフォーマンスを向上させることを目的としています。
Thinking Evolution は、革新的な方法で推論中のコンピューティング リソースの利用を拡大し、モデルが複雑な問題をより効率的に処理できるようにすることを目的としています。
大規模アクション モデルは、言語による対話から現実世界のアクション実行への移行を実現し、AI を人工汎用知能 (AGI) へと推進することを目的としています。
意味的頻度キューは、周波数領域での分析と選択的学習を通じて、従来の空間領域手法の限界に対処することを目的としています。
ASAL は、基本モデルを活用して人工生命の分野におけるシミュレーション空間を自動的に探索することを目指しています。
オフライン メタ強化学習は、オフライン データを利用してモデルをトレーニングし、大規模なオンライン インタラクションを必要とせずにモデルが新しいタスクや環境に迅速に適応できるようにすることを目的としています。
分布外一般化は、未知または見えないデータ分布に直面したときにモデルが良好なパフォーマンスと安定性を維持できるようにすることに重点を置いています。
普遍近似理論は、十分に複雑な構造を持つニューラル ネットワークが任意の連続関数を任意の精度で近似できることを示しています。
DPO の中心的なアイデアは、別の報酬モデルをトレーニングしたり、強化学習を使用したりせずに、人間の嗜好データに基づいて直接最適化することです。
トレーニング不要のガイダンスは、条件付き生成の分野における拡散モデルの困難な問題を解決するように設計されています。
一次臭気マップは、臭気の化学構造とその嗅覚特性の間の関係をモデル化するように設計されています。
分布外の検出は、モデルのトレーニング段階でカバーされなかったデータ サンプルを特定することに重点を置いています。
Star Attendant は推論時間を大幅に短縮し、95-100% の精度を維持しながらメモリ要件と推論時間を最大 11 倍削減します。
UniSeg3D は、同じモデル内で 6 つの異なる 3D 点群セグメンテーション タスクを実装できます。
Numeric Understanding and Processing は、数値ドメインにおける大規模言語モデル (LLM) のパフォーマンスを独立して評価するように設計されています。
Coconut は推論プロセスを従来の言語空間から解放し、モデルが連続潜在空間で直接推論できるようにします。
密度の法則は、大規模言語モデル (LLM) の機能密度が時間の経過とともに指数関数的に増加することを表します。
最近傍検索は、データベースまたはデータセット内の特定のクエリ ポイントに最も近いポイント (またはポイントのセット) を見つけるアルゴリズムの問題です。
近傍検索とは、シミュレーション ボックス内の各粒子 (通常は原子) の周囲に隣接する粒子を特定するプロセスを指します。
シングルポイント PageRank 計算では、ランダム ウォーク モデルを使用してノードの重要性を決定します。
強化微調整では、教師あり微調整と強化学習を組み合わせて、高品質の回答を生成するモデルの能力を最適化します。
NLRL は、強化学習の中核となる概念を自然言語の形で再定義します。
MILP-StuDio は、問題のブロック構造を保持することで高品質の MILP インスタンスを生成することを目的としています。
推論時間のスケーリングは、推論フェーズ中に計算リソースを増やすことで大規模言語モデル (LLM) のパフォーマンスを向上させる方法です。
スロー知覚は、知覚プロセスを分割することで幾何学的図形の詳細な知覚を実現し、視覚的推論タスクにおける大規模なマルチモーダル モデルのパフォーマンスを向上させることを目的としています。
Thinking Evolution は、革新的な方法で推論中のコンピューティング リソースの利用を拡大し、モデルが複雑な問題をより効率的に処理できるようにすることを目的としています。
大規模アクション モデルは、言語による対話から現実世界のアクション実行への移行を実現し、AI を人工汎用知能 (AGI) へと推進することを目的としています。
意味的頻度キューは、周波数領域での分析と選択的学習を通じて、従来の空間領域手法の限界に対処することを目的としています。
ASAL は、基本モデルを活用して人工生命の分野におけるシミュレーション空間を自動的に探索することを目指しています。
オフライン メタ強化学習は、オフライン データを利用してモデルをトレーニングし、大規模なオンライン インタラクションを必要とせずにモデルが新しいタスクや環境に迅速に適応できるようにすることを目的としています。
分布外一般化は、未知または見えないデータ分布に直面したときにモデルが良好なパフォーマンスと安定性を維持できるようにすることに重点を置いています。
普遍近似理論は、十分に複雑な構造を持つニューラル ネットワークが任意の連続関数を任意の精度で近似できることを示しています。
DPO の中心的なアイデアは、別の報酬モデルをトレーニングしたり、強化学習を使用したりせずに、人間の嗜好データに基づいて直接最適化することです。
トレーニング不要のガイダンスは、条件付き生成の分野における拡散モデルの困難な問題を解決するように設計されています。
一次臭気マップは、臭気の化学構造とその嗅覚特性の間の関係をモデル化するように設計されています。
分布外の検出は、モデルのトレーニング段階でカバーされなかったデータ サンプルを特定することに重点を置いています。
Star Attendant は推論時間を大幅に短縮し、95-100% の精度を維持しながらメモリ要件と推論時間を最大 11 倍削減します。
UniSeg3D は、同じモデル内で 6 つの異なる 3D 点群セグメンテーション タスクを実装できます。
Numeric Understanding and Processing は、数値ドメインにおける大規模言語モデル (LLM) のパフォーマンスを独立して評価するように設計されています。
Coconut は推論プロセスを従来の言語空間から解放し、モデルが連続潜在空間で直接推論できるようにします。
密度の法則は、大規模言語モデル (LLM) の機能密度が時間の経過とともに指数関数的に増加することを表します。
最近傍検索は、データベースまたはデータセット内の特定のクエリ ポイントに最も近いポイント (またはポイントのセット) を見つけるアルゴリズムの問題です。
近傍検索とは、シミュレーション ボックス内の各粒子 (通常は原子) の周囲に隣接する粒子を特定するプロセスを指します。
シングルポイント PageRank 計算では、ランダム ウォーク モデルを使用してノードの重要性を決定します。
強化微調整では、教師あり微調整と強化学習を組み合わせて、高品質の回答を生成するモデルの能力を最適化します。
NLRL は、強化学習の中核となる概念を自然言語の形で再定義します。
MILP-StuDio は、問題のブロック構造を保持することで高品質の MILP インスタンスを生成することを目的としています。