Command Palette
Search for a command to run...
百科事典
我々は数百の関連エントリーを収集し、「人工知能」を理解するための数百のAI関連エントリー
Search for a command to run...
我々は数百の関連エントリーを収集し、「人工知能」を理解するための数百のAI関連エントリー
マルチモーダル大規模言語モデルは、自然言語処理 (NLP) の能力と画像、オーディオ、ビデオなどの他のモダリティを組み合わせます。
専門家の混合を使用する他の LLM アップグレード方法と比較して、DUS は効率的にトレーニングおよび推論するために複雑な変更を必要としません。
深層学習の分野では、グロッキング現象とは、ニューラル ネットワークのトレーニング プロセスにおける現象を指します。つまり、トレーニング エラーが長期間減衰した後でも良好な一般化が達成される可能性があります。
深層学習におけるスケーリング則とは、対象となる機能特性 (通常はテスト損失や微調整タスクのパフォーマンス指標) とアーキテクチャまたは最適化プロセスの特性 (モデルのサイズ、幅、トレーニングなど) との関係を指します。計算)。
人工知能の分野における出現とは、単純な個人やルールの相互作用を通じて複雑な集団行動や構造が生じる現象を指します。人工知能では、この創発は、設計によって直接決定されない、モデルによって学習される高レベルの機能または動作を指す場合があります […]
説明可能な人工知能 (XAI、または説明可能な AI) は、人間のユーザーが機械学習アルゴリズムによって作成された結果と出力を理解し、信頼できるようにする一連のプロセスと方法です。
条件付き計算は、必要な場合にのみ計算を実行することで、総計算量を削減する手法です。
統計的分類は、新しい観測データを既知のカテゴリの中から特定のカテゴリに分類するために使用される教師あり学習手法です。
変分オートエンコーダ (VAE) は、Diederik P. Kingma と Max Welling によって提案された人工ニューラル ネットワーク構造であり、確率グラフ モードおよび変分ベイジアン法に属します。
マスク言語モデリング (MLM) は、自然言語処理 (NLP) タスク、特に BERT、GPT-2、RoBERTa などの Transformer モデルのトレーニングで広く使用されている深層学習手法です。
ナレッジ エンジニアリングは、ルールを開発し、それをデータに適用して、特定の主題の専門知識を持つ人の思考プロセスを模倣する人工知能 (AI) の一分野です。
インセプション スコア (IS) は、敵対的生成ネットワーク (GAN) によって生成された生成イメージまたは合成イメージの品質を評価するために使用される客観的なパフォーマンス指標です。
ファジーロジックは、同じ変数を通じて複数の可能な真理値を処理できるようにする変数処理手法です。ファジー ロジックは、オープンで不正確なデータ スペクトルとヒューリスティックを通じて問題を解決し、一連の正確な結論を得ようとします。
フレシェの初期距離 FID はパフォーマンス指標です。FID スコアが低いほど、ジェネレーターによって生成される画像の品質は高く、実際の画像に似ています。 FID は画像の特徴ベクトルに基づいています。
DALL-E は、OpenAI によって開発された新しい人工知能プログラムで、テキストの説明プロンプトに基づいて画像を生成します。言語処理と視覚処理を組み合わせることができ、この革新的なアプローチはクリエイティブ分野、コミュニケーション、教育などに新たな可能性をもたらします。 2021年1月に発売されたDALL-Eは […]
LoRA (Low Level Adaptation) は、これらの高度なモデルの力を利用して、リソースに負担をかけたり、コストを制限したりすることなくカスタム タスクとデータ セットを完了する画期的な効率的な微調整テクノロジです。
CBR は、過去の同様の事例を取得し、それを現在の状況に適応させて意思決定を行ったり、問題を解決したりすることで機能します。
敵対的機械学習は、欺瞞的な入力を提供することで機械学習モデルを騙すように設計された機械学習手法です。
コグニティブ検索は、人工知能 (AI) テクノロジーを使用してユーザーの検索クエリを絞り込み、複数の異なるデータ セットから関連情報を抽出する新世代のエンタープライズ検索を表します。
コード品質は、ソフトウェア コードの有効性、信頼性、保守性の全体的な評価を表します。コード品質の主な品質には、可読性、明瞭さ、信頼性、セキュリティ、モジュール性などが含まれます。 これらの特性により、コードの理解、変更、操作、デバッグが容易になります。
クラウド コンテナは、クラウド環境でアプリケーションをデプロイ、実行、管理するために使用されるテクノロジーです。これらは、アプリケーションとその依存関係を自己完結型のランタイム環境にカプセル化する軽量で移植可能な方法を提供します。
モデルの量子化により、ディープ ニューラル ネットワーク モデルのメモリ フットプリントと計算要件を削減できます。重み量子化は、ニューラル ネットワークの重みとアクティベーションを高精度浮動小数点数から 16 ビットまたは 8 ビット整数などの低精度形式に変換する一般的な量子化手法です。
三重項損失は深層学習の損失関数であり、アンカー ポイントと同じアイデンティティを持つポジティブ サンプルの間の距離を最小化し、アンカー ポイントと異なるアイデンティティを持つネガティブ サンプルの間の距離を最小化することを指します。
Large Language Model Source Operations (LLMOps) は、運用環境で大規模な言語モデルを運用管理するための実践、手法、ツールです。 LLMOps は、ツールと手法を使用して、微調整からメンテナンスに至る LLM のライフサイクルを管理および自動化することを専門としています。