日付

3ヶ月前

組織

Paper URL

タグ

モデルスープは、2022年7月にワシントン大学、Google、その他の大学や研究機関の研究チームによって共同で提案されました。関連する研究成果は論文「…」に掲載されています。モデルスープ：複数のファインチューニング済みモデルの重みを平均化することで、推論時間を増加させることなく精度を向上させるICML 2022に選出されました。

モデルスープとは、複数の独立してファインチューニングされたモデルの重みを平均化することで、モデルの精度と堅牢性を向上させる手法です。この手法では、ハイパーパラメータスイープ後にファインチューニングされたモデルに対してのみ重み付き平均化を実行するため、追加のトレーニングは不要で、推論時の計算コストも増加しません。CLIP、ALIGN、JFTで事前学習されたViT-Gなどの大規模な事前学習済みモデルをファインチューニングする場合、モデルスープ手法はImageNet上でハイパーパラメータスイープによって得られた最良の単一モデルを大幅に改善します。結果として得られたViT-GモデルはImageNet上で90.941 TP3Tの精度を達成し、新たな技術レベルに到達しました。さらに、この手法は様々な画像分類や自然言語処理タスクに拡張でき、分布外汎化性能の向上だけでなく、新たな下流タスクにおけるゼロショット学習能力の向上にもつながります。

ワールドアクションモデルWAM

WAMは、身体化された知能とロボット工学の分野における、新しいAI基盤モデルアーキテクチャです。

2ヶ月前

誘導思考強化

GTRは、複雑な視覚環境におけるモデルの推論を導き、「思考停止」を防ぐことができる。

3ヶ月前

ピークリターン貪欲スライス

PRGSは、オフライン強化学習モデルが高報酬の経験を繋ぎ合わせる能力を大幅に向上させる。

3ヶ月前

展開しながら学ぶ

LWDは、汎用ロボットが継続的に経験を収集し、ポリシーの自己進化を実現することを可能にする、フリートレベルのオフラインからオンラインへの強化学習フレームワークです。

2ヶ月前

空間理論

空間理論とは、知的エージェントが不完全な情報環境において、能動的な探索を通じて空間的な信念を構築、更新、活用する能力に関する枠組みを指す。

3ヶ月前

デンス・レトリバー

高密度検索エンジンは、膨大な文書ライブラリからクエリの意味に最も関連性の高い段落を迅速に見つける役割を担っており、検索強化生成システムの中核となる基盤コンポーネントです。

3ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

日付

3ヶ月前

組織

Paper URL

2203.05482

タグ

機械学習

ワールドアクションモデルWAM

WAMは、身体化された知能とロボット工学の分野における、新しいAI基盤モデルアーキテクチャです。

2ヶ月前

誘導思考強化

GTRは、複雑な視覚環境におけるモデルの推論を導き、「思考停止」を防ぐことができる。

3ヶ月前

ピークリターン貪欲スライス

PRGSは、オフライン強化学習モデルが高報酬の経験を繋ぎ合わせる能力を大幅に向上させる。

3ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連 Wiki

ワールドアクションモデルWAM

誘導思考強化

ピークリターン貪欲スライス

展開しながら学ぶ

空間理論

デンス・レトリバー

AIでAIを構築

HyperAI Newsletters

関連 Wiki

ワールドアクションモデルWAM

誘導思考強化

ピークリターン貪欲スライス

展開しながら学ぶ

空間理論

デンス・レトリバー

AIでAIを構築

HyperAI Newsletters

関連 Wiki

ワールドアクションモデルWAM

誘導思考強化

ピークリターン貪欲スライス

展開しながら学ぶ

空間理論

デンス・レトリバー

関連 Wiki

ワールドアクションモデルWAM

誘導思考強化

ピークリターン貪欲スライス

展開しながら学ぶ

空間理論

デンス・レトリバー

Command Palette

モデルスープ

AIでAIを構築

HyperAI Newsletters

Command Palette

モデルスープ

関連 Wiki

ワールドアクションモデルWAM

誘導思考強化

ピークリターン貪欲スライス

展開しながら学ぶ

空間理論

デンス・レトリバー

AIでAIを構築

HyperAI Newsletters

Command Palette

モデルスープ

関連 Wiki

ワールドアクションモデルWAM

誘導思考強化

ピークリターン貪欲スライス

展開しながら学ぶ

空間理論

デンス・レトリバー

AIでAIを構築

HyperAI Newsletters

関連 Wiki

ワールドアクションモデルWAM

誘導思考強化

ピークリターン貪欲スライス

展開しながら学ぶ

空間理論

デンス・レトリバー

関連 Wiki

ワールドアクションモデルWAM

誘導思考強化

ピークリターン貪欲スライス

展開しながら学ぶ

空間理論

デンス・レトリバー