6ヶ月前

マルチモーダル表現

マルチモーダル

アプローチ／フレームワーク

マルチモーダル

Anas Awadalla Irena Gao Josh Gardner Jack Hessel Yusuf Hanafy Wanrong Zhu Kalyani Marathe Yonatan Bitton Samir Gadre Shiori Sagawa

概要

本稿では、3B～9Bパラメータ規模の自己回帰型視覚言語モデルであるOpenFlamingoを紹介する。OpenFlamingoは、DeepMindが開発したFlamingoモデルのオープンソース版を実現するための継続的な取り組みである。7つの視覚言語データセットにおいて、OpenFlamingoモデルは対応するFlamingoモデルの性能の80～89％を平均的に達成している。本技術報告書では、モデルの構造、学習データ、ハイパーパラメータ、評価セットについて詳述する。モデルおよびコードは、https://github.com/mlfoundations/open_flamingo にて公開している。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています