マルチモーダル言語変換 | SOTA | HyperAI超神経

マルチモーダル言語翻訳は、自然言語処理のサブタスクの一つで、ソース言語の単語を対応するターゲット言語の単語に翻訳する際に、ソース文と1つ以上の画像を利用します。このタスクは、視覚的情報とテキスト情報を統合することで、翻訳の精度と文脈適合性を向上させます。これにより、クロスリンガル画像注釈やマルチモーダル機械翻訳などのアプリケーションにおいて価値が高まります。

MultiSubs English-French

MultiSubs English-German

MultiSubs English-Portuguese

MultiSubs English-Spanish