HyperAIHyperAI

Command Palette

Search for a command to run...

言語ガイダンスを視覚ベースのディープメトリック学習に統合する

Karsten Roth Oriol Vinyals Zeynep Akata

概要

ディープメトリック学習(Deep Metric Learning: DML)は、埋め込み空間内の距離として意味的類似性を表現するメトリック空間を学習することを目的としている。このような空間は、訓練時に観測されたクラス以外のクラスに対しても転移可能であるべきである。一般的に、DML手法はネットワークに二値クラス割り当てに基づく対照的ランク付けタスクを課す。しかし、こうしたアプローチは実際のクラス間における高次の意味的関係を無視しており、学習された埋め込み空間に不完全な意味的文脈が反映され、クラス間の意味的関係が正しく表現されないという問題を引き起こす。その結果、学習されたメトリック空間の一般化性能が損なわれる。この問題に対処するため、本研究では視覚的類似性学習に向けた言語ガイドライン目的(language guidance objective)を提案する。専門家によるクラス名および擬似クラス名の言語埋め込みを活用することで、意味的に意味のある言語的意味論に対応する視覚表現空間を文脈化し、再配置することにより、より高い意味的整合性を実現する。広範な実験およびアブレーションにより、本手法の有効性が強く示され、言語ガイドラインがDMLにおいてモデルに依存しない顕著な性能向上をもたらすことが明らかになった。また、すべてのベンチマークにおいて競争力ある、さらには最先端の結果を達成した。コードは以下のURLで公開されている:https://github.com/ExplainableML/LanguageGuidance_for_DML


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています