15日前

Text2Mol:自然言語クエリを用いたクロスモーダル分子検索

{Heng Ji, ChengXiang Zhai, Carl Edwards}
Text2Mol:自然言語クエリを用いたクロスモーダル分子検索
要約

本研究では、自然言語による記述をクエリとして用いて分子を検索する新しいタスク「Text2Mol」を提案する。自然言語と分子はそれぞれまったく異なる方法で情報を表現しており、この二つの非常に異なるモダリティを統合するという、興味深いが困難な課題が生じる。これまでに、テキストベースの検索や構造ベースの検索に関する研究は行われてきたが、本タスクは分子と自然言語をより直接的に統合する必要がある。さらに、分子を独特な文法を持つ言語と捉えると、これは特に挑戦的なクロスリンガル検索問題と見なすことができる。本研究では、分子とその対応するテキスト記述のペアから構成されるデータセットを構築し、検索のために両者を統合した共通の意味表現空間を学習する。さらに、注意機構(attention)を関連規則(association rules)として解釈することで、説明可能性と再ランク付けを実現するクロスモーダル注意ベースのモデルを構築した。また、異なるアーキテクチャをアンサンブルする手法を採用し、MRR(Mean Reciprocal Rank)を0.372から0.499まで大幅に向上させた。本研究で提案する新しいマルチモーダルアプローチは、化学文献理解および分子機械学習における問題解決に新たな視点を提供する。

Text2Mol:自然言語クエリを用いたクロスモーダル分子検索 | 最新論文 | HyperAI超神経