
要約
深層学習に基づく薬物反応予測(Drug Response Prediction: DRP)手法は、医薬品の発見プロセスを加速し、研究開発コストを削減することができます。主流の手法は、反応回帰値の予測において高い精度を達成していますが、これらの手法の回帰に配慮した表現は断片的であり、サンプル順序の連続性を捉えることができません。この現象により、モデルが部分最適解空間に最適化され、汎化能力が低下し、医薬品発見段階で大幅な無駄なコストが発生する可能性があります。本論文では、自然言語監督を使用した対照学習フレームワークである\MN(MN)を提案します。MNは回帰ラベルをテキストに変換し、これを伝統的なモダリティ(グラフ、シーケンス)と比較して薬物反応のキャプションテキストと共にサンプルの第二モダリティとして統合します。各バッチにおいて、あるサンプルの2つのモダリティが肯定的なペアとみなされ、他のペアは否定的なペアとみなされます。また、数値テキストの連続表現能力を強化するために、常識的な数値知識グラフが導入されています。我々は癌に対する薬剤感受性ゲノミクスデータセットから数十万件のサンプルを検証し、MNフレームワークを使用することでDRP手法の平均的な改善率が7.8%から31.4%であることを観察しました。実験結果は、MNが表現空間内でサンプルを連続分布に効果的に制約し、事前学習後に僅かなエポックでの微調整だけで印象的な予測性能を達成することを示しています。コードは以下のURLで公開されています:\url{https://gitee.com/xiaoyibang/clipdrug.git}。