11日前

SMILESデータを用いた双向LSTMを用いたドラッグ安全性評価の高速化

K. Venkateswara Rao, Kunjam Nageswara Rao, G. Sita Ratnam
SMILESデータを用いた双向LSTMを用いたドラッグ安全性評価の高速化
要約

計算手法は、創薬のプロセスを加速する上で有用である。創薬には、ターゲットの同定と検証、リード化合物の発見、リード最適化などの段階が含まれる。特にリード最適化の段階では、リード化合物の吸収(Absorption)、分布(Distribution)、代謝(Metabolism)、排泄(Excretion)、および毒性(Toxicity)に関する特性(ADMET特性)が評価される。本研究では、リード化合物の毒性および溶解度を予測する問題に対処するため、簡略分子入力ラインエントリーシステム(Simplified Molecular Input Line Entry System; SMILES)表記で表現された分子データを対象とした。SMILESデータを扱う手法の中でも、本研究ではシーケンスベースのアプローチを採用した。提案モデルである双向長短期記憶(Bi-Directional Long Short Term Memory; BiLSTM)は、再帰型ニューラルネットワーク(Recurrent Neural Network; RNN)の一種であり、分子のシーケンスデータを前向きおよび後向きの両方向から同時に処理することで、分子構造の特徴を包括的に解析できる。本研究の目的は、SMILES文字列に符号化された順序パターンを理解し、それを基に分子の毒性を予測することにある。提案モデルは、ClinToxデータセットにおいて、従来のTrimnetや事前学習済みグラフニューラルネットワーク(Pre-training Graph Neural Networks; GNN)を上回る性能を示し、ROC曲線下の面積(AUC)が0.96を達成した。また、FreeSolvデータセットにおいても、溶解度予測において従来モデルを上回り、低RMSE(1.22)を実現した。

SMILESデータを用いた双向LSTMを用いたドラッグ安全性評価の高速化 | 最新論文 | HyperAI超神経