
突然変異に伴うタンパク質結合親和性の変化を正確に評価することは、新規治療薬の発見および設計、および突然変異解析研究を支援する上で極めて重要である。突然変異による結合親和性変化の評価には、高度で高コストかつ時間のかかる実験的手法(ウェットラボ実験)が必要となるが、これに計算手法を活用することで支援が可能である。しかし、現存する大多数の計算予測手法はタンパク質の三次構造を必要とし、構造が既知のタンパク質複合体に限られるという制約がある。本研究では、突然変異に伴う結合親和性変化を、タンパク質構造ではなく配列情報に基づいて予測する手法を検討した。我々は、機械学習技術を用いてタンパク質配列情報を活用し、突然変異による結合親和性変化を高精度に予測する手法を提案した。本研究で開発した新たな配列ベースの結合親和性変化予測手法である「PANDA」は、同一の検証データセットにおいて既存手法を上回る精度を示しただけでなく、外部独立テストデータセットにおいても優れた性能を発揮した。外部テストデータセットにおいて、PANDAの最大ピアソン相関係数は0.52を達成したのに対し、現在の最先端の構造ベース手法であるMutaBindは最大0.59の相関係数を示した。本研究で提案する配列ベースの手法は、既存の構造依存型手法と比較して、広範な適用可能性と同等の性能を有しており、特に構造情報が入手困難なタンパク質複合体に対しても有効である。PANDAのクラウドベースWebサーバー実装およびPythonコードは、以下のURLから公開されている:https://sites.google.com/view/wajidarshad/software および https://github.com/wajidarshad/panda。