2ヶ月前
単細胞におけるタンパク質のサブセルラーローカライゼーションの予測
Xinyi Zhang, Yitong Tseo, Yunhao Bai, Fei Chen, Caroline Uhler

要約
タンパク質のサーセルラ局在はその機能にとって重要であり、その誤った局在は多くの疾患と関連しています。既存のデータセットでは、限られた数のタンパク質と細胞株の組み合わせしか捉えていません。また、既存のタンパク質局在予測モデルは、細胞型特異性を欠いているか、未見のタンパク質に一般化できないという問題があります。本稿では、未見のタンパク質のサーセルラ局在を予測する方法(Prediction of Unseen Proteins' Subcellular localization: PUPS)を提案します。PUPSは、プロテイン言語モデルと画像補完モデルを組み合わせることで、タンパク質配列と細胞内画像の両方を利用します。我々は、タンパク質配列入力が未見のタンパク質への一般化を可能にし、細胞内画像入力が単一細胞変動を捉え、細胞型特異的な予測を可能にするという点を示しました。実験的検証により、PUPSが訓練に使用されたヒューマンプロテインアトラス以外で新たに行われた実験においてもタンパク質局在を予測できることを確認しました。総じて、PUPSは細胞株間および同一細胞株内の単一細胞における差異的なタンパク質局在を予測するフレームワークを提供しており、突然変異によって引き起こされるタンパク質局在の変化も含めています。