作者:プラスゼロ
編集者: Li Baozhu、三陽
MIT は、グラフ ニューラル ネットワーク Chemprop を使用して、アシネトバクター バウマニを特異的に殺す可能性のある抗生物質を特定します。
自然界には、結核菌(結核の原因)やコレラ菌(コレラの原因)など、人々の健康を深刻に脅かすさまざまな微生物が存在します。人類の歴史上、これらの病原菌による感染には、体自身の免疫システムに頼る以外に解決策がほとんどありません。ペニシリンの発見により、初めて人類に病気の原因となる細菌に対する強力な武器が与えられたのは 1928 年のことでした。
しかし、抗生物質の広範な使用は、抗生物質耐性(AMR)という大きな危機ももたらしています。世界保健機関(WHO)の統計によると、2019年には世界中で約120万人が抗生物質耐性(AMR)によって死亡しました。エイズによる細菌感染症の数はすでにエイズによる死亡者数を上回っています。抗生物質の誤用は特定の「スーパーバグ」の出現につながり、21 世紀における病気の重要な臨床原因となっています。この問題を解決するには、新しい抗生物質の開発が急務です。
特定の細菌について、深層学習モデルは化合物の有効性と安全性の予測精度を向上させ、室内実験や臨床試験の時間とリソースの消費を効果的に削減でき、効果的で安全な抗生物質の発見に不可欠です。
この目的を達成するために、MIT の研究者らは、グラフ ニューラル ネットワーク Chemprop を使用して、大規模な化学ライブラリから潜在的な抗生物質を特定し、新しい種類の抗生物質を発見した、抗生物質を発見するためのディープ ラーニング手法を開発しました。これらは重要な薬剤耐性細菌であるアシネトバクター バウマンニ (Acinetobacter baumannii) を特異的に殺すことができ、関連する論文が Nature に掲載されています。
論文はNatureに掲載されました
用紙のアドレス:
https://www.nature.com/articles/s41586-023-06887-8
公開アカウントをフォローし、「Discover Antibiotics」に返信して論文全文をダウンロードしてください
一次審査:この研究では、最初に 39,312 の化合物をスクリーニングし、それらの抗生物質活性とヒト細胞毒性特性を分析しました。
拡大予測:予測範囲をさらに拡大するために、12,076,365 個の化合物 (Mcle データベースからの 11,277,225 個と Broad Institute データベースからの 799,140 個) についてモデルがテストされました。
39,312 個の化合物の分子量分布
グラフ ニューラル ネットワーク Chemprop を使用して、スクリーニングされた 39,312 個の化合物をトレーニングし、その抗生物質活性とヒト細胞毒性を予測しました。トレーニング プロセスは次のとおりです。
分子は以下を表します。RDKit を使用して、各化合物の SMILES (簡易分子入力行入力仕様、簡易分子入力行入力仕様) 文字列からグラフベースの分子表現を生成します。
特徴ベクトルの生成:原子の特性 (原子番号、結合の数、正電荷など) および結合の特性 (結合の種類、共役、環のメンバーシップなど) を含む、各原子と結合の固有ベクトルを生成します。
情報転送:キーベースの情報転送畳み込みニューラル ネットワークを実装し、キーのメッセージを更新し、ニューラル ネットワーク層を通過して、非線形活性化関数を適用します。
モデルの出力:固定情報伝達ステップの後、モデルは分子全体の情報を要約し、フィードフォワード ニューラル ネットワークを通じて、抗生物質活性、細胞毒性、プロトンの動的ポテンシャルを変化させる活性などの化合物の活性を予測します。
最適化対策:これには、分子レベルの機能の追加、ハイパーパラメーター最適化を使用した最適なパフォーマンス パラメーターの選択、アンサンブル学習によるモデルの堅牢性の強化が含まれます。
研究者らは、50μMの化合物濃度で培地中の黄色ブドウ球菌(黄色ブドウ球菌)に対する抗生物質活性を予測し、80%の正規化増殖阻害カットオフ値に基づいて活性か不活性かを区別した。合計 10 個のグラフ ニューラル ネットワーク モデルが、同じ 80% ~ 20% トレーニング データ セットでトレーニング、検証、テストされました。
結果は次のようになります。RDKit 機能を備えた Chemprop モデルは優れた予測力を示し、39,312 の化合物の中から 512 の活性化合物を特定しました。
抗生物質の活性を予測するための深層学習モデルの比較
研究者らは、39,312 の化合物を使用して、ヒト肝がん細胞 (HepG2)、ヒト初代骨格筋細胞 (HSkMC)、およびヒト肺線維芽細胞 (IMR-90) に対する毒性スクリーニングを実施しました。細胞生存率は、10μMの各化合物で2~3日間処理した後に評価し、90%細胞生存率のカットオフを使用して化合物の活性を分類した。
10 個の Chemprop モデル セットもトレーニング、検証、テストされました。比較結果は次のとおりです。
ヒトの細胞毒性を予測するための深層学習モデルの比較
結果は、3,341 (8.5%)、1,490 (3.8%)、および 3,447 (8.8%) の化合物が、それぞれ HepG2 細胞、HSkMC、および IMR-90 細胞に対して毒性であることを示しました。前のステップでスクリーニングされた 512 種類の活性抗菌化合物のうち、306 種類はこれら 3 種類の細胞に対して無毒でした。
要約すると、抗生物質活性モデルと比較すると一定の制限はありますが、このモデルは薬剤の有効性と人体への無害性のバランスが取れており、創薬において高度な計算手法を使用できる可能性を示しています。
研究のこの段階では、大規模な化学空間で潜在的な抗生物質化合物を特定し、その細胞毒性を評価するためのモデルの改良と適用に重点が置かれています。研究者らは、HepG2、HSkMC、IMR-90 細胞における抗生物質活性と細胞毒性を予測するために 20 の Chemprop モデルを再トレーニングしました。改良されたモデルは 12,076,365 個の化合物の予測に適用されました。
抗生物質活性スクリーニング: 抗生物質予測スコアが 0.4 を超える 3,004 化合物が Mcule データベースからスクリーニングされ、スコアが 0.2 を超える 7,306 化合物が Broad Institute データベースからスクリーニングされました。
ヒト細胞毒性スクリーニング:
細胞毒性予測スコアが 0.2 未満の化合物は保持され、結果として 3,646 個の化合物 (Mcle データベースから 1,210 個、Broad Institute データベースから 2,436 個) がスクリーニングされました。これは、評価されたすべての化合物の 0.03% に相当します。
化合物スクリーニング
a: コンピューターシミュレーションフィルタープログラムbe: HepG2、HSkMC、およびIMR-90細胞における抗生物質活性と細胞毒性の予測
分子表現としてモーガン フィンガープリントが使用され、化学空間の視覚化には t 分布確率的近隣埋め込み (t-SNE、t 分布確率的近隣埋め込み) 法が使用されます。
以下に示すように、t-SNE を視覚化すると、ヒット (スクリーニングを通過した化合物) と非ヒット (抗生物質予測スコアが低い化合物) の明らかな違いが明らかになります。
化合物のt-SNE分析
3,646 個の化合物の中から、黄色ブドウ球菌に対する高い活性とヒト細胞に対する良好な選択性を示した 2 つの化合物 (No. 1 および No. 2) をスクリーニングし、さまざまな試験条件下でのこれら 2 つの化合物の性能、特に血清中での増殖阻害能力を調べました。を含む培地は優れており、さらなる研究の価値があります。
これらの化合物の研究は、深層学習モデルによって予測された構造クラスが、新しい抗生物質候補を発見するための実験的スクリーニングを効果的に導くことができることを実証しています。
化合物のスクリーニング: 反応性、変異原性、または好ましくない薬物動態の可能性に関する PAINS および Brenk アラートを持つ化合物が、最初の 3,646 件のヒット化合物から削除され、2,209 件の化合物が得られました。
構造スクリーニング: 事前のカットオフ点として最大のタニモト類似性スコア ≤0.5 を使用して、トレーニング セットのものとは異なる構造を持つ化合物をさらにスクリーニングし、β-ラクタム環またはキノロン二環式コアを含む化合物を除外し、最終的に 1,261 個の化合物が抽出されました。得られた。
増殖阻害試験:合理的グループ G1 ~ G5 に関連する 9 つのヒット化合物のうち、4 つの化合物 (44%) が、黄色ブドウ球菌 (S. aureus) に対して、最小発育阻止濃度 (MIC) ≤ 32 μg/ml で活性であることが判明しました。
構造クラスと有効性: これらの活性化合物は合理的なグループ G1、G2、および G5 に関連しており、そのうちグループ G2 の 2 つの化合物 (No. 1 および No. 2) が活性であることが確認されています。これら 2 つの化合物は、Lipinski の規則と Ghose の基準の両方に準拠しており、良好な経口バイオアベイラビリティと薬物のような特性を備えており、さらなる研究の価値があることを示しています。
2 つの化合物がスクリーニングアウトされました
徹底的な機構研究と in vitro および in vivo 実験を通じて、化合物 1 および 2 は新規の抗生物質候補としての可能性を示しました。それらは多剤耐性株に対して効果的であるだけでなく、耐性発現傾向が低く、安全性プロファイルも良好です。
これらの発見は、これら 2 つの化合物が抗生物質開発における有望な化学ファミリーとして機能する可能性があることを示唆しています。
共通構造:化合物 1 と 2 は構造 N-[2-(2-クロロフェノキシ)エチル]アニリン コアを共有しており、これが抗生物質活性の基本構造である可能性があることが予測されています。
増殖阻害実験:黄色ブドウ球菌および枯草菌に対する時間ベースの殺菌実験では、これら 2 つの化合物はバンコマイシンと同様の抗生物質活性を示しましたが、バンコマイシンほど殺菌力はありませんでした。
耐性の研究:抗生物質耐性黄色ブドウ球菌株を用いた実験では、両方の化合物の最小発育阻止濃度(MIC)はわずかに増加しただけであり、これらの化合物が一般的な抗生物質とは異なる作用機序を持っている可能性があることが示唆されています。
薬剤耐性の発生:30 日間の連続培養後、これら 2 つの化合物の MIC はほとんど変化を示さず、薬剤耐性の発現が低下する傾向を示しました。
幅広い抵抗:両方の化合物は、バンコマイシン耐性腸球菌を含む 40 の異なる細菌種に対して活性を示し、MIC 中央値はそれぞれ 4 および 3 μg/ml でした。
定常期細菌に対する有効性:両化合物は、枯草菌の定常期細胞に対しても活性を示した。
安全性研究:どちらの化合物も、非溶血性、金属イオンの非結合性、非遺伝毒性、化学的安定性、マウスにおける安全性など、in vitro 実験で優れた安全性プロファイルを示しました。
in vivo での有効性実験:化合物 1 は、黄色ブドウ球菌皮膚感染症および大腿感染症のマウスモデルにおいて顕著な抗菌活性を示しました。
化合物の生体内での有効性
研究者は長年にわたり、抗生物質耐性に対処するための効果的で簡単に生成できる方法を模索してきましたが、その過程でディープラーニングの出現により、抗生物質耐性に対処するための新しいアイデアが研究者に提供されてきました。その応用価値は次のとおりです。
従来の抗生物質発見方法を超えて:従来の抗生物質の発見方法は、既知の活性構造に依存することが多く、新薬発見の範囲が制限されています。ディープラーニング手法は、従来の抗生物質とは構造的に異なり、現在耐性を持っている細菌に対して効果的である可能性のある新しい化合物を特定できます。
個別化された精密医療:ディープラーニングを使用すると、特定の病原体の遺伝的および表現型の特徴を分析できるため、特定の病原体または感染症の種類に合わせた個別の抗生物質の開発に役立ちます。
道は閉ざされており、長いですが、道は近づいています。医薬品の研究開発におけるディープラーニングの応用はまだ比較的初期段階にあり、データの品質や解釈可能性などの課題に直面する可能性がありますが、細菌に対する人間の重要な防御線として、関連する研究は非常に重要であり、私はそう信じています。今後もテクノロジーの反復をサポートしながら継続していきます。
参考文献:
https://www.nature.com/articles/s41586-023-06887-8