トロント大学は、11 のアルゴリズムを水平比較した後、新しい長時間作用型注射薬の開発を加速する機械学習モデルを立ち上げました。

特色图像

「中国居住者の栄養と慢性疾患の状況に関する報告書(2020年)」によると、2019年の我が国の総死亡者数のうち、慢性疾患による死亡は88.5%を占めています。慢性疾患は人間の健康を脅かす主要な「死因」となっています。慢性疾患の中でも学者の間で「人類最悪の病気」と呼ばれる統合失調症を例に挙げると、患者が完全に回復するには長期間の維持療法が必要となる。しかし、この期間中に、さまざまな理由で患者の投薬が中断され、再発が生じる可能性があります。

慢性患者の服薬遵守不良の問題を解決するために、この薬は十分な量の薬を一定の製剤に溶解し、注射ルートを通って体内に入り、小さな薬の「保管庫」を形成する長時間作用型注射剤が開発されました。 」と薬をゆっくりと体内に放出し、安定した治療的役割を果たします。従来の薬と比べて、長時間作用型注射には、長い投与間隔、迅速な作用、安定した薬剤投与量という利点があります。

しかしその一方で、この新しいタイプの薬の研究開発は非常に困難でもあります。たとえば、指定された時間範囲内で薬を体内に最適に放出するためには、膨大な量の実験が必要です。さまざまな候補者の準備が必要です。このプロセスは面倒で時間がかかり、長時間作用型注射剤のさらなる開発のボトルネックとなっています。

最近、トロント大学の研究者らは、機械学習モデルを開発しました。関連する実験結果は、このモデルが長時間作用型注射剤の薬物放出速度を正確に予測し、長時間作用型注射剤の開発を効果的に加速できることを示しています。この研究はNature Communications誌に掲載された。タイトルは「ポリマー長時間作用型注射剤の設計を加速する機械学習モデル」です。

成果は「Nature Communications」に掲載されました

用紙のアドレス:

https://www.nature.com/articles/s41467-022-35343-w#Abs1

 実験概要

長時間作用型の注射可能な製剤は、一般に脂質と合成ポリマーなど、さまざまな製剤で入手できます。以下の図は、長時間作用型注射剤の従来の開発手法とデータドリブンな開発手法の比較を示しています。

図 1: 長時間作用型注射剤の従来のデータ駆動型開発手法の概略図

a 図: 米国食品医薬品局が承認した長時間作用型注射製剤の投与経路。

図 b: 従来の長時間作用型注射剤の開発における典型的な試行錯誤のサイクル。

図 c: この研究のワークフローの概要。トレーニングされた機械学習モデルを使用して、長時間作用型注射剤の開発プロセスを加速します。

この実験データセットは、以前に発表された研究結果から構築されています。Web of Science エンジンから検索された外部ソースのデータも追加されました。具体的には、データセットには、181 種類の薬物と 43 種類の薬物とポリマーの組み合わせの放出量 (一定時間内に放出される薬物分子の数) が含まれています。同時に、研究者らは構築されたデータセットを 2 つのサブセットに分割しました。それぞれモデルのトレーニングとテストに使用されます。

長時間作用型注入データセット

発行機関:トロント大学

含まれる数量:181 種類の薬剤と 43 種類の薬剤とポリマーの組み合わせをリリース

推定サイズ:394.1KB

発売時期:2022年

ダウンロードアドレス:hyper.ai/datasets/23625

実験プロセス

この研究では、研究者は合計 11 の機械学習アルゴリズムをトレーニングしました。多重線形回帰 (MLR)、最小絶対収縮および選択演算子 (Lasso)、部分最小二乗回帰 (PLS)、デシジョン ツリー (DT)、ランダム フォレスト (RF)、光勾配ブースティング マシン (LGBM)、極端な勾配ブースティング ( XGB)、自然勾配ブースティング (NGB)、サポート ベクトル回帰 (SVR)、k 最近傍アルゴリズム (k-NN)、およびニューラル ネットワーク (NN)。

機種選定 

これらの機械学習モデルの予測パフォーマンスを評価するために、研究者らは、内部 (トレーニングと検証) ループと外部 (テスト) ループで構成されるネストされた相互検証アプローチを使用しました。具体的なプロセスとしては、研究者らはまず薬物とポリマーの組み合わせに従ってデータセットをグループ化し、次に、各機械学習モデルに対して 10 回のネストされた相互検証実験が実行されました。

最後に、内側と外側のネストされた相互検証ループにおける各機械学習モデルの予測パフォーマンスを、以下の表 1 と図 2 にまとめます。表 1 は、ネストされた相互検証で薬物放出を予測するためにさまざまな機械学習アルゴリズムを使用することによって得られた平均絶対誤差 (MAE) 値と平均標準誤差 (σM、括弧内に表示) を示しています (n=10)。表からわかるように、ツリーベースのマシン モデルは、線形、インスタンスベース、深層学習モデルよりも全体的に正確です (MAE<0.16)。

表 1: ネストされた相互検証における各機械学習モデルの予測パフォーマンス

図2は、ネストされた相互検証で得られた薬物放出予測の絶対誤差(AE)値を示しています(n=10)。表 1 と図 1 の情報を組み合わせると、LGBM ベースのモデルは、内側サイクルと外側サイクルの両方で 11 モデルの中で MAE 値と AE 値が最も小さくなります。したがって、研究者らは、LGBM ベースのモデルが最高の予測パフォーマンスを持つモデルであると考えています。

図 2: 各アルゴリズム モデルの全体的な予測パフォーマンス

図中の黒丸は各モデルのMAE値、黒点線はAE値を表します。

モデルの最適化 

機械学習モデルの汎化能力をさらに向上させるために、研究者らは、クラスター分析を通じて 17 特徴 LGBM モデルをさらに最適化および改善しました。

ここでは、以下の図に示すように、最遠近傍クラスタリング アルゴリズムを使用して入力フィーチャを階層構造に配置し、17 個のフィーチャに冗長性があることを発見しました。改良後、ファイナル15 個の特徴を持つ LGBM モデルが最も優れたパフォーマンスを発揮すると判断されました。

図 3: 最初の 17 個の入力特徴のスピアマン相関係数ヒート マップ

濃い青は絶対スピアマン相関係数 (階層データに基づいて 2 つの変数間の相関を調べる方法) が 1 であることを示し、ピンクは絶対スピアマン相関係数が 0 であることを示します。ヒート マップには、集約された階層クラスタリング分析によって特定されたフィーチャ クラスターの階層構造を示す樹状図が付属しています。

実験結果 

上記の最適なモデルを取得した後、研究者らは 2 つのテストを実施しました。1 つは、そのモデルを使用して特定の長時間作用型注射剤の薬物放出曲線を予測することでした。2 つ目は、このモデルを使用して薬物ポリマーの薬物放出を予測することでした。得られた結果を実験的な薬物放出曲線と比較した結果を下の図に示します。

図 4 は、選択した長時間作用型注射剤の予測薬物放出プロファイルと実験薬物放出プロファイルの比較を示し、図 5 は薬物-ポリマー薬物放出プロファイルと実験薬物放出プロファイルの比較を示します。 、予測値と実験値は基本的に一致しています。したがって、研究者らは、LGBM アルゴリズムに基づくモデルが長時間作用型注射剤の薬物放出速度を正確に予測できると考えています。

図 4: データセットにおける長時間作用型注射剤の予測薬物放出プロファイルと実験薬物放出プロファイルの比較

図 5: 薬物ポリマー予測と対応する実験的薬物放出プロファイルの比較

Acceleration Alliance: 科学研究における新しいパラダイムの実装を支援

注目に値するのは、この研究の著者である Christine Allen と Alán Aspuru-Guzik は、どちらも Acceleration Consortium (AC) の出身です。2021 年に誕生した Acceleration Alliance は、カナダのトロント大学に本部を置き、AI とロボット工学を使用して新しい材料と分子の発見と設計を加速するというビジョンを持つ、学界、産業界、政府間の新しい世界的なコラボレーションです。

「私たちの目標は科学の発展を加速することです。」Acceleration Alliance のディレクター、アラン・アスプル・グジク氏は次のように述べています。「この目標を達成するには、自動運転のアイデアを自動化された実験室に拡張し、AI と自動化テクノロジーを使用して実験を行うことができることに気づきました。より賢い方法。

図 6: Acceleration Alliance、科学者が自動固形分注ロボットから事前に分注された試薬を取り外す

注目に値するのは、つい先月、加速アライアンスがカナダ第一研究優秀基金 (CFREF) から 2 億米ドルの助成金を受け取ったばかりであることです。この助成金は、アライアンスの「自動運転研究所」 (自動運転研究所) のサポートに使用されます。この点に関して、トロント大学学長のメリック・ガートラー氏は次のように述べています。「AI主導の研究とイノベーションへのこれらの多大な投資は、カナダおよび世界中の生活を改善する可能性を秘めています。」

この研究コードは次のことに対処します。

https://github.com/aspuru-guzik-group/long-acting-injectables