AAAI 2025に選出されました!香港理工大学のチームはグラフトランスフォーマーに基づいて有機材料分子の光電子特性を正確に予測します

1966年、日本の東北大学の研究室から出された一連の異常なデータがエネルギーの歴史を書き換えました。研究者たちは、ビオロゲン染料結晶の薄膜を太陽光の下に置いたところ、電流検出器からの信号が突然上昇したことに衝撃を受けた。有機材料はシリコン結晶に頼らずに光電流を生成できます!『応用物理学会誌』に掲載されたこの画期的な発見は、深い池に投げ込まれた石のように、半世紀にわたって続く科学的な波紋を生み出した。
しかし、有機太陽電池(OSC)の道のりは予想よりもはるかに困難です。その後の 40 年間、研究者たちは「効率の呪い」に陥っていました。有機材料中の励起子の拡散距離は 10 ナノメートル未満で、生成された電子正孔対は電極に到達する前に消滅してしまうのです。転機は2005年に訪れました。カリフォルニア大学ロサンゼルス校のヤン・ヤンのチームが植物の光合成系からヒントを得たのです。彼らは葉緑体の光合成系IIとIの分業と協力を模倣し、P3HTとPCBMという2つの材料を使ってナノスケールの相互浸透ネットワークを構築しました。この「バルクヘテロ接合」構造により、励起子分離効率が 60% まで向上し、デバイス効率は 5% という歴史的なブレークスルーに達します。関連する結果はサイエンス誌の表紙に掲載されました。
それ以来、有機太陽電池の効率限界は突破され続けています。しかし、有機太陽電池が 20% の効率限界に近づくにつれて、従来の「試行錯誤」の研究開発モデルはボトルネックに遭遇しました。あらゆる新しい分子の背後には、何兆もの構造的組み合わせが存在し、それが計算材料科学の強力な発展につながっています。
香港理工大学のチームが最近発表した「RingFormer」フレームワークは、分子設計における認知革命を引き起こしている。この方法は、原子化学リングの階層グラフ Transformer アーキテクチャを構築し、ローカル メッセージ パッシングとグローバル アテンション メカニズムを組み合わせて、分子の光電子特性を正確に予測します。ハーバード大学のクリーンエネルギープロジェクトデータベース(CEPDB)のテストセットでは、従来の方法と比較してパフォーマンスが22.77%向上しました。これは、新材料の研究開発サイクルが数年から数週間に短縮されることに相当し、有機太陽電池の研究が正式に「計算誘導実験」の新時代に入ったことを示しています。
「RingFormer: 有機太陽電池特性予測のためのリング強化グラフトランスフォーマー」と題された関連成果は、AI分野の最高学術会議であるAAAI 2025に選出されました。

論文リンク:
https://doi.org/10.48550/arXiv.2412.09030
研究で使用された関連データセットのダウンロードアドレス:
https://hyper.ai/cn/datasets/37721
GNNは長い従来のR&Dモデルを変える
世界的なエネルギー転換における再生可能エネルギーの需要が高まる中、有機太陽電池(OSC)は優れた光電変換特性により研究のホットスポットとなっています。これらのデバイスは有機小分子半導体材料をベースとしており、共役構造における電子供与体と受容体の相互作用を通じて光エネルギーを電気エネルギーに変換します。その効率は分子構造の複雑さと密接に関係しています。しかし、従来の研究開発モデルは、多くの試行錯誤の実験と長い合成プロセスに依存しています。研究開発サイクルは3〜5年かかることが多いです。これにより、材料の革新のスピードが著しく制限されます。
潜在的な OSC 分子をより効率的にスクリーニングするために、研究者は機械学習手法を使用して OSC のパフォーマンスを予測し始めました。現在、フィンガープリントベースの方法が広く使用されており、通常は手動で設計された分子フィンガープリント(MACCS や ECFP など)を分子特徴として使用し、ランダムフォレストやサポートベクターマシンなどの既存の機械学習モデルに入力します。ただし、これらの指紋は分子構造を簡略化して表現したものです。複雑な分子情報と相互作用を無視すると、これは、複雑な構造を持つ OSC 分子で特に顕著です。
グラフ ニューラル ネットワーク (GNN) はかつて、このジレンマに希望をもたらしました。分子を原子ノードと化学結合エッジのトポロジカル グラフに抽象化し、ディープラーニングを通じて構造的特徴を捉えるのです。しかし、既存のモデルでは、OSC 分子の解析において 2 つの課題に直面しています。一方では、GNN の「原子近視」により、複数のベンゼン環にわたる長距離電子結合効果を捉えることが困難になります。一方で、リングシステム間の接続パターンの特性が欠如しているため、重要な構造上の違い(例えば、線形接続とスタートポロジーが励起子分離に与える影響)を区別することができません。
これらの課題に対応するために、香港理工大学の研究チームは革新的なフレームワーク「RingFormer」を提案しました。これは、OSC 分子内のリング システムをキャプチャする最初のグラフ トランスフォーマー フレームワークです。このフレームワークは、従来の原子レベルのモデリングの単一の視点を打ち破り、原子リングの二重レベル機能融合システムを構築します。
この方法の核心は、動的相互作用メカニズムを確立することです。原子レベルでの化学結合や電荷分布などの微視的特徴に対する感度を維持しながら、リングレベルでクロスリングアテンションネットワークを確立し、凝縮リングの共有エッジや非凝縮リングの空間配置などのマクロ構造的特徴を正確に分析します。
リング間接続マトリックスとリング内原子重量割り当てアルゴリズムを導入することで、モデルは主要なリング システムとその相互作用パターンを自律的に識別できます。実験結果によれば、この 2 レベルのモデリング戦略により、電力変換効率 (PCE) の予測精度が 92% に向上します。5 つ以上の環を含む複雑なシステムを持つ分子において、より強力な特性評価機能を発揮します。この画期的な進歩は、OSC 材料設計に新たなパラダイムをもたらすだけでなく、複雑な分子システムの機械学習モデリングへの新たな道も開きます。
RingFormer: 原子レベルとリングレベルの両方で OSC の分子構造を表現する
この方法をより良く評価するために、研究者らは 5 つの OSC 分子データセットをまとめました。これには、密度汎関数理論 (DFT) に基づいて生成された CEPDB データセットと、さまざまな種類の OSC 分子で構成される HOPV、PFD、NFA、PD データセットが含まれます。これらのデータセットは、6:2:2 の比率でトレーニング セット、検証セット、テスト セットに分割されます。
研究で使用された関連データセットのダウンロードアドレス:
https://hyper.ai/cn/datasets/37721
OSC 分子の原子レベルおよびリングレベルの構造的特徴を正確に捉えるために、本研究では RingFormer フレームワークを提案しました。まず、マルチレベル OSC グラフが構築され、次にこのマルチレベル グラフが RingFormer レイヤーを通じて全体としてエンコードされ、そのパフォーマンスが予測されます。下の図に示すように、このマルチレベル OSC 図には、原子レベル、リングレベル、およびレベル間図が含まれています。

原子レベルの図は OSC 分子の原子結合構造を詳細に説明しますが、リングレベルの図はリングとその接続に焦点を当てて複雑なリングシステムを捉えます。クロスレベル グラフは、リングと原子の関係をモデル化し、分子の階層構造を完全に表現します。これら 3 つのレベルを統合することで、OSC の分子構造を包括的に説明でき、特性をより正確に予測できるようになります。
次、RingFormer フレームワークは、ローカル メッセージ パッシングとグローバル アテンション メカニズムを組み合わせます。各レベルの固有の構造パターンを捉え、表現力豊かなグラフ表現を学習します。原子レベルのグラフでは、RingFormer レイヤーはメッセージ パッシング GNN を利用して、ローカル構造の特徴を原子ノード表現にエンコードします。
リングレベルのグラフの場合、RingFormer レイヤーは、リング システム内のグローバル パターン、特にリング間の接続をキャプチャするように特別に設計された革新的なクロス アテンション メカニズムを導入します。さらに、RingFormer レイヤーは、クロスレベル グラフ上のメッセージ パッシングを通じて、リング ノードとアトミック ノード間の相互作用を容易にします。各 RingFormer レイヤーの最後には、異なるレベルの情報が互いに補完できるように、階層的な融合戦略が実装されています。
最後に、複数のレイヤーを積み重ねた後、RingFormer は原子とリングのノード表現を集約して、OSC の分子構造を包括的にエンコードするグラフ表現を形成し、パフォーマンス予測のための強固な基盤を提供します。
次に、OSC のパフォーマンス予測における RingFormer の有効性を評価するために、研究者らは 5 つの OSC 分子データセット上の 11 のベースライン モデルと比較しました。実験結果によれば、RingFormer は、ベースライン モデルを一貫して上回ります。特に、大規模な CEPDB データセットでは、RingFormer は最も近い競合製品に対して 22.77% という大幅な相対的改善を達成しています。
下の表に示すように、予測される電力変換効率(PCE)に関しては、RingFormer はほぼすべてのデータセットで最高のパフォーマンスを発揮し、PFD データセットでのみ 2 位にランクされています。特に、平均リング数が最も多い NFA データセットでは、RingFormer は指紋ベースの方法 ECFP よりも 4.96% 優れています。さらに、より大きく複雑な OSC 分子を扱う場合でも、RingFormer はこれらのデータセットで優れたパフォーマンスを発揮し、4 つのデータセットのうち 3 つで最高のパフォーマンスを達成しました。


研究者らはさらに、CEPDB データセットを使用して、マルチタスク学習における RingFormer のパフォーマンスを評価しました。結果は、RingFormer は、6 つのターゲット パフォーマンス メトリックすべてにおいて、一貫して他の競合モデルよりも優れたパフォーマンスを発揮します。そして、多くの場合、大きな利点があります。さらに、メッセージ パッシングとグローバル アテンション メカニズムの融合により、GPS はすべてのターゲット パフォーマンスでも優れたパフォーマンスを発揮し、RingFormer に次ぐ性能を発揮します。これは、OSC 分子における局所的および全体的な構造的特徴の両方を捉えることの重要性をさらに裏付けています。
最後に、研究者らは、異なる数のリングを持つ OSC 分子を処理する際の RingFormer のパフォーマンスも評価しました。分子内のリングの数が増えると、それに応じて RingFormer のパフォーマンスも向上します。これは、RingFormer の優れたパフォーマンスとリング システムの複雑さの間に明確な正の相関関係があることを示しています。
さらに、本研究では、UMAP テクノロジーを使用して、CEPDB テスト セット内の OSC 分子のグラフ表現の視覚分析も実行しました。 GPSによって生成された埋め込みと比較すると、RingFormer によって生成された埋め込みは、OSC 分子内のリングの数に応じて明確に区別できます。これらの観察は、リングシステムの複雑な構造を捉える RingFormer の優れた能力をさらに裏付けています。
AI技術は業界の未来を変え、OSCを支える中国の力は無視できない
世界的なエネルギー転換の波の中で、有機太陽電池(OSC)は軽量、柔軟性、低コストという特徴により、徐々に研究室から産業化の最前線へと移行しつつあり、有機太陽電池分野における中国の科学者の研究の進歩は目を見張るものがある。
2015年、中国科学院の侯建輝教授のチームは「ポリマーと小分子の相乗効果」の理論を提唱し、蝶形の3次元構成により分子の正確な結合を可能にする非フラーレン受容体ITICを開発した。同チームの製品は、標高4,200メートルの青海高原の過酷な気候条件下でも82%の効率を維持でき、高地での実証事例としては世界初となる。
2025年までに、東呉大学の李耀文氏のチームは、「逐次結晶化戦略」を通じて活性層の分子配列勾配を制御し、20.82%の認定効率を達成し、厚膜デバイス産業化のボトルネックを突破した。400ナノメートル厚のフィルムの効率は17.93%に達しました。ロールツーロール印刷技術の開発の基礎を築きました。
同時に、寧波材料研究所の葛子怡のチームはキノキサリン受容体SMAを設計し、整然とした分子配列により、剛性 OSC とフレキシブル OSC の効率はそれぞれ 20.22% と 18.42% に向上しました。96% は 2,000 回の曲げ後でも性能が維持され、ウェアラブル エネルギー デバイスの新たな基準を確立しました。
AIと有機太陽電池の研究の組み合わせは、2023年にはすでに登場しています。東呉大学機能性ナノ材料・ソフトマター研究所の李有勇教授のチームは、袁建宇教授のチームと協力し、機械学習を利用して有機太陽電池のハイスループットスクリーニングを実現しました。彼らは、DFT 計算を通じて有機分子の電子構造特性について詳細な研究を行い、ビッグデータ技術を使用して機能性材料データベースを構築し、機械学習モデルのトレーニングのための強固な基盤を提供しました。この研究は、有機光電子材料のスクリーニングの効率を向上させ、計算コストを削減するだけでなく、また、光電子デバイスの設計と最適化にも強力なサポートを提供します。
*論文タイトル:
ディープラーニングとアンサンブル学習による有機太陽電池の効率的なスクリーニングフレームワーク
*論文リンク:
https://www.nature.com/articles/s41524-023-01155-9
2024年、イリノイ大学とトロント大学の研究チームは、AIを説明可能な化学知識エンジンに変換する画期的な「クローズドループ転送(CLT)」手法を提案した。この方法は、物理的な特徴選択と教師あり学習を組み合わせたものです。5 ラウンドの閉ループ実験で、光安定性が 5 倍に向上した集光分子を含む 30 種類の新しい分子がスクリーニングされました。高エネルギー三重項状態密度 (TDOS) と安定性の間に強い相関関係があることが明らかになり、光劣化問題に対する普遍的な設計原理が提供されました。
* 論文タイトル:
閉ループ転送により人工知能が化学知識を生み出すことが可能に
* 論文リンク:
https://doi.org/10.1038/s41586-024-07892-1
また、2024年には、ドイツのヘルムホルツ研究所のChristoph J. Brabec氏とWu Jianchang氏、厦門大学のWang Luyao氏、ドイツのカールスルーエ工科大学のPascal Friederich氏、韓国の蔚山国立科学技術院のSang Il Seok氏が共同で閉ループの自動化ワークフローを開発しました。このプロセスでは、機械学習と実験を組み合わせます。特定のデバイスのニーズに合わせて分子設計ルールを迅速に生成する機能、有機太陽電池などの次世代高性能光電子デバイス開発の基盤を築きます。
* 論文タイトル:
逆設計ワークフローによりペロブスカイト太陽電池に適した正孔輸送材料を発見
* 論文リンク:
https://doi.org/10.1126/science.ads0901
AI技術は、世界中の有機太陽電池研究においてますます重要な役割を果たしていることがわかります。AI技術は、新材料の発見や性能の最適化を加速するだけでなく、長年の科学的問題に対する新たな視点と解決策も提供します。技術の継続的な成熟と工業化の加速により、中国は世界の有機太陽電池技術の発展を牽引する重要な原動力となり、将来のエネルギー革命にさらなる中国の知恵と解決策を提供することが期待されています。