コーネル大学は、電子顕微鏡画像をわずか2～5分で材料科学的な知見に変換できるマルチエージェントプラットフォーム「EMSeek」を開発した。

3ヶ月前

電子顕微鏡（EM）は、原子の世界への前例のない窓を人類にもたらし、触媒、電池、半導体の性能を左右する欠陥、格子歪み、化学的不均一性を直接観察することを可能にした。電子顕微鏡データの量は爆発的に増加しているが、ほとんどのデータセットがまだ十分に分析されていないという重大な問題が残っている。これは科学的価値がないからではなく、専門家による解釈プロセスが遅く、断片的で、再現が難しいからである。

近年、AI技術の進歩により、電子顕微鏡データの科学的価値を最大限に引き出す新たな可能性が開かれました。しかし、画像化手法や分析タスクの多様性から、既存のアプリケーションは依然として個々のステップに限定されています。例えば、AtomAIは原子レベルのセグメンテーションのためのピクセルレベルの手法を提供し、AutoMatは構造インデックスの自動化を推進しています。それぞれがEM解析プロセスの特定の部分のみを扱っている。このような断片化によって、元の顕微鏡画像と結晶構造モデル、物性予測、あるいは文書による証拠を結びつけることが困難になり、観察から洞察に至る「最後の難関」を突破することができなくなる。

そこで、重要な疑問が生じる。多様な画像処理タスクを自律的に処理し、異なる材料分野を横断し、学際的な知識を統合できる「仮想電子顕微鏡科学者」を構築することは可能だろうか？知能エージェントが数万枚もの顕微鏡画像を同時に処理できるようになれば、人間の科学研究の効率が大幅に向上し、材料イノベーションが加速するだろう。

この文脈では、コーネル大学の研究チームは、発生源追跡機能を備えたモジュール式のマルチエージェントプラットフォームであるEMSeekを提案した。EMSeek は、知覚、構造再構築、特性推論、文献推論を統合した統一された電子顕微鏡分析ワークフローです。20 種類の材料システムと 5 つのタスクカテゴリでの評価結果によると、EMSeek はセグメンテーションタスクで Segment Anything の約 2 倍の速度とより高い精度を実現し、STEM2Mat データセットで 90% を超える構造類似性を達成し、約 2% のラベル付きデータのみを使用したキャリブレーションで、3 つの分布外特性予測ベンチマークで強力な単一専門家モデルのパフォーマンスと同等またはそれ以上の性能を発揮します。さらに重要なことに、この方法は、各画像を完全に照会するのにわずか2～5分しかかからず、専門家による処理よりも約50倍高速です。

「自律型エージェントプラットフォームによる電子顕微鏡と材料分析の橋渡し」と題された関連研究成果は、Science Advances誌に掲載された。

研究のハイライト:

* この研究では、ソース追跡機能を備えたモジュール式のマルチエージェントシステムを提案し、知覚、構造モデリング、特性推論、文献推論を再現可能なEMワークフローに統合します。

* 二次元格子および担持ナノ粒子に関する事例研究は、EMSeekの汎用性を実証し、材料発見を加速させ、専門家と非専門家の両方の研究者を支援する可能性を示しています。

EMSeekは、「仮想科学者」が人間の研究者と協力することを可能にし、基礎的な特性評価からデバイスの最適化まで、あらゆる分野における材料発見を加速させる。

用紙のアドレス:
https://www.science.org/doi/10.1126/sciadv.aed0583
弊社の公式WeChatアカウントをフォローし、バックグラウンドで「EMSeek」と返信すると、PDF全文を入手できます。

データセット：現在の電子顕微鏡分析の広さと難易度のバランス

このマルチエージェントシステムのコアユニットであるSegMentorを訓練および評価するために、研究者らは、現在の電子顕微鏡分析の広範さと難しさを反映したベンチマークデータセットを構築しました。これは以下の図に示されています。

*構築されたマルチタスク電子顕微鏡データセットの規模*
*20種類の物質システムと5種類のミッションタイプを網羅している。*

このデータセットには、20種類の材料系（ペロブスカイト、高エントロピー合金、ファンデルワールスヘテロ構造、単原子触媒など）から得られた、ピクセルレベルで注釈が付けられた数千枚の顕微鏡写真が含まれています。タスクは、原子列の位置特定、点欠陥の注釈付け、ナノ粒子の輪郭抽出、放射線誘発欠陥の計数、および単原子の識別という5つのカテゴリに分けられます。

材料選定は、以下の3つの基準に基づいて行われます。

（i）触媒作用、エネルギー貯蔵、半導体の信頼性などの主要な課題に関連するもの。

（ii）非常に対称的な結晶から、欠陥が多い格子やコントラストの低い格子まで、幅広い構造的複雑さを包含する。

（iii）加速電圧、線量、検出モードのバリエーションを含むイメージングの多様性を備えており、モデルの堅牢性を厳密にテストします。

より詳細な統計情報は、以下の表に示されています。

*SegMentorが使用するデータセットソース*
公開データセットにはすべて参考文献が含まれていますが、「非公開」のエントリは、著者自身が注釈を付けて編集したデータであることを示します。

EMSeekフレームワーク：タスクは大規模な言語モデルによって統一的にスケジュールされます。

単一の深層学習システムに依存するのとは異なり、EMSeekは、階層的な専門エージェントにタスクを割り当て、それらのエージェントは大規模言語モデル（LLM）によって統一的にスケジュールされ、計画、呼び出し、実行を自動的に完了します。これにより人的介入が最小限に抑えられ、その全体的な枠組みは下図に示すとおりである。

*エンドツーエンドの電子顕微鏡解析のためのインタラクティブなEMSeekマルチエージェントフレームワーク*

このプラットフォームは、以下の5つのコアユニットで構成されています。

セグメンター

このモジュールは、参照データに基づいた「汎用的なセグメンテーション」を担当します。原子レベルおよび粒子レベルのマスクは、様々な材料および撮像条件下で生成することができる。 SegMentorの中核を成すのはRef-UNetです。これは軽量なU-Netであり、エンコーダーブロックがビジュアルバックボーンに置き換えられ、スキップ接続は特徴マップだけでなく、ユーザーが選択した参照パッチの学習済み埋め込みも伝達します。

順伝播の過程で、参照パッチはトークン化され、位置エンコードされた後、パッチの類似性に基づいてチャネル応答の重み付けを再調整するクロスアテンション層を介して各エンコーダー段階に注入されます。生成されたコンテキストベクトルはアップサンプリングパスに沿って伝播し、干渉を抑制しながら、参照に一致する特徴に近づくようにピクセルレベルの予測を誘導します。

CrystalForge (EM2CIF)

このモジュールは、マスク制約の下で逆格子空間探索を実行し、データベース検索と候補生成を組み合わせることで、未知の化学系に直面した場合でも、密度汎関数理論（DFT）に使用できる単位格子構造を再構築します。

マットプロフェット

このモジュールは、複数の原子間モデルの出力を融合するゲート付きエキスパートハイブリッド（MoE）モデルを採用しています。較正は、約2%の標識データだけで完了できる。また、形成エネルギーや欠陥エネルギーなどの特性、およびそれらの不確実性も予測します。

スカラーシーカー

このモジュールは、膨大な量の文献から証拠を収集・統合し、引用をアンカーとした回答を生成することで、「錯覚」を軽減する役割を担っています。これは3段階のループで動作します。文書検索：密な類似性クエリによって候補となる段落を取得します。証拠抽出：文をソートおよびフィルタリングし、Guardian Agent を介して完全なソース（DOI と文のオフセット）を記録します。推論分析：証拠を構造化された議論に整理し、Scribe Agent によって引用および裏付けとなるテキストをユーザーレポートに挿入します。

ガーディアン

各引き渡しステップにおいて、物理的な合理性、単位の一貫性、およびトレーサビリティ情報が検証され、Scribeはマスク、結晶構造ファイル（CIF）、物性データシート、および参照情報を統合して監査可能なレポートを作成します。

EMSeekプラットフォームは材料研究を簡素化します

EMSeekプラットフォームは、顕微鏡画像から重要な特徴を特定し、結晶構造を決定し、材料特性を予測し、結果を既存の科学文献と比較し、統合されたワークフロー内でレポートを生成することで、材料研究を簡素化します。研究者たちは、一連の実験を通してEMSeekの包括的な機能を検証しました。

EMSeekは「ワンクリックガイダンス」により、普遍的な原子セグメンテーションを実現します。

高解像度電子顕微鏡写真には通常、1枚の画像内に数万個の原子列が含まれるが、手動の方法であろうとキューベースのツールであろうと、1回の処理で結晶学的に等価なすべての部位を特定することは困難である。 EMSeekは「ワンフォーオール」の原子セグメンテーションモードを提案しています。ユーザーは代表的な部位をクリックするだけで、モデルが視野全体にわたって結晶学的に類似したすべての原子列を自動的に検索してラベル付けすることができます。

研究者らは、マルチタスクデータセットを用いてRef-UNetを学習させた。実験結果によると、Ref-UNetはタスク性能と全体性能の両方においてSegment Anything Modelを大幅に上回る性能を示した（下の図BおよびEを参照）。計算コストは259 GFLOPs、パラメータ数は2800万で、SAM 2 Hiera-B+（560 GFLOPs、8100万パラメータ）の約半分に過ぎない。これにより、単一GPU上で約2倍の推論速度を実現し、EMSeekワークフローにおけるリアルタイムのインタラクティブなフィードバックをサポートします。

原子列認識、原子欠陥検出、照射合金欠陥検出、ナノ粒子認識、単原子触媒認識という5つのセグメンテーションタスクにおけるタスクレベルの性能。

システム実装の観点から、研究者らはRef-UNetをEMSeekのセグメンテーションエージェントとしてカプセル化し、直感的な電子顕微鏡画像ビューアと組み合わせることでリアルタイム推論を実現した。下図に示すように、ユーザーがクリックするたびに、参照テンソル入力モデルに変換され、単一フレーム内に重ね合わせた結果として返されるため、研究者は傾斜シーケンスや現場ビデオを閲覧しながら、セグメンテーションマスクを繰り返し最適化することができる。このエージェントは、ピクセルレベルで正確な関心領域（ROI）、統計的記述、および3次元原子座標をエクスポートすることもでき、これらは自動CIF構築、相分率分析、および後続の物性予測モジュールに直接入力できます。

EMSeekは、「ワンクリックCIF生成」機能により、電子顕微鏡と結晶学の間のギャップを埋めます。

電子顕微鏡画像は原子構造を解明する上で非常に重要ですが、ノイズの多い二次元投影画像を信頼性の高い結晶構造モデルに変換する作業は、しばしば困難で手間のかかるプロセスです。従来の手法では、一般的にグローバルテンプレートマッチングと手動インデックス付けの組み合わせに依存していますが、コントラストのずれ、ステージやスキャンの不安定性、炭素汚染、ブラッグディスクによる部分的な遮蔽などの要因に非常に敏感です。

EMSeekは、「まずセグメントを作成し、次に再構築する」という戦略を採用することで、これらの問題を回避しています。ピクセルベースの手法と比較すると、EMSeekは構造類似性の点で実世界の構造物を凌駕します。その構造類似性は、3つの難易度レベルすべてにおいて90%を上回り、AtomAIとAutoMatをすべてのレベルで凌駕します（図C、左下）。この利点は、コントラストや残留炭素膜のわずかな変化がグローバルマッチング手法に大きなずれを引き起こすことが多い高ノイズシーンで特に顕著です。

*CrystalForgeの性能評価（EM2CIF）*
構造類似性（SS）、二乗平均平方根偏差（RMSD）、格子誤差（ε）について、さまざまな難易度レベルでベンチマークテストを実施し、EMSeekをAtomAI、AutoMat、純粋探索モード、およびハイブリッドモードと比較した。

EMSeekは堅牢性に加えて、既存のデータベースの範囲を超える材料システムにも対応できる能力を備えています。したがって、通常の条件下での安定した構造再構築に適しているだけでなく、高ノイズ、多形性イメージング条件、未知の格子構造といった探索的なシナリオにおいても、信頼性の高いサポートを提供する。

EMSeekのマルチドメイン実世界材料タスクにおける汎化能力

電子顕微鏡データに基づく材料問題は非常に多岐にわたります。従来の自動化手法では、通常、カスタムスクリプト、一時的なデータ形式、および広範な手動処理に依存しています。信号対雑音比の低さ、欠陥と歪みの比較の重複、電子ビームのドリフト、および注釈の不足といった問題が、完全自動化ワークフローの実現をさらに阻害しています。AtomAIのようなフレームワークを使用しても、アナリストは新しいデータセットごとにモデルを再トレーニングする必要があり、数週間かかることがよくあります。EMSeekは、ユーザーの要求を自然言語プロンプトに変換し、それらを統一されたインテリジェントエージェントフレームワークに統合することで、この断片化を解消します。

下の図 A は、走査透過型電子顕微鏡 (STEM) 画像における単層状 MoS₂ の格子識別を示しています。SegMentor は Mo と S の原子列のセグメンテーションを実行し、マスクは CrystalForge (EM2CIF) に渡されて MoS₂ 格子が再構築され、その後 MatProphet が材料特性 (原子あたりのエネルギーなど) を予測します。下の図 B は、非晶質 Al₂O₃ 上にロードされた PtSn ナノ粒子の分析を示しています。SegMentor は約 73 個のほぼ球形の粒子を検出し、AnalyzerHub は中程度の多分散性を示すサイズ分布ヒストグラムを生成します。すべてのマスク、粒子統計、およびヒストグラムは記録され、追跡可能です。プロセス全体はマイクログラフ 1 つあたりわずか数秒で完了し、すべての中間結果が追跡可能です。

画像解析に加えて、EMSeekは、科学的な質問への回答のために、文書ベースの推論機能も統合しています。下図に示すように、ScholarSeekerを通じてドメイン文献を組み込んだ後、冶金QAデータセットに対する回答の精度と検証可能性は、基本的な大規模言語モデルや単純なウェブ検索よりも優れています。ただし、大規模なウェブ検索結果にはタスクとの関連性が低い情報が含まれていることが多く、証拠の不一致や方法の代替といった問題が生じるため、単純なネットワーク拡張ではパフォーマンスが低下する場合があることに注意が必要です。

対照的に、査読済みの文献から証拠を検索・抽出することで、システムは「錯覚」を大幅に減らし、回答の正確性と完全性を向上させることができます。例えば、Mg-Al-Mn合金の強度と靭性を向上させる方法についての質問に対して、システムは信頼できる熱処理プロセスを検索し、引用文献付きの正確な推奨事項を提供できます。

EMSeekは、電子顕微鏡分析にかかる時間を数週間から数分に短縮します。

最近のその場透過型電子顕微鏡（TEM）研究では、3人の専門家が、1200枚の照射欠陥画像に対する包括的な注釈付けを完了するのに、約20週間を要した。従来の静止画像では、欠陥を確実に数えるために、画像1枚あたり数分から1時間かかるのが一般的です。原子分解能格子解析や結晶粒マッピングも、専門家による数時間の作業が必要であり、分析者の主観に左右されやすいという問題があります。

同じ種類のデータに対して、EMSeekは4つのA100 GPU上で、参照誘導型セグメンテーション、マスク認識型格子再構成、MatProphet MoE特性予測、文献検索と検証、およびレポート生成を完了できます。所要時間はわずか146±18秒です。この処理速度の向上により、実際の処理時間が2～3桁短縮され、電子顕微鏡検査は事後診断ツールから、ほぼリアルタイムの仮説検証とプロセス最適化の推進力へと変貌を遂げる。

将来の材料研究における新たな競争の焦点

より広い視点で見ると、人工知能は材料科学研究の根本的なパラダイムを再構築しており、特に「特性評価－理解－設計」という重要な段階において、かつてないほどの効率性を実現しています。従来、原子レベルの材料特性評価は、経験豊富な専門家に大きく依存しており、数ヶ月、あるいは数年にわたる専門的な訓練が必要でした。熟練したオペレーターでさえ、二次元（2D）材料のような新しいシステムを扱う際には、結果の安定性と一貫性を保証するのに苦労していました。このような人的資源と経験への強い依存は、長年にわたり材料研究の規模拡大と自動化のボトルネックとなっており、「より少ないデータで、参入障壁の低い」インテリジェントな特性評価システムの開発を直接的に促してきました。

代表的な例としては、デューク大学の王浩哲氏とMITの任志初氏のチームが2025年に提案したATOMIC（Autonomous Technology for Optical Microscopy and Intelligent Characterization）フレームワークが挙げられる。これは、ベースモデルを統合して2D材料の完全自律的なゼロサンプル特性評価を実現するエンドツーエンドのフレームワークです。このシステムは、ビジュアルベースモデル（Segment Anythingモデル）、大規模言語モデル（ChatGPT）、教師なしクラスタリング、トポロジー解析を統合し、追加のトレーニングなしで迅速なエンジニアリングを通じて顕微鏡制御、サンプルスキャン、画像セグメンテーション、インテリジェント解析を自動化します。典型的なMoS(2)サンプルの分析において、この手法は99.71 TP3Tの単層認識およびセグメンテーション精度を達成し、専門家の精度に匹敵します。

論文タイトル：2次元材料のスケーラブルかつインテリジェントな特性評価のためのゼロショット自律型顕微鏡
論文リンク:

https://arxiv.org/abs/2504.10281

EMSeekのマルチエージェントフレームワークを踏襲しつつ、ATOMICは別の道筋を示しています。それは、ベースモデルによって駆動されるエンドツーエンドの自動化を通じて、複雑な実験プロセスをプログラム可能で再利用可能なインテリジェントなタスクに変換することです。これらのシステムの共通の価値は、大規模なラベル付きデータや単一タスクのための繰り返しトレーニングに頼るのではなく、汎用的な機能の組み合わせによって新しい材料システムへの迅速な適応を実現する点にあります。これは、将来の材料研究における主要な競争分野の一つが、「インテリジェントエージェントと知識資源をより効率的に管理できるのは誰か」という点に移行することを意味する。

材料科学は、徐々に「AIネイティブ」な研究の時代へと移行していくことが予想される。実験データは瞬時に分析され、モデル予測と文献知識はリアルタイムで連携可能となり、研究者は膨大なデータ処理や反復作業から解放され、研究課題の設定や実験設計に集中できるようになる。この過程において、人工知能はもはや単なる補助ツールではなく、材料の発見と革新を推進する中核的なインフラとなるだろう。

参考文献:

https://www.science.org/doi/10.1126/sciadv.aed0583
https://phys.org/news/2026-04-ai-electron-microscopy-materials-insights.html
https://mp.weixin.qq.com/s/AaAHOpChVXj_2xQJRvqHSg