科学のための AI 新しい結果、新しい展開、新しい視点をプレビューします—
* DeepMind の最新研究 FunSearch が Nature に掲載されました
* Google がヘルスケア業界モデル MedLM を発表
* Jingtai Technology が香港証券取引所に進出、AI+ ロボットが AI を科学に活用
* GHDDI はマイクロソフト科学インテリジェンス研究センターと協力しています
* 地震学処理および解析のためのオープンソース AI ツール
*我が国初の自主開発地球システムモデルがオープンソースとして発表
* Baidu Feiyuan Propeller チームがタンパク質と低分子のドッキング立体構造予測モデル HelixDock を構築
※国内研究チームがハイブリッド機械学習に基づく炭素排出量予測手法とシステムを公開
※Appleチップ「専用カスタマイズ版」機械学習フレームワークオープンソース
詳細は以下をご覧ください~
Google DeepMind の最新研究である FunSearch は、数学とコンピュータ サイエンスの新しいソリューションを検索する方法です。 FunSearch は、コンピューター コードの形式で創造的なソリューションを提供することを目的とした事前トレーニング済みの大規模モデル (LLM) と、幻覚や誤ったアイデアの防止を担当する自動「評価器」を組み合わせることで機能します。これら 2 つのコンポーネント間を行き来することにより、最初の解決策は新しい知識に「進化」します。 FunSearch は、数学における長年の問題である上限集合問題に対する新しい解決策を発見しました。これは、大規模なモデルを使用した科学または数学における難解な未解決の問題の最初の発見を表します。用紙のアドレス:Nature.com/articles/s41586-023-06924-6
最近、Google は、臨床医や研究者が複雑な研究を実施したり、医師と患者のやりとりを要約したりするのを支援するために設計された、ヘルスケア固有の人工知能モデルの新しいセットである MedLM の発売を発表しました。この動きは、ヘルスケア業界向けの人工知能ツールを収益化するというGoogleの最新の試みを示すものであり、ヘルスケア業界のデジタル変革における重要なマイルストーンとなる。まず、MedLM は、臨床医や研究者が複雑な調査やデータ分析を実施して医療診断の精度と効率を向上させるのに役立ちます。次に、MedLM は医師と患者のやり取りを要約し、医師により良い患者管理とサービス エクスペリエンスを提供できます。さらに、MedLM は医療機関に優れたデータ管理および分析ツールを提供し、医療リソースの利用効率を向上させることができます。
QuantumPharm Inc. (Jingtai Technology) は先月、香港証券取引所に目論見書を正式に提出し、18C ルールに基づいてメインボードに上場する予定です。 18C ルールは主に専門技術企業を対象としており、新世代情報技術、高度なハードウェアとソフトウェア、先端材料、新エネルギーと省エネルギーと環境保護、新しい食品と農業技術など、業界の技術的特性についてより高い要件を定めています。およびその他の産業分野。 Jingtai Technology は、量子物理学に基づく第一原理コンピューティング、高度な人工知能技術、および自動化されたウェットラボ機能を同時に保有する世界でも数少ない医薬品および材料科学の研究開発企業の 1 つであり、また、数少ない量子物理学 + AI の 1 つでもあります。 + 自動化を推進する世界の企業。医薬品および材料科学の研究開発プラットフォームの 1 つ。
最近、Global Health Drug Discovery Institute (GHDDI) と Microsoft Research AI4Science は提携を発表し、両社は実装と変革に焦点を当てて、グローバルヘルス感染症テクノロジーの分野における生成人工知能と基本的な大規模モデルを共同開発します。革新的な医薬品の研究開発。これまで両社は、結核菌とコロナウイルスの主要な標的タンパク質の研究において、新しい構造をもつさまざまな小分子阻害剤の設計に成功してきた。
北京生物幾何生物技術有限公司と北京芝埔華章技術有限公司はこのほど、自然言語と生活言語のマルチモーダルモデルを共同構築するための戦略的協力を発表した。このモデルは、生命科学や医学研究の分野における生成人工知能プラットフォームの有用性を高めることが期待されています。
現在、地震学的処理と解析のためのオープンソース ツールには、位相ピッキング、分極、分散抽出が含まれています。このツールは中国で 100Hz モデルをオープンソース化しています。一部のモデルは CSNCD データセットに基づいてトレーニングされており、PgSgPnSn の 4 つの地震フェーズのピッキング モデルが最も高い精度を持っています。アクセス住所:https://gitee.com/cangyeone/seismological-ai-tools
最近、中国科学院大気物理研究所は、独立した知的財産権を持つ我が国初の「完全な」地球システム数値モデルを公開し、そのソースコードを公開したと発表した。このモデルには、大気循環や海洋循環などの 8 つのサブシステム モデルを統合した完全な気候システムと生態環境システムが含まれており、国家の主要な科学技術インフラでもあります。地球システム数値シミュレータ「総プログラムコード約270万行からなる中核ソフトウェアは「地球研究所」と呼ばれています。
Baidu Flying Paddle Propeller チームは、大規模なシミュレーション データセットを構築し、幾何学ベースのニューラル ネットワークをアップグレードすることにより、タンパク質と小分子のドッキング立体構造予測モデル HelixDock を構築しました。これにより、立体構造予測の精度が大幅に向上しました。詳しい結果については、HelixDock の記事を参照してください。https://arxiv.org/abs/2310.13913
飛行プロペラのアクセスアドレス:https://paddlehelix.baidu.com/
国内の研究チームは、ハイブリッド機械学習に基づく炭素排出量予測方法とシステムを公開しました。このうち、ターゲット組み合わせモデルは、単一変数の計算を実現するために、データセットを処理します。時系列予測と多変数駆動因子モデルの最適な重み付けの組み合わせにより、各モデルの利点が考慮され、炭素排出量予測の精度が向上します。訪問先住所:https://cprs.patentstar.com.cn/Search/Detail?ANE=9HFF9IBA9GDC5BCA8GBA9FHE9AHA8BCA9DFB9CFF9GFF7BDA
MLX は Apple チップ用に特別に設計されたソフトウェアです機械学習フレームワーク (クリックすると詳細な説明が表示されます)、使いやすさを確保しながら、Apple チップ上でのモデルの効率的なトレーニングとデプロイメントをサポートすることを目的としています。その設計コンセプトはシンプルで、NumPy、PyTorch、Jax、ArrayFire などのフレームワークを参照しており、遅延計算や動的グラフ構築などの主要な機能が含まれています。訪問先住所:https://github.com/ml-explore/mlx/tree/main/examples
デュアルニューロン光人工学習による大規模光電子ニューラルネットワークのトレーニング
* ソース:ネイチャーコミュニケーションズ
* 分野:ニューラルネットワーク、光電子知能
* 著者: 清華大学電子工学部方陸研究グループ
研究チームは、大規模なオプトエレクトロニクス・インテリジェント・コンピューティングのための光人工デュアルニューロン学習アーキテクチャ(DuAl-Neuron opTical-artificial lEarning、DANTE)を提案しました。その中で、光ニューロンはライト フィールド計算プロセスを正確にモデル化し、人工ニューロンは軽量マッピング関数を使用して勾配伝播を支援するジャンプ接続を確立し、グローバル人工ニューロンとローカル光ニューロンは学習効果を確保するために交互学習メカニズムを使用して反復的に最適化されます。同時に、トレーニングの時空間的な複雑さが大幅に軽減され、より大規模でより深い光電子ニューラル ネットワークのトレーニングが可能になります。
元の記事を読む:https://www.nature.com/articles/s41467-023-42984-y
大規模な事前トレーニング済み深層学習モデルの微調整による効率的なタイコグラフィー再構成戦略
* ソース:iサイエンス
* 分野:データマイニング、畳み込みニューラルネットワーク
* 著者: 中国科学院チーム
研究チームは、X 線タイコグラフィーの実験データから物体の正確な投影を復元するために、PtyNet と呼ばれる畳み込みニューラル ネットワーク フレームワークを開発しました。強力なコンピューティング クラスターのサポートにより、PtyNet はトレーニング用に放射光源からデータを迅速に取得し、ユーザーの実験データの画像を迅速に再構成できます。
元の記事を読む:https://doi.org/10.1016/j.isci.2023.108420
配列クラスタリングと AlphaFold2 による複数の立体構造の予測
* ソース:自然
* 分野: バイオインフォマティクス
* 著者: ブランダイス大学、ハワード・ヒューズ医学研究所、ハーバード大学、ケンブリッジ大学の研究チーム
研究チームは合格した配列の類似性多重配列アラインメント (MSA) をクラスター化することで、AF2 は既知の変成タンパク質の交互状態を高い信頼性でサンプリングできるようになります。同時に、研究者らはAF-Cluster法を使用して、モーフィングタンパク質KaiB5の予測構造の進化的分布を研究し、両方の立体構造の予測がKaiBファミリーのクラスターに分布していることを発見した。
元の記事を読む:
https://www.nature.com/articles/s41586-023-06832-9
ProRefiner: グローバルなグラフに注目した逆タンパク質フォールディングのためのエントロピーベースのリファイン戦略
* ソース:ネイチャーコミュニケーションズ
* 分野:生体遺伝子、ディープラーニング
* 著者: 香港中文大学、志江研究所、ファーウェイのノアの方舟研究所、南京医科大学の研究チーム
研究チームは、ノイズ除去コンテキストを最大限に活用できるメモリ効率の高いグローバル グラフ アテンション モデルである ProRefiner を導入し、トランスポゾン関連トランスポザーゼ B (TnpB) 特性の再設計における ProRefiner の適用可能性を実証しました。提案された 20 個のバリアントのうち 6 個で遺伝子の改善が見られました。編集活動。
元の記事を読む:https://www.nature.com/articles/s41467-023-43166-6
分子表現学習を改善するための知識に基づいた事前トレーニング フレームワーク
* ソース:ネイチャーコミュニケーションズ
* 分野: 生体分子、創薬
* 著者: 清華大学、西湖大学、志江研究所の研究チーム
研究チームは、分子特性の分子表現予測を大幅に強化することにより、改善された一般化可能で堅牢な学習を提供する自己教師あり学習フレームワークである、Knowledge-guided Pre-training of Graph Transformer (KPGT) を提案しました。 KPGT フレームワークには、分子グラフ用に特別に設計されたグラフ Transformer と、分子の構造的および意味論的な知識を完全に捕捉するための知識に基づく事前トレーニング戦略が統合されています。元の記事を読む:https://www.nature.com/articles/s41467-023-43214-1
2023年ロボット学習会議(CoRL)が先月米国アトランタで開催された。公式データによると、今年は 25 か国から 199 件の論文が CoRL に選ばれました。人気のあるトピックには操作や強化学習などが含まれます。
そのうち最優秀論文賞は「Distilled Feature Fields Enable Few-Shot Language-Guided Manipulation」です。
* 著者:ウィリアム・シェン、ガー・ヤン、アラン・ユー、ジェンセン・ウォン、レスリー・パック・ケルブリング、フィリップ・イソラ
* 機構:MIT CSAIL、IAIFI
元の記事を読む:https://openreview.net/forum?id=Rb0nGIt_kh5
その他の賞の詳細は公式サイトをご覧ください。https://www.corl2023.org/awards
このセミナーはNASSMA、モハメッド6世工科大学、Google Deepmindなどの機関が共催した。現在、セミナーのスピーチ PPT とライブ リプレイがオンラインで公開されています。
以上が今号の「サイエンスAIウィークリー」の内容です〜
科学用AIに関する最新の研究結果や企業に関する生の情報などがありましたら、「ニュースを公開する」というメッセージを残してください。