ComfyUI Chroma は文学グラフの新たな次元を解き放ちます。 OpenMathReasoning数学的推論データセットは、数学的推論に焦点を当てた最初の高品質のデータセットです。

Wensheng グラフ モデルは近年大きく進歩しましたが、既存のモデルでは実際のアプリケーションにおいて依然として多くの制限があります。ほとんどのモデルは単一の画像しか生成できず、画像を微調整することはできません。この課題に対処するために、ロック チームは Chroma モデルを立ち上げました。
Chroma は、FLUX.1-schnell の 8.9 B パラメータ モデルに基づいています。このモデルは、映画レベルのカラーグレーディング、特殊効果の合成、様式化されたレンダリングを実現し、プロフェッショナルレベルの視覚効果をもたらします。また、アニメ、ファーリー、アートワーク、写真など、さまざまなジャンルをカバーしています。このモデルは現在、 ComfyUIの呼び出し、ユーザーがパーソナライズされた創作を実現できるよう支援する。従来の特殊効果ソフトウェアと比較して、操作がより簡単かつ便利です。
HyperAI Super Neural がオンラインになりました「ComfyUI Chroma ワークフロー オンラインチュートリアル」、ぜひお試しください〜
オンラインでの使用:https://go.hyper.ai/y8mdm
5月19日から5月23日まで、hyper.ai公式サイトが更新されます。
* 高品質の公開データセット: 10
* 高品質のチュートリアル: 16
* コミュニティ記事の選択: 6 記事
* 人気のある百科事典のエントリ: 5
* 5月に締め切りを迎えるトップカンファレンス:3
公式ウェブサイトにアクセスしてください:ハイパーアイ
公開データセットの選択
1. M2RAGマルチモーダル評価ベンチマークデータセット
このデータセットは、画像とテキスト データを組み合わせて、ニュース イベントの分析や視覚的な質問への回答など、実際のシナリオにおける情報の検索および生成タスクをシミュレートします。これは、画像コンテンツの理解、画像とテキストの関連付けの推論、事実の判断など、マルチモーダル コンテキストで検索された文書の知識を使用する MLLM の能力を評価することに重点を置いています。
直接使用します:https://go.hyper.ai/xQuV4

2. Geometry3k 幾何学問題データセット
このデータセットには、角度、辺の長さ、面積、周囲長などのさまざまな幾何学の問題が記述されており、合計 6,293 個のテキスト項目が含まれています。図表は、さまざまな幾何学的形状(三角形、円、四辺形など)やそれらの相互関係など、幾何学の問題におけるグラフィカルな情報を提示するために使用され、合計 27,213 個のテキスト項目があります。
直接使用します:https://go.hyper.ai/xQuV4

3. LLM4Mat-Bench結晶構造データセット
このデータセットには、10 個の公開材料データベースから約 197 万個の結晶構造サンプルが含まれており、45 種類の異なる材料の物理的および化学的特性をカバーしています。これは、物質特性予測のための大規模言語モデル (LLM) のパフォーマンスを評価するこれまでで最大のベンチマークです。
直接使用します:https://go.hyper.ai/cWEme

4. SeniorTalk 高齢者向け中国語音声データセット
このデータセットには、話者情報、会話内容の書き起こし、タイムスタンプ(文レベル、単語レベルを含む)、アクセントカテゴリラベルなど、多次元の詳細な注釈が含まれています。これらの実世界データは、高齢者の音声信号の詳細な研究や高齢者向け音声インタラクションシステムの最適化に貴重なサポートを提供し、高齢者向け機器、健康管理、高齢者介護ロボットなどの関連産業の発展を促進します。
直接使用します:https://go.hyper.ai/MtvcV

5. DeepMath-103K 数学的推論データセット
このデータセットは、代数、微積分、数論、幾何学、確率、離散数学などの分野を網羅したレベル 5 ~ 9 の数学の問題に焦点を当てており、複雑な推論能力に挑戦することに重点を置いています。このデータセットでは、セマンティック マッチングを通じて一般的なベンチマークの詳細な除染処理も実行し、テスト セットの漏洩を最小限に抑え、公平なモデル評価を促進します。
直接使用します:https://go.hyper.ai/dquTu

6. OpenMathReasoning 数学的推論データセット
このデータセットには、数学の問題タイプのラベル、詳細な問題解決手順、問題の難易度分類などが含まれています。数学の専門分野とオンラインコミュニティから得られたこれらの高品質のデータは、数学的推論プロセスと数学の問題解決モデルの最適化に関する詳細な研究に強力かつ確固としたサポートを提供し、インテリジェントな数学指導システム、数学競技補助ツール、科学研究コンピューティング自動化などの関連産業の活発な発展を促進します。
直接使用します:https://go.hyper.ai/svX2f
7. VL3-Syn7M マルチモーダル画像テキストデータセット
データセットには、画像の詳細なキャプション、短いキャプション、画像ソース情報などの多次元の詳細な注釈が含まれており、シーン画像、ドキュメント画像、テキスト画像などのさまざまなタイプのデータをカバーしており、モデルがマルチモーダル情報を学習するための豊富な資料を提供します。
直接使用します:https://go.hyper.ai/luQiA
8. 材料DFT材料特性データセット
データセットはさまざまな化学組成と物理的特性をカバーしており、各エントリは固有の材料に対応しています。すべての特性は、物質の挙動を予測する際に広く使用されている計算方法である密度汎関数理論 (DFT) 計算によって得られました。このデータセットは、材料特性モデリング、機械学習トレーニング、材料発見などのタスクに適しており、データ サイエンティストや研究者に強力な基本データ サポートを提供します。
直接使用します:https://go.hyper.ai/S7bEj
9. ヤング率データセット
ヤング率は、材料の変形に対する抵抗力を測定する物理量です。値が大きいほど、材料が変形する可能性が低くなります。このデータセットには 393 個のデータ ポイントが含まれており、さまざまな方向の結晶のヤング率を測定することで材料の異方性を特徴付けることを目的としています。
直接使用します:https://go.hyper.ai/do6zP
10. ChildMandarin 児童中国語会話音声データセット
このデータセットは、この年齢層の中国語音声データの不足に対処するために設計されており、子供の音声認識や話者検証などの関連研究分野の発展を支援することを目的としています。
直接使用します:https://go.hyper.ai/GynAr
選択された公開チュートリアル
画像生成チュートリアル
1. ComfyUI Chromaワークフローオンラインチュートリアル
Chroma は、FLUX.1-schnell の 8.9 B パラメータ モデルに基づいて、2025 年に rock によって導入された Vincent 図形モデルです。モデルはまだトレーニング中であり、トレーニングデータセットはアニメ、獣、芸術作品、写真などさまざまなタイプを網羅する2,000万のサンプルから500万のデータを慎重に選択しました。
このチュートリアルでは、リソースとして単一の RTX 4090 カードを使用し、英語のプロンプトのみをサポートします。
オンラインで実行:https://go.hyper.ai/irRhP

2. FractalGen: ピクセル単位の高解像度画像生成 FractalGen は、フラクタルの考え方に基づいた新しい画像生成テクノロジーです。フラクタル生成モデルを通じてピクセル単位の高解像度画像生成を実現し、計算効率を大幅に向上させ、高解像度画像生成における従来の生成モデルの計算ボトルネックを解決します。
このプロジェクトはノートブックの形式で展開されています。ワンクリックでクローンを作成し、ステップごとに体験できます。
オンラインで実行:https://go.hyper.ai/qZN2x

3. PixelFlow: ピクセル空間画像生成ソリューション
PixelFlow プロジェクトは、主流の潜在空間モデルとは対照的に、生のピクセル空間で直接動作する画像生成モデルのファミリーです。
テキストから画像への変換の定性的な結果では、PixelFlow が画像品質、芸術性、意味制御の点で優れたパフォーマンスを発揮していることがわかりました。
オンラインで実行:https://go.hyper.ai/MbfLU

4. HiDream-I1-フルイメージ生成デモ
HiDream-I1 プロジェクトは、新しいオープンソースの画像生成基本モデルです。 HiDream-I1-Full は、170 億のパラメータを持つオープンソースの画像生成モデルです。他の 2 つのバージョンは、HiDream-I1-Dev と HiDream-I1-Fast です。 HiDream-I1-Full は最高のパフォーマンスを誇り、業界をリードする画質を数秒で実現します。
このプロジェクトの関連モデルと依存関係がデプロイされました。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/2fSbo

5. OminiControl: 多彩な画像生成と制御
OminiControl は、FLUX などの Diffusion Transformer モデル用の最小限でありながら強力な汎用制御フレームワークです。 FLUX モデルを使用して任意の制御タスク (3D、マルチビュー、ジェスチャ ガイダンスなど) をカスタマイズすることで、独自の OminiControl モデルを作成できます。
このチュートリアルは、OminiControl ユニバーサル コントロール フレームワークに基づいており、コンピューティング リソースには単一のカード A6000 を使用します。
オンラインで実行:https://go.hyper.ai/zOAWH

AI科学チュートリアル
1. Prithvi-EO-2.0 マルチテンポラル地球観測リモートセンシングモデルデモ
このモデルには、複数のチャンクとタイムスタンプにわたる空間的および時間的な注意メカニズムが含まれています。さらに、時間と場所の情報が埋め込みを通じてモデル入力に追加されます。
このチュートリアルでは、デモとして Prithvi-EO-2.0-300M モデルを使用し、コンピューティング リソースには RTX 4090 を使用します。
オンラインで実行:https://go.hyper.ai/DvqV1

2. Gnnwr 時空間インテリジェント回帰 (STIR) モデルデモ
GNNWR は、空間的および時間的な非定常性の問題を処理するために特別に設計された、PyTorch ベースの時空間インテリジェント回帰モデルです。このモデルは、地理的近接性と非定常重みの非線形フィッティングをニューラル ネットワークの表現と構築に変換することで、複雑な地理的プロセスの高精度モデリングを実現します。
このプロジェクトの関連モデルと依存関係がデプロイされました。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/Y1Cq0

3. RFUAVシステムに基づくMatlabを使用したUAV信号の処理
通信セキュリティとスペクトル監視の分野では、無線周波数 (RF) データに基づくドローン識別システムが広く研究されてきました。 RFUAV プロジェクトは、スペクトル分析と信号対雑音比の推定を通じてドローンの IQ 信号を分析および処理します。
元のデータはまだ入手できないため、ここでのデータ セットでは、データ処理のデモンストレーションとして IDLab プラットフォームのデータを使用しています。完全なデータセットが大きすぎるため、このチュートリアルではデータの一部のみを分析します。下のリンクをクリックすると、ワンクリックでデプロイできます。
オンラインで実行:https://go.hyper.ai/rowsq

4. 流体圧力を考慮したコイナ地震の非線形動的応答解析
Abaqus は、エンジニアリング シミュレーションの分野で広く使用されている強力な有限要素解析 (FEA) ソフトウェアです。有限要素法を通じてさまざまな工学上の問題をシミュレートおよび分析し、単純な線形問題から複雑な非線形問題に至るまでの問題を処理できます。
このチュートリアルは、公式の Abaqus チュートリアル「コンクリート重力式ダムの地震解析」です。この例では、任意の荷重を受けるコンクリート構造物の安定性と損傷を評価するための、コンクリートの損傷塑性材料モデルの一般的な適用方法を示します。
オンラインで実行:https://go.hyper.ai/cXdKk
5. VASPとPhonopyを組み合わせてシリコンのフォノンスペクトルを計算する
Phonopy は、調和レベルと準調和レベルでのフォノンバンド構造、熱特性、群速度、およびその他のフォノン関連の量を計算するための Python パッケージです。
このチュートリアルでは、自動スクリプトを使用して phonopy を実行し、計算プロセスを説明します。このチュートリアルでは、フォノンスペクトル計算の基本的なプロセスを学習します。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/Lb00V

6. 機械学習の力場トレーニングにVASPを使用する
このチュートリアルでは、シリコン結晶を例に、NpT アンサンブル分子動力学を通じて Vasp 機械学習力場をトレーニングする方法を説明します。このチュートリアルでは、機械学習の力場トレーニングの基本的なプロセスを学習します。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/JssLr

7. VASPとPhonopyを組み合わせてシリコンの比熱容量を計算する
VASP は、電子構造計算や量子力学的分子動力学など、第一原理から原子スケールの材料をモデリングするためのコンピュータ プログラムです。 Phonopy は、調和レベルと準調和レベルでのフォノンバンド構造、熱特性、群速度、およびその他のフォノン関連の量を計算するための Python パッケージです。
このチュートリアルでは、自動化されたスクリプトを使用して、Phonopy を使用した計算プロセスを説明します。このチュートリアルでは、比熱容量計算の基本的なプロセスを学習します。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/MWlU1

vLLMチュートリアル
1. DeepCoder-14B-Preview のワンクリック デプロイ DeepCoder-14B-Preview は、LiveCodeBench v5 (8/1/24-2/1/25) で Pass@1 精度 60.6% を達成しました。これは、ベースモデル (53%) と比べて 8% の向上であり、わずか 14B のパラメータで OpenAI の o3-mini と同等のパフォーマンスを達成しました。 DeepCoder-14B-Preview は、bitsandbytes が提供する 8 ビット量子化方式を使用して、ビデオ メモリの使用を最適化します。使用されるコンピューティング パワー リソースは RTX4090 です。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/6U1k1

2. vLLMとOpen-WebUIを使用してGLM-4-32Bを展開する
GLM-4-32B-0414 は、コード エンジニアリング、成果物生成、関数呼び出し、検索ベースの質問回答、レポート生成において優れた結果を達成しました。特に、コード生成や特定の質問応答タスクなどのいくつかのベンチマークでは、GLM-4-32B-Base-0414は、GPT-4oやDeepSeek-V3-0324(671B)などのより大規模なモデルに匹敵するパフォーマンスを実現します。
このチュートリアルでは、デモとして GLM-4-32B を使用し、コンピューティング リソースにはデュアル カード A6000 を使用します。
オンラインで実行:https://go.hyper.ai/j13EA

3. vLLM+Open-webUIを使用してQwen3シリーズモデルをデプロイする
Qwen3 は、Qwen シリーズの最新世代の大規模言語モデルであり、包括的な高密度モデルと専門家の混合 (MoE) モデルを提供します。豊富なトレーニング経験に基づき、Qwen3 は推論、指示の追従、エージェント機能、多言語サポートにおいて画期的な進歩を遂げました。 Qwen3 の応用シナリオは非常に広範囲です。テキスト、画像、音声、ビデオの処理をサポートし、マルチモーダル コンテンツの作成やクロスモーダル タスクのニーズを満たすことができます。
このチュートリアルでは、デモとして vLLM + Open-webUI を使用し、使用されるリソースは単一の RTX 4090 カードです。
オンラインで実行:https://go.hyper.ai/IiHHC

4. vLLM を使用して大規模モデルをロードし、少数ショット学習を行う
このチュートリアルは、vLLM を使用して RTX 4090 に AWQ 量子化をロードするための Qwen2.5-3B-Instruction です。各テスト問題について、トレーニング データを使用して、そのテスト問題を「サポートする」類似の質問のセットを取得します。同様の一連の質問を使用して、「構成」や「主題」などを考慮しながら、モデルに取り込むことができる会話を作成しました。
現在、HyperAI公式サイトでは、「vLLMを使用して大量モデルをロードし、少量学習を行う」ワンクリック展開チュートリアルを公開しています。クローンをクリックすると、ワンクリックで起動します。
オンラインで実行:https://go.hyper.ai/YhwvL
注目のコミュニティ記事
1. タンパク質言語モデルと画像修復モデルを組み合わせ、MITとハーバード大学は共同で単一細胞タンパク質の局在化を実現するPUPSを提案した。
MITとハーバード大学のチームは、タンパク質配列と細胞画像を組み合わせて未知のタンパク質の細胞内局在を予測する予測フレームワークPUPSを提案しました。このフレームワークは、タンパク質言語モデルと画像修復モデルを革新的に組み合わせてタンパク質の局在を予測し、未知のタンパク質予測の一般化機能と、細胞の変動性を捉える細胞タイプ固有の予測を統合することを可能にします。
レポート全体を表示します。https://go.hyper.ai/TIgUm
2. 浙江大学のチームは、深時間進化/地質プロファイル/科学研究シナリオを探索し、深時間地球科学研究を可能にするために地球エクスプローラーシステムを開発した。
浙江大学地球科学学院専任研究員のQi Jin氏は、中国地理学会地理モデルと地理情報分析専門委員会の2025年学術年次会議において、「ディープタイム地球クラウドインテリジェンス協働イノベーションプラットフォーム」に関する特別講演を行った。チームの成果は、深層時間可視化解析システム(Earth Explorer)の全体概要、研究開発の進捗状況、応用成果の3つの側面から紹介されました。この記事は、Qi Jin先生の講演のハイライトを書き起こしたものです。
レポート全体を表示します。https://go.hyper.ai/6wNdI
3. コーネル大学のチームは、800万の実際のデータに基づいてグラフニューラルネットワークを使用して肺がん患者の生存率を正確に予測し、3つの致命的なサブタイプを発見しました。
米国のコーネル大学とリジェネロン・ファーマシューティカルズは、グラフ・ニューラル・ネットワークを使用して患者の電子医療記録内の複雑な関係をエンコードし、それを生存分析モデルと組み合わせて一貫した特性と生存結果を持つサブ表現型を識別するグラフ・エンコード混合生存モデル(GEMS)を提案しました。
レポート全体を表示します。https://go.hyper.ai/dXSH5
4. コロンビアチームは、ナノ結晶のエンドツーエンド分析を実現するためにPXRDnetを初めて提案し、200個の複雑な模擬ナノ結晶の分析に成功した。
コロンビア大学とスタンフォード大学の研究者らは、拡散モデルに基づく生成型人工知能構造解析手法PXRDnetを提案した。このモデルは、化学式と、情報が少なく、サイズが制限され、広がった粉末回折パターンのみを条件とした場合であっても、さまざまな対称性と複雑さを持つシミュレートされた 200 個のナノ結晶をうまく分解することができ、サイズが 10 Å までのすべての 7 つの結晶系の構造をカバーしました。
レポート全体を表示します。https://go.hyper.ai/6JqUm
5. Gemini 2.5のフルシステムアップデート、Deep ThinkがOpenAIをサポートし、圧倒
先日終了したGoogle I/O 2025の基調講演で、Googleはいくつかの重要なアップデートを発表し、AI競争における同社の強さをさらに示しました。
レポート全体を表示します。https://go.hyper.ai/Ct6DM
6. ファン・ジェンスン氏の最新スピーチ!オープン エコシステムである NVLink Fusion は、セミカスタム AI インフラストラクチャをサポートします。オープンソースのヒューマノイドロボット基本モデル
黄仁訓氏はComputex 2025で、データセンター、エンタープライズAI、ロボティクスの分野におけるNvidiaの最新情報をいくつか共有しました。
レポート全体を表示します。https://go.hyper.ai/VRCgw
人気のある百科事典の項目を厳選
1. DALL-E
2. 人間と機械のループ
3. 逆ソート融合
4. 双方向の長短期記憶
5. 大規模マルチタスク言語理解
ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。
トップカンファレンスの締め切りは5月
RTSS 2025:5月23日 19:59:59
シーグラフ2025: 3月23日 19:59:59
ASE 2025:5月31日 19:59:59
主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event
以上が今週の編集長セレクトの内容です。含めたい場合は ハイパーアイ 公式サイト上のリソースについては、メッセージを残したり、ご意見をお寄せいただくこともできます。
また来週お会いしましょう!