HyperAIHyperAI

Command Palette

Search for a command to run...

極めて軽量でありながら、画質は損なわれていません! ERNIE-Image-Turbo:長い待ち時間とはおさらば、超高速スピード。知覚と認知の二次元指標を導入:アリババの統合マルチモーダル解析および評価データセットOmniParsingBenchがオンラインで利用可能になりました。

Featured Image

ERNIE-Image-Turboは、Baiduがオープンソース化した高効率なテキスト画像変換モデルです。シングルストリーム拡散変換器(DiT)アーキテクチャをベースとし、DMDとRL技術で高度に最適化されているため、わずか8ステップの推論で高精細かつ美しい画像を迅速に生成できます。優れた軽量設計により、アプリケーションや研究におけるハードウェアの障壁を大幅に低減します。

このモデルは、極めて高速な生成速度を維持しながら、優れた制御性と汎用性を発揮します。複数のオブジェクトや複雑な関係性を含む命令を正確に実行でき、長文や複雑なレイアウトのレンダリング能力を大幅に向上させているため、ポスターデザイン、マルチパネルコミック、インフォグラフィックに最適です。さらに、リアルな写真、デザイン性の高いタイポグラフィ、ソフトな映画のような効果など、多様な美的スタイルを完全にサポートしており、視覚的な品質と産業レベルのクリエイティブ効率を両立させた理想的なツールです。

「ERNIE-Image-Turbo Raw Image Model」がHyperAIのウェブサイトで公開されました。ぜひお試しください!

オンラインでの使用:https://go.hyper.ai/hmKUg

より詳しい情報については、弊社の公式ウェブサイトをご覧ください。

https://hyper.ai

hyper.aiの公式サイトにおける4月18日から4月24日までの更新内容の概要は以下のとおりです。

* 高品質な公開データセット:9件

* 厳選された高品質チュートリアル:5つ

* コミュニティ記事分析:2件

* 人気のある百科事典のエントリ: 5

* 4月に締め切りを迎えるトップカンファレンス: 1

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. OmniParsingBench マルチモーダル構文解析機能評価データセット

2026年にアリババがリリースしたOmniParsingBenchは、マルチモーダル大規模モデル(MLLM)の統合的な構文解析能力を評価するためのベンチマークデータセットです。このデータセットには、6つのモーダル領域(自然画像、グラフィックス、文書、音声、自然動画、テキスト密度の高い動画)を網羅する約5,294のサンプルが含まれており、知覚(Perc.)、認知(Cog.)、総合(Ovr.)の3つのレベルの評価指標が導入されています。各データセットには、画像または音声/動画の入力と、それに対応する構造化された構文解析タスクが含まれています。

オンラインでの使用:https://go.hyper.ai/AqyDg

2.BRIGHT災害建物評価データセット

BRIGHTは、光学画像とSAR(合成開口レーダー)データを統合した、多様な災害タイプを網羅した、世界規模で公開・配信される初のマルチモーダル災害現場ベンチマークデータセットです。このデータセットは、14の地域と7種類の災害(自然災害5種類+人為災害2種類)を対象とし、約4,200組の画像ペア、38万を超える建物インスタンス、約0.3~1メートルの空間解像度を誇ります。データは、災害前画像、災害後画像、および対象物の注釈で構成されています。

オンラインでの使用:https://go.hyper.ai/RifVg

3. 花:バングラデシュの花の画像データセット

バングラデシュ花画像データセットは、コンピュータビジョンによる画像分類タスク向けに設計されたデータセットです。このデータセットには、バングラデシュで撮影された様々な花の実写画像が含まれています。すべての画像はオリジナルで合成画像ではなく、自然光の下で撮影されており、豊かな色彩の変化が表現されています。このデータセットは、バングラデシュの多様な花の種類とその外観特性を網羅しており、カテゴリ別にラベル付けされています。

オンラインでの使用:https://go.hyper.ai/wirun

4. MIAマルチステップ推論および決定軌跡データセット

MIA(Multi-Step Reasoning and Decision Trajectory)データセットは、2026年4月に華東師範大学、上海イノベーション研究所、ハルビン工業大学が共同で公開したもので、長期記憶とタスク実行能力を備えたインテリジェントエージェントの訓練と評価に使用されるデータセットです。このデータセットには、問題解決、計画、探索、実行の全プロセスを網羅する約21,000の推論軌跡が含まれており、エージェント推論と強化学習の研究に適しています。

オンラインでの使用:https://go.hyper.ai/XITit

5. PanScaleリモートセンシングPancolorシャープニングデータセット

PanScaleは、大規模な推論と能力評価のためのベンチマークデータセットであり、2026年に中国科学院が中国科学技術大学および香港科技大学と共同で公開しました。このデータセットには、8ビットTIFF形式のマルチスペクトル(MS)画像とパンクロマチック(PAN)画像のペアが7,559組含まれています。jilin、landsat、skysatなどの複数のサブセットを網羅し、fjilin、flandsat、fskysatなどのクロススケールバージョンにも拡張されており、同一スケールから複数スケール(最大4.0倍)までのシーンのシステム評価をサポートします。

オンラインでの使用:https://go.hyper.ai/mz2gh

6. Emotion-probes感情検出データセット

Emotion-probesは、感情理解とモデル解釈性の研究のために設計された合成テキストデータセットです。モデルから感情ベクトルと感情マスキング機能を抽出することを目的としており、感情分類、モデルアライメント、セキュリティ研究、大規模モデルの内部メカニズム分析などに幅広く利用されています。このデータセットには約447,000のサンプルが含まれています。各サンプルには、実際の感情、表現された感情、テキストコンテンツ、役割情報などのフィールドが含まれています。

オンラインでの使用:https://go.hyper.ai/jw5FA

7. OpenMementos コンテキストメモリ圧縮データセット

OpenMementosは、Microsoftが2026年にリリースしたコンテキストメモリ圧縮データセットで、大規模モデルの長連鎖推論とコンテキスト管理機能をモデル化するために設計されています。このデータセットは、コンテキスト圧縮と連続推論を実行するモデルをトレーニングすることを目的としており、限られたコンテキストウィンドウ内で複雑な多段階推論タスクをサポートします。長連鎖推論モデリング、メモリ強化型モデルトレーニング、効率的な生成など、幅広い研究シナリオに適用可能です。

オンラインでの使用:https://go.hyper.ai/RwCkt

8. ParseBench文書解析能力評価データセット

ParseBenchの文書解析能力評価データセットは、LlamaIndexチームによって2024年から2025年にかけて公開されました。このデータセットには、約2,000の手動で検証および注釈付けされたページと、5つの次元にわたる169,011のテストルールが含まれています。これらのページは、保険、金融、政府、その他の分野を網羅する公開されている企業文書から抽出されており、PDF、スキャン画像、表やページレイアウトを含むページなど、さまざまなページタイプが含まれています。標準化された解析結果は、構造理解と情報抽出におけるモデルのパフォーマンスを評価するために、人間の注釈と合わせて提供されています。

オンラインでの使用:https://go.hyper.ai/FfFR6

9. SOHL-multidish-yoloデータセットは、複数の料理を含むインド料理を検出するためのものです。

SOHL Multi-Dish YOLOは、コンピュータビジョンにおける複数物体検出タスクのための食品認識データセットです。YOLOv8アノテーション仕様に基づいて構築されており、複雑なシーンにおける複数の料理の検出問題に焦点を当てています。このデータセットには、16種類の食品カテゴリを網羅する377枚のアノテーション付き画像と、それに対応する377個のアノテーションが含まれています。各画像には2~6個の食品オブジェクトが含まれており、重なり、マルチスケール、複雑なレイアウトなどの特徴を示しています。

オンラインでの使用:https://go.hyper.ai/u5Lng

選択された公開チュートリアル

1. ERNIE-Image-Turbo 生画像モデル

ERNIE-Image-Turboは、Baidu ERNIE-Imageチームが2026年4月にリリースしたオープンソースのテキストから画像への生成モデルです。ERNIE-Image-Turboは、複雑な命令トレース、テキストレンダリング、ポスターレイアウト生成、構造化画像生成、幅広いスタイル対応といった機能を備えており、ポスターデザイン、イラスト生成、インターフェースコンセプトスケッチなどのクリエイティブコンテンツワークフローに適しています。

オンラインで実行:https://go.hyper.ai/hmKUg

デモページ

2. Qwen 3.6-27B のワンクリック展開

Qwen3.6-27Bは、同義千文チームがオープンソース化した、270億個のパラメータを持つ高密度マルチモーダルモデルです。このモデルは、マルチモーダル思考モードと非思考モードの両方をサポートし、エージェントプログラミングにおいてフラッグシップレベルの性能を実現しており、前身であるオープンソースのフラッグシップモデルQwen3.5-397B-A17Bを総合的に凌駕しています。高密度アーキテクチャを採用しているため、MoEルーティングなしで展開でき、実用的かつ幅広い展開が可能な方法で最高レベルのプログラミング機能を求める開発者にとって理想的な選択肢となります。

オンラインで実行:https://go.hyper.ai/GU9S2

デモページ

3. SAM3.1:ビデオマルチオブジェクトトラッキングとセグメンテーション

SAM3.1(Segment Anything Model 3.1)は、動画向けのオープンボキャブラリー型物体追跡・セグメンテーションシステムです。このモデルは、物体多重化技術を導入することで、効率的な複数物体動画追跡を実現します。

オンラインで実行:https://go.hyper.ai/3e5qL

デモページ

4. Qwen3.6-35B-A3B: インテリジェントエージェントをプログラミングするための強力なツール。

2026年4月、Qwenチームはマルチモーダルハイブリッドエキスパート(MoE)モデル「Qwen3.6-35B-A3B」をリリースしました。このモデルは合計350億個のパラメータを持ちますが、各推論でアクティブ化されるパラメータはわずか30億個であるため、高いパフォーマンスを維持しながら推論コストを大幅に削減できます。

オンラインで実行:https://go.hyper.ai/Gc7bp

デモページ

5. ニューラルネットワークをゼロから構築する:NumPyチュートリアル

このチュートリアルでは、NumPyライブラリのみを使用してシンプルなニューラルネットワークフレームワークをゼロから構築する方法を解説します。ニューロン、重み、順伝播から隠れ層、活性化関数、損失関数に至るまで、コアコンセプトを網羅的に説明します。また、フレームワークAPIを呼び出すだけでなく、ディープラーニングモデル構築の原理を理解するのにも役立ちます。

オンラインで実行:https://go.hyper.ai/OmyS0

コミュニティ記事の解釈

1. ICLR 2026 | タスクあたりの学習可能パラメータを125倍削減!新しい手法であるタスクトークンが、具現化された知能による複雑なタスク能力の向上を支援

イスラエル工科大学(テクニオン)の研究チームは、BFM(ベースライン・ファインディング)の柔軟性を維持しながら、特定のタスクに効果的に適応させる「タスクトークン」と呼ばれる手法を提案した。この新しい手法は、標準的なベースライン手法と比較して、タスクごとの学習可能なパラメータ数を最大125分の1に削減し、収束速度を最大6倍向上させる。研究者らはまた、分布外シナリオを含む様々なタスクにおけるタスクトークンの有効性を検証し、他のキューイング手法との互換性も実証した。

レポート全体を表示します。https://go.hyper.ai/vs0C6

2. トロント大学などが提案したdnaHNetは、推論速度を3倍向上させ、ゲノム学習の計算コストを約4分の1に削減します。

トロント大学、カナダのベクター人工知能研究所、および米国のアーク研究所が共同で提案したdnaHNetモデルは、計算上の実現可能性と生物学的忠実性の間のより良いバランスを実現するための新しいアプローチを提供する。

レポート全体を表示します。https://go.hyper.ai/dRnYT

人気のある百科事典の項目を厳選

1. スキル

2. グラウンドトゥルース

3. トリプレット損失関数

4. コルモゴロフ・アーノルドネットワーク

5. 相互ランク融合

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://go.hyper.ai/wiki

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。

また来週お会いしましょう!

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 2100以上の公開データセット向けに、国内高速ダウンロードノードを提供

* 700以上の定番かつ人気のオンラインチュートリアルを収録

* 300件以上のAI4Science論文事例を分析

* 700以上の関連用語の検索に対応

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai