ジブリ風の絵画を生成するツールである EasyControl がワンクリックで起動します。一枚の画像を数秒で3Dモデルに変換できるTripoSGは、3Dアセット生成に革命をもたらします。

最近、ジブリ風の画像がソーシャルメディアで話題になっています。宮崎駿監督のアニメーション風のフィルターを映画やテレビシリーズに加えると、まるでファンタジーに満ちたおとぎ話の世界に迷い込んだかのような気分になります。しかし、ジブリ風の絵を自分で作りたいと考えている多くのユーザーにとって、既存の生成モデルは操作が複雑、使用のハードルが高い、生成効果が満足できないなどの問題を抱えていることが多い。
EasyControl は、高度なテクノロジーとシンプルで使いやすいインターフェースにより、作成のハードルを大幅に下げます。軽量な条件付き注入を導入する LoRAモジュール、位置認識トレーニングパラダイム、および因果的注意メカニズムそして KVキャッシュテクノロジーモデルの互換性が大幅に向上し、プラグアンドプレイ機能と非破壊的なスタイル制御がサポートされます。
現在のところ、HyperAI スーパーニューラル「EasyControl ジブリ風画像生成デモ」チュートリアルを公開しました。デモでは、様式化されたImg2Imgコントロールモデルを使用して、肖像画を宮崎スタイルアート作品、ぜひ見に来てくださいね〜
オンラインでの使用:https://go.hyper.ai/jWm9j
4月21日から4月25日まで、hyper.ai公式サイトが更新されます。
* 高品質の公開データセット: 10
* 高品質のチュートリアル: 12
* コミュニティ記事選択: 4 記事
* 人気のある百科事典のエントリ: 5
* 4月に締め切りを迎えるトップカンファレンス: 1
公式ウェブサイトにアクセスしてください:ハイパーアイ
公開データセットの選択
このデータセットには、無人航空機 (UAV) によって撮影された 15,070 フレームの画像が含まれており、地方道路、都市の交差点、田舎道、さまざまな種類のラウンドアバウトなど、さまざまな交通シナリオをカバーしています。画像には 155,328 個のオブジェクトが注釈付けされており、そのうち 137,602 個は自動車、17,726 個はオートバイです。これらの画像は YOLOフォーマットストレージは、畳み込みニューラル ネットワークに基づくマシン ビジョン アルゴリズムのトレーニングに便利です。
直接使用します:https://go.hyper.ai/VJoXE

このデータセットには、フランスのサンテティエンヌ大学病院で収集され、患者のプライバシーとデータのコンプライアンスを確保するために完全に匿名化された、500 人の患者の 2D 頂端四腔像および二腔像シーケンスが含まれています。各画像は専門の医療従事者によって正確に注釈が付けられており、左心室心内膜、左心室外膜、左心房の輪郭情報が網羅されています。これらの詳細な注釈は、研究者に豊富なトレーニングおよび検証リソースを提供します。
直接使用します:https://go.hyper.ai/iYtn2

このデータセットには、画像カテゴリが「船」のみの 26.9k の画像が含まれています。これらの画像は、船舶検出用に特に注意深く注釈が付けられています。境界ボックスの注釈は YOLO 形式で表示され、画像内の船舶を正確かつ効率的に検出できます。
直接使用します:https://go.hyper.ai/s03Tk

4. SkyCity 航空都市景観 都市景観航空写真データセット
このデータセットは、航空風景分類用に選択されたデータセットで、合計 8,000 枚の画像が含まれており、10 の異なるカテゴリが含まれています。各カテゴリには、解像度 256×256 ピクセルの 800 枚の高品質画像が含まれています。このデータセットは、公開されている AID および NWPU-Resisc45 データセットから都市景観を統合し、都市景観分析を容易にすることを目的としています。
直接使用します:https://go.hyper.ai/eCRdN

このデータセットには 302 の希少疾患が含まれており、各カテゴリから 1 ~ 9 個の希少疾患がランダムに選択されています。これらの希少疾患は、欧州委員会が共同出資する包括的な希少疾患データベースである Orphanet データベースの 33 種類、7,000 件以上の希少疾患から選択されました。
直接使用します:https://go.hyper.ai/LwqME
このデータセットは、本研究における DRfold2 のパフォーマンスを客観的に評価するために構築された独立したテスト データセットです。これには、シーケンス長が 400 nt 未満の RNA 構造が 28 個含まれており、最新の RNA パズルのターゲット シーケンス、 CASP15 競合における RNA ターゲット配列。 2024 年 8 月 1 日現在、Protein Data Bank (PDB) データベースに公開されている最新の RNA 構造。
直接使用します:https://go.hyper.ai/shkp6
このデータセットには、2018 年と 2019 年に取得された心尖四腔像 (A4C) と心尖二腔像 (A2C) の 2 次元心エコー (エコー) 記録が含まれています。記録は、さまざまなメーカーの機器 (Phillips や GE Vivid 超音波装置など) によって、時間解像度 25 フレーム/秒、空間解像度 422 × 636 ~ 768 × 1024 ピクセルで取得されました。
直接使用します:https://go.hyper.ai/gQN8a
Reasoning-v1-20m には約 2,000 万の推論トレースが含まれており、数学、プログラミング、科学などの複数の分野の複雑な問題をカバーしています。このデータセットは、推論プロセスの豊富な例を提供することで、モデルが複雑な推論ロジックを学習し、複数ステップの推論タスクでのパフォーマンスを向上させることを目的としています。
直接使用します:https://go.hyper.ai/c2RqP
9. II-Thought-RL-v0 マルチタスク質問応答データセット
II-Thought-RL-v0 は、強化学習と問題解決のために設計された大規模なマルチタスク データセットです。数学、プログラミング、科学など複数の分野を網羅し、複数のステップで厳密にフィルタリングされた高品質の質問と回答のペアが含まれています。データセット内の質問ペアは公開データセットから取得されるだけでなく、データの多様性と実用性を確保するためにカスタマイズされた高品質の質問ペアも含まれています。
直接使用します:https://go.hyper.ai/9eSSq
10. AM-DeepSeek-R1-Distilled-1.4M大規模一般推論タスクデータセット
データセットには約 140 万件のデータ エントリが含まれており、数学、コード、科学的な Q&A、一般的なチャットなど、さまざまな質問タイプをカバーしています。これらのデータは、データの品質と難易度の高さを確保するために、慎重に選択され、意味的に重複が排除され、厳密にクリーニングされています。データセットの各エントリには豊富な思考の痕跡が含まれており、モデルに推論プロセスの例を提供するだけでなく、モデルが複雑な推論タスクをよりよく理解して解決策を生成するのにも役立ちます。
直接使用します:https://go.hyper.ai/2PSxR
選択された公開チュートリアル
YOLOEは、清華大学の研究チームが2025年に提案した新しいリアルタイム視覚モデルであり、「すべてをリアルタイムで見る」という目標の実現を目指しています。 YOLOシリーズのモデルのリアルタイム性と効率性を継承し、その上でゼロショット学習とマルチモーダルプロンプト機能を深く統合し、テキスト、ビジョン、サイレントプロンプトなどの複数のシナリオでターゲット検出とセグメンテーションをサポートできます。
このプロジェクトの関連モデルと依存関係がデプロイされました。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/rOIS1

R1-OneVision は、浙江大学のチームによってリリースされた大規模なマルチモーダル推論モデルです。このモデルは、R1-Onevision データセットの Qwen2.5-VL に基づいて微調整されています。複雑な視覚的推論タスクを処理し、視覚データとテキストデータをシームレスに統合するのに優れています。数学、科学、深層画像理解、論理的推論などの分野で優れたパフォーマンスを発揮し、さまざまな問題を解決するための強力な AI アシスタントとして機能します。
このチュートリアルでは、デモとして R1-Onevision-7B を使用し、コンピューティング リソースには RTX 4090 を使用します。コンテナを起動したら、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/7I2pi

UNO プロジェクトは、単一被験者と複数被験者の両方の画像生成をサポートし、複数のタスクを 1 つのモデルに統合し、強力な一般化機能を実証します。
このプロジェクトは FLUX.1-dev-fp 8 をベースとしており、テキストを素早く認識し、テキストの説明に基づいて画像を生成できます。
オンラインで実行:https://go.hyper.ai/r8JZo

4. TripoSG: たった数秒で一枚の画像を高忠実度の3D画像に変換
TripoSG は、高い忠実度、高品質、高い汎用性を備えた、画像から 3D を生成する高度なベース モデルです。大規模な整流変圧器、ハイブリッド教師ありトレーニング、高品質のデータセットを活用して、3D 形状生成における最先端のパフォーマンスを実現します。
このプロジェクトの関連モデルと依存関係がデプロイされました。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/rcWwu

InfiniteYou(略称InfU)は、ByteDanceの知能創造チームが2025年に発表した、Diffusion Transformers(FLUXなど)に基づくアイデンティティ保存画像生成フレームワークです。高度な技術により、画像を生成する際に人物のアイデンティティの一貫性を維持し、アイデンティティの類似性、テキストと画像の整合、生成品質における既存の方法の欠点を解決します。
このチュートリアルでは、InfiniteYou-FLUX v1.0 をデモとして使用し、コンピューティング パワー リソースは A6000 です。モデルをすぐに複製するには、以下のリンクをクリックしてください。
オンラインで実行:https://go.hyper.ai/K5Yl5

6. DeepCoder-14B-Previewのワンクリックデプロイ
DeepCoder-14B-Preview プロジェクトは、2025 年 4 月 8 日に AGENTICA によってリリースされた 14B エンコーディング モデルです。このモデルは、コード推論用に DeepSeek-R1-Distilled-Qwen-14B LLM から微調整されており、分布強化学習 (RL) を使用して長いコンテキスト長に拡張できます。このモデルは、LiveCodeBench v5 (8/1/24-2/1/25) で Pass@1 精度 60.6% を達成し、ベースモデル (53%) と比べて 8% の向上を達成し、わずか 14B のパラメータで OpenAI の o3-mini と同等のパフォーマンスを達成しました。
このチュートリアルでは、DeepCoder-14B-Preview モデルをデモケースとして使用し、bitsandbytes が提供する 8 ビットの量子化方式を採用してビデオ メモリの使用を最適化します。
オンラインで実行:https://go.hyper.ai/17aD2

EasyControl は、拡散変圧器に効率的かつ柔軟な制御を追加することを目的としたプロジェクトです。このプロジェクトでは、軽量の条件付き注入 LoRA モジュール、位置認識トレーニング パラダイムを導入し、因果的注意メカニズムと KV キャッシュ テクノロジを組み合わせることでモデルの互換性が大幅に向上し、プラグ アンド プレイ機能とロスレス スタイル制御がサポートされます。
このチュートリアルでは、顔の特徴を維持し、象徴的なアニメの美学を適用しながら、肖像画を宮崎駿スタイルのアートワークに変換できる Stylized Img2Img Controls モデルを使用します。
オンラインで実行:https://go.hyper.ai/jWm9j

8. Qwen2.5-0mni: 読む、聞く、書くのフルモードサポート
Qwen2.5-Omni は、アリババの Tongyi Qianwen チームがリリースした最新のエンドツーエンドのマルチモーダル フラッグシップ モデルです。包括的なマルチモーダル認識を実現するように設計されており、ストリーミング テキスト生成と自然な音声合成出力をサポートしながら、テキスト、画像、オーディオ、ビデオなどのさまざまな入力をシームレスに処理します。
このチュートリアルでは、デモンストレーションとして Qwen2.5-Omni を使用し、コンピューティング リソースは A6000 です。
オンラインで実行:https://go.hyper.ai/eghWg

9. Qwen2.5-VL-32B-Instructのワンクリック展開
Qwen2.5-VL-32B-Instruct は、Alibaba Tongyi Qianwen チームによって開発されたオープンソースのマルチモーダル大規模モデルです。このモデルは、Qwen2.5-VL シリーズをベースに、強化学習テクノロジーによって最適化されており、32B パラメータ スケールによるマルチモーダル機能の画期的な進歩を実現しています。
このチュートリアルでは、デモンストレーションとして Qwen2.5-VL-32B を使用し、コンピューティング リソースは A6000*2 です。機能には、テキスト理解、画像理解、ビデオ理解などがあります。
オンラインで実行:https://go.hyper.ai/Dp2Pd

10. ワンクリック展開 Qwen2.5-VL-32B-Instruct-AWQ
Qwen2.5-VL-32B-Instruct-AWQ は、Qwen2.5-VL-32B-Instruct の量子化バージョンであり、プログラミングおよび数学的計算機能が大幅に強化されています。このモデルは 29 の言語でのインタラクションをサポートし、128K トークンの長いテキストを処理でき、構造化データの理解や JSON 生成などのコア機能を備えています。トランスフォーマーアーキテクチャをベースに開発され、量子化技術による効率的な展開を実現し、大規模な AI アプリケーションシナリオに適しています。
このプロジェクトの関連モデルと依存関係がデプロイされました。コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります。
オンラインで実行:https://go.hyper.ai/fAYEK
11. オンラインチュートリアル: o3-miniに匹敵するオープンソースのコード推論モデルDeepCoder-14B-Previewは3,000個のスターを獲得
DeepCoder-14B-Preview はリリース以来、コード理解および推論タスクにおける優れたパフォーマンスにより、GitHub で 3,000 を超えるスターを獲得しています。このモデルは複数の評価において o3-mini に匹敵する機能を実証しており、効率的な推論性能と優れたスケーラビリティを備えています。
開発者がモデルをすぐに体験して展開できるように、HyperAl の公式 Web サイトのチュートリアル セクションでは、「DeepCoder-14B-Preview のワンクリック展開」チュートリアルが開始されました。すぐに開始するには、以下のリンクをクリックしてください。
オンラインで実行:https://go.hyper.ai/V42RT
AIタンパク質工学の応用と発展を促進するため、上海交通大学のHong Liang教授の研究グループは、タンパク質工学に特化したワンストップオープンプラットフォーム「VenusFactory」を開発しました。研究者は、複雑なコードを書かずに、40 を超える最先端のタンパク質ディープラーニング モデルを簡単に呼び出すことができます。
現在、HyperAI公式サイトでは「VenusFactory タンパク質工学設計プラットフォーム」のワンクリック導入チュートリアルを公開しています。クローンをクリックすると、ワンクリックで起動します。
オンラインで実行:https://go.hyper.ai/TnskV
注目のコミュニティ記事
1. CVPR 2025に選出された上海AIラボらは、11のデータセットでSOTAを達成した初のフルモダリティ医療画像再識別フレームワークを提案した。
上海人工知能研究所といくつかの大学が提案した MaMIモデルは、連続モーダルパラメータアダプタを革新的に導入し、従来の単一モダリティの制限を打ち破り、統合モデルがX線やCTなどの複数の入力モダリティにリアルタイムで適応できるようにしました。 11 の公開医用画像データセットで評価された MaMI は、最先端の再識別パフォーマンスを実証し、パーソナライズ医療における正確で動的な過去の画像検索を強力にサポートします。この記事は、その研究を詳細に解釈し共有したものです。
レポート全体を表示します。https://go.hyper.ai/e8Eat
カナダの先端材料企業である Phaseshift Technologies は、AI テクノロジーとマルチスケール シミュレーションを使用して次世代の合金と複合材を開発することに取り組んでいます。同社の Rapid Alloy Design (RAD™) プラットフォームは、さまざまな業界の特定のニーズやシナリオに合わせてカスタマイズされた合金を開発できるため、材料開発の速度を従来の方法の 100 倍に高めながら、コストを 90% 削減できます。この記事は、その会社についての詳細なレポートです。
レポート全体を表示します。https://go.hyper.ai/da4VH
3. 酵素反応速度パラメータ予測、ボトルネック特定…中国科学院深圳先端技術研究所の羅暁州氏は、酵素分野におけるAIの革新的な応用について講演した。
中国科学院深圳先進技術研究所の羅暁州教授は、上海交通大学が主催した「未来が来た」AIタンパク質設計サミットで、「人工知能主導の酵素工学」をテーマに詳細なプレゼンテーションを行いました。 UniKPフレームワークやProEnsembleマシンなどの複数の観点から、酵素工学とそのバイオ製造の実践におけるAIの革新的な応用について説明します。この記事は羅暁州教授の講演の記録です。
レポート全体を表示します。https://go.hyper.ai/de1KW
4. ICLR 2025に選出されたMIT/UCバークレー/ハーバード/スタンフォードは、生物学的配列設計のボトルネックを打破するDRAKESアルゴリズムを提案した。
MIT/カリフォルニア大学バークレー校/ハーバード大学/スタンフォード大学などのトップ大学のチームが共同で革新的なアルゴリズム DRAKES を提案しました。強化学習フレームワークを導入することで、離散拡散モデルで生成された完全な軌跡の微分可能な報酬バックプロパゲーションを初めて実現し、シーケンスの自然さを維持しながら下流タスクのパフォーマンスを大幅に向上させました。この記事は研究論文を詳細に解釈して共有したものです。
レポート全体を表示します。https://go.hyper.ai/YyEof
人気のある百科事典の項目を厳選
1.ダルイー
2. 相互ソーティング融合 RRF
3. パレートフロント パレートフロント
4. 大規模マルチタスク言語理解MMLU
5. 対照学習
ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。