AAAI'25本日締め切りです! SD コア メンバーは、Midjourney よりも優れた Vincentian ダイアグラム モデルをオープンソース化し、ワンクリックで起動できるようになりました。

ミッドジャーニーは本当に最悪です! 6 月に Stable Diffusion 3 がオープンソース化された後、Stability AI の元コアメンバーである Robin Rombach 氏が新しいチームを率いて、今月初めに FLUX.1 画像生成モデル ファミリを立ち上げました。関係者は、FLUX.1 は多くの重要な指標において Midjourney v6.0 や DALL・E 3 などの Vincentian ヘッド モデルを上回っており、オープンソースでもあると主張しています。あなたはとても強いです、準備はできていますか?
hyper.ai公式サイトのチュートリアルセクションに「FLUX.1-schnell Wenshengtu Demo」が公開されました。記事をプルダウンしてリンクを取得すると、ワンクリックでクローンを作成してプレイを開始できます。
8 月 12 日から 8 月 16 日までの hyper.ai 公式 Web サイトの更新の概要:
* 高品質なチュートリアルのセレクション: 3
* 高品質の公開データセット: 10
* コミュニティ記事選択: 4 記事
* 人気のある百科事典のエントリ: 5
※8月提出締切:2
公式ウェブサイトにアクセスしてください:ハイパーアイ
選択された公開チュートリアル
1. FLUX.1-schnell Vincent 図のデモ
FLUX.1 は、テキストの説明から画像を生成できる 120 億の大規模なパラメータ モデルで、リアルタイム トラッキング、視覚的品質、画像の詳細、出力の多様性において最先端のパフォーマンスを実現します。このチュートリアルでは、FLUX.1 [schnell] バージョンのモデルを使用します。モデルと環境は、チュートリアルのガイドラインに従って推論生成に直接使用できます。
直接使用します:https://go.hyper.ai/peksE
2. オンライン チュートリアル | Lvmin Zhang の新作 Paints-Undo がオンラインで完成します。
ControlNet の作者 Lvmin Zhang は、Paints-Undo と呼ばれる新しいプロジェクトを開発しました。このプロジェクトは、あらゆる画像のペイント プロセスを迅速に解体し、初心者がさまざまなスタイルの画像のペイント テクニックをよりよく理解できるようにします。 HyperAI Super Neural は、「1 枚の画像から絵画を生成するプロセス全体のペイント取り消しデモ」を開始しました。このチュートリアルは、コマンドを入力する必要がなく、誰でも開始できます。ワンクリックでクローンを作成できます。
直接使用します:https://go.hyper.ai/EwBE0
3. プルコケミカルの大型モデル ChemLLM-7B のワンクリック導入 - チャットデモ
ChemLLM-7B-Chat は、2024 年に上海人工知能研究所 (Shanghai AI Laboratory) によってオープンソース化された、化学および分子科学のための最初のオープンソース大規模言語モデル「Puco Chemistry (ChemLLM)」です。このチュートリアルでは、モデルのワンクリック デモ デプロイメントを提供します。コンテナーを複製して起動し、生成された API アドレスを直接コピーするだけで、モデルの推論を体験できます。
直接使用します:https://go.hyper.ai/X8V9z
公開データセットの選択
このデータセットは、最初の科学大規模モデル Pulco Chemistry Large Model (ChemlLM) とともに、上海人工知能研究所によってオープンソース化されました。これには、主に 9 つのコア化学タスクと 730K の高品質な質疑応答の大規模言語モデル化学機能が含まれています。データセットを微調整するための手順。
直接使用します:https://go.hyper.ai/94tF1
2. ChemBench4K 化学的能力評価ベンチマーク データ セット
このデータセットは、化学分子と反応に関する 9 つのタスクで構成され、4,100 の多肢選択式の質問が含まれています。このベンチマークは、大規模な言語モデルの化学能力を客観的に測定するための基礎を築きます。
直接使用します:https://go.hyper.ai/itsdU
このデータセットは、さまざまなドメイン (StackExchange、LeetCode、数学コンテスト) から 1,385 件の実際のクエリを収集しており、すべて実際の人間のデータに由来しています。 BRIGHT データセットは、検索システムがこの深い論理関係を特定し、関連する学術論文やレポートを見つけられるかどうかを判断するために特別に設計されています。
直接使用します:https://go.hyper.ai/s735d
マルチモーダル ArXiv は、LVLM の科学的理解能力を強化するために、ArXivCap と ArXivQA で構成されています。 ArXivCap は、640 万の画像と 390 万のキャプションを含むグラフ キャプション データセットです。 ArXivQA は、科学グラフに基づいて GPT-4V をプロンプトすることによって生成された質問応答データセットです。関連する結果は ACL 2024 に承認されました。
直接使用します:https://go.hyper.ai/n64Jh
5. SPIQA マルチモーダル科学論文の質問と回答のデータ セット
これは、コンピューター サイエンスのさまざまな分野の科学研究論文の複雑な図や表を解釈するために特別に設計された初の大規模な QA データセットであり、270,000 の質問が含まれており、トレーニング、検証、および 3 つの異なる評価パートに分かれています。 12 のよく知られた基本モデルでの広範な実験を通じて、チームは、研究論文の微妙な側面を理解する現在のマルチモーダル システムの能力を評価しました。
直接使用します:https://go.hyper.ai/qd7I2
6. MMEvaIPro マルチモーダルベンチマーク評価データセット
MMEvalPro は、2 つの「アンカー」質問 (認識質問 1 つと知識質問 1 つ) を追加して、モデルのマルチモーダルな理解のさまざまな側面をテストする「質問トリプル」を形成することで、既存の評価方法を改善します。最終的なベンチマークには 2,138 の質問トリプルが含まれており、合計 6,414 の異なる質問がさまざまなトピックと難易度をカバーしています。
直接使用します:https://go.hyper.ai/Hw8JA
7. PubMedVision 大規模医療 VQA データセット
PubMedVision は、大規模で高品質な医療マルチモーダル データセットです。研究チームは、高度なデータ処理手法を使用して、PubMed の国際医学雑誌の記事から医療関連の画像と有益な画像の説明を効果的にフィルタリングしました。非医療画像や文脈上無関係なコンテンツ。
直接使用します:https://go.hyper.ai/Uy8XM
8. マルチモーダル自己指示マルチモーダル ベンチマーク データ セット
データセットには、ダッシュボード、ロードマップ、図、表、フローチャート、関係図、ビジュアル パズル、2D フロア プランなどの 8 つのカテゴリをカバーする、関連する質問を含む合計 11,193 枚の抽象画像が含まれています。また、さらに 62,476 枚のデータが含まれています。 -モデルを調整します。
直接使用します:https://go.hyper.ai/FwGuz
9. Assetto Corsa Gym 大規模自律走行シミュレーション ベンチマーク
このデータセットは 6,400 万ステップのレーシング運転データを収集しており、そのうち 230 万ステップはさまざまな運転レベルの人間のドライバーからのもので、残りはソフト アクター - クリティカル (SAC) 戦略からのものです。
直接使用します:https://go.hyper.ai/6tfuM
10. MiraData: 長時間の構造化された字幕を備えた大規模なビデオ データセット
MiraData は 1 ~ 2 分の未編集のビデオ クリップ (平均再生時間 72.1 秒) に焦点を当てており、各ビデオにはさまざまな角度からの構造化された説明が含まれており、平均説明長は 318 ワードであり、ビデオ コンテンツの包括的なプレゼンテーションを保証します。このデータセットは、長時間ビデオの生成、ビデオコンテンツの理解と生成の分野の研究者に貴重なリソースと新たな挑戦の機会を提供します。
直接使用します:https://go.hyper.ai/2LmEJ
その他の公開データセットについては、以下をご覧ください。
注目のコミュニティ記事
1. ACL 2024 で最優秀論文 7 件が発表、華中科技大学の学部生がその功績により賞を受賞
8月14日、ACL 2024の各賞が順次発表され、合計7件の成果が最優秀論文を受賞し、華中科学技術大学、アデレード大学が共同出版した「Deciphering Oracle Bone Language with Diffusion Models」が受賞した。安養師範大学、華南理工大学「賞を受賞したHyperAIが皆さんに詳しく説明しました。
レポート全体を表示します。https://go.hyper.ai/t5Zon
2. MIT/CETI チームは機械学習テクノロジーを使用してマッコウクジラの発音アルファベットを分離しました。人間の言語システムに非常に似ており、より強力な情報伝達能力を持っています。
最近、MIT Pratyusha Sharma と CETI の研究者らは、機械学習を使用してマッコウクジラの録音を分析し、マッコウクジラが発する音はさまざまな特徴の組み合わせで構造化され構成されており、人間に関連するマッコウクジラの発音アルファベットを分離したことを確認しました。言語表現システムは非常に似ています。この記事は研究論文の詳細な解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/nA23S
3. 国産光チップの大躍進!清華大学のチームはニューラル ネットワークを使用して、初のフルフォワード インテリジェント オプティカル コンピューティング トレーニング アーキテクチャを作成
最近、清華大学の戴瓊海院士と方陸教授の研究チームは、光子の伝播の対称性に着目し、ニューラルネットワークトレーニングにおける順方向伝播と逆方向伝播の両方を光の前方伝播と同一視し、完全順方向モードの手法を開発しました。学ぶ。この記事は研究論文の詳細な解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/lxNhj
ニューラル ネットワーク アルゴリズムと DFT アルゴリズムをより有機的に組み合わせるために、清華大学の Xu Yong と Duan Wenhui の研究グループは、ニューラル ネットワーク密度汎関数理論 (ニューラル ネットワーク DFT) フレームワークを提案しました。このフレームワークは、ニューラル ネットワークの損失関数の最小化と密度汎関数理論のエネルギー関数の最適化を統合し、従来の教師あり学習手法と比較して精度と効率が高く、深層学習 DFT 手法の開発に新たな道を開きます。新しい方法。この記事は研究論文の詳細な解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/oE7nH
人気のある百科事典の項目を厳選
1. 対応のある t 検定対応のある t 検定
2. 相互ソーティング融合 RRF
3. パレートフロント パレートフロント
4. 大規模マルチタスク言語理解MMLU
5. データの拡張
ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event
上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。
また来週お会いしましょう!
HyperAIについて Hyper.ai
HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。
* 1,300 を超える公開データセットに対して国内の高速ダウンロード ノードを提供
* 400 以上の古典的で人気のあるオンライン チュートリアルが含まれています
* 100 以上の AI4Science 論文ケースを解釈
* 500 以上の関連用語クエリをサポート
*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします
学習の旅を始めるには、公式 Web サイトにアクセスしてください。