ICML の最高の論文 SD3 が公開チュートリアルとして公開されました。自動画像評価の新しいベンチマークである DreamBench++ は、人間の好みの深い調整を実現します。

最近、ICML 2024 の最優秀論文が発表されました。その中には、年次画像生成用の「インターネット有名人モデル」である Stable Diffusion 3 (SD3 と呼ばれます) があります。 SD3 は、Stability AI によって開発された最新のテキストから画像への生成モデルで、少し前にインターネット上でオープンソース化されました。ハイパーAI Super Neural は、ComfyUI ワークフローでの SD3 の実行に関するチュートリアルを開始しました。ぜひ論文を読みながらSD3の技術革新を体感してください!
SD3 チュートリアルのリンク:https://go.hyper.ai/ojO3g
7 月 22 日から 7 月 26 日までの hyper.ai 公式 Web サイト更新の概要:
* 高品質の公開データセット: 10
* 高品質なチュートリアルのセレクション: 3
* コミュニティ記事選択: 4 記事
* 人気のある百科事典のエントリ: 5
※8月締切:4日
公式ウェブサイトにアクセスしてください:ハイパーアイ
公開データセットの選択
データセットには、9 つの生きた被験者 (犬や猫など) と 21 の物体を含む 30 の異なるカテゴリの被験者が含まれており、各被験者に 4 ~ 6 枚の画像が含まれています。これにより、少数の画像を使用してモデルをトレーニングできるため、主要な視覚的特徴を維持しながら、さまざまなコンテキストで特定の個人の画像を生成できるようになります。
直接使用します:https://go.hyper.ai/Jiqg6
データセットには 581K の段落と 729K の空白が含まれており、複数のドメインをカバーしています。 ChID では、段落内のイディオムは空白記号に置き換えられます。ギャップごとに、ゴールデン イディオムを含む候補イディオムのリストが選択肢として提供されます。
直接使用します:https://go.hyper.ai/dt4AR
このデータセットは、清華大学が 2021 年に開始した中国古典詩マッチング データセットで、トレーニング セット (21,778 文)、検証セット (2,720 文)、テスト セット (2,720 文) が含まれています。
直接使用します:https://go.hyper.ai/ymhF6
MMDU ベンチマークは、1,600 を超える質問を含む 110 の高品質、複数画像、複数ターンの会話で構成されており、それぞれに詳細な長文の回答が付いています。 MMUD の問題には 2 ~ 20 の画像が関係し、画像とテキストの平均タグ長は 8.2K タグ、最大画像とテキスト長は 18K タグであり、既存のマルチモーダル大規模モデルに重大な課題をもたらします。
直接使用します:https://go.hyper.ai/vNyjl
5. ModeINet10 プリンストン 3D オブジェクト データセット
ModelNet10 データセットは ModelNet40 データセットの一部であり、バスタブ、ベッド、椅子、テーブルなどの 10 カテゴリの CAD 家具モデルの 4,899 個の事前に位置合わせされた形状が含まれています。このうち、3,991 (80%) 形状がトレーニングに使用され、908 (20%) 形状がテストに使用されます。
直接使用します:https://go.hyper.ai/ZPFKs
データセットには画像フォルダーとラベル フォルダーが含まれています。画像フォルダーには、トレーニング用の train (画像 374 枚) と検証用の Val (画像 111 枚) の 2 つのサブフォルダーが含まれています。
直接使用します:https://go.hyper.ai/WAKTy
7. baike_qa2019百科事典の質問と回答のjsonバージョンデータセット
データセットには、事前にフィルタリングされた 150 万件の高品質な質問と回答が含まれており、各質問はカテゴリに属しています。カテゴリは合計 492 あり、そのうち 434 は頻度が 10 回以上です。
直接使用します:https://go.hyper.ai/3KWJ8
8. DreamBench++自動画像評価ベンチマークデータセット
DreamBench++ は、パーソナライズされた画像の評価に存在する問題を解決することを目的として、清華大学、西安交通大学、イリノイ大学アーバナシャンペーン校、中国科学院、Megvii の研究者によって共同で 2024 年に開始された新しいベンチマークです。発電技術。マルチモダリティをサポートする GPT-4o を導入することで、人間の好みとの深い整合と自動評価を実現し、より包括的で多様なデータセットを開始します。
直接使用します:https://go.hyper.ai/glVDV
9. 新型コロナウイルス感染症 X 線撮影データベース 胸部 X 線画像データベース
このデータセットには、3,616 人の新型コロナウイルス感染症陽性症例、10,192 人の正常症例、6,012 人の肺混濁(非新型コロナウイルス感染症による肺感染)症例、および 1,345 件のウイルス性肺炎画像と対応する肺マスク画像が含まれており、研究者が新型コロナウイルス感染症パンデミックの最中に研究を行うのに役立ちます。
直接使用します:https://go.hyper.ai/89Wxz
10. OceanInstruct海洋大型モデル指示データセット
このデータセットには 20,000 の命令が含まれており、海洋ドメインの大規模な言語モデルのトレーニング データを提供するように設計されています。これらの指示は海洋科学の幅広い知識をカバーしており、モデルが海洋科学の質問と回答、コンテンツ生成、および水中で具現化されたインテリジェンス機能における専門的な機能を備えていることを保証します。
直接使用します:https://go.hyper.ai/WuYlv
その他の公開データセットについては、以下をご覧ください。
選択された公開チュートリアル
1. オンライン チュートリアル | Stable Diffusion 3 Medium がオープンソースになり、ワンクリックでクリエイティブな旅を始めましょう!
Vincentian グラフィックス界のリーダーである Stability AI のオープンソース モデル Stable Diffusion 3 Medium (SD3 と呼ばれます) は、画質、複雑で迅速な理解、リソース効率が大幅に向上しており、リアルな詳細と明るい色の画像を生成できます。 、自然な照明で、さまざまなスタイルに適応できます。このチュートリアルでは、SD3 のグラフィック機能と ComfyUI のワークフローを強力に組み合わせているため、すぐに作業を開始してクリエイティブな旅を始めることができます。
オンラインで実行:https://go.hyper.ai/ojO3g
2. Kolors Kuaishou は絵、テキスト、写真を描くことができます 大型モデルのデモ
Kolors は、Kuaishou Kolors チームによって開発された潜在拡散に基づく大規模なテキストから画像への生成モデルです。何十億ものテキストと画像のペアでトレーニングされた Kolors は、ビジュアル品質、複雑なセマンティクスの精度、中国語と英語の文字のテキスト レンダリングにおいて、オープンソース モデルやクローズド ソース モデルと比べて大きな利点を示しています。このチュートリアルではコマンドを入力する必要はなく、ワンクリックでクローン作成をすぐに開始できます。
オンラインで実行:https://go.hyper.ai/ur8q7
3. Mistral-Nemo-Instruct-2407 のワンクリック展開
Mistral-Nemo-Instruct-2407 は、Mistral AI と NVIDIA が共同でオープンソース化した Mistral-Nemo-Base-2407 命令の微調整バージョンであり、そのパフォーマンスは既存の小型モデルまたは同等サイズのモデルよりも大幅に優れています。 120 億 (12B) のパラメータ サイズと 128k のコンテキスト ウィンドウを備えた Mistral NeMo は、推論、世界の知識、エンコードの精度においてクラスをリードしています。このチュートリアルは、Mistral-Nemo-Instruct-2407 をワンクリックでデプロイするもので、関連する環境と依存関係がインストールされています。推論を体験するには、それを複製するだけです。
オンラインで実行:https://go.hyper.ai/zGkci
注目のコミュニティ記事
1. 小型モデルにとって大きな進歩!ニューラル ネットワークは空間的異質性を見抜き、複雑な地理的現象を正確に記述します
ライブ ブロードキャストの「Meet AI4S」シリーズの最初のエピソードで、HyperAI は幸運なことに、浙江大学からリモート センシングと地理情報システムの博士課程の学生である丁 Jiale 氏を招待しました。氏は「ニューラルネットワークが住宅価格の空間的不均一性を新たに説明する」と題して、研究結果を詳細かつ分かりやすく解説しました。この記事は、丁博士のシェアのエッセンスを要約したものです。
レポート全体を表示します。https://go.hyper.ai/g2fXy
2. ゼロサンプル学習を導入し、華中科技大学はOracleの解読に最適化された条件付き拡散モデルをリリース
華中科技大学のBai Xiang氏とLiu Yuliang氏の研究チームは、アデレード大学、安陽師範大学、華南理工大学と協力して、画像ベースの生成モデルを使用して、OBSDに最適化された条件付き拡散モデルをトレーニングしました。自然言語処理を提供する Oracle 解読用 解決が困難な古代文字認識タスクに対して新しいアプローチが提供されます。この記事は関連論文の詳細な解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/fLcZU
3. データセットの概要 | キャロットランは来年利益を上げますか?自動運転は「エンドツーエンド」の新時代を開き、高品質のデータセットは大規模な AI モデルの車載に役立ちます
自動運転は「エンドツーエンド」の新時代を切り開き、高品質のデータセットが重要な役割を果たします。これに関して、HyperAI は、収集および使用できるように、10 個の人気のあるオープンソース自動運転データ セットをまとめました。
レポート全体を表示します。https://go.hyper.ai/5nj1s
4. ACL2024に選出!浙江大学が初の海洋言語モデル「OceanGPT」を発表、水中身体化知能を実現
浙江大学コンピュータ科学技術院のZhang Ningyu氏とChen Huajun氏のチームは、海洋分野における初の大規模言語モデルであるOceanGPTを提案した。このモデルは海洋学者の指示に従って質問に答えることができ、予備的な具体化されたインテリジェンスを獲得した。海洋工学の能力。この記事は、関連する論文を詳細に解釈して共有するものです。
レポート全体を表示します。https://go.hyper.ai/b6tqu
人気のある百科事典の項目を厳選
1. スケーリングの法則
2. マスクされた言語モデリング MLM
3. データの拡張
4. 長期記憶と短期記憶長い 短期記憶
5. 量子ニューラルネットワーク 量子ニューラルネットワーク
ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event
上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。
また来週お会いしましょう!
HyperAIについて Hyper.ai
HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。
* 1,300 を超える公開データセットに対して国内の高速ダウンロード ノードを提供
* 400 以上の古典的で人気のあるオンライン チュートリアルが含まれています
* 100 以上の AI4Science 論文ケースを解釈
* 500 以上の関連用語クエリをサポート
*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします
学習の旅を始めるには、公式 Web サイトにアクセスしてください。