3日までカウントダウン!今すぐ Apple の WWDC24 ライブ ブロードキャストの予約をしてください。RLAIF-V 大規模なマルチモーダル嗜好データ セットがオンラインになり、さまざまな MLLM の幻覚現象が効果的に軽減されます。

特色图像

6 月 3 日から 6 月 7 日までの hyper.ai 公式 Web サイトの更新の概要:

高品質の公開データセット: 10

高品質なチュートリアルセレクション: 2

コミュニティ記事の選択: 3 件の記事

人気のある百科事典のエントリ: 5

6月~7月の提出期限: 5

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. ChartQA チャート問題ベンチマーク データセット

このデータセットは、人間が書いた 9.6,000 件の質問と、人間が書いた図の要約から生成された 23.1,000 件の質問をカバーしており、視覚的および論理的推論を含む複雑な問題を解決できるように設計されています。

直接使用します:https://go.hyper.ai/5tJE9

2. RS5M大規模画像・テキストペアリモートセンシングデータセット

RS5M データセットには、英語の説明が付いた 500 万枚のリモート センシング画像が含まれています。このデータセットは、事前にトレーニングされた視覚言語モデル (VLM) を使用して、公開されている画像とテキストのペアのデータセットとラベル付きリモート センシング (RS) データセットをフィルタリングすることによって取得されました。
直接使用します:https://go.hyper.ai/jbwsV

3. CapsFusion-120M マルチモーダル グラフィックおよびテキスト データ セット

このデータセットには、LAION-2B および LAION-COCO データセットからの画像およびテキスト情報が含まれており、大規模なマルチモーダル事前トレーニングに使用したり、画像およびテキスト データの品質をさらに調査したりするために使用できます。

直接使用します:https://go.hyper.ai/pEE7u

4. ShareGPT4V 大規模で高品質なグラフィックおよびテキスト データ セット

データセットには 120 万の画像とテキストのペアが含まれており、視覚的特徴と言語的特徴を効果的に調整し、指示に従うモデルの能力を強化し、ScienceQA、TextVQA、SBU などのより学術的なタスクを組み込んでいます。

直接使用します:https://go.hyper.ai/9CVao

5. RLAIF-V-Dataset 大規模なマルチモーダル嗜好データセット

RLAIF-V データセットは、AI によって生成されたマルチモーダルな嗜好データセットで、さまざまなタスクとドメインをカバーします。このデータセットには 44,757 を超える高品質のアライメントが含まれており、マルチモーダル大規模言語モデルのトレーニングと評価に使用されます。

直接使用します:https://go.hyper.ai/cG6fp

6. FoodLogoDet-1500 高品質食品ロゴ検出データセット

データセットは、1,500 のカテゴリ、99,768 個の画像、145,400 個のオブジェクトで構成されています。これは、公的に利用可能な最初で最大の食品ラベル検出データセットです。

直接使用します:https://go.hyper.ai/eco23

7. ZSFooD 食品画像データセット

このデータセットには、10 のレストラン シーンで収集された 20,603 の食品画像が含まれており、各シーンには境界ボックスで注釈が付けられた複数の食品オブジェクトがあり、95,322 の境界ボックスと 291 のクラスで構成されています。

直接使用します:https://go.hyper.ai/6xrrC

8. Food-1K 食品画像データセット

このデータセットには、1,000 を超えるきめ細かい食品カテゴリと 500,000 枚を超える画像が含まれており、ICCV 2021 で開催された大規模なきめ細かい食品分析コンテスト Workshop LargeFineFoodAI で使用されました。

直接使用します:https://go.hyper.ai/sjZJi

9. ISIA Ingredient-201 成分画像データセット

このデータセットには 201 のサブカテゴリがあり、既存の食品成分カテゴリの一般的なタイプをカバーしています。食材画像は食品に関する 5 つのシーンで収集され、各シーンには少なくとも 150 の食品カテゴリが収集されます。

直接使用します:https://go.hyper.ai/bGe45

10. ISIA Food-500 食品料理データセット

データセットには 399,726 の食品が含まれており、合計 500 を超える料理が含まれています。各項目には食べ物の名前と食べ物の写真が含まれています。

直接使用します:https://go.hyper.ai/yqco5

その他の公開データセットについては、以下をご覧ください。

https://hyper.ai/datasets

選択された公開チュートリアル

1. ComfyUI DynamiCrafter チュートリアル | AI ビデオ生成を覆す!数分で画像をビデオに変換し、細部を完璧に調整できます

香港中文大学やテンセントAI研究所などが発表したDynamiCrafterモデルは、ビデオ拡散技術を利用して現実世界の動きのパターンをシミュレートし、テキストコマンドと組み合わせることで写真をダイナミックビデオに変換できる。このチュートリアルでは、誰でも ComfyUI のワークフロー環境をセットアップできます。ノード接続エラーを心配する必要はありません。操作するには、画像をアップロードしてテキストを入力するだけです。

オンラインで実行:https://go.hyper.ai/PWzJR

2. 待ってはいけません! GLM-4-9B-Chat Demoをぜひ体験してください

今週、Zhipu AI は、初めてマルチモーダル機能を備えたベース大型モデル GLM-4 - GLM-4-9B の最新のオープンソース成果をリリースしました。 「Llama3-8Bを超える」と主張するこのオープンソースモデルを誰もが初めて体験できるように、Super Neuroは「GLM-4-9B-Chat Demo」チュートリアルを開始しました。コマンドを入力する必要はなく、クローンをクリックすると、すぐに GLM-4-9B-Chat の優れたパフォーマンスを体験し始めます。

オンラインで実行:https://go.hyper.ai/hc5OK

注目のコミュニティ記事

1. タンパク質の方向性進化を導く実験データは存在しない。上海交通大学のホン・リャン研究グループは、微環境知覚マップニューラルネットワーク ProtLGN を発表した。

上海交通大学のHong Liang氏の研究グループは、PROTLGN微環境センシングマップニューラルネットワークを提案した。これは、タンパク質の三次元構造から有益なアミノ酸変異部位を学習および予測でき、単一部位変異および複数部位変異の設計を導く。異なる機能を持つタンパク質において、Super 40% PROTLGN で操作された単一点変異タンパク質は、対応する野生型タンパク質よりも優れた性能を発揮しました。関連する成果は「JCM」に掲載されています。

レポート全体を表示します。https://go.hyper.ai/6FkFu

2. リチウム電池の性能限界を再構築するために、武漢理工大学の Kang Jianqiang チームは、統合学習に基づいた簡素化された電気化学モデルを提案しました。

武漢理工大学のKang Jianqiang氏のチームは、統合学習(ELM)+FIEの簡略化された電気化学モデルモデルを提案した。 ELM は固相電極のリチウム イオン濃度を正確に予測し、単一モデルよりも正確な電圧予測を実現します。また、計算の複雑さも P2D モデルよりもはるかに低くなります。 FIE は、正極と負極の集電体付近の電解液中のリチウム イオン濃度を正確に予測します。

レポート全体を表示します。https://go.hyper.ai/CWvce

3. ポストムーア時代に向けてマイクロエレクトロニクスが加速!復旦大学の梅永峰氏の研究グループは、DNN とナノフィルム技術を統合して入射光の角度を正確に分析

復旦大学材料科学部の梅永峰教授の研究グループは、マルチレベル準静的有限要素解析法を提案し、6種類のシリコン/クロムナノフィルム集合体の三次元微細構造と対応する三次元光検出器を設計・構築した。 、技術の優れた汎用性と産業上の実用性を検証します。関連する結果は「Nature」誌に掲載されています。

レポート全体を表示します。https://go.hyper.ai/2s73Q

人気のある百科事典の項目を厳選

1. 核の規範

2. マスクされた言語モデリング MLM

3. 長期記憶と短期記憶 長短期記憶

4. YOLOv10 リアルタイムのエンドツーエンドのオブジェクト検出

5. コルモゴロフ・アーノルド・ネットワーク

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://hyper.ai/wiki

ステーションBのライブブロードキャストプレビュー

Apple は北京時間 6 月 11 日 (来週の火曜日) に WWDC24 を開催します。その際、HyperAI スーパー ニューラル ビデオ アカウントとステーション B がリアルタイムでブロードキャストします。ライブブロードキャストの予約をするためにコードをスキャンしてください。 ↓

Apple についてさらに詳しく知るために、Super NeuroB Station の生放送ルームでは、今後も「Apple Special Topic」の動画を放送していきます。含まれるもの: 過去の WWDC カンファレンス、幹部インタビュー、関連ドキュメンタリー、その他の豊富なコンテンツ。

次の表は、編集者が全員に向けて選択したコンテンツのプレビューです↓↓↓

日付時間コンテンツ
6月10日月曜日18:00ジョブズ略歴
6月11日火曜日1:00アップルWWDC24
6月12日水曜日18:00Apple を Apple たらしめているものは何ですか?
6月13日(木)18:00iPhone初の発売カンファレンス
6月14日金曜日18:00スティーブ・ジョブズの歴史
6月15日土曜日18:00Appleは破産寸前をどうやって生き延びたのか
6月16日(日)18:00ティム・クックの歴史

スーパー ニューラル TV ステーションは、7 時間 24 日中断のない生放送を放送しており、ワンクリックで AI 分野の「電子マスタード」を収穫できます。

http://live.bilibili.com/26483094

6月~7月の締め切り会議

主要な人工知能学会をワンストップで追跡:https://hyper.ai/events

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。

また来週お会いしましょう!

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1,200 を超える公開データセットに対して国内の高速ダウンロード ノードを提供

* 300 以上の古典的で人気のあるオンライン チュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai