HyperAI超神経

メタ初のマルチモーダル大型モデルをワンクリックで起動可能!最初の多針刺繍データセットがオンラインに公開され、30,000 を超える画像が含まれています

特色图像

Xiao Zha 氏は、Meta Connect 2024 の基調講演で、初のマルチモーダル大型モデル Llama 3.2 ビジョンの立ち上げを発表しました。このモデルには 11B と 90B の 2 つのバージョンがあり、マルチモーダル タスクをサポートする最初の Llama シリーズ モデルとなっています。公式データによると、これら 2 つのオープンソース モデルのパフォーマンスはクローズドソース モデルを上回っています。

編集者はそれを展開するのが待ちきれません。そして、11B モデルのワンクリック導入チュートリアルが hyper.ai 公式 Web サイトで初めて公開されました。みなさんも推理体験にぜひご参加ください〜

オンラインで実行:https://go.hyper.ai/DKGzm

9 月 23 日から 9 月 27 日までの hyper.ai 公式 Web サイト更新の概要:

* 高品質の公開データセット: 10

* 高品質なチュートリアルのセレクション: 2

* コミュニティ記事の選択: 3 記事

* 人気のある百科事典のエントリ: 5

※10月の提出締切:7日

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1.MSEmbGAN多針刺繍データセット

このデータセットは、単一針および複数針のラベルで詳細な注釈が付けられた最初の刺繍データセットです。刺繍画像と対応するコンテンツ画像を含む 30,000 を超える画像が、プロ仕様の刺繍ソフトウェア (Wilcom 9.0) によって作成されました。この記事は、構築された多針刺繍データセットをこの研究分野の他の研究者に提供します。

直接使用します:https://go.hyper.ai/urNGE

2. Movies Dataset 映画情報データセット

このデータセットには、完全な MovieLens データセット内の 45,000 本の映画の詳細なメタデータが含まれており、すべて 2017 年 7 月より前にリリースされました。このデータセットには、ポスター、背景、予算、収益などの映画に関する基本情報だけでなく、公開日、言語、制作国、会社などの詳細も含まれています。

直接使用します:https://go.hyper.ai/SDwXX

3. X-Embodiment の実際のロボット データ セットを開く

このデータセットには、単腕ロボットから両手ロボット、四足ロボットまで、22 種類の異なるロボットに関するデータがまとめられており、21 の異なる機関が協力して収集したもので、527 の異なるスキルと 160,266 のタスクがカバーされています。これは、世界中の 34 のロボット研究研究所から 60 の既存のロボット データセットを集めて構築され、さまざまなロボットのタスクと環境を実証しています。

直接使用します:https://go.hyper.ai/Cqlw6

4. TMDB 5k Movie Dataset 映画情報データセット

このデータセットには、過去 100 年間 (1916 ~ 2017 年) の主に米国の 5k 映画に関する詳細情報が含まれています。このデータセットは、研究者やアナリストが映画業界で人気のトレンドや投資の方向性を調査できるようにするとともに、映画業界への新規参入者に参考となる提案を提供できるように設計されています。

直接使用します:https://go.hyper.ai/zaRFY

5. LongCite-45k 大規模モデルのきめ細かい改善データセット

このデータ セットには、文レベルの参照を含む 44,600 の高品質な質問と回答のデータが含まれており、最大 128,000 トークンの長文処理をサポートし、ユーザーはきめ細かい文レベルの参照を生成することで模範解答の精度を検証できます。

直接使用します:https://go.hyper.ai/omO5f

6.完全な TMDB 映画データセット 2024 映画データセット

TMDb (映画データベース) は、TMDB データベースからの 1,000,000 の映画のコレクションを含む包括的な映画データベースであり、タイトル、評価、公開日、収益、ジャンルなどの詳細を含む映画に関する情報を提供します。

直接使用します:https://go.hyper.ai/r9ks2

7. InfiMM-WebMath-40B マルチモーダル数学的推論データ セット

このデータセットは、数学的推論タスク用に特別に設計された大規模なオープンソースのマルチモーダル データセットで、2.4k の Web ページ、850 個の関連画像 URL、および 400 億個のトークンが含まれており、これらはすべて CommonCrawl データベースから慎重に抽出およびフィルタリングされています ( 2019 ~ 2023 年)。

直接使用します:https://go.hyper.ai/P8m9l

8. VoiceAssistant - 400K 音声アシスタント最適化データセット

VoiceAssistant-400K は、音声アシスタント用に特別に最適化されたデータ セットで、音声アシスタント サービスを提供する際にモデルがコード シンボルの生成を削減し、実際のアプリケーションでのモデルの実用性を高めるのに役立つように設計されています。

直接使用します:https://go.hyper.ai/KGIM0

9. オールタイムミュージックアルバムレビューデータセットの上位5,000枚のアルバム

このデータセットには以下が含まれます http://rateyourmusic.com コミュニティによって投票された、史上最もホットな 5,000 枚のアルバム。このデータセットは、2021 年 10 月 12 日にクロールして取得されたもので、ランキング、アルバム名、アーティスト名、リリース日、ジャンル、説明、平均評価、評価数、レビュー数の属性が含まれています。

直接使用します:https://go.hyper.ai/c4Olt

10. Spotify デイリートップ 200 曲音楽ソングトレンドデータセット

このデータセットには、2017 年から 2021 年までの世界中の毎日の Spotify トップ 200 曲リストが含まれています。このデータセットは 350,000 曲以上をカバーしており、研究者や音楽愛好家に人気のトレンド、音楽の好み、その他の関連研究を分析するための豊富な情報を提供します。

直接使用します:https://go.hyper.ai/afvbK

その他の公開データセットについては、以下をご覧ください。

https://hyper.ai/datasets

選択された公開チュートリアル

1. Llama-3.2-11B-Vision-Instruct のワンクリック展開

このモデルは、Llama 3.2-Vision マルチモーダル大型モデル シリーズの 11B パラメータ サイズで、高解像度画像入力 (1120 × 1120 ピクセル) をサポートし、ベース モデルの完成と命令調整されたチャット バリアントによるクロス アテンション メカニズムを使用します。公式 Web サイトにアクセスしてコンテナをクローンして起動し、API アドレスを直接コピーすると、モデルで推論を実行できます。

直接使用します:https://go.hyper.ai/DKGzm

2.ComfyUl Littletinies 童話イラスト生成デモ

このモデルは、テキスト プロンプトに基づいて手描きの漫画スタイルの画像を生成できます。このモデルは、古典的な漫画の美学を備えた風変わりで様式化されたイラストを作成し、手描きのテクスチャ、滑らかなブラシストローク、パステル カラーの画像を作成するのに特に適しています。モデルと環境がデプロイされており、チュートリアルのガイドラインに従って推論生成を実行できます。

直接使用します:https://go.hyper.ai/YHu0a

また、Stable Diffusion チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に注目し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりするためにグループに参加してください。

注目のコミュニティ記事

1. 刺繍模様を賢く生成できる!武漢紡織大学のビジュアルコンピューティングとデジタルテキスタイルチームが初のマルチステッチ刺繍生成敵対的ネットワークモデルを発表、トップジャーナルTVCGに受理された

武漢紡績大学コンピューター人工知能学部の胡鑫栄氏の研究グループは、マルチステッチ刺繍生成敵対的ネットワークモデル MSEmbGAN を提案し、最大の刺繍データセットを作成しました。関連論文は現在、トップジャーナル TVCG にも掲載されています。この記事は、論文の詳細な解釈と共有です。

完全な概要を参照してください。https://go.hyper.ai/5t8NQ

2. 権威ある雑誌 Cell Discovery からの新しい結果!上海交通大学のHong Liang氏のチームは、超低コストかつ完全自動で機能性タンパク質を設計するCPDiffusionモデルを提案した。

上海交通大学のHong Liang氏のチームは、非常に低いトレーニングコストとデータコストでタンパク質の配列、構造、機能の間の暗黙のマッピング関係を学習できる拡散確率モデルフレームワークを設計し、それによって多様なタンパク質配列を生成した。この記事は、論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/ziRvz

3. ECCV 2024に選出されました! 5.4w+ 画像をカバーする MIT は、SAM よりも優れたパフォーマンスを備えた医療画像セグメンテーションの一般的なモデルである ScribblePrompt を提案しました

MIT コンピュータ サイエンスおよび人工知能研究所のチームは、マサチューセッツ総合病院およびハーバード大学医学部の研究者と協力して、ニューラル ネットワークに基づくインタラクティブな生物医学画像セグメンテーションの一般モデル ScribblePrompt を提案しました。このセグメンテーション ツールにより、アノテーターは生物医学画像を柔軟に実行できます。トレーニングされていないラベルや画像タイプであっても、落書き、クリック、境界ボックスなどのさまざまな注釈方法を使用した画像セグメンテーション タスク。この記事は、論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/QQjAf

人気のある百科事典の項目を厳選

1. シグモイド関数

2. 対応のある t 検定対応のある t 検定

3. 対照学習

4. 半教師あり学習

5. データの拡張

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://go.hyper.ai/wiki

主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。

また来週お会いしましょう!

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1,300 を超える公開データセットに対して国内の高速ダウンロード ノードを提供

* 400 以上の古典的で人気のあるオンライン チュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai