HyperAI超神経

Microsoft と Tencent はテクノロジーで競合し、TRELLIS は 3D 生成の分野でマルチフォーマットのサポートで新たな方向性をリードしています。5,000 を超える質問があります。 VIS-Bench で AI に「空間記憶」を学習させる

特色图像

昨年 11 月、テンセントは Hunyuan3D 生成モデルを発表しました。これは、3D のテキストと画像の両方の生成をサポートする業界初のオープンソースの大規模モデルです。それから 1 か月も経たないうちに、Microsoft は 3D アセット生成の分野での競争に参加するための新しいフレームワーク TRELLIS をリリースしました。 TRELLIS は、放射線フィールド、3D ガウス、グリッドなどのマルチフォーマット出力をサポートし、さまざまなニーズに最大限の柔軟性を提供します。

両方のモデルが hyper.ai の公式 Web サイトに掲載されていますので、どちらが良いか試してみてください。

オンラインでHunyuan3Dを使用します:https://go.hyper.ai/Rsrno

TRELLIS をオンラインで使用する:https://go.hyper.ai/JE5s5

1 月 6 日から 1 月 11 日までの hyper.ai 公式 Web サイトの更新の概要:

* 高品質の公開データセット: 10

*厳選された高品質なチュートリアル: 6

* コミュニティ記事の選択: 8 記事

* 人気のある百科事典のエントリ: 5

※1月締切:7日

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. VSI-Bench 視覚空間知能ベンチマーク テスト セット

このデータ セットには 5,000 を超える質問と回答のペアが含まれており、住宅、オフィス、工場などのさまざまな環境を含む 290 近くの実際の屋内シーンのビデオをカバーし、物体認識、位置関係、行動予測などの多くの側面をカバーしています。

直接使用します:https://go.hyper.ai/q0DYA

VSI-Bench のタスクデモ

2. 顔特徴抽出データセット 顔特徴抽出データセット

このデータセットは、750 枚の画像を含むラベル付きデータセットで、顔の眉毛、目、鼻、唇、ひげの領域を検出するために使用されます。データのラベル付けプロセスは Roboflow で実行され、YOLOv8 形式でエクスポートされます。

直接使用します:https://go.hyper.ai/O3kER

データセットの例

3. 感情と感情の分析データセット 感情と感情の分析データセット

データセットには、422,000 のセンチメント分析文と、補足として 3,309 個のセンチメント分析文が含まれています。感情分析では、喜び、悲しみ、怒り、恐怖、愛、驚きの 6 つの異なる感情をタグ付けします。

直接使用します:https://go.hyper.ai/wFNO6

4. Eurus-2-RL-Data 数理計画問題トレーニング データセット

このデータ セットは、強化学習トレーニングに特別に使用される高品質のデータ セットで、主に数学とプログラミングの問題を解くために使用されます。約 455,000 の数学の問題と 27,000 のプログラミングの問題が含まれています。

直接使用します:https://go.hyper.ai/Wdo1k

5. Medical o1 Reasoning SFT 医療推論データセット

このデータセットは、医療用大規模言語モデルである HuatuoGPT-o1 を微調整するために特別に設計されており、複雑な医療推論タスクにおけるパフォーマンスを向上させることを目的としています。データセットの構築は GPT-4o に依存しており、検証可能な医療質問を検索し、回答検証に医療バリデータを利用することでデータの正確性と信頼性を保証します。

直接使用します:https://go.hyper.ai/XMtXp

6. MCTS中国語簡体字データセット

このデータセットには、Penn Chinese Treebank (CTB) 標準に基づいてニュース コーパスから選択された複雑な構造を持つ 723 文が含まれており、各文には複数の人為的に簡略化されたバージョンが含まれており、最大かつ最も参照されている中国語テキスト削減評価データ セットとなっています。

直接使用します:https://go.hyper.ai/UR3CN

7. educhat-sft-002-data-osm 教育分野の対話データセット

このデータ セットには 400 万のデータ ポイントが含まれており、自由質疑応答、エッセイの添削、ヒューリスティックな指導、感情的サポート、コースのコーチングなど、さまざまな教育分野のデータが含まれています。

直接使用します:https://go.hyper.ai/nQw0K

8. GOAT算術タスク微調整データセット

このデータセットには、dataset.json と dataset.ipynb という 2 つのファイルがあります。 dataset.json ファイルには、算術タスク用に dataset.ipynb によって生成された約 170 万の合成データが含まれています。

直接使用します:https://go.hyper.ai/8ZAvG

9. NaturalProofs の数学的推論データセット

このデータセットは、自然言語で数学的推論を研究するためのマルチドメイン コーパスであり、約 30,000 の定理ステートメントと証明、15,000 の定義、および 2,000 の追加ページ (公理、系譜など) がすべて自然言語で書かれています。

直接使用します:https://go.hyper.ai/Bk4WE

10. TransGPT-pt&sft 交通対話事前トレーニング データセット

このデータセットは、中国初の包括的な交通モデルであるTransGPTの一部であり、現場での事前トレーニングに使用される約346,000件の交通分野のテキストデータと、微調整用の約58,000件の交通分野の対話データが含まれています。

直接使用します:https://go.hyper.ai/vuDHa

選択された公開チュートリアル

1. Hunyuan3D: わずか 10 秒で 3D アセットを生成

Hunyuan3D は、軽量バージョンと標準バージョンを含む 3D 生成拡散モデルで、どちらもテキストと画像の入力から高品質の 3D アセットの生成をサポートします。定性的および定量的な多次元評価の後、Hunyuan3D-1.0 は、幾何学的詳細、テクスチャ詳細、テクスチャとジオメトリの一貫性、3D 合理性、および指示への準拠性の点で非常に優れたパフォーマンスを発揮しました。

このチュートリアルは Hunyuan3D の軽量バージョンであり、下のリンクをクリックしてチュートリアルのガイドラインに従って 3D モデルの生成を体験してください。

オンラインで実行:https://go.hyper.ai/Rsrno

エフェクト例

2.  TRELLIS: Microsoft のオープンソース 3D アセット生成モデルのデモ

TRELLIS は、2024 年に Microsoft チームによって開発されたグラフ ニューラル ネットワークに基づく解釈可能フレームワークです。グラフ構造データの特性を学習することで、効率的なモデルの解釈可能性を提供することを目的としています。

モデルと環境がデプロイされているので、チュートリアルのガイドラインに従って、大きなモデルを使用して画像を 3D 画像に変換できます。

オンラインで実行:https://go.hyper.ai/JE5s5

エフェクト例

3.ChatGLM2-6b-32k を迅速に導入する

ChatGLM-6B は、中国語と英語のバイリンガルをサポートするオープンソースの会話言語モデルであり、一般言語モデル (GLM) アーキテクチャに基づいており、62 億のパラメーターがあります。モデル量子化テクノロジと組み合わせると、ユーザーは最小 6 GB のビデオ メモリを備えた民生用グラフィック カードでローカル (INT4 量子化) を実行できます。

チュートリアルの手順に従い、生成された API アドレスを直接コピーして ChatGLM-6B を使用します。

オンラインで実行:https://go.hyper.ai/B0b7V

モデルの Web インターフェイス

4. 自然言語処理に NLTK を使用する

NLTK は、自然言語データを使用して Python プログラムを作成するための最も人気のあるプラットフォームの 1 つです。分類、トークン化、ステミング、タグ付け、解析、意味論的推論のためのテキスト処理ライブラリに加えて、50 を超える大規模な構造化テキスト データセット (コーパス) と語彙リソースへのシンプルなインターフェイスを提供します。

このチュートリアルでは、NLTK を使用してテキスト処理段階でさまざまな NLP 操作を実行し、感情分析テキスト分類用の NLTK ツールを利用して Keras モデルを作成する方法を紹介します。

オンラインで実行:https://go.hyper.ai/BFZ10

単語の頻度分布の例

5. オーディオ LDM オーディオ編集チュートリアル

AudioLDM は、任意のテキスト入力が与えられた場合にリアルなオーディオ サンプルを生成できる、潜在的なテキストからオーディオへの拡散モデルです。 AudioLDM はテキスト プロンプトを入力として受け取り、対応する音声を予測します。テキスト条件付きの音響効果、人間の音声、音楽を生成できます。

このプロジェクトでは、Gradio インターフェイスを介してフロントエンドのインタラクティブ インターフェイスを生成できます。関連するモデルと依存関係がデプロイされているので、オーディオを編集できます。

オンラインで実行:https://go.hyper.ai/BCOWL

6. ShowUI: GUI 自動化に焦点を当てた視覚言語アクション モデル

ShowUI モデルは、画面インターフェイスのコンテンツを理解し、クリック、入力、スクロールなどの対話型アクションを実行することにより、Web およびモバイル アプリケーションのシナリオをサポートし、複雑なユーザー インターフェイス タスクを自動的に完了できます。 ShowUI は、スクリーンショットとユーザー コマンドを解析して、インターフェイス上のインタラクションを予測できます。

このチュートリアルでは、モデルのワンクリック デモ デプロイメントを提供します。モデルを体験するには、コンテナーを複製して起動し、生成された API アドレスを直接コピーするだけです。

オンラインで実行:https://go.hyper.ai/reHs7

モデルの Web インターフェイス

💡安定拡散チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] にメモし、グループに参加してさまざまな技術的な問題について話し合い、アプリケーションの効果を共有してください。

注目のコミュニティ記事

1. トップ 10 のクリスマス データセットの概要: 過去 10 年間のヒット曲/プレゼントの欲しいものリスト/レシピ/クリスマスの Twitter コピー…

クリスマス期間中、HyperAI はオンライン利用と高速ダウンロードをサポートする 10 個のクリスマス関連データ セットを用意しました。ぜひ体験してください。

データセットの概要を表示します。https://go.hyper.ai/if7Lc

2. コストが100倍下がりました!非営利団体 E11 Bio の新たな結果は、脳内の数百万の細胞間の接続をマッピングする

バイオテクノロジー企業 E11 Bio は、非常に低コストで脳全体の何百万もの細胞の接続関係をマッピングできる PRISM テクノロジーを発表しました。この一連のイノベーションにより、脳全体のコネクトミクスの全体的なコストが少なくとも 100 分の 1 に削減されると期待されています。 、人類の将来の探求への道を切り開く、脳は可能性を提供します。この記事は会社に関する詳細なレポートです。クリックしてすぐに読んでください。

レポート全体を表示します。https://go.hyper.ai/ISc4j

3. 多国籍政策/科学研究の躍進/先駆者/企業レイアウト... 2024 年の主要な AI4S 業界イベントをすべて 1 つの記事で読む

HyperAI Super Neural は、2024 年の科学用 AI 分野で大きな影響を与える出来事を整理し、目録を作成しました。クリックすると詳細レポートが表示されます。

レポート全体を表示します。https://go.hyper.ai/d2Dlv

4. 地球温暖化を逆転させるのは困難です。スタンフォード大学のチームは AI を使用して、90% の記録破りの可能性のある最大気温変化を予測しました。

地球温暖化の進行を背景に、まれな極端気象現象がより頻繁に発生し始めています。スタンフォード大学、コロラド州立大学、チューリッヒ工科大学の研究チームは、人工知能畳み込みニューラル ネットワーク システムを地球温暖化予測に使用し、たとえ急速な排出削減を達成できたとしても、地球の気温が上昇し続ける可能性がまだあることを発見しました。 。 高い。この記事は、論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/vDt3e

5. パデュー大学のチームは、人間の反応的な把握プロセスをシミュレートして、ロボット学習用のデータの効率的な触覚表現を実現しました。

パデュー大学博士課程3年生のXu Zhengtong氏は、「ロボット学習のためのデータ効率の良い触覚表現」をテーマに、ロボットの統一触覚表現のための反応性把握コントローラLeTac-MPCとUniTの2つの主要な科学研究結果を共有した。この記事は共有コンテンツの概要です。クリックしてすぐに読んでください。

レポート全体を表示します。https://go.hyper.ai/IPIjj

6. CASP、五大戦におけるタンパク質構造予測の風見鶏、南開大学の鄭偉氏:実用的な生物学的問題に焦点を当て、競争力と難易度の向上

CASP は、タンパク質構造予測のベンチマークとして業界で長い間考えられてきました。 このような背景から、HyperAI は、業界のベンチマークとして重要な国際コンペティションである CASP を通じて、Zheng Wei 教授に詳細なインタビューを行う機会に恵まれ、タンパク質構造予測分野における現在の開発傾向を分析しました。役立つ情報が満載ですので、クリックしてご覧ください。

レポート全体を表示します。https://go.hyper.ai/Y83iz

7. 30 年間の粘り強さを経て、MIT は次世代のリチウム電池を目指し、生成 AI を使用して固体電解質における大きな進歩を達成しました。

新しい研究で、MITと豊田研究所の研究チームは、ポリマー生成におけるさまざまな高度な生成モデルの複雑さを詳しく調査し、新しいGPTと拡散ベースのモデルポリマーのde novo設計アプローチを継続的に生成および評価できる方法を提案しています。電解質は実験的テストのための新しい候補を提供します。この記事は、論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/PDc8J

8. ただ!世界最速の GPU RTX 5090 の公式価格は 14,000 元以上、国家銀行の去勢版 5090 D の価格は 16,000 元以上

CES 2025 カンファレンスで、Nvidia RTX 5090 はこれまでで最速の GeForce RTX GPU として正式に発表され、初期価格は 14,000 元で、National Bank バージョンの 5090 D の価格は 16,000 元です。 RTX 5090 は、FP4 サポートも追加しています。前世代の製品と比較して、メモリ使用量が少なく、生成 AI モデルを 2 倍高速に実行できます。この記事は製品の詳細な紹介です。クリックしてすぐに読んでください。

レポート全体を表示します。https://go.hyper.ai/dyyZS

人気のある百科事典の項目を厳選

1. 核の規範

2. 対応のある t 検定対応のある t 検定

3. 大規模マルチタスク言語理解MMLU

4. シグモイド関数シグモイド関数

5. 最小二乗法

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://go.hyper.ai/wiki

1月の締め切り会議

主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。

また来週お会いしましょう!

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1700 を超える公開データ セットに対して国内の高速ダウンロード ノードを提供

* 500 以上の古典的で人気のあるオンライン チュートリアルが含まれています

* 200 以上の AI4Science 論文ケースを解釈

* 600 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai

最後に、「クリエイター インセンティブ プログラム」をおすすめします。興味のあるお友達はコードをスキャンして参加してください。