HyperAI超神経

MMLU-Pro ベンチマーク テスト データ セットはオンラインであり、12,000 の学際的な複雑な問題が含まれているため、難易度が高く、より挑戦的です。 DeepSeek 数学モデルのワンクリック展開

特色图像

大規模言語モデル (LLM) が急成長する時代において、大規模マルチタスク言語理解 (MMLU) などのベンチマークは、さまざまな分野で AI の言語理解と推論能力を限界まで押し上げる上で重要な役割を果たします。

ただし、モデルの継続的な改善と最適化により、これらのベンチマーク テストにおける LLM のパフォーマンスは徐々に安定してきており、異なるモデルの機能の違いを区別することがますます困難になってきています。

LLM の機能をより適切に評価するために、ウォータールー大学、トロント大学、カーネギーメロン大学の研究者は共同で MMLU-Pro データセットをリリースしました。このデータセットは、元の MMLU データセット、STEM Web サイト、TheoremQA、およびサイエンスベンチなどデータセットは hyper.ai でダウンロードできるようになりました。記事をドロップダウンしてリンクを取得してください~

9 月 9 日から 9 月 14 日までの hyper.ai 公式 Web サイトの更新の概要:

* 高品質の公開データセット: 10

* 高品質なチュートリアルのセレクション: 3

* コミュニティ記事選択: 4 記事

* 人気のある百科事典のエントリ: 5

※9月締切:3日

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. MMLU-Pro 大規模マルチタスク理解データセット

MMLU-Pro データセットは、大規模な言語モデルの機能をより厳密にベンチマークするように設計された、より強力でやりがいのある大規模なマルチタスク理解データセットです。このデータセットには、分野にわたる 12,000 の複雑な問題が含まれています。

直接使用: https://go.hyper.ai/PwJDW

2. DeepGlobe18 道路抽出データセット

Road Challenge のトレーニング データには、サイズ 1024 × 1024 の 6,226 個の RGB 衛星画像が含まれています。画像の解像度は 50 cm ピクセルで、DigitalGlobe の衛星によって収集されました。

直接使用: https://go.hyper.ai/VIg0J

3. OpenForensics 顔偽造検出データセット

データセットは、野生の 115,000 枚の画像と 334,000 の顔で構成されており、すべて偽のクラス、境界ボックス、セグメンテーション マスク、偽の境界、一般的な顔のランドマークを含む豊富な顔の注釈が付いています。また、さまざまな背景と複数の年齢、性別、姿勢、人の位置と顔の咬み合わせ。

直接使用: https://go.hyper.ai/jTTRz

4. DeepfakeTIMIT ディープフェイク検出データセット

このデータセットには、オープンソースの敵対的生成ネットワーク (GAN) ベースのアプローチを使用して交換された顔のビデオが含まれています。これらのビデオは、独自のオートエンコーダーベースのディープフェイク アルゴリズムに基づいて作成されています。

直接使用: https://go.hyper.ai/me1TI

5. SESYD合成文書データベース

このデータセットには、ベースラインの実情報を含む文書画像が含まれており、284k の画像、190k のシンボル、284k の文字を含む 11 セットで構成されており、主に文書画像分析の分野における 2 つの主要な研究課題を対象としています: (1) オンライン描画画像 (シンボルなど)平面図や回路図での認識と位置決め) (2) 地理的地図での文字の分割と認識。

直接使用: https://go.hyper.ai/ZqRTQ

6. LAV-DF マルチモーダル DeepFake オーディオビジュアル データ セット

LAV-DF は、VoxCeleb2 データセットから派生したマルチモーダル (ビデオ改ざんおよびオーディオ改ざん) データセットで、36,431 件の本物のビデオと 99,873 件のフェイク ビデオを含む 136,304 件のビデオが含まれています。

直接使用: https://go.hyper.ai/ujock

7. Vibrent 洋服レンタル データセット 洋服レンタル データセット

このデータセットには、64,000 件のトランザクション、2,2,000 人の匿名ユーザーのレンタル履歴記録、および 15,800 点の固有の衣類セットが含まれており、各物理オブジェクトの属性とレンタル履歴が詳細に記録されています。すべての衣類は個別のアイテムまたはそれに対応する製品グループとしてリストされており、これは個々のアイテム間で共有されるデザインを指し、各衣類にはその属性の一部を説明する一連のタグが付いています。

直接使用します:https://go.hyper.ai/PFlKA

8. FFIW10K 顔偽造データセット

このデータには、Youtube から収集された 10,000 個の高品質のフェイク ビデオが含まれており、各ビデオには本物の顔と偽の顔が含まれており、実際の複雑なシーンに近くなります。操作プロセスは完全に自動化されており、ドメイン敵対的品質評価ネットワークによって制御されているため、データセットの拡張性が高く、人件費が低く抑えられています。

直接使用: https://go.hyper.ai/AHS7y

9. ForgeryNet 顔偽造データセット

このデータセットには 290 万枚の画像と 221,247 件のビデオが含まれており、世界中の 7 つの画像レベルと 8 つのビデオレベルの偽造操作方法をカバーしています。このデータ セットは、画像およびビデオ レベルで 4 つのタスク (画像偽造分類、空間偽造位置特定、ビデオ偽造分類、および時間偽造位置特定) をサポートするための豊富なリソースを研究者に提供します。

直接使用: https://go.hyper.ai/Yx0mj

10. EEG Eve State Dataset 眼球状態脳波データセット

このデータセットには、目が開いているか閉じているかが出力される EEG 測定のインスタンスが含まれています。データセット内の値は時系列に並べられており、0 は目が開いた状態を表し、1 は目が閉じた状態を表します。データセットには、AF3、F7、F3、FC5、T7、P、O1、O2、P8、T8、FC6、F4、F8、AF4 とラベル付けされた 14 個の EEG 測定値が含まれています。

直接使用します:https://go.hyper.ai/RTBDy

その他の公開データセットについては、次のサイトをご覧ください。:

https://hyper.ai/datasets

選択された公開チュートリアル

1. 1つ主要な展開 DeepSeek-Prover-V1.5

このモデルは、2024 年に DeepSeek によってオープンソース化された数学定理証明モデルです。研究チームはこのモデルを Lean 4 で導入しました。このモデルは、自己反復とリーン証明者の監視を通じて「囲碁」スタイルの学習環境を構築します。このチュートリアルは、モデルのワンクリック展開を段階的にデモンストレーションします。

直接使用: https://go.hyper.ai/MevMB

2. LLaVA OneVision マルチモーダル全天ビジョンモデル デモ

このモデルは、画像、テキスト、画像とテキストのインターリーブ入力、およびビデオを処理でき、これら 3 つの重要なコンピューター ビジョン シナリオにおけるオープン マルチモーダル モデルのパフォーマンスのボトルネックを同時に突破できる最初の単一モデルです。公式 Web サイトにアクセスしてコンテナをクローンして起動し、API アドレスを直接コピーすると、モデルで推論を実行できます。

直接使用する:https://go.hyper.ai/Dcg74

3. オンラインチュートリアル|先生、ヴィンセント絵画の時代がまた変わりました! SD の中心メンバーが独自のビジネスを立ち上げ、最初のモデル FLUX.1 が SD 3 と Midjourney に強化されました

ヴィンセント図モデルの競争は激化しています。 Stable Diffusion の元中心メンバーが起業し、商用利用からオープンソースの個人利用までをカバーする Vincent ダイアグラム モデル FLUX をリリースしました。生成されたエフェクトは実際のショットに非常に近く、キャラクターの詳細は非常にリアルです。現在、hyper.ai では「FLUX ComfyUI (Black Myth Wukong LoRA training version を含む)」を起動しており、以下のリンクをクリックしてチュートリアルに従ってデプロイしてください。

直接使用する使用:https://go.hyper.ai/trQhv

注目のコミュニティ記事

1. データセット概要|ディープフェイクは混沌に満ちている、魔法を使って魔法を倒す!高品質のデータセットが偽造品検出技術の開発をサポート

顔認識とディープフェイクの混乱に関しては、改ざんされた画像やビデオを正確に判断するために、顔認識と偽造検出技術をアップグレードすることが急務となっています。 HyperAI は、誰でも使用できる 11 の一般的に使用される顔認識およびディープフェイク データ セットをコンパイルしており、ワンクリックでダウンロードできます。

完全な概要を参照してください。https://go.hyper.ai/EMKo2

2. Apple Intelligence が深夜に爆発! Apple、4つの自社開発チップをリリース、iPhone/iWatch/AirPodsがアップグレード

Appleは9月10日の秋の新製品発表会で、自社開発チップを搭載し、性能も大幅に向上したiPhone 16、AirPods 4、Apple Watch Series 10などの新製品を発表した。 Apple Intelligence と完全に統合されており、ユーザーに前例のないスマートなエクスペリエンスをもたらします。この記事は、Appleの秋の新製品発表に関する包括的なレポートです。

レポート全体を表示します。https://go.hyper.ai/H7P8X

3. 感度が向上した56%、香港チャイニーズ/復丹/エール大学などが共同で新たなタンパク質ホモログ検出法を提案

タンパク質同定のプロセスにおいて、タンパク質配列相同性の同定は重要なタスクの 1 つです。タンパク質の遠隔相同性研究の問題点をタンパク質言語モデルと高密度検索技術に基づいて解決するために、香港中文大学のLi Yu氏、復旦大学知能複雑システム研究所の若手研究者Sun Siqi氏、および上海人工知能研究所とイェール大学の Mark Gerstein は、超高速かつ高感度のホモログ検出フレームワークである高密度ホモログ サーチャーを提案しました。この記事は研究論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/vLAej

4. 北京師範大学のチームは、2,500 平方キロメートルの実生活データに基づいて、高空間解像度の画像予測を実現する StarFusion モデルを提案しました。

北京師範大学地球表面プロセス・資源生態学国家重点研究室のChen Jin氏のチームは、デュアルストリーム時空間デカップリング融合アーキテクチャモデルStarFusionを提案した。このモデルは、既存の深層学習アルゴリズムのほとんどがHSR時系列画像を必要とするという問題を克服できる。高空間解像度画像の予測を完全に実現します。この記事は研究論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/7LmzA

人気のある百科事典の項目を厳選

1. シグモイド関数

2. 対応のある t 検定対応のある t 検定

3. 対照学習

4. 半教師あり学習

5. データの拡張

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://go.hyper.ai/wiki

主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1,300 を超える公開データセットに対して国内の高速ダウンロード ノードを提供

* 400 以上の古典的で人気のあるオンライン チュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai