価値999! Apache CoC カンファレンスのチケットが無料で配布されます。ToT の大規模なモデル時間推論ベンチマーク データ セットがリリースされます。

7 月 26 日から 28 日まで、Apache は杭州で CommunityOverCode Asia 2024 (略称 CoC) を開催します。このカンファレンスでは、Apache コミュニティの構築と開発に関する最新情報と最先端の実践が紹介されます。 HyperAI は協力的なコミュニティとして参加するよう招待されました。会場の皆様に素敵なチェックイン アクティビティや豊富なギフトをご用意しましたので、ぜひブースで交流してください。
メリットがどんどん出てきます!全員に999元相当のイベントチケット5枚を用意しました。抽選形式での配布となります。「HyperAI Super Neural」公式アカウントをフォローすると抽選に参加できます。
7 月 15 日から 7 月 19 日までの hyper.ai 公式 Web サイトの更新の概要:
* 高品質の公開データセット: 10
* 高品質なチュートリアルのセレクション: 2
* コミュニティ記事選択: 4 記事
* 人気のある百科事典のエントリ: 5
※8月締切:4日
公式ウェブサイトにアクセスしてください:ハイパーアイ
公開データセットの選択
1. 大規模なモデル時間推論機能の時間ベンチマーク テスト データ セットのテスト
データセットは ToT と呼ばれ、3 つのサブセットに分割されています。ToT-semantic には 1,850 の例が含まれ、ToT-arithmetic には 2,800 の例が含まれ、ToT-semantic-large には 46,480 の例が含まれます。ToT は、LLM の時間理解と算術能力をそれぞれ検査します。 。
直接使用します:https://go.hyper.ai/D5089
このデータ セットには 50,000 を超える科学論文の画像データとテキスト データが含まれており、インターリーブされた画像とテキストの読解タスク用に特別に構築されています。
直接使用します:https://go.hyper.ai/DMmWq
このデータセットには 2,690 枚の注釈付き画像 (1,056 x 1,056 ピクセル) が含まれており、果物の品質管理タスクの研究に使用できます。
直接使用します:https://go.hyper.ai/03ytr
4. 1981 年から 2016 年までの主要作物の GDHY 世界履歴生産データセット
このデータセットは、1981 年から 2016 年までの世界の主要作物の過去の収量データを提供し、作物収量に対する気候変動の影響を分析し、地球規模のグリッド作物モデル シミュレーションを評価し、世界的および季節的作物予測システムの基礎を提供するために重要です。
直接使用します:https://go.hyper.ai/xNzH3
5. 大規模スペクトル画像分類用のWHU-OHSベンチマークデータセット
このデータセットは、中国の 40 以上の異なる場所の 42 枚の OHS 衛星画像で構成されています。トレーニング セット、検証セット、テスト セットには、それぞれ 4,822 個、513 個、2,460 個のサブ画像があります。
直接使用します:https://go.hyper.ai/OFxxR
6. VISO 大規模衛星ビデオ移動目標検出および追跡データセット
このデータ セットは、吉林 1 号衛星プラットフォームによってキャプチャされた解像度 12,000 × 5,000 ピクセルの高解像度ビデオで構成されており、衛星ビデオ分析分野の技術進歩を促進し、小さいターゲット サイズなどの既存の課題に対処することを目的としています。空間解像度の低下、外観やテクスチャ情報の制限などの問題。
直接使用します:https://go.hyper.ai/LcMbH
7. SAT-DS 大規模 3D 医用画像セグメンテーション データセット
このデータセットは現在最大の 3D 医用画像セグメンテーション データセットです。 72 の公開データ セット、CT、MR、PET の 3 つのモダリティからの 22,000 以上の画像、人体の 8 つの主要部分の 497 のセグメンテーション ターゲットをカバーする 302,000 以上のセグメンテーション アノテーションをまとめ、テキスト プロンプトを通じて放射線画像を実現します。 一般的な医療セグメンテーション モデル。
直接使用します:https://go.hyper.ai/aANbx
8. 一般的な人工知能アシスタント用の GAIA ベンチマーク データセット
GAIA は 450 を超える複雑な質問で構成されており、それらの質問には明確な回答があり、解決にはさまざまなレベルのツールと自主性が必要です。したがって、レベル 1 は非常に優れた LLM によって克服でき、レベル 3 はモデルの機能が大幅に向上していることを示します。各レベルは、検証用の完全に公開された開発セットと、プライベートな回答とメタデータを含むテスト セットに分割されます。
直接使用します:https://go.hyper.ai/VY3cU
このデータ セットには、「ヘルメット」と「ヘルメットなし」の 2 つの異なるカテゴリの 764 枚の画像が含まれており、ヘルメット検出タスクに使用できます。
直接使用します:https://go.hyper.ai/QuMyR
このデータセットは、ハイパースペクトルデータに基づいた土壌水分評価のベンチマークデータセットであり、ドイツのカールスルーエでの 5 日間の現地測定キャンペーンを通じて取得されました。ハイパースペクトルデータに基づいて土壌水分含有量を推定する能力の研究と開発を目的としています。 。 モデル。
直接使用します:https://go.hyper.ai/fG77T
その他の公開データセットについては、以下をご覧ください。
選択された公開チュートリアル
1. Tencent HunyuanDiT Wenshengtu デモ
このモデルは、初の中国語と英語のバイリンガル DiT アーキテクチャです。拡散トランスフォーマーに基づいたテキストから画像への生成モデルです。このモデルは、中国語と英語でのきめ細かい理解機能を備えています。研究チームは、モデル最適化の反復を支援するためにデータを更新および評価するための完全なデータ パイプラインを構築しました。このチュートリアルではコマンドを入力する必要はなく、ワンクリックでクローン作成をすぐに開始できます。
オンラインで実行:https://go.hyper.ai/Dwtf7
2. Paints-Undo は 1 枚の画像からペイント プロセス全体のデモを生成します
PaintsUndo は、人間の絵画動作をシミュレートできるモデルであり、人間に絵画動作の基本的なモデルを提供することを目的としています。また、将来の AI モデルが人間のアーティストの実際のニーズをより適切に満たすことも期待されています。このプロジェクトは、画像を入力として受け取り、その画像の一連の描画を出力するモデル ファミリを提供します。このチュートリアルは、PaintsUndo のワンクリック実行デモです。関連する環境と依存関係がインストールされており、クローンを作成してワンクリックで開始できます。
オンラインで実行:https://go.hyper.ai/Nr3DC
また、Stable Diffusion チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に注目し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりするためにグループに参加してください。
注目のコミュニティ記事
1. ニューラル ネットワークが密度汎関数理論に取って代わります!清華大学の研究グループが超高精度の予測を実現するユニバーサル材料モデル DeepH をリリース
清華大学の研究者は、独自の DeepH 手法を使用して DeepH ユニバーサル材料モデルを開発し、「大規模材料モデル」を構築するための実現可能なソリューションを実証しました。このブレークスルーは、革新的な材料発見の新たな機会を提供します。この記事は論文の解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/lxFha
2. 代替ではなく共生!気象科学の未来には AI と数値予報の有機的な組み合わせが必要です
近年、AIの急速な発展に伴い、「従来の数値予測はAIに追いつけられるのか、追い越されるのか、あるいは完全に置き換えられるのか?両者はどのように共存できるのか?」という問いが人々の注目と思考を呼び起こしている。この点に関して、中国気象局上海台風研究所の副所長であるファン・ウェイ氏は、「近い将来、AI天気予報と従来の数値予報を有機的に組み合わせることが、予報のブレークスルーを達成する最も効果的な方法になるだろう」と考えている。この記事は、HyperAI Super Neuro によるこの 2 つの関係の解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/ui8Yv
3. ICMLに選出されました!人民大学チームは等変グラフ ニューラル ネットワークを使用して標的タンパク質の結合部位を予測し、最高のパフォーマンス向上を実現しました 20%
中国人民大学ヒルハウス人工知能学院の研究チームは、E(3)等変グラフニューラルネットワーク(GNN)を初めてリガンド結合部位予測に適用し、CNNが直面する問題を解決するEquiPocketと呼ばれるフレームワークを提案した。 -ベースの課題。この記事は研究プロセスを解釈し共有するものです。
レポート全体を表示します。https://go.hyper.ai/HrzK4
言語モデルのトレーニングに必要なデータ量の増加とデータ品質の問題に対応して、スタンフォード/Apple を含む 23 機関が DCLM ベンチマーク テストをリリースし、240 兆のデータを一掃しました。この記事は実験プロセスの解釈と共有です。
レポート全体を表示します。https://go.hyper.ai/V3gPg
人気のある百科事典の項目を厳選
1. スケーリングの法則
2. マスクされた言語モデリング MLM
3. データの拡張
4. 長期記憶と短期記憶長い 短期記憶
5. 量子ニューラルネットワーク 量子ニューラルネットワーク
ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event
上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。
また来週お会いしましょう!
福祉活動
CommunityOverCode 2024 カンファレンス (略称 CoC) が、7 月 26 日から 28 日まで杭州で開催されます。このカンファレンスは、Apache Software Foundation (ASF) の公式グローバル シリーズカンファレンスであり、オープンソース テクノロジーの開発とコミュニティへの参加を促進することを目的としています。 。 HyperAI は協力コミュニティとしてこのイベントに参加し、オフラインでお会いできることを楽しみにしています。
抽選にご参加いただくために、「HyperAI Super Neural」公開アカウントをフォローしてください。999元相当のイベントチケットが当たるチャンス!