HyperAI超神経

シングルカード A6000 のワンクリック起動 AlphaFold3 チュートリアルがオンラインになりました! 7万本以上の動画と50種類以上のエンティティオブジェクトを収録した360度モーションキャプチャデータセットを公開

特色图像

先週、HyperAl は AlphaFold3 依存データベースを更新しましたが、データが大きすぎて導入が難しいと多くのパートナーが報告しました。

今週、Hyper.ai公式サイトにて「AlphaFold3タンパク質予測デモ」を開始、関連するデータとモデルがインストールおよび構成されており、占有容量は個人用ストレージの 300 MB 未満であり、A6000 カード 1 枚だけで AlphaFold3 を使用してタンパク質を予測するために迅速に展開して使用できます。

オンラインでの使用:https://go.hyper.ai/KHIRR

12 月 16 日から 12 月 20 日までの hyper.ai 公式 Web サイトの更新の概要:

* 高品質の公開データセット: 10

* 高品質なチュートリアルのセレクション: 3

* コミュニティ記事選択: 4 記事

* 人気のある百科事典のエントリ: 5

※1月提出締切:9日

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. ドローン検出 UAV 検出データセット

データセットは、各ドローンの周囲に注釈付きの境界ボックスを含む 10,000 を超えるドローン画像で構成されています。境界ボックスは、さまざまな背景や環境でドローンを検出および追跡するための正確な位置情報を提供します。このデータセットは、特に監視、ドローン検出、自律追跡などのアプリケーションにおける物体検出タスク用のコンピューター ビジョン モデルのトレーニングと評価に適しています。

直接使用します:https://go.hyper.ai/686JV

データセットの例

2. 360Motion-Dataset モーション キャプチャ データ セット

このデータセットの V1 バージョンには、さまざまな動物などの 50 の異なるエンティティをカバーする 72k のビデオと、1 つの砂漠シーンと 2 つの HDRI シーンを含む 6 つの Unreal Engine (UE) シーンが含まれています。さらに、データセットには 121 の異なる軌道テンプレートも含まれており、研究者に豊富な動作パターンと行動の変化を提供します。


直接使用します:https://go.hyper.ai/rsmeQ

データセットの例

3. 脳腫瘍データセット 脳腫瘍医療データセット

このデータセットは、さまざまなモデルを使用して脳腫瘍を分類およびセグメント化するためのデータセットであり、1,621 枚の神経膠腫画像、1,775 枚の髄膜腫画像、1,757 枚の脳下垂体画像、2,000 枚の腫瘍なし (脳の健康) 画像を含む、合計 7,153 枚の画像が含まれています。

直接使用します:https://go.hyper.ai/zgX7A

データセットの例

4. LAION-SG 大規模高画質画像理解データセット

LAION-SG には、オブジェクト、属性、関係性が注釈付けされた 540,005 個のシーン グラフと画像のペアが含まれており、トレーニング、検証、テスト セットに分割されています。データセットの画像は LAION-Aesthetics V2 (6.5+) データセットから取得され、注釈プロセスでは自動注釈に GPT-4o が使用されます。

直接使用します:https://go.hyper.ai/HHT6V

データセットの例

5. 服装属性データセット 服装属性データセット

データセットには、長袖、襟付き、縞模様などの 26 の基本的な衣服属性を持つ 1,856 枚の画像が含まれています。ラベルは Amazon Mechanical Turk を使用して収集されました。

直接使用します:https://go.hyper.ai/7f3ej

データセットの例

6. Detect Al-Generated Faces 顔検出データセット

このデータセットには、本物の顔と AI で生成された合成顔の 3,203 枚の高品質画像 (2,202 枚の本物の画像と 1,001 枚の AI で生成された画像を含む) が含まれており、機械学習および深層学習アプリケーション向けに設計されています。本物の顔と AI で生成された顔画像を区別するリソースを提供するように設計されており、ディープフェイク検出、画像の信頼性検証、顔画像分析などのタスクに適しており、最先端の研究とアプリケーションをサポートできます。

直接使用します:https://go.hyper.ai/SwMXL

データセットの例

7. U-MATH 数的推論データセット

このデータセットには、本物の教材から派生した 1.1k の未発表の大学レベルの数学の問題が含まれており、初等数学、代数学、微分積分、積分微積分、多変数微積分、数列と級数という 6 つの主要な数学トピックをカバーしています。

直接使用します:https://go.hyper.ai/FcNc2

8. Open01-SFT 監視付き微調整データセット

OpenO1-SFT データセットは、教師あり微調整 (SFT) 手法を使用して言語モデルの思考連鎖機能を活性化することに焦点を当てたデータセットで、一貫した論理推論シーケンスを生成するモデルの機能を強化することを目的としています。 77,685 件のレコードが含まれており、中国語だけでなく英語もカバーしているため、このデータ セットは多言語環境で役立ちます。

直接使用します:https://go.hyper.ai/KlyzY

9. QwQ-LongCoT-130K 微調整データセット

QwQ-LongCoT-130K データ セットは、O1 のような大規模言語モデル (LLM) をトレーニングするために特別に設計された SFT (教師あり微調整) データ セットです。このデータセットには約 130,000 のインスタンスが含まれており、それぞれが QwQ-32B-Preview モデルを使用して生成された応答です。

直接使用します:https://go.hyper.ai/kE9aG

10. ヘルスケア特許における ML ヘルスケア特許データセット

このデータセットは、「機械学習とヘルスケア」という検索クエリを使用して Google 特許から編集されたもので、医療画像、診断ツール、AI による治療の推奨など、さまざまな分野で付与された特許が含まれています。

直接使用します:https://go.hyper.ai/8p1M5

選択された公開チュートリアル

1. AlphaFold3 タンパク質予測デモ

AlphaFold3 は、2024 年に Google DeepMind によって開発された人工知能 (AI) ツールです。 AlphaFold 3 モデルは拡散ベースのアーキテクチャを使用して、タンパク質構造だけでなく、核酸、小分子、イオン、修飾残基などの複雑な構造も正確に予測します。

このチュートリアルでは、AlphaFold3 を迅速に展開して使用してタンパク質を予測する方法を紹介します。このエクスペリエンスを実行するには、カード A6000 が 1 枚だけ必要です。

オンラインで実行:https://go.hyper.ai/KHIRR

ビジュアルディスプレイ

2. RMBG-2.0: オープンソースの背景除去モデル

RMBG-2.0 は、さまざまなカテゴリや画像タイプにわたって前景を背景から効率的に分離するように設計されたオープンソースの背景除去モデルです。

このモデルの環境と依存関係は設定されており、API アドレスを入力することでワンクリックでカットアウトを体験できます。

オンラインで実行:https://go.hyper.ai/FF10L

モデル例

3. DePLM: ノイズ除去言語モデルを使用したタンパク質の最適化 (少数のサンプル)

ノイズ除去タンパク質言語モデル (DePLM) は、タンパク質言語モデルによって捕捉された進化情報を、最適化ターゲットの特性に関連する情報と無関係な情報の混合物として扱うことができます。無関係な情報は「ノイズ」とみなされ、削除されるため、モデルの能力が向上します。景観に適応する際のタンパク質の予測精度を高め、最適化のために機能的に最適な配列を特定するのに役立ちます。

このチュートリアルは、浙江大学がリリースしたトレーニングおよび推論ノイズ除去タンパク質言語モデル (DePLM) であり、関連する結果が「NeurIPS 24」に選択されています。プラットフォームは必要な環境とデータ セットの構成を完了しており、トレーニングと推論のためにチュートリアルで指定されたコマンドを直接実行できます。

オンラインで実行:https://go.hyper.ai/ktd87

また、Stable Diffusion チュートリアル交換グループも設立しました。お友達はコードをスキャンして [SD チュートリアル] に注目し、さまざまな技術的な問題について話し合ったり、アプリケーションの効果を共有したりするためにグループに参加してください。

注目のコミュニティ記事

1. アメリカの AI 製薬会社の最初の薬剤候補である Tu Youyou からインスピレーションを得て臨床試験に入り、5 年間で 8 ラウンドの資金調達を受けました。

最近、米国のAI製薬スタートアップEnvedaは、シリーズCで1億3,000万米ドルの資金調達を完了し、調達総額は3億6,000万米ドルとなったと発表した。さらに、今年10月末には、Envedaプラットフォームを使用して発見された最初の薬剤候補であるENV-294が米国FDAからIND承認を取得し、第I相臨床試験に入った。この記事は同社の詳細なレポートです。

レポート全体を表示します。https://go.hyper.ai/rMk2U

2. チベット高原に関するデータ不足の問題に対処してください!浙江大学のチームは、チベット高原の表面熱流分布を説明する新しいGeoAIモデルを提案した

青海チベット高原は地理的に特殊なため、一部の険しい地域では表面熱流データが非常に不足しています。この問題を解決するために、浙江大学地球科学部は、解釈可能性を高めた地理ニューラルネットワーク加重回帰モデルを提案しました。これは、チベット高原の熱流分布と地球力学メカニズムを包括的に理解するための新しい研究枠組みと技術サポートを提供します。 。この記事は、論文の詳細な解釈と共有です。

レポート全体を表示します。https://go.hyper.ai/vqQDi

3. NeurIPS 2024 の提出経験を共有してください!浙江大学チームは DePLM モデルを使用してタンパク質の最適化を支援し、最初の論文のデモがオンラインで公開されています

Meet AI4S の 5 回目のライブ ブロードキャストでは、浙江大学ナレッジ エンジン研究所の博士課程候補者、Wang Zeyuan 氏が NeurlPS 2024 に選ばれた結果を共有し、デモを披露しました。また、彼自身の提出経験も紹介しました。をクリックしてすぐに視聴してください。

レポート全体を表示します。https://go.hyper.ai/PLyBo

4. DeepMind と Google Research が協力し、複数の技術ルートを通じて AI 天気予報の「六角戦士」を作成

GoogleのDeepMindとGoogle Researchは、短期・中期・長期の予報を考慮し、従来の手法とAIを統合し、天気予報用の「六角形の戦士」を段階的に作成し、天気予報の分野で多くの成果を発表した。

レポート全体を表示します。https://go.hyper.ai/Cvzkc

人気のある百科事典の項目を厳選

1. 相互ソーティング融合 RRF

2. マスクされた言語モデリング MLM

3. 核の規範

4. コルモゴロフ・アーノルド表現定理

5. データの拡張

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://go.hyper.ai/wiki

主要な人工知能学会をワンストップで追跡:https://go.hyper.ai/event


上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。