HyperAIのスーパーニューラル新コラム登場〜毎週月曜日、HyperNeural 編集部は、前週に hyper.ai 公式 Web サイトで更新されたコンテンツ (データ セット、AI4S ペーパー ケース、百科事典のエントリ) を選択し、ここに公開します。すべてのコンテンツを表示するには、hyper.ai に直接アクセスしてください。
1 月 15 日から 1 月 21 日までの hyper.ai 公式 Web サイトの更新の概要:
* 高品質の公開データセット: 10
※AI4S紙ケース:2枚
* 人気のある百科事典のエントリ: 10
公式ウェブサイトにアクセスしてください:https://hyper.ai/
公開データセットの選択
1. クロスドック2020:レスジェネ 研究処理されたデータセット
初期データセットには、2,200 万を超えるタンパク質とリガンドのペアが含まれています。このデータセットは、タンパク質と小分子の相互作用研究、特にタンパク質ポケットへの分子の結合能力を評価するために使用できます。
直接使用します:
https://hyper.ai/datasets/29021
2. RJUA-QA は、中国初の専門医療に関する質問と回答の推論データセットです。
RJUA-QA は、革新的な泌尿器科専門の質問に答える推論データセットです。このデータセットは、Ant Group Medical LLM チームが上海交通大学医学部附属仁吉病院泌尿器科の専門家チームと協力して作成したものです。このデータセットは、実際の患者の臨床データを、Q-context-A (Question-Context-Answer) 形式で表示される仮想の患者の臨床会話に変換するために開発されました。
直接使用します:
https://hyper.ai/datasets/28970
3. MetaMathQA 数学的推論データセット
モデルの順推論および逆推論の機能を向上させるために、ケンブリッジ、香港科技大学、およびファーウェイの研究者は、一般的に使用される 2 つの数学的データ セット (GSM8K および MATH) に基づいた MetaMathQA データ セットを提案しました。広範囲をカバーする高品質のデータセット。 MetaMathQA は、大規模な言語モデルによって生成された 395K の順方向および逆方向の数学的な質問と回答のペアで構成されています。
直接使用します:
https://hyper.ai/datasets/28954
4. M³IT マルチモード多言語命令チューニング データセット
このデータセットは、ビジュアルからテキストへの構造に再フォーマットされた、240 万のインスタンスと 400 の手動で作成されたタスク指示を含む 40 のデータセットで構成されています。このデータセットは、字幕、視覚的質問応答 (VQA)、視覚状態の生成、推論、分類など、古典的な視覚言語タスクからさまざまなタスクをコンパイルしています。
直接使用します:
https://hyper.ai/datasets/29048
5. ChatHaruhi-RolePlaying ロールプレイング会話データセット
ChatHaruhi は、32 の中国語/英語のテレビ/アニメのキャラクターと 54,000 を超える模擬ダイアログを含むデータセットです。大規模な言語モデルで構築されたロールプレイング チャットボットは広く注目を集めていますが、特定の架空のキャラクターを模倣するために、研究チームは、スクリプトから抽出されたキャラクターのプロンプトと記憶を改善することで言語モデルを制御するアルゴリズムを提案しました。研究チームは、映画、小説、脚本などからコーパスを収集し、構造化抽出を行うことで、2万3000件以上の会話情報を収集した。
直接使用します:
https://hyper.ai/datasets/28926
今週更新されたその他のデータセットについては、以下をご覧ください。
サイエンスAI 口論厳選された記事
1. 最高の技術よりも8倍高速:浙江大学のHou Tingjun氏らは、タンパク質ポケットに基づく3D分子生成モデルResGenを提案
浙江大学と志江研究所研究チームは、タンパク質ポケットに基づく3次元分子生成モデル-ResGenを提案し、これまでの最適技術と比較して、速度が8倍向上し、より低い結合エネルギーとより高い多様性を持つ分子を生成することに成功しました。この論文は雑誌「Nature」に掲載されました。
レポート全体を表示します。
2. 中国科学院のLuo Xiaozhou氏のチームは、酵素反応速度パラメータを高精度で予測するための大規模モデル+機械学習であるUniKPフレームワークを提案した
中国科学院深セン先進技術研究所のLuo Xiaozhou氏のチームは、酵素速度論パラメータ予測フレームワーク(UniKP)に基づいて、さまざまな酵素速度論パラメータを予測することを提案した。この論文は雑誌「Nature」に掲載されました。
レポート全体を表示します。
人気のある百科事典の項目を厳選
1. シグモイド関数
2. マルコフ連鎖 (マルコフ連鎖)
3. 素早い言葉攻め(即時注入)
4. 報酬モデル
5. 迅速なエンジニアリング
ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。
上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、メッセージを残すか、投稿してお知らせください。
また来週お会いしましょう!
HyperAIについて Hyper.ai
HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。
* 1,200 を超える公開データセットに対して国内の高速ダウンロード ノードを提供
* 300 以上の古典的で人気のあるオンライン チュートリアルが含まれています
* 100 以上の AI4Science 論文ケースを解釈
* 500 以上の関連用語クエリをサポート
*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします
学習の旅を始めるには、公式 Web サイトにアクセスしてください。