Weekly Editor's Picks|Hill Shell 音声データセット シリーズが開始、中国の学者が乳がん予後スコアリング システム MIRS を確立

特色图像

🏮大晦日、再会を求めて数千マイルの旅

🏮世界の花火、新年の家族の喜びでいっぱい

玉兎に別れを告げ、金龍とともに春を迎えます。明日の夜は大晦日です!HyperAI は皆さんに新年のお祝いをするためにここにいます~Dragon Xinglulu(dá)!今週、hyper.ai 公式 Web サイトで、Hill Shell がオープンソース化した数千時間分の中国語音声データベースが公開され、あなたの音声への扉が開かれました。

2 月 5 日から 2 月 8 日までの hyper.ai 公式 Web サイトの更新の概要:

* 高品質の公開データセット: 8

※AI4S紙ケース:2枚

* 人気のある百科事典のエントリ: 8

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. AISHELL-1 オープンソース中国語音声データベース

このデータセットは、中国のさまざまなアクセント地域の 400 人によって記録されました。プロの音声校正者によって書き起こされ、注釈が付けられ、厳格な品質検査に合格した後、このデータベースのテキスト精度は 95% 以上です。トレーニング セット、開発セット、テスト セットに分かれています。

直接使用します:

https://hyper.ai/datasets/29344

2. AISHELL-2 中国語音声データベース

中国標準語音声データベースである AISHELL-2 には、1,000 時間の音声時間が含まれています。収録テキストは、ウェイクアップワード、音声制御ワード、スマートホーム、無人運転、工業生産など12分野をカバー。

直接使用します:

https://hyper.ai/datasets/29347

3. AISHELL-3 高忠実度中国語音声データベース

このデータセットは、中国のさまざまなアクセント地域の 218 人によって記録されました。プロの発音校正者がピンインと韻の注釈を行い、このデータベースの発音文字精度は 98% 以上です。

直接使用します:

https://hyper.ai/datasets/29352

4. AISHELL-4 マルチチャンネル中国語会議音声データベース

AISHELL-4 は 211 の録音された会議セッションで構成されており、各会議セッションには 4 ~ 8 人の講演者が含まれ、合計時間は 120 時間であり、音声フロントエンド処理や音声認識などの個別のタスクに使用できます。

直接使用します:

https://hyper.ai/datasets/29375

5AISHELL-WakeUp-1 中国語と英語のウェイクワード音声データベース

このデータ セットでは、254 人の講演者が録音に参加するよう招待され、合計 400 万近くのウェイクワード スピーチと 1561.12 時間が記録されました。録音されたテキストは、「こんにちは、ミア」と「こんにちは、ミア」というウェイクアップ ワードです。このデータベースはプロの音声校正者によって転記され、注釈が付けられており、厳しい品質検査に合格しています。声紋認識や音声覚醒認識などの研究目的に使用できます。

直接使用します:

https://hyper.ai/datasets/29186

6. AISHELL-DMASH 中国語中国語マイクアレイホームシーン音声データベース

AISHELL-DMASH データセットは、実際のスマート ホーム シナリオで 2 つの異なる部屋で記録されており、30,000 時間の音声データが含まれています。このデータセットはプロの音声アノテーターによって書き起こされ、単語精度は 98% で、声紋認識、音声認識、ウェイクワード認識などの研究に使用できます。

直接使用します:

https://hyper.ai/datasets/29380

7.DeepSymNet ディープ シンボリック ネットワーク データ セット

これは、中国科学院半導体研究所の研究者によって提案された、シンボリック式を表現するための DeepSymNet と呼ばれる新しいシンボリック ネットワークであり、シンボリック回帰に使用されるシンボリック ネットワークです。

直接使用します:

https://hyper.ai/datasets/29321

8. Evol Instruct 中国語 GPT4 テキスト データ セット

データセットは次のように作成されます。

(1) Evol-instruct-70k の英語の質問を中国語に翻訳します。

(2) GPT4 に中国語の回答を生成するようリクエストします。

直接使用します:

https://hyper.ai/datasets/29318

サイエンスAI  厳選された紙ケース

1.  世界最大のがんをターゲットに、中国の学者らが乳がん予後スコアリングシステムMIRSを確立

最近、中国の学者らは、ニューラルネットワークモデルを使用して、乳がんの予後と治療を予測するためのスコアリングシステムMIRSを確立しました。これは、乳がん患者の治療戦略策定の指針として使用できます。関連論文が「」に掲載されています。アイサイエンス"ジャーナル。

レポート全体を表示します。

https://hyper.ai/news/29304

2. 中国科学院深セン先進技術研究所は、数ショット学習フレームワークに基づいて動物の社会行動を分析するための SBeA を提案しました。

動物行動研究では、技術革新による研究の効率と精度の向上が急務となっています。これに基づいて、SBeA (Social Behavior Atlas) が誕生し、中国科学院の深センハイテク研究所によって開発されました。これは、自由に社会的な動物の行動を包括的に定量化し、より少ない数のラベル付きフレームを使用できます。約400フレーム)を使用して、複数の動物の3Dマッピングを実行します。姿勢推定、双方向転移学習戦略により、複数動物識別の精度率は 90% を超えています。関連する結果は雑誌「Nature」に掲載されました。

レポート全体を表示します。

https://hyper.ai/news/29353

人気のある百科事典の項目を厳選

1. 1 秒あたりの浮動小数点演算の数 フロップス

2. ランダムウォーク ランダムウォーク

3. バーチャル上映バーチャル上映

4.音楽情報検索MIR

5. 量子ニューラルネットワーク 量子ニューラルネットワーク

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://hyper.ai/wiki

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、メッセージを残すか、投稿してお知らせください。

新年の到来にあたり、HyperAI は改めて皆さんのドラゴンの動きの幸運を祈ります。すべてが繁栄し、ドラゴンの口は閉じず、幸せになります!新年には、さらなるサプライズをお届けします!

辰年にお会いしましょう!

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 1,200 を超える公開データセットに対して国内の高速ダウンロード ノードを提供

* 300 以上の古典的で人気のあるオンライン チュートリアルが含まれています

* 100 以上の AI4Science 論文ケースを解釈

* 500 以上の関連用語クエリをサポート

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai/