HyperAI超神経

SeniorTalk 高齢者向け中国語音声データセット

日付

1ヶ月前

サイズ

55.3 MB

組織

公開URL

github.com

カテゴリ

SeniorTalkデータセットは、2025年3月に南開大学と北京知源人工知能研究所によって公開された世界初の中国の超高齢者の会話音声データセットです。関連する論文結果は次のとおりです。SeniorTalk: 超高齢者向けの豊富な注釈付き中国語会話データセットこのデータセットには、話者情報、会話内容の書き起こし、タイムスタンプ(文レベル、単語レベルを含む)、アクセントカテゴリラベルなど、多次元の詳細な注釈が含まれています。これらの実世界データは、高齢者の音声信号の詳細な研究や高齢者向け音声インタラクションシステムの最適化に貴重な支援を提供し、高齢者向け機器、健康管理、高齢者介護ロボットなどの関連産業の発展を促進します。

主な特徴:

  • データサイズは202ビット、超高齢者の音声データ55.53時間と大きいです。
  • 広範囲の地理的範囲: データは 16 の州と都市から収集され、さまざまな地域のアクセントをカバーしています。
  • 自然でリアルなインタラクション: 退職、健康、生活などのトピックをカバーし、実際のコミュニケーションシナリオに近い、2人の間での自然な対話を採用しています。
高齢者の地理的分布
高齢者の年齢と性別の統計
SeniorTalk.torrent
シーディング 2ダウンロード中 0ダウンロード完了 13総ダウンロード数 32
  • SeniorTalk/
    • README.md
      1.78 KB
    • README.txt
      3.56 KB
      • data/
          • .cache/
              • huggingface/
                • .gitignore
                  3.57 KB
                  • download/
                    • .gitattributes.lock
                      3.57 KB
                    • .gitattributes.metadata
                      3.66 KB
                    • README.md.lock
                      3.66 KB
                    • README.md.metadata
                      3.76 KB
                      • data/
                        • test-00000-of-00001.parquet.lock
                          3.76 KB
                        • test-00000-of-00001.parquet.metadata
                          3.88 KB
                        • train-00000-of-00001.parquet.lock
                          3.88 KB
                        • train-00000-of-00001.parquet.metadata
                          4 KB
                        • validation-00000-of-00001.parquet.lock
                          4 KB
                        • validation-00000-of-00001.parquet.metadata
                          4.13 KB
        • .gitattributes
          6.53 KB
        • SeniorTalk.zip
          55.3 MB