HyperAI超神経

IndicVault インドの質問と回答のペアのデータセット

ダウンロードヘルプ

Indic Vault は、チャットボットや音声アシスタントの調整に適した、インドの日常言語の質問と回答のデータセットです。

このデータセットには、2025年のインド全土で使用されている現代の日常言語で書かれた質問と回答のペアが含まれており、日常会話で実際に使用されている口語表現を捉えています。データは、金融、健康、テクノロジー、人間関係、家庭生活、食品と料理、教育、キャリア、エンターテイメント、旅行、スポーツ、文化、社会、環境、科学、法律と行政、ビジネス、農業、美容とファッション、政治を含む20の主要カテゴリを網羅しています。

データセットの機能:

  • 混合言語参照:ヒンディー語、ヒングリッシュ、テルグ語を含む
  • 自然な話し方:返答は、実際の会話で人々が話すのと同じように表現されます
  • リアルタイム:2025年のインドユーザーの期待に基づいて書かれた実際のテーマ