HyperAI

IndicVault-Datensatz Zu Indischen Frage-Antwort-Paaren

Datum

vor 4 Tagen

Veröffentlichungs-URL

huggingface.co

Download-Hilfe

Indic Vault ist ein Frage-Antwort-Datensatz in der indischen Alltagssprache, der sich zum Optimieren von Chatbots und Sprachassistenten eignet.

Der Datensatz enthält Frage-Antwort-Paare in der zeitgenössischen, alltäglichen Sprache Indiens im Jahr 2025 und erfasst reale, umgangssprachliche Ausdrücke aus alltäglichen Gesprächen. Die Daten decken 20 Kernkategorien ab, darunter Finanzen, Gesundheit, Technologie, Beziehungen, Privatleben, Essen und Kochen, Bildung, Karriere, Unterhaltung, Reisen, Sport, Kultur, Gesellschaft, Umwelt, Wissenschaft, Recht und Regierung, Wirtschaft, Landwirtschaft, Schönheit und Mode sowie Politik.

Datensatzfunktionen:

  • Gemischte Sprachreferenz:Einschließlich Hindi, Hinglisch und Telugu
  • Natürlicher, gesprochener Ton:Die Antworten werden so ausgedrückt, wie man in einem lockeren, echten Gespräch sprechen würde.
  • Echtzeit:Echte Themen, die basierend auf den Erwartungen indischer Benutzer im Jahr 2025 geschrieben wurden