IndicVault-Datensatz Zu Indischen Frage-Antwort-Paaren
Datum
vor 4 Tagen
Veröffentlichungs-URL
Kategorien
Indic Vault ist ein Frage-Antwort-Datensatz in der indischen Alltagssprache, der sich zum Optimieren von Chatbots und Sprachassistenten eignet.
Der Datensatz enthält Frage-Antwort-Paare in der zeitgenössischen, alltäglichen Sprache Indiens im Jahr 2025 und erfasst reale, umgangssprachliche Ausdrücke aus alltäglichen Gesprächen. Die Daten decken 20 Kernkategorien ab, darunter Finanzen, Gesundheit, Technologie, Beziehungen, Privatleben, Essen und Kochen, Bildung, Karriere, Unterhaltung, Reisen, Sport, Kultur, Gesellschaft, Umwelt, Wissenschaft, Recht und Regierung, Wirtschaft, Landwirtschaft, Schönheit und Mode sowie Politik.
Datensatzfunktionen:
- Gemischte Sprachreferenz:Einschließlich Hindi, Hinglisch und Telugu
- Natürlicher, gesprochener Ton:Die Antworten werden so ausgedrückt, wie man in einem lockeren, echten Gespräch sprechen würde.
- Echtzeit:Echte Themen, die basierend auf den Erwartungen indischer Benutzer im Jahr 2025 geschrieben wurden