ZeroSearch-Frage-Antwort-Datensatz
Datum
Veröffentlichungs-URL
Kategorien
ZeroSearch ist ein hochwertiger Frage-Antwort-Datensatz, der 2025 vom Alibaba Tongyi Lab veröffentlicht wurde und sich auf den Aufbau von Modellfunktionen konzentriert, die Fragen ohne externe Suche direkt beantworten können. Die relevanten Ergebnisse der Studie sind:ZeroSearch: Fördern Sie die Suchfunktion von LLMs ohne Suchen".
Der Datensatz enthält etwa 170.000 Beispiele und deckt mehrere Wissensgebiete ab, beispielsweise wissenschaftliche Erkenntnisse, historische Ereignisse, Film- und Fernsehunterhaltung, Geographie und Geisteswissenschaften. Dieser Datensatz umfasst Sachfragen, Definitionsfragen, Richtig-Falsch-Fragen usw. und eignet sich zum Trainieren kleiner und mittelgroßer Frage-Antwort-Modelle. Ziel ist es, durch sorgfältig gestaltete Frage-Antwort-Paare die Fähigkeiten des Modells zum gesunden Menschenverstand, zum Faktengedächtnis und zur logischen Schlussfolgerung zu bewerten und standardisierte Trainings- und Testressourcen für den Bereich der natürlichen Sprachverarbeitung bereitzustellen.