20 Newsgroups Newsgroup-Dokumentendatensatz
Datum
Größe
Veröffentlichungs-URL
Lizenz
Nicht-kommerziell
20 Newsgroups ist ein Datensatz, der aus ungefähr 20.000 Nachrichtendokumenten besteht und sich zu einem beliebten Datensatz für Textanwendungsexperimente im maschinellen Lernen entwickelt hat.
Der Datensatz ist gleichmäßig auf 20 verschiedene Newsgroups verteilt und ist einer der internationalen Standarddatensätze, die für die Textklassifizierung, das Text Mining und die Informationsabrufforschung verwendet werden.
Der Datensatz mit 20 Newsgroups wurde 1995 von Ken Lang in den Proceedings der 12. Internationalen Konferenz zum maschinellen Lernen veröffentlicht. Das zugehörige Dokument heißt Newsweeder: Learning to filter netnews.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.