HyperAIHyperAI

Command Palette

Search for a command to run...

vor 3 Monaten

Die neuronale Hype und Vergleiche mit schwachen Baselines

{Jimmy Lin}

Die neuronale Hype und Vergleiche mit schwachen Baselines

Abstract

Kürzlich hielt die Machine-Learning-Community inne, um eine Selbstreflexion einzuleiten. In einer in der ICLR 2018 breit diskutierten Arbeit schrieben Sculley et al.: „Wir beobachten, dass die Rate empirischer Fortschritte möglicherweise nicht durch eine konsequente Steigerung des Niveaus empirischer Rigor im gesamten Feld korreliert hat.“ Ihr Hauptanliegen ist die Entwicklung einer „Forschungs- und Publikationskultur, die auf Siege setzt“ (Hervorhebung im Original), was gewöhnlich bedeutet: „zu zeigen, dass eine neue Methode gegenüber früheren Ansätzen bei einer bestimmten Aufgabe oder einem bestimmten Benchmark besser abschneidet“. Eine treffende Beschreibung hierfür wäre „Leaderboard-Jagen“ – und für viele Aufgaben im Bereich Vision und NLP ist dies keinesfalls metaphorisch. Es gibt tatsächlich zentralisierte Leaderboards¹, die den schrittweisen Fortschritt bis auf den fünften Dezimalplatz verfolgen, manche über Jahre hinweg bestehen und Dutzende Einträge aufweisen.Sculley et al. erinnern uns daran, dass „das Ziel der Wissenschaft nicht Siege, sondern Wissen ist“. Die Struktur des wissenschaftlichen Unternehmens heute (Publikationsdruck, Tempo der Fortschritte usw.) führt dazu, dass „Gewinnen“ und „gute Wissenschaft betreiben“ oft nicht vollständig übereinstimmen. Um dies zu untermauern, verweisen sie auf mehrere Studien, die nahelegen, dass jüngste Fortschritte in neuronalen Netzen durchaus banalen Faktoren wie eine verbesserte Hyperparameter-Optimierung zuzuschreiben sein könnten. Viele Ergebnisse sind nicht reproduzierbar, und einige beobachtete Verbesserungen könnten lediglich Rauschen darstellen.

Benchmarks

BenchmarkMethodikMetriken
ad-hoc-information-retrieval-on-trec-robust04Anserini BM25+RM3
MAP: 0.302
P@20: 0.4012

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Die neuronale Hype und Vergleiche mit schwachen Baselines | Forschungsarbeiten | HyperAI