vor 6 Monaten

Zusammenfassung

Wir stellen miniF2F vor, einen Datensatz formaler Mathematikaufgaben auf Olympiade-Niveau, der als einheitlicher, systemübergreifender Benchmark für neuronale Beweisführung dienen soll. Der miniF2F-Benchmark zielt derzeit auf Metamath, Lean, Isabelle (teilweise) und HOL Light (teilweise) ab und umfasst 488 Aufgabenstellungen, die aus dem AIME, AMC und der Internationalen Mathematik-Olympiade (IMO) sowie aus Materialien von Schul- und Hochschulmathematik-Kursen stammen. Wir präsentieren Baseline-Ergebnisse, die mit GPT-f erzielt wurden, einem neuronalen Beweissystem auf Basis von GPT-3, sowie eine Analyse seiner Leistungsfähigkeit. Wir sehen miniF2F als eine communitygetriebene Initiative und hoffen, dass unser Benchmark die Fortschritte in der neuronalen Beweisführung voranbringen wird.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Kunhao Zheng Jesse Michael Han Stanislas Polu

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Kunhao Zheng Jesse Michael Han Stanislas Polu

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

MiniF2F: Ein cross-system Benchmark für formale Mathematik auf Olympiade-Niveau | Paper | HyperAI

Command Palette

MiniF2F: Ein cross-system Benchmark für formale Mathematik auf Olympiade-Niveau

Kunhao Zheng Jesse Michael Han Stanislas Polu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MiniF2F: Ein cross-system Benchmark für formale Mathematik auf Olympiade-Niveau

Kunhao Zheng Jesse Michael Han Stanislas Polu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MiniF2F: Ein cross-system Benchmark für formale Mathematik auf Olympiade-Niveau

Kunhao Zheng Jesse Michael Han Stanislas Polu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters