Der MMLU-Pro-Benchmark-Datensatz Ist Jetzt Verfügbar Und Enthält 12.000 Komplexe Interdisziplinäre Probleme. Es Ist Anspruchsvoller! Bereitstellung Des Mathematischen DeepSeek-Modells Mit Nur Einem Klick

Im Zeitalter großer Sprachmodelle (LLMs) spielen Benchmarks wie Massive Multi-Task Language Understanding (MMLU) eine entscheidende Rolle bei der Erweiterung der Grenzen des Sprachverständnisses und der Denkfähigkeiten der KI in verschiedenen Bereichen.
Mit der kontinuierlichen Verbesserung und Optimierung des Modells hat sich die Leistung von LLM in diesen Benchmarks jedoch allmählich stabilisiert, sodass es zunehmend schwieriger wird, die Unterschiede in den Fähigkeiten verschiedener Modelle zu erkennen.
Um die Fähigkeiten von LLM besser bewerten zu können, haben Forscher der University of Waterloo, der University of Toronto und der Carnegie Mellon University gemeinsam den MMLU-Pro-Datensatz veröffentlicht, der Fragen aus mehreren Quellen integriert, darunter den ursprünglichen MMLU-Datensatz, STEM-Websites, TheoremQA und SciBench.Der Datensatz steht jetzt auf hyper.ai zum Download bereit. Scrollen Sie nach unten, um den Link zu erhalten~
Vom 9. bis 14. September gibt es Updates auf der offiziellen Website von hyper.ai:
* Hochwertige öffentliche Datensätze: 10
* Auswahl an hochwertigen Tutorials: 3
* Community-Artikelauswahl: 4 Artikel
* Beliebte Enzyklopädieeinträge: 5
* Top-Konferenzen mit Deadline im September: 3
Besuchen Sie die offizielle Website:hyper.ai
Ausgewählte öffentliche Datensätze
1. MMLU-Pro-Datensatz zum Verständnis großer Multitasking-Aufgaben
Der MMLU-Pro-Datensatz ist ein leistungsfähigerer und anspruchsvollerer Datensatz zum Verständnis mehrerer Aufgaben im großen Maßstab, der für ein strengeres Benchmarking der Fähigkeiten großer Sprachmodelle konzipiert wurde. Der Datensatz enthält 12.000 komplexe Fragen aus verschiedenen Disziplinen.
Direkte Nutzung: https://go.hyper.ai/PwJDW
2. DeepGlobe18-Datensatz zur Straßenextraktion
Die Trainingsdaten für die Road Challenge enthalten 6.226 RGB-Satellitenbilder mit einer Größe von 1024×1024. Die Bilder haben eine Auflösung von 50 cm Pixeln und werden von den Satelliten von DigitalGlobe aufgenommen.
Direkte Nutzung: https://go.hyper.ai/VIg0J
3. OpenForensics-Datensatz zur Gesichtsfälschungserkennung
Der Datensatz besteht aus 115.000 Bildern aus der freien Wildbahn und 334.000 Gesichtern, alle mit umfangreichen Gesichtsanmerkungen, darunter Fälschungskategorien, Begrenzungsrahmen, Segmentierungsmasken, Fälschungsgrenzen und allgemeine Gesichtsmerkmale, und deckt verschiedene Hintergründe und mehrere Personen unterschiedlichen Alters, Geschlechts, unterschiedlicher Posen, Positionen und Gesichtsverdeckungen ab.
Direkte Nutzung: https://go.hyper.ai/jTTRz
4. DeepfakeTIMIT-Deepfake-Erkennungsdatensatz
Der Datensatz enthält Videos von Gesichtern, die mithilfe eines Open-Source-Ansatzes auf Basis eines Generative Adversarial Network (GAN) ausgetauscht wurden. Diese Videos wurden auf Grundlage des ursprünglichen, auf Autoencoder basierenden Deepfake-Algorithmus erstellt.
Direkte Nutzung: https://go.hyper.ai/me1TI
5. SESYD Synthetische Dokumentdatenbank
Der Datensatz enthält Dokumentbilder mit Benchmark-Realinformationen. Es besteht aus 11 Sätzen, darunter 284.000 Bilder, 190.000 Symbole und 284.000 Zeichen. Der Schwerpunkt liegt auf zwei großen Forschungsproblemen im Bereich der Dokumentbildanalyse: (1) Symbolerkennung und -lokalisierung in Online-Zeichnungsbildern (wie Grundrissen und Schaltplänen); (2) Zeichensegmentierung und -erkennung in geografischen Karten.
Direkte Nutzung: https://go.hyper.ai/ZqRTQ
6. LAV-DF Multimodaler DeepFake Audiovisueller Datensatz
LAV-DF ist ein multimodaler (Videomanipulation und Audiomanipulation) Datensatz, der aus dem VoxCeleb2-Datensatz abgeleitet wurde und 136.304 Videos enthält, darunter 36.431 echte Videos und 99.873 gefälschte Videos.
Direkte Nutzung: https://go.hyper.ai/ujock
7. Vibrant Clothes Rental Dataset Kleidungsverleih-Datensatz
Der Datensatz enthält 64.000 Transaktionen, Miethistorien von 2.200 anonymen Benutzern und 15.800 einzigartige Outfits mit detaillierten Informationen zu den Eigenschaften und der Miethistorie jedes Artikels. Alle Kleidungsstücke werden als einzelne Produkte oder als entsprechende Produktgruppen aufgelistet, wobei auf gemeinsame Designs der einzelnen Artikel verwiesen wird. Jedes Kleidungsstück wird von einer Reihe von Tags begleitet, die einige seiner Eigenschaften beschreiben.
Direkte Verwendung:https://go.hyper.ai/PFlKA
8. FFIW10K-Datensatz zur Gesichtsfälschung
Die Daten umfassen 10.000 hochwertige Fake-Videos von YouTube mit durchschnittlich drei Gesichtern pro Frame. Jedes Video enthält echte und falsche Gesichter, was realistischeren und komplexeren Szenen näher kommt. Der Manipulationsprozess ist vollautomatisch und wird durch ein domänenübergreifendes Qualitätsbewertungsnetzwerk gesteuert, wodurch der Datensatz hochgradig skalierbar und mit geringen Arbeitskosten verbunden ist.
Direkte Nutzung: https://go.hyper.ai/AHS7y
9. ForgeryNet-Datensatz zur Gesichtsfälschung
Der Datensatz enthält 2,9 Millionen Bilder und 221.247 Videos und deckt 7 Fälschungsmethoden auf Bild- und 8 auf Videoebene aus der ganzen Welt ab. Dieser Datensatz bietet Forschern umfangreiche Ressourcen zur Unterstützung von vier Aufgaben auf Bild- und Videoebene: Klassifizierung von Bildfälschungen, räumliche Lokalisierung von Fälschungen, Klassifizierung von Videofälschungen und zeitliche Lokalisierung von Fälschungen.
Direkte Nutzung: https://go.hyper.ai/Yx0mj
10. EEG-Eye-State-Datensatz EEG-Datensatz zum Augenzustand
Dieser Datensatz enthält Instanzen von EEG-Messungen, bei denen die Ausgabe der Zustand der Augen ist, ob sie geöffnet oder geschlossen sind. Die Werte im Datensatz sind in chronologischer Reihenfolge angeordnet, wobei 0 den Zustand „Augen offen“ und 1 den Zustand „Augen geschlossen“ darstellt. Der Datensatz enthält 14 EEG-Messungen mit den Bezeichnungen AF3, F7, F3, FC5, T7, P, O1, O2, P8, T8, FC6, F4, F8, AF4.
Direkte Verwendung:https://go.hyper.ai/RTBDy
Weitere öffentliche Datensätze finden Sie unter:
Ausgewählte öffentliche Tutorials
1. EinsSchlüsselbereitstellung DeepSeek-Prover-V1.5
Bei diesem Modell handelt es sich um ein mathematisches Theorembeweismodell, das 2024 von DeepSeek als Open Source veröffentlicht wurde. Das Forschungsteam hat dieses Modell in Lean 4 eingeführt. Das Modell erstellt durch Selbstiteration und Überwachung durch einen Lean-Beweiser eine Lernumgebung im „Go“-Stil. Dieses Tutorial ist eine Schritt-für-Schritt-Anleitung zur Verwendung der One-Click-Bereitstellungsdemo des Modells.
Direkte Nutzung: https://go.hyper.ai/MevMB
2. Demo zum multimodalen Allround-Sehmodell LLaVA OneVision
Das Modell kann Bilder, Text, Bild-Text-verschachtelte Eingaben und Videos verarbeiten. Es ist das erste Einzelmodell, das die Leistungsengpässe offener multimodaler Modelle in diesen drei wichtigen Computer Vision-Szenarien gleichzeitig überwinden kann. Gehen Sie zur offiziellen Website, um den Container zu klonen und zu starten, kopieren Sie die API-Adresse direkt und erleben Sie dann die Inferenz des Modells.
Direkte Verwendung: https://go.hyper.ai/Dcg74
3. Online-Tutorial | Sir, die Ära von Vincent van Gogh hat sich erneut geändert! SD-Kernmitglieder gründen ihre eigene Firma, und das erste Modell FLUX.1 ist ein harter Kampf gegen SD 3 und Midjourney
Der Wettbewerb im Wenshengtu-Modell wird immer härter! Die ehemaligen Kernmitglieder von Stable Diffusion gründeten ihr eigenes Unternehmen und veröffentlichten das Textgraphenmodell FLUX, das alles von der kommerziellen Nutzung bis hin zur Open-Source-Nutzung für den persönlichen Gebrauch abdeckt. Der erzeugte Effekt kommt dem echten Shooting sehr nahe und die Charakterdetails sind sehr realistisch. Derzeit hat hyper.ai „FLUX ComfyUI (einschließlich der Trainingsversion von Black Myth Wukong LoRA)“ gestartet. Klicken Sie auf den Link unten, um es gemäß dem Tutorial bereitzustellen.
Direktverwenden:https://go.hyper.ai/trQhv
Community-Artikel
Um das Chaos rund um Gesichtserkennung und DeepFake in den Griff zu bekommen, müssen die Technologien zur Gesichtserkennung und Fälschungserkennung dringend verbessert werden, um genau feststellen zu können, ob Bilder und Videos manipuliert wurden. HyperAI hat 11 häufig verwendete Datensätze zur Gesichtserkennung und DeepFake zusammengestellt, die Sie mit nur einem Klick herunterladen können.
Sehen Sie sich die vollständige Zusammenfassung an:https://go.hyper.ai/EMKo2
Auf der Herbstkonferenz zur Einführung neuer Produkte am 10. September stellte Apple neue Produkte wie das iPhone 16, AirPods 4, die Apple Watch Series 10 usw. vor. Basierend auf selbst entwickelten Chips haben sie einen großen Leistungssprung erzielt und Apple Intelligence vollständig integriert, um den Benutzern ein beispielloses intelligentes Erlebnis zu bieten. Dieser Artikel bietet eine umfassende Berichterstattung über Apples Herbstevent zur Vorstellung neuer Produkte.
Den vollständigen Bericht ansehen:https://go.hyper.ai/H7P8X
Im Prozess der Proteinerkennung ist die Identifizierung der Proteinsequenzhomologie eine der wichtigsten Aufgaben. Um die Schwachstellen der Forschung zu entfernter Proteinhomologie zu lösen, haben Li Yu von der Chinesischen Universität Hongkong zusammen mit Sun Siqi, einem jungen Forscher vom Labor für intelligente komplexe Systeme der Universität Fudan und dem Shanghai Artificial Intelligence Laboratory, sowie Mark Gerstein von der Yale University ein ultraschnelles und hochempfindliches Framework zur Homologieerkennung vorgeschlagen – den Dense Homology Searcher. Dabei wird auf Proteinsprachenmodellen und einer Dense-Retrieval-Technologie (DHT) aufgebaut. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe des Forschungspapiers.
Den vollständigen Bericht ansehen:https://go.hyper.ai/vLAej
Das Team von Chen Jin vom State Key Laboratory of Earth Surface Processes and Resource Ecology der Beijing Normal University schlug mit StarFusion ein duales, räumlich-zeitlich entkoppeltes Fusionsarchitekturmodell vor, das das Problem überwinden kann, dass die meisten bestehenden Deep-Learning-Algorithmen HSR-Zeitreihenbilder zum Training benötigen, und die Vorhersage von Bildern mit hoher räumlicher Auflösung vollständig realisieren kann. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe des Forschungspapiers.
Den vollständigen Bericht ansehen:https://go.hyper.ai/7LmzA
Beliebte Enzyklopädieartikel
1. Sigmoidfunktion
2. Gepaarter t-Test
3. Kontrastives Lernen
4. Halbüberwachtes Lernen
5. Datenerweiterung
Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

Zentrale Verfolgung der wichtigsten wissenschaftlichen KI-Konferenzen:https://go.hyper.ai/event
Über HyperAI
HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:
* Bereitstellung inländischer beschleunigter Download-Knoten für über 1300 öffentliche Datensätze
* Enthält über 400 klassische und beliebte Online-Tutorials
* Interpretation von über 100 AI4Science-Papierfällen
* Unterstützt die Suche nach über 500 verwandten Begriffen
* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China
Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen: