Metas Größter Datensatz Zur Videosegmentierung Ist Jetzt Online Und 50-mal Größer Als Ähnliche Datensätze. Es Hat 9.000 Sterne! Die Kuaishou Digital Human Demo Beginnt Mit Einem Klick!

Wie erweckt KI statische Porträts zum Leben und lässt ihre Lächeln, Blinzeln und sogar subtilen Gesichtsausdrücke lebendig werden? Vor Kurzem hat das Kuaishou-Team LivePortrait als Open Source freigegeben. Laden Sie einfach ein statisches Foto hoch und es kann in ein dynamisches Porträt mit ausdrucksstarken Elementen umgewandelt werden. Es hat auf GitHub bereits 9.000 Sterne erhalten.Dieses Tutorial ist jetzt auf HyperAI verfügbar. Kommen Sie und erleben Sie es jetzt!

LivePortrait Link zum Tutorial:

https://go.hyper.ai/oTs66

Vom 29. Juli bis 2. August gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 11

* Auswahl an hochwertigen Tutorials: 3

* Community-Artikelauswahl: 4 Artikel

* Beliebte Enzyklopädieeinträge: 5

* Top-Konferenzen mit Deadline im August: 4

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. SA-V-Videosegmentierungsdatensatz

Der SA-V-Datensatz ist ein umfangreicher Datensatz zur Videosegmentierung, der 2024 von Meta zum Trainieren und Bewerten von Meta Segment Anything Model 2 erstellt wurde. Er enthält ungefähr 51.000 Videos aus der realen Welt und 643.000 räumlich-zeitliche Maskenanmerkungen und ist damit etwa 50-mal größer als andere ähnliche Datensätze.

Direkte Verwendung:https://go.hyper.ai/X4DGI

2. LAB Bench Biology Benchmark Dataset: Umfasst 8 Hauptaufgaben und über 2,4.000 Multiple-Choice-Fragen

Um die effektive Entwicklung von KI-Systemen im Bereich der Biologie zu fördern, haben Forscher von FutureHouse Inc. den Language Agent Biology Benchmark Dataset LAB-Bench eingeführt, der zur Bewertung der Leistung von KI-Systemen in der tatsächlichen biologischen Forschung wie Literaturrecherche und -schlussfolgerung, Graphinterpretation sowie Verständnis und Verarbeitung von DNA- und Proteinsequenzen verwendet wird. Die Ergebnisse wurden der Spitzenkonferenz NeurlPS 2024 vorgelegt.

Direkte Verwendung:https://go.hyper.ai/UznkS

3. NuminaMath-CoT Mathematik-Wettbewerbsproblem-Datensatz

Der Datensatz enthält über 860.000 Frage-Lösungspaare aus Mathematikwettbewerben, von denen jedes die Chain of Thought (CoT)-Argumentationsvorlage verwendet. Zu den Quellen des Datensatzes zählen Mathematikübungen für chinesische Oberschulen sowie Wettbewerbsfragen der amerikanischen und internationalen Mathematikolympiade. Die Daten wurden hauptsächlich aus Online-Prüfungsbögen im PDF-Format und aus Mathematik-Diskussionsforen gesammelt.

Direkte Verwendung:https://go.hyper.ai/svElx

4. Taptap überprüft den Datensatz mit Spielebewertungen

Dieser Datensatz enthält gekennzeichnete Bewertungen von etwa 300 Spielen der mobilen Spiele-App TapTap mit insgesamt 4.888 Datenbeispielen, die für Aufgaben zur Stimmungsanalyse verwendet werden können. Darunter wurden Nutzerbewertungen mit weniger als 3 Sternen (maximal 5 Sterne) als 0 (unzufrieden) und die anderen als 1 (zufrieden) gewertet. Das Verhältnis dieser beiden Kategorien beträgt ungefähr 1:1.

Direkte Verwendung:https://go.hyper.ai/ISf7c

5. CCPD-Datensatz Chinesischer Kennzeichenerkennungsdatensatz

Der CCPD-Datensatz ist ein großer, vielfältiger und sorgfältig kommentierter Datensatz zur Nummernschilderkennung. Der Datensatz wird hauptsächlich auf Parkplätzen in Hefei, China, gesammelt und enthält Nummernschildfotos in einer Vielzahl komplexer Umgebungen, wie Unschärfe, Neigung, Regen und Schnee, was den Datensatz bei der Nummernschilderkennungsaufgabe anspruchsvoller macht.

Direkte Verwendung:https://go.hyper.ai/gZ37Y

6. TinyStories-Datensatz zur Kurzgeschichtensynthese

Dieser Datensatz ist ein synthetischer Datensatz von Kurzgeschichten, der mit GPT-3.5 und GPT-4 generiert wurde, und der enthaltene Wortschatz ist auf das Verständnisspektrum von 3- bis 4-jährigen Kindern beschränkt. Mit diesem Datensatz können Modelle trainiert werden, die Kurzgeschichten erstellen, die flüssig, konsistent und vielfältig sind und eine nahezu perfekte Grammatik aufweisen.

Direkte Verwendung:https://go.hyper.ai/m9ouS

7. Wildfire Smoke Wildfire Smoke Detection Dataset

Dieser Datensatz wurde 2019 gemeinsam von AI for Mankind und HPWREN veröffentlicht. Er enthält insgesamt 737 Bilder, darunter 516 Trainingsbilder, 147 Verifizierungsbilder und 74 Testbilder, wobei das Annotationsformat COCO ist. Ziel ist es, die Fähigkeit des Modells zu verbessern, zwischen Wolken/Nebel und Rauch zu unterscheiden und eine durchgängige Feedbackschleife zu etablieren.

Direkte Verwendung:https://go.hyper.ai/ofGHZ

8. LJSpeech-Datensatz

Dies ist ein gemeinfreier Sprachdatensatz, der aus 13.100 kurzen Audioclips besteht, in denen ein einzelner Sprecher Passagen aus 7 Sachbüchern vorliest. Für jedes Fragment werden Transkriptionen bereitgestellt. Die Länge der Clips variierte zwischen 1 und 10 Sekunden, mit einer Gesamtlänge von ungefähr 24 Stunden.

Direkte Verwendung:https://go.hyper.ai/Eo1bK

9. Chinesische Tierkreiszeichen

Der Datensatz enthält 8.508 Bilder der zwölf chinesischen Tierkreiskategorien. Der Datensatz wurde im Verhältnis 85:7,5:7,5 in Training, Validierung und Test aufgeteilt.

Direkte Verwendung:https://go.hyper.ai/ps2es

10. DISC-Law-SFT Hochwertiger Feinabstimmungsdatensatz zur chinesischen Rechtsaufsicht

Dieser Datensatz enthält fast 300.000 Trainingsdaten und ist speziell für den chinesischen Rechtsbereich konzipiert. Ziel ist es, die Fähigkeiten des Modells bei der Verarbeitung juristischer Texte, beim juristischen Denken sowie beim Wissensabruf und bei der Einhaltung von Vorschriften im juristischen Bereich zu verbessern.

Direkte Verwendung:https://go.hyper.ai/zh9Ij

11. Free Spoken Digit Dataset (FSDD) Digitaler Audioerkennungsdatensatz

Der Free Spoken Digit Dataset (FSDD) ist ein Audiodatensatz, der aus digitalen Sprachaufnahmen in WAV-Dateien mit einer Abtastrate von 8 kHz besteht. Die Aufnahmen wurden bearbeitet, um die Stille am Anfang und Ende zu minimieren.

Direkte Verwendung:https://go.hyper.ai/HZ00d

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Neues Tutorial | Das Drei-in-Eins-Tool für Text-zu-Bild, Bild-zu-Bild und Bildwiederherstellung, das HiDiffusion-Tutorial mit einem Klick ist jetzt online!

HiDiffusion ist ein Open-Source-Framework für hohe Auflösungen, das von Megvii Technology entwickelt wurde. Es unterstützt nicht nur textgenerierte Bilder und bildgenerierte Bilder, sondern verfügt auch über Funktionen zur Bildwiederherstellung. HyperAI Super Neural hat jetzt das Tutorial „HiDiffusion kann schnell eine Demo für hochwertige 8k-Bilder erstellen“ veröffentlicht. Sie müssen keine Befehle eingeben, klonen Sie es einfach mit einem Klick, um zu starten.

Online ausführen:https://go.hyper.ai/yZ5K5

2. LivePortrait Kuaishou Open Source bildgeneriertes Video digitale Menschendemo

LivePortrait ist ein Framework zur Erstellung von Porträtvideos. Zu seinen Hauptfunktionen gehören das Generieren lebendiger Animationen aus einem einzigen Bild, die präzise Steuerung der Augen- und Lippenbewegungen, das nahtlose Zusammenfügen mehrerer Porträts, die Unterstützung von Porträts in mehreren Stilen, das Generieren hochauflösender Animationen usw. Dieses Tutorial ist eine Demo von LivePortrait, die mit einem Klick ausgeführt wird. Die relevante Umgebung und die Abhängigkeiten wurden installiert. Sie können es erleben, indem Sie es klonen und mit einem Klick starten.

Online ausführen:https://go.hyper.ai/oTs66

3. AuraSR GAN-basierte Superauflösungs-Bildvergrößerungsdemo

AuraSR ist ein auf Deep Learning basierendes Modell zur Wiederherstellung hochauflösender Bilder, das detaillierte Informationen in Bildern intelligent erkennen und fehlende Details beim Vergrößern der Bilder automatisch ergänzen kann. Im Vergleich zu herkömmlichen Bildvergrößerungsmethoden liefert AuraSR nicht nur bessere Ergebnisse, sondern ist auch einfach zu verwenden und kann ohne professionelle Kenntnisse problemlos genutzt werden. Erleben Sie das Modell mit dem Klonen per Mausklick.

Online ausführen:https://go.hyper.ai/y2wIU

Community-Artikel

1. Aitomatic veröffentlichte mit Beiträgen von Meta, Tokyo Electron, FPT Software usw. das erste Open-Source-Modell in der Halbleiterindustrie und „sperrte“ die technologische Autonomie von Unternehmen

Aitomatic, ein führendes Unternehmen im Bereich KI-Innovation im Industriesektor, gab die Einführung von SemiKong bekannt, dem weltweit ersten Open-Source-KI-Modell in großer Sprache, das speziell für die Halbleiterindustrie entwickelt wurde. Das Unternehmen hat zuvor einen KI-Agenten namens aiKO auf den Markt gebracht, der exklusive Agenten für Unternehmensbenutzer auf der Grundlage ihres Fachwissens und ihrer Daten erstellt und den Unternehmen das „volle Eigentum“ an ihren Agenten überlässt.

Den vollständigen Bericht ansehen:https://go.hyper.ai/A7eCi

2. Highlights: Huang Renxun und Zuckerbergs „Gespräch des Jahrhunderts“

Am frühen Morgen des 30. Juli führten Nvidia-Gründer und CEO Huang Renxun und Meta-Gründer und CEO Mark Zuckerberg auf der 51. SIGGRAPH-Grafikkonferenz ein „Kamingespräch“. HyperAI hat die Highlights und vollständigen chinesischen Untertitel für das Video zusammengestellt.

Den vollständigen Bericht ansehen:https://go.hyper.ai/rbU2u

3. Für ICML ausgewählt! MIT-Team erzielt neuen Durchbruch auf Basis von AlphaFold und enthüllt die dynamische Vielfalt von Proteinen

Das MIT-Forschungsteam hat hochpräzise Einzelzustandsprädiktoren wie AlphaFold und ESMFold neu aufgesetzt und sie in einem benutzerdefinierten Flow-Matching-Framework fein abgestimmt, um sequenzbedingte Modelle zur Generierung von Proteinstrukturen namens AlphaFLOW und ESMFLOW zu erhalten. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe der relevanten Dokumente.

Den vollständigen Bericht ansehen:https://go.hyper.ai/qupG9

4. Das Niveau ist fast so gut wie das der leitenden Pathologen! Tsinghua-Team schlägt KI-basiertes Modell ROAM vor, um eine genaue Diagnose von Gliomen zu erreichen

Das Life Basic Model Laboratory der Abteilung für Automatisierung der Tsinghua-Universität hat in Zusammenarbeit mit dem Xiangya-Krankenhaus der Central South University ein präzises KI-Basismodell zur pathologischen Diagnose namens ROAM vorgeschlagen, das auf großen regionalen Interessen und einem Pyramidentransformator basiert und für die Diagnose auf klinischer Ebene und die Entdeckung molekularer Marker von Gliomen verwendet wird und auf die pathologische Diagnose anderer Tumorarten ausgeweitet werden kann.

Den vollständigen Bericht ansehen:https://go.hyper.ai/w4tsr

Beliebte Enzyklopädieartikel

1. Neuronales Strahlungsfeld (NeRF)

2. Gruppenabfrage Aufmerksamkeit GQA

3. Datenerweiterung

4. Umfangreiches Multitasking-Sprachverständnis (MMLU)

5. Langzeit-Kurzzeitgedächtnis

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://go.hyper.ai/wiki

Zentrale Verfolgung der wichtigsten wissenschaftlichen KI-Konferenzen:https://go.hyper.ai/event

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bereitstellung inländischer beschleunigter Download-Knoten für über 1300 öffentliche Datensätze

* Enthält über 400 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai

HyperAI

Metas Größter Datensatz Zur Videosegmentierung Ist Jetzt Online Und 50-mal Größer Als Ähnliche Datensätze. Es Hat 9.000 Sterne! Die Kuaishou Digital Human Demo Beginnt Mit Einem Klick!

vor 2 Jahren

Information

Künstliche Intelligenz

Datensatz

Tiefes Lernen

LivePortrait Link zum Tutorial:

https://go.hyper.ai/oTs66

Vom 29. Juli bis 2. August gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 11

* Auswahl an hochwertigen Tutorials: 3

* Community-Artikelauswahl: 4 Artikel

* Beliebte Enzyklopädieeinträge: 5

* Top-Konferenzen mit Deadline im August: 4

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. SA-V-Videosegmentierungsdatensatz

Direkte Verwendung:https://go.hyper.ai/X4DGI

2. LAB Bench Biology Benchmark Dataset: Umfasst 8 Hauptaufgaben und über 2,4.000 Multiple-Choice-Fragen

Direkte Verwendung:https://go.hyper.ai/UznkS

3. NuminaMath-CoT Mathematik-Wettbewerbsproblem-Datensatz

Direkte Verwendung:https://go.hyper.ai/svElx

4. Taptap überprüft den Datensatz mit Spielebewertungen

Direkte Verwendung:https://go.hyper.ai/ISf7c

5. CCPD-Datensatz Chinesischer Kennzeichenerkennungsdatensatz

Direkte Verwendung:https://go.hyper.ai/gZ37Y

6. TinyStories-Datensatz zur Kurzgeschichtensynthese

Direkte Verwendung:https://go.hyper.ai/m9ouS

7. Wildfire Smoke Wildfire Smoke Detection Dataset

Direkte Verwendung:https://go.hyper.ai/ofGHZ

8. LJSpeech-Datensatz

Direkte Verwendung:https://go.hyper.ai/Eo1bK

9. Chinesische Tierkreiszeichen

Der Datensatz enthält 8.508 Bilder der zwölf chinesischen Tierkreiskategorien. Der Datensatz wurde im Verhältnis 85:7,5:7,5 in Training, Validierung und Test aufgeteilt.

Direkte Verwendung:https://go.hyper.ai/ps2es

10. DISC-Law-SFT Hochwertiger Feinabstimmungsdatensatz zur chinesischen Rechtsaufsicht

Direkte Verwendung:https://go.hyper.ai/zh9Ij

11. Free Spoken Digit Dataset (FSDD) Digitaler Audioerkennungsdatensatz

Direkte Verwendung:https://go.hyper.ai/HZ00d

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Neues Tutorial | Das Drei-in-Eins-Tool für Text-zu-Bild, Bild-zu-Bild und Bildwiederherstellung, das HiDiffusion-Tutorial mit einem Klick ist jetzt online!

Online ausführen:https://go.hyper.ai/yZ5K5

2. LivePortrait Kuaishou Open Source bildgeneriertes Video digitale Menschendemo

Online ausführen:https://go.hyper.ai/oTs66

3. AuraSR GAN-basierte Superauflösungs-Bildvergrößerungsdemo

Online ausführen:https://go.hyper.ai/y2wIU

Community-Artikel

Den vollständigen Bericht ansehen:https://go.hyper.ai/A7eCi

2. Highlights: Huang Renxun und Zuckerbergs „Gespräch des Jahrhunderts“

Den vollständigen Bericht ansehen:https://go.hyper.ai/rbU2u

3. Für ICML ausgewählt! MIT-Team erzielt neuen Durchbruch auf Basis von AlphaFold und enthüllt die dynamische Vielfalt von Proteinen

Den vollständigen Bericht ansehen:https://go.hyper.ai/qupG9

4. Das Niveau ist fast so gut wie das der leitenden Pathologen! Tsinghua-Team schlägt KI-basiertes Modell ROAM vor, um eine genaue Diagnose von Gliomen zu erreichen

Den vollständigen Bericht ansehen:https://go.hyper.ai/w4tsr

Beliebte Enzyklopädieartikel

1. Neuronales Strahlungsfeld (NeRF)

2. Gruppenabfrage Aufmerksamkeit GQA

3. Datenerweiterung

4. Umfangreiches Multitasking-Sprachverständnis (MMLU)

5. Langzeit-Kurzzeitgedächtnis

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://go.hyper.ai/wiki

Zentrale Verfolgung der wichtigsten wissenschaftlichen KI-Konferenzen:https://go.hyper.ai/event

Bis nächste Woche!

Über HyperAI

* Bereitstellung inländischer beschleunigter Download-Knoten für über 1300 öffentliche Datensätze

* Enthält über 400 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai

Verwandt Neuigkeiten

Erreichen Sie „Sprachausgabefreiheit“ Mit Nur 3 Sekunden Audio: Mistral Open-Source-Sprachmodell Voxtral-4B-TTS-2603; Setzen Sie Einen Neuen Maßstab Für Datenqualität: Sutra 10B Pretraining.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Extrem Leichtgewichtig Und Dennoch Mit Unverminderter Bildqualität! ERNIE-Image-Turbo: Schluss Mit Langen Wartezeiten, Blitzschnelle Geschwindigkeit! Einführung Zweidimensionaler Metriken Für Wahrnehmung Und Kognition: Alibabas Einheitlicher Multimodaler Parsing- Und Evaluierungsdatensatz OmniParsingBench Ist Jetzt online.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

Unterstützt Die Generierung Von Live-Action-/Animations-/Tier-basierten Videos; Meituans Open-Source-Framework LongCat 1.5 Zur Generierung Von Audio-basierten Videos in Verschiedenen Stilen Erweitert Die Diagrammrekonstruktions- Und Tabellenextraktionsfunktionen Von VLM Mithilfe Des Millionenfachen Diagrammverständnis-Datensatzes ChartNet.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

HyperAI

Metas Größter Datensatz Zur Videosegmentierung Ist Jetzt Online Und 50-mal Größer Als Ähnliche Datensätze. Es Hat 9.000 Sterne! Die Kuaishou Digital Human Demo Beginnt Mit Einem Klick!

vor 2 Jahren

Information

Künstliche Intelligenz

Datensatz

Tiefes Lernen

LivePortrait Link zum Tutorial:

https://go.hyper.ai/oTs66

Vom 29. Juli bis 2. August gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 11

* Auswahl an hochwertigen Tutorials: 3

* Community-Artikelauswahl: 4 Artikel

* Beliebte Enzyklopädieeinträge: 5

* Top-Konferenzen mit Deadline im August: 4

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. SA-V-Videosegmentierungsdatensatz

Direkte Verwendung:https://go.hyper.ai/X4DGI

2. LAB Bench Biology Benchmark Dataset: Umfasst 8 Hauptaufgaben und über 2,4.000 Multiple-Choice-Fragen

Direkte Verwendung:https://go.hyper.ai/UznkS

3. NuminaMath-CoT Mathematik-Wettbewerbsproblem-Datensatz

Direkte Verwendung:https://go.hyper.ai/svElx

4. Taptap überprüft den Datensatz mit Spielebewertungen

Direkte Verwendung:https://go.hyper.ai/ISf7c

5. CCPD-Datensatz Chinesischer Kennzeichenerkennungsdatensatz

Direkte Verwendung:https://go.hyper.ai/gZ37Y

6. TinyStories-Datensatz zur Kurzgeschichtensynthese

Direkte Verwendung:https://go.hyper.ai/m9ouS

7. Wildfire Smoke Wildfire Smoke Detection Dataset

Direkte Verwendung:https://go.hyper.ai/ofGHZ

8. LJSpeech-Datensatz

Direkte Verwendung:https://go.hyper.ai/Eo1bK

9. Chinesische Tierkreiszeichen

Der Datensatz enthält 8.508 Bilder der zwölf chinesischen Tierkreiskategorien. Der Datensatz wurde im Verhältnis 85:7,5:7,5 in Training, Validierung und Test aufgeteilt.

Direkte Verwendung:https://go.hyper.ai/ps2es

10. DISC-Law-SFT Hochwertiger Feinabstimmungsdatensatz zur chinesischen Rechtsaufsicht

Direkte Verwendung:https://go.hyper.ai/zh9Ij

11. Free Spoken Digit Dataset (FSDD) Digitaler Audioerkennungsdatensatz

Direkte Verwendung:https://go.hyper.ai/HZ00d

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Neues Tutorial | Das Drei-in-Eins-Tool für Text-zu-Bild, Bild-zu-Bild und Bildwiederherstellung, das HiDiffusion-Tutorial mit einem Klick ist jetzt online!

Online ausführen:https://go.hyper.ai/yZ5K5

2. LivePortrait Kuaishou Open Source bildgeneriertes Video digitale Menschendemo

Online ausführen:https://go.hyper.ai/oTs66

3. AuraSR GAN-basierte Superauflösungs-Bildvergrößerungsdemo

Online ausführen:https://go.hyper.ai/y2wIU

Community-Artikel

Den vollständigen Bericht ansehen:https://go.hyper.ai/A7eCi

2. Highlights: Huang Renxun und Zuckerbergs „Gespräch des Jahrhunderts“

Den vollständigen Bericht ansehen:https://go.hyper.ai/rbU2u

3. Für ICML ausgewählt! MIT-Team erzielt neuen Durchbruch auf Basis von AlphaFold und enthüllt die dynamische Vielfalt von Proteinen

Den vollständigen Bericht ansehen:https://go.hyper.ai/qupG9

4. Das Niveau ist fast so gut wie das der leitenden Pathologen! Tsinghua-Team schlägt KI-basiertes Modell ROAM vor, um eine genaue Diagnose von Gliomen zu erreichen

Den vollständigen Bericht ansehen:https://go.hyper.ai/w4tsr

Beliebte Enzyklopädieartikel

1. Neuronales Strahlungsfeld (NeRF)

2. Gruppenabfrage Aufmerksamkeit GQA

3. Datenerweiterung

4. Umfangreiches Multitasking-Sprachverständnis (MMLU)

5. Langzeit-Kurzzeitgedächtnis

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://go.hyper.ai/wiki

Zentrale Verfolgung der wichtigsten wissenschaftlichen KI-Konferenzen:https://go.hyper.ai/event

Bis nächste Woche!

Über HyperAI

* Bereitstellung inländischer beschleunigter Download-Knoten für über 1300 öffentliche Datensätze

* Enthält über 400 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai

Verwandt Neuigkeiten

Erreichen Sie „Sprachausgabefreiheit“ Mit Nur 3 Sekunden Audio: Mistral Open-Source-Sprachmodell Voxtral-4B-TTS-2603; Setzen Sie Einen Neuen Maßstab Für Datenqualität: Sutra 10B Pretraining.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Extrem Leichtgewichtig Und Dennoch Mit Unverminderter Bildqualität! ERNIE-Image-Turbo: Schluss Mit Langen Wartezeiten, Blitzschnelle Geschwindigkeit! Einführung Zweidimensionaler Metriken Für Wahrnehmung Und Kognition: Alibabas Einheitlicher Multimodaler Parsing- Und Evaluierungsdatensatz OmniParsingBench Ist Jetzt online.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

Unterstützt Die Generierung Von Live-Action-/Animations-/Tier-basierten Videos; Meituans Open-Source-Framework LongCat 1.5 Zur Generierung Von Audio-basierten Videos in Verschiedenen Stilen Erweitert Die Diagrammrekonstruktions- Und Tabellenextraktionsfunktionen Von VLM Mithilfe Des Millionenfachen Diagrammverständnis-Datensatzes ChartNet.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

Command Palette

Metas Größter Datensatz Zur Videosegmentierung Ist Jetzt Online Und 50-mal Größer Als Ähnliche Datensätze. Es Hat 9.000 Sterne! Die Kuaishou Digital Human Demo Beginnt Mit Einem Klick!

Command Palette

Metas Größter Datensatz Zur Videosegmentierung Ist Jetzt Online Und 50-mal Größer Als Ähnliche Datensätze. Es Hat 9.000 Sterne! Die Kuaishou Digital Human Demo Beginnt Mit Einem Klick!

Verwandt Neuigkeiten

Erreichen Sie „Sprachausgabefreiheit“ Mit Nur 3 Sekunden Audio: Mistral Open-Source-Sprachmodell Voxtral-4B-TTS-2603; Setzen Sie Einen Neuen Maßstab Für Datenqualität: Sutra 10B Pretraining.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

Command Palette

Metas Größter Datensatz Zur Videosegmentierung Ist Jetzt Online Und 50-mal Größer Als Ähnliche Datensätze. Es Hat 9.000 Sterne! Die Kuaishou Digital Human Demo Beginnt Mit Einem Klick!

Verwandt Neuigkeiten

Erreichen Sie „Sprachausgabefreiheit“ Mit Nur 3 Sekunden Audio: Mistral Open-Source-Sprachmodell Voxtral-4B-TTS-2603; Setzen Sie Einen Neuen Maßstab Für Datenqualität: Sutra 10B Pretraining.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

Verwandt Neuigkeiten

Erreichen Sie „Sprachausgabefreiheit“ Mit Nur 3 Sekunden Audio: Mistral Open-Source-Sprachmodell Voxtral-4B-TTS-2603; Setzen Sie Einen Neuen Maßstab Für Datenqualität: Sutra 10B Pretraining.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

Verwandt Neuigkeiten

Erreichen Sie „Sprachausgabefreiheit“ Mit Nur 3 Sekunden Audio: Mistral Open-Source-Sprachmodell Voxtral-4B-TTS-2603; Setzen Sie Einen Neuen Maßstab Für Datenqualität: Sutra 10B Pretraining.

Kostenloses Online-Tutorial Zur CPU | Hermes Agent: Langzeitgedächtnis Lernen? Das Speichererweiterungs-Plugin TencentDB Agent Memory Kann Fakten, Präferenzen, Aufgabenzustände usw. Separat speichern.

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.