Tencent Bringt PhotoMaker Auf Den Markt, Eine Neue Ebene Der Personalisierten Bilderzeugung; LawInstruct, Der Erste Groß Angelegte Datensatz Für Rechtsanweisungen, Wird Veröffentlicht

PhotoMaker ist ein KI-basiertes Bilderzeugungstool, das gemeinsam von Tencent und der Nankai-Universität entwickelt wurde. Es kann nicht nur die Gesichtszüge von Menschen erfassen, sondern auch realistische Bilder von Menschen entsprechend ihren Vorlieben erstellen und so die personalisierte Anpassung auf ein neues Niveau heben. Egal, ob Sie einen brandneuen Avatar für soziale Medien möchten oder einen einzigartigen Charakter für Ihr Spiel entwerfen möchten, wir können Sie zufriedenstellen.

Das One-Click-Run-Demo-Tutorial dieses Projekts ist jetzt auf der offiziellen Website von hyper.ai verfügbar.Damit jeder das Modell bequemer und schneller erleben kann, wird auch die ComfyUI-Workflow-Version eingeführt, die eine schnellere Generierungsgeschwindigkeit aufweist! Weitere benutzerdefinierte Formulare verfügbar! Kommen Sie und erleben Sie es~

Vom 17. bis 21. Juni gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 10

* Ausgewählte hochwertige Tutorials: 2

* Community-Artikelauswahl: 4 Artikel

* Beliebte Enzyklopädieeinträge: 5

* Top-Konferenzen mit Deadlines im Juni und Juli: 5

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. TreeOfLife-10M biologischer Bilddatensatz

Mit über 10 Millionen Bildern, die 454.000 Taxa aus dem gesamten Stammbaum des Lebens abdecken, ist dieser Datensatz der bislang größte ML-Datensatz mit Bildern biologischer Organismen und den zugehörigen taxonomischen Bezeichnungen. Die Forschungsarbeit ist die beste Arbeit des CVPR 2024.

Direkte Verwendung:https://go.hyper.ai/jimyx

2. HAR 15-Datensatz zur Erkennung menschlicher Handlungen

Der Datensatz ist eine Basis mit 15 verschiedenen Kategorien menschlicher Aktivitäten und über 12.000 beschrifteten Bildern (einschließlich Verifizierungsbildern). Jedes Bild weist nur eine Kategorie menschlicher Aktivitäten auf und zielt darauf ab, menschliches Verhalten zu verstehen und jeder Aktion Beschriftungen zuzuweisen.

Direkte Verwendung:https://go.hyper.ai/3jmf1

3. Linux China Originalartikel-Datensatz

Dieser Datensatz ist ein Datensatz aus originalen technischen Artikeln von Linux China + übersetzten technischen Artikeln und bietet mehrere Felder wie Artikeltitel und -inhalt.

Direkte Verwendung:https://go.hyper.ai/KgFgf

4. DroneVehicle Großflächiger Datensatz zur Erkennung von Drohnen-Luftfahrzeugen

Der Datensatz besteht aus insgesamt 56.878 von Drohnen erfassten Bildern, von denen die Hälfte RGB-Bilder und der Rest Infrarotbilder sind. Dieser Datensatz bietet Unterstützung für intelligentes Verkehrsmanagement und Katastrophenhilfe in Städten.

Direkte Verwendung:https://go.hyper.ai/KhbuB

5. PianoMotion10M Datensatz zur Generierung von Klavierbewegungsgesten

Bei diesem Datensatz handelt es sich um einen Benchmark-Datensatz, der sich auf die Generierung von Klavierspielgesten konzentriert. Er umfasst 116 Stunden Klavierspielvideos aus der Vogelperspektive und enthält 10 Millionen kommentierte Handhaltungen. Diese Daten stellen eine wertvolle Quelle für die Erforschung des Zusammenhangs zwischen Klaviermusik und Handbewegungen dar.

Direkte Verwendung:https://go.hyper.ai/QAOi8

6. LawInstruct: Der erste groß angelegte Datensatz zu Rechtsanweisungen

Dieser Datensatz ist der erste groß angelegte Anweisungsdatensatz für den Rechtsbereich. Er deckt 17 Rechtsgebiete und 24 Sprachen ab, enthält 12 Millionen Trainingsbeispiele und deckt eine Vielzahl juristischer Aufgaben ab, wie etwa die Beantwortung von Fragen, Implikationen, Zusammenfassungen und Informationsextraktion.

Direkte Verwendung:https://go.hyper.ai/ARN3n

7. ASL-Alphabet-Gebärdensprachen-Datensatz

Der Datensatz enthält Bilder von Buchstaben der amerikanischen Gebärdensprache, die in 29 Kategorien unterteilt sind und unterschiedliche Buchstaben und Symbole der Gebärdensprache darstellen. Die Bildgröße im Datensatz beträgt einheitlich 200×200 Pixel und der Trainingsdatensatz enthält 87.000 Bilder.

Direkte Verwendung:https://go.hyper.ai/IhhZc

8. AZ-Datensatz handschriftlicher Briefe im CSV-Format

Dieser Datensatz ist eine umfangreiche Sammlung von Bildern handgeschriebener englischer Buchstaben, die speziell für Aufgaben zur Handschrifterkennung entwickelt wurde und zum Trainieren verschiedener Bilderkennungsmodelle verwendet werden kann.

Direkte Verwendung:https://go.hyper.ai/28lwk

9. CAT-Datensatz Bilddatensatz zur Annotation von Gesichtsmerkmalen einer Katze

Der Datensatz enthält über 9.000 Katzenbilder mit annotierten Gesichtszügen. Jedes Bild ist mit einem Katzenkopf versehen, der 9 Punkte hat: 1 für den Mund, 2 für die Augen und 6 für die Ohren.

Direkte Verwendung:https://go.hyper.ai/MkmTu

10. Audio Katzen und Hunde

Der Datensatz enthält Hunderte von Audiodateien der Kategorien Katzen und Hunde: 164 WAV-Dateien für Katzen, entsprechend 1.323 Sekunden Audio; und 113 WAV-Dateien für Hunde, entsprechend 598 Sekunden Audio. Alle „WAV“-Dateien enthalten 16-kHz-Audio und haben eine variable Länge.

Direkte Verwendung:https://go.hyper.ai/e0RGg

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Demo zur Generierung beliebig stilisierter Bilder mit PhotoMaker

PhotoMaker ist ein effizientes benutzerdefiniertes Porträtmodell, mit dem schnell benutzerdefinierte Porträtfotos und künstlerische Fotos auf der Grundlage von Porträtfotos erstellt werden können. Neben der Erstellung personalisierter Porträts können auch Alter und Geschlecht einer Person geändert und die Merkmale verschiedener Personen integriert werden, um neue Personeninformationen zu erstellen. Es ist ein sehr nützliches KI-Malwerkzeug. Dieses Tutorial hat die Umgebung für Ihre Bequemlichkeit eingerichtet.

Online ausführen:https://go.hyper.ai/3B5Rd

2. ComfyUI PhotoMaker ZHO-Bildgenerierungs-Workflow

In diesem Tutorial erfahren Sie, wie Sie den ComfyUI-Workflow in PhotoMaker ausführen. Im Vergleich zur Gradio-Version der Demo bietet die ComfyUI-Workflow-Version die Vorteile einer schnelleren Generierung, Unterstützung für Knotenaufteilung und benutzerdefinierte Größe usw. Chao Neural Network hat die entsprechende Umgebung für Sie erstellt und Sie können sie ausführen, indem Sie sie mit einem Klick klonen.

Online ausführen:https://go.hyper.ai/XdSoQ

3. Songstilklassifizierung basierend auf HuBERT

In diesem Lernprogramm wird anhand des Basismodells HuBERT gezeigt, wie mit einem vortrainierten Audiomodell Audioklassifizierungsaufgaben durchgeführt werden können. Außerdem wird die Klassifizierung von Musikstilen durch Feinabstimmung des vortrainierten Modells implementiert.

Online ausführen:https://go.hyper.ai/7QjRj

Wir haben außerdem eine Tutorial-Austauschgruppe zum Thema „Stabile Diffusion“ eingerichtet. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen~

Community-Artikel

1. Sitzung zum Austausch von KI-Compiler-Technologien: Shanghai Jiao Tong University/Institute of Computing Technology, Chinese Academy of Sciences/Microsoft Asia Research/Zhiyuan, sie sind hier!

HyperAI veranstaltet am 6. Juli (Samstag) das 5. Offline-Treffen des Meet AI Compiler Technology Salon am Institute of Computing Technology der Chinesischen Akademie der Wissenschaften. Dieses Treffen ist in zwei Teile gegliedert: Technologieaustausch und Diskussion am runden Tisch. Die Gäste kommen von der Shanghai Jiao Tong University, Institute of Computing Technology, Chinese Academy of Sciences, Microsoft Research Asia und der Beijing Academy of Artificial Intelligence. Wir hoffen, dass das neue Treffen allen neue technologische Fortschritte bringt und neue Freunde auf demselben Gebiet schafft.Klicken Sie auf „Originaltext lesen“, um sich anzumelden und teilzunehmen!

Ereignisdetails anzeigen:https://go.hyper.ai/oAsLQ

2. Dialog mit Shao Yilei, Dekan des Shanghai Institute of Artificial Intelligence and Finance, ECNU: Im KI-Zeitalter werden Schulen mit einem starken geisteswissenschaftlichen Hintergrund einen großen Vorteil haben

Die weltweit erste Bildungs- und Forschungseinrichtung, die sich mit der Schnittstelle zwischen künstlicher Intelligenz und Finanzen befasst – das Shanghai Institute of Artificial Intelligence and Finance der East China Normal University – wurde vor Kurzem offiziell eröffnet. HyperAI hatte die Ehre, ein ausführliches Interview mit Dekan Shao Yile zu führen und die Vision und den Entwicklungsplan des neuen Colleges besser zu verstehen.

Lesen Sie das ganze Interview:https://go.hyper.ai/bp4Po

3. Kann die Vermehrung von Krebszellen hemmen! Die Huihu School of Pharmacy und die Tianjin Medical University haben gemeinsam einen neuen Tumorsuppressor-Protein-Degrader dp53m entwickelt

Professor Wu Sijin von der Huihu School of Pharmacy an der Xi'an Jiaotong-Liverpool University hat zusammen mit Professor Xie Songbo und dem Team von Professor Zhong Diansheng vom Tianjin Medical University General Hospital einen selektiven p53-R175H-Degrader – dp53m – entwickelt. Dieser Degrader kann das mutierte p53-R175H-Protein spezifisch erkennen und gezielt abbauen, wobei er eine signifikante Antitumorwirksamkeit aufweist und keine offensichtlichen toxischen Reaktionen hervorruft. dp53m kann auch die Empfindlichkeit von Krebszellen gegenüber dem Chemotherapeutikum Cisplatin erhöhen, was für die Krebsbehandlung von entscheidender Bedeutung ist. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe der Forschungsergebnisse.

Den vollständigen Bericht ansehen:https://go.hyper.ai/k80er

4. Sagen Sie die Immobilienpreise in Wuhan genau voraus! Das GIS-Labor der Zhejiang-Universität schlug das osp-GNNWR-Modell vor: Es beschreibt komplexe räumliche Prozesse und geografische Phänomene präzise

Forscher des GIS-Labors der Zhejiang-Universität führten eine Methode mit neuronalen Netzwerken ein, um mehrere räumliche Nähemaße zwischen Beobachtungspunkten nichtlinear zu koppeln und so ein optimiertes räumliches Nähemaß zu erhalten, das die Genauigkeit der Vorhersagen des Modells zu den Immobilienpreisen verbesserte. Die Studie kombinierte außerdem OSP mit der Methode der gewichteten Regression geografischer neuronaler Netzwerke, um das osp-GNNWR-Modell zu erstellen, und realisierte das Training des neuronalen Netzwerks durch Lösen der räumlichen nichtstationären Regressionsbeziehung zwischen der abhängigen Variable und der unabhängigen Variable. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe der Forschungsergebnisse.

Den vollständigen Bericht ansehen:https://go.hyper.ai/kWmHC

Beliebte Enzyklopädieartikel

1. Funktionsaufruf Funktionsaufruf

2. Spiking Neural Network (SNN)

3. Kontextpositionskodierung CoPE

4. Russische Puppen repräsentieren das Erlernen von MRL

5. Kolmogorov-Arnold-Darstellungssatz

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://hyper.ai/wiki

Vorschau auf die Live-Übertragung von Station B

Jeff Dean ist leitender Forscher und Informatiker bei Google. Er ist bekannt für seine Pionierarbeit im Bereich verteilter Systeme und künstlicher Intelligenz, einschließlich der Entwicklung von MapReduce und TensorFlow, und eine der Schlüsselfiguren in der technologischen Entwicklung von Google. Diese Woche überträgt Super Neuro TV die Reden und Interviews von Jeff Dean live.

Die folgende Tabelle ist eine Vorschau der vom Herausgeber ausgewählten Inhalte ↓↓↓

Datum	Zeit	Inhalt
Montag, 24. Juni	18:00	Jeff Dean über die fünf wichtigsten Trends im maschinellen Lernen
Dienstag, 25. Juni	18:00	Lassen Sie KI allen dienen
Mittwoch, 26. Juni	18:00	Jeff Deans positiver Ausblick auf die Zukunft der KI
Donnerstag, 27. Juni	18:00	Jeff Deans Rede auf der Stanford Medical Big Data Conference
Freitag, 28. Juni	18:00	Jeff Deans Vortrag über Deep Learning
Samstag, 29. Juni	18:00	Google Brain & Brain Residency
Sonntag, 20. Juni	18:00	So nutzen Sie Deep Learning zur Problemlösung

Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:

http://live.bilibili.com/26483094

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bereitstellung inländischer beschleunigter Download-Knoten für über 1300 öffentliche Datensätze

* Enthält über 400 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai

HyperAI

Tencent Bringt PhotoMaker Auf Den Markt, Eine Neue Ebene Der Personalisierten Bilderzeugung; LawInstruct, Der Erste Groß Angelegte Datensatz Für Rechtsanweisungen, Wird Veröffentlicht

vor 2 Jahren

Information

Künstliche Intelligenz

Datensatz

Maschinelles Lernen

Tiefes Lernen

Vom 17. bis 21. Juni gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 10

* Ausgewählte hochwertige Tutorials: 2

* Community-Artikelauswahl: 4 Artikel

* Beliebte Enzyklopädieeinträge: 5

* Top-Konferenzen mit Deadlines im Juni und Juli: 5

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. TreeOfLife-10M biologischer Bilddatensatz

Direkte Verwendung:https://go.hyper.ai/jimyx

2. HAR 15-Datensatz zur Erkennung menschlicher Handlungen

Direkte Verwendung:https://go.hyper.ai/3jmf1

3. Linux China Originalartikel-Datensatz

Dieser Datensatz ist ein Datensatz aus originalen technischen Artikeln von Linux China + übersetzten technischen Artikeln und bietet mehrere Felder wie Artikeltitel und -inhalt.

Direkte Verwendung:https://go.hyper.ai/KgFgf

4. DroneVehicle Großflächiger Datensatz zur Erkennung von Drohnen-Luftfahrzeugen

Direkte Verwendung:https://go.hyper.ai/KhbuB

5. PianoMotion10M Datensatz zur Generierung von Klavierbewegungsgesten

Direkte Verwendung:https://go.hyper.ai/QAOi8

6. LawInstruct: Der erste groß angelegte Datensatz zu Rechtsanweisungen

Direkte Verwendung:https://go.hyper.ai/ARN3n

7. ASL-Alphabet-Gebärdensprachen-Datensatz

Direkte Verwendung:https://go.hyper.ai/IhhZc

8. AZ-Datensatz handschriftlicher Briefe im CSV-Format

Direkte Verwendung:https://go.hyper.ai/28lwk

9. CAT-Datensatz Bilddatensatz zur Annotation von Gesichtsmerkmalen einer Katze

Der Datensatz enthält über 9.000 Katzenbilder mit annotierten Gesichtszügen. Jedes Bild ist mit einem Katzenkopf versehen, der 9 Punkte hat: 1 für den Mund, 2 für die Augen und 6 für die Ohren.

Direkte Verwendung:https://go.hyper.ai/MkmTu

10. Audio Katzen und Hunde

Direkte Verwendung:https://go.hyper.ai/e0RGg

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Demo zur Generierung beliebig stilisierter Bilder mit PhotoMaker

Online ausführen:https://go.hyper.ai/3B5Rd

2. ComfyUI PhotoMaker ZHO-Bildgenerierungs-Workflow

Online ausführen:https://go.hyper.ai/XdSoQ

3. Songstilklassifizierung basierend auf HuBERT

Online ausführen:https://go.hyper.ai/7QjRj

Community-Artikel

1. Sitzung zum Austausch von KI-Compiler-Technologien: Shanghai Jiao Tong University/Institute of Computing Technology, Chinese Academy of Sciences/Microsoft Asia Research/Zhiyuan, sie sind hier!

Ereignisdetails anzeigen:https://go.hyper.ai/oAsLQ

Lesen Sie das ganze Interview:https://go.hyper.ai/bp4Po

3. Kann die Vermehrung von Krebszellen hemmen! Die Huihu School of Pharmacy und die Tianjin Medical University haben gemeinsam einen neuen Tumorsuppressor-Protein-Degrader dp53m entwickelt

Den vollständigen Bericht ansehen:https://go.hyper.ai/k80er

Den vollständigen Bericht ansehen:https://go.hyper.ai/kWmHC

Beliebte Enzyklopädieartikel

1. Funktionsaufruf Funktionsaufruf

2. Spiking Neural Network (SNN)

3. Kontextpositionskodierung CoPE

4. Russische Puppen repräsentieren das Erlernen von MRL

5. Kolmogorov-Arnold-Darstellungssatz

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://hyper.ai/wiki

Vorschau auf die Live-Übertragung von Station B

Die folgende Tabelle ist eine Vorschau der vom Herausgeber ausgewählten Inhalte ↓↓↓

Datum	Zeit	Inhalt
Montag, 24. Juni	18:00	Jeff Dean über die fünf wichtigsten Trends im maschinellen Lernen
Dienstag, 25. Juni	18:00	Lassen Sie KI allen dienen
Mittwoch, 26. Juni	18:00	Jeff Deans positiver Ausblick auf die Zukunft der KI
Donnerstag, 27. Juni	18:00	Jeff Deans Rede auf der Stanford Medical Big Data Conference
Freitag, 28. Juni	18:00	Jeff Deans Vortrag über Deep Learning
Samstag, 29. Juni	18:00	Google Brain & Brain Residency
Sonntag, 20. Juni	18:00	So nutzen Sie Deep Learning zur Problemlösung

Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:

http://live.bilibili.com/26483094

Bis nächste Woche!

Über HyperAI

* Bereitstellung inländischer beschleunigter Download-Knoten für über 1300 öffentliche Datensätze

* Enthält über 400 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai

Verwandt Neuigkeiten

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Können Emojis Die Sprachgenerierung Steuern? Irodori-TTS Ist Ein Japanisches TTS, Das Auf Der RF-DiT-Architektur Basiert; Datensätze Zu Ekzemen Und Tinea-Hauterkrankungen: Unterstützung Der Medizinischen Bildklassifizierung Und Des Transferlernens.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

MiniCPM5-1B, Trainiert Mit RL+OPD, Erzielt Bestleistungen (SOTA) Bei Mehreren Komplexen Aufgaben; Der CHI-Bench-Datensatz Zur Evaluierung Von Medizinischen Agenten, Der Für Die Automatisierung Komplexer Prozesse Im Gesundheitswesen Entwickelt Wurde, Wurde veröffentlicht.

Extrem Leichtgewichtig Und Dennoch Mit Unverminderter Bildqualität! ERNIE-Image-Turbo: Schluss Mit Langen Wartezeiten, Blitzschnelle Geschwindigkeit! Einführung Zweidimensionaler Metriken Für Wahrnehmung Und Kognition: Alibabas Einheitlicher Multimodaler Parsing- Und Evaluierungsdatensatz OmniParsingBench Ist Jetzt online.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

HyperAI

Tencent Bringt PhotoMaker Auf Den Markt, Eine Neue Ebene Der Personalisierten Bilderzeugung; LawInstruct, Der Erste Groß Angelegte Datensatz Für Rechtsanweisungen, Wird Veröffentlicht

vor 2 Jahren

Information

Künstliche Intelligenz

Datensatz

Maschinelles Lernen

Tiefes Lernen

Vom 17. bis 21. Juni gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 10

* Ausgewählte hochwertige Tutorials: 2

* Community-Artikelauswahl: 4 Artikel

* Beliebte Enzyklopädieeinträge: 5

* Top-Konferenzen mit Deadlines im Juni und Juli: 5

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. TreeOfLife-10M biologischer Bilddatensatz

Direkte Verwendung:https://go.hyper.ai/jimyx

2. HAR 15-Datensatz zur Erkennung menschlicher Handlungen

Direkte Verwendung:https://go.hyper.ai/3jmf1

3. Linux China Originalartikel-Datensatz

Dieser Datensatz ist ein Datensatz aus originalen technischen Artikeln von Linux China + übersetzten technischen Artikeln und bietet mehrere Felder wie Artikeltitel und -inhalt.

Direkte Verwendung:https://go.hyper.ai/KgFgf

4. DroneVehicle Großflächiger Datensatz zur Erkennung von Drohnen-Luftfahrzeugen

Direkte Verwendung:https://go.hyper.ai/KhbuB

5. PianoMotion10M Datensatz zur Generierung von Klavierbewegungsgesten

Direkte Verwendung:https://go.hyper.ai/QAOi8

6. LawInstruct: Der erste groß angelegte Datensatz zu Rechtsanweisungen

Direkte Verwendung:https://go.hyper.ai/ARN3n

7. ASL-Alphabet-Gebärdensprachen-Datensatz

Direkte Verwendung:https://go.hyper.ai/IhhZc

8. AZ-Datensatz handschriftlicher Briefe im CSV-Format

Direkte Verwendung:https://go.hyper.ai/28lwk

9. CAT-Datensatz Bilddatensatz zur Annotation von Gesichtsmerkmalen einer Katze

Der Datensatz enthält über 9.000 Katzenbilder mit annotierten Gesichtszügen. Jedes Bild ist mit einem Katzenkopf versehen, der 9 Punkte hat: 1 für den Mund, 2 für die Augen und 6 für die Ohren.

Direkte Verwendung:https://go.hyper.ai/MkmTu

10. Audio Katzen und Hunde

Direkte Verwendung:https://go.hyper.ai/e0RGg

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Demo zur Generierung beliebig stilisierter Bilder mit PhotoMaker

Online ausführen:https://go.hyper.ai/3B5Rd

2. ComfyUI PhotoMaker ZHO-Bildgenerierungs-Workflow

Online ausführen:https://go.hyper.ai/XdSoQ

3. Songstilklassifizierung basierend auf HuBERT

Online ausführen:https://go.hyper.ai/7QjRj

Community-Artikel

1. Sitzung zum Austausch von KI-Compiler-Technologien: Shanghai Jiao Tong University/Institute of Computing Technology, Chinese Academy of Sciences/Microsoft Asia Research/Zhiyuan, sie sind hier!

Ereignisdetails anzeigen:https://go.hyper.ai/oAsLQ

Lesen Sie das ganze Interview:https://go.hyper.ai/bp4Po

3. Kann die Vermehrung von Krebszellen hemmen! Die Huihu School of Pharmacy und die Tianjin Medical University haben gemeinsam einen neuen Tumorsuppressor-Protein-Degrader dp53m entwickelt

Den vollständigen Bericht ansehen:https://go.hyper.ai/k80er

Den vollständigen Bericht ansehen:https://go.hyper.ai/kWmHC

Beliebte Enzyklopädieartikel

1. Funktionsaufruf Funktionsaufruf

2. Spiking Neural Network (SNN)

3. Kontextpositionskodierung CoPE

4. Russische Puppen repräsentieren das Erlernen von MRL

5. Kolmogorov-Arnold-Darstellungssatz

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://hyper.ai/wiki

Vorschau auf die Live-Übertragung von Station B

Die folgende Tabelle ist eine Vorschau der vom Herausgeber ausgewählten Inhalte ↓↓↓

Datum	Zeit	Inhalt
Montag, 24. Juni	18:00	Jeff Dean über die fünf wichtigsten Trends im maschinellen Lernen
Dienstag, 25. Juni	18:00	Lassen Sie KI allen dienen
Mittwoch, 26. Juni	18:00	Jeff Deans positiver Ausblick auf die Zukunft der KI
Donnerstag, 27. Juni	18:00	Jeff Deans Rede auf der Stanford Medical Big Data Conference
Freitag, 28. Juni	18:00	Jeff Deans Vortrag über Deep Learning
Samstag, 29. Juni	18:00	Google Brain & Brain Residency
Sonntag, 20. Juni	18:00	So nutzen Sie Deep Learning zur Problemlösung

Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:

http://live.bilibili.com/26483094

Bis nächste Woche!

Über HyperAI

* Bereitstellung inländischer beschleunigter Download-Knoten für über 1300 öffentliche Datensätze

* Enthält über 400 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai

Verwandt Neuigkeiten

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Können Emojis Die Sprachgenerierung Steuern? Irodori-TTS Ist Ein Japanisches TTS, Das Auf Der RF-DiT-Architektur Basiert; Datensätze Zu Ekzemen Und Tinea-Hauterkrankungen: Unterstützung Der Medizinischen Bildklassifizierung Und Des Transferlernens.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

MiniCPM5-1B, Trainiert Mit RL+OPD, Erzielt Bestleistungen (SOTA) Bei Mehreren Komplexen Aufgaben; Der CHI-Bench-Datensatz Zur Evaluierung Von Medizinischen Agenten, Der Für Die Automatisierung Komplexer Prozesse Im Gesundheitswesen Entwickelt Wurde, Wurde veröffentlicht.

Extrem Leichtgewichtig Und Dennoch Mit Unverminderter Bildqualität! ERNIE-Image-Turbo: Schluss Mit Langen Wartezeiten, Blitzschnelle Geschwindigkeit! Einführung Zweidimensionaler Metriken Für Wahrnehmung Und Kognition: Alibabas Einheitlicher Multimodaler Parsing- Und Evaluierungsdatensatz OmniParsingBench Ist Jetzt online.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

Command Palette

Tencent Bringt PhotoMaker Auf Den Markt, Eine Neue Ebene Der Personalisierten Bilderzeugung; LawInstruct, Der Erste Groß Angelegte Datensatz Für Rechtsanweisungen, Wird Veröffentlicht

Command Palette

Tencent Bringt PhotoMaker Auf Den Markt, Eine Neue Ebene Der Personalisierten Bilderzeugung; LawInstruct, Der Erste Groß Angelegte Datensatz Für Rechtsanweisungen, Wird Veröffentlicht

Verwandt Neuigkeiten

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Können Emojis Die Sprachgenerierung Steuern? Irodori-TTS Ist Ein Japanisches TTS, Das Auf Der RF-DiT-Architektur Basiert; Datensätze Zu Ekzemen Und Tinea-Hauterkrankungen: Unterstützung Der Medizinischen Bildklassifizierung Und Des Transferlernens.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

MiniCPM5-1B, Trainiert Mit RL+OPD, Erzielt Bestleistungen (SOTA) Bei Mehreren Komplexen Aufgaben; Der CHI-Bench-Datensatz Zur Evaluierung Von Medizinischen Agenten, Der Für Die Automatisierung Komplexer Prozesse Im Gesundheitswesen Entwickelt Wurde, Wurde veröffentlicht.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

Command Palette

Tencent Bringt PhotoMaker Auf Den Markt, Eine Neue Ebene Der Personalisierten Bilderzeugung; LawInstruct, Der Erste Groß Angelegte Datensatz Für Rechtsanweisungen, Wird Veröffentlicht

Verwandt Neuigkeiten

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Können Emojis Die Sprachgenerierung Steuern? Irodori-TTS Ist Ein Japanisches TTS, Das Auf Der RF-DiT-Architektur Basiert; Datensätze Zu Ekzemen Und Tinea-Hauterkrankungen: Unterstützung Der Medizinischen Bildklassifizierung Und Des Transferlernens.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

MiniCPM5-1B, Trainiert Mit RL+OPD, Erzielt Bestleistungen (SOTA) Bei Mehreren Komplexen Aufgaben; Der CHI-Bench-Datensatz Zur Evaluierung Von Medizinischen Agenten, Der Für Die Automatisierung Komplexer Prozesse Im Gesundheitswesen Entwickelt Wurde, Wurde veröffentlicht.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

Verwandt Neuigkeiten

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Können Emojis Die Sprachgenerierung Steuern? Irodori-TTS Ist Ein Japanisches TTS, Das Auf Der RF-DiT-Architektur Basiert; Datensätze Zu Ekzemen Und Tinea-Hauterkrankungen: Unterstützung Der Medizinischen Bildklassifizierung Und Des Transferlernens.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

MiniCPM5-1B, Trainiert Mit RL+OPD, Erzielt Bestleistungen (SOTA) Bei Mehreren Komplexen Aufgaben; Der CHI-Bench-Datensatz Zur Evaluierung Von Medizinischen Agenten, Der Für Die Automatisierung Komplexer Prozesse Im Gesundheitswesen Entwickelt Wurde, Wurde veröffentlicht.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.

Verwandt Neuigkeiten

Schnell Und Präzise! Cohere Veröffentlicht Ein Open-Source-Transkriptionsmodell; Präzises Parsen Komplexer Szenarien: Das Visuelle Sprachmodell Chandra-ocr-2 Erzielt Eine Genaue OCR.

Können Emojis Die Sprachgenerierung Steuern? Irodori-TTS Ist Ein Japanisches TTS, Das Auf Der RF-DiT-Architektur Basiert; Datensätze Zu Ekzemen Und Tinea-Hauterkrankungen: Unterstützung Der Medizinischen Bildklassifizierung Und Des Transferlernens.

4-stufige Bildausgabe/4K-Qualität/6-fache Beschleunigung, PiD Verwendet Pixeldiffusion Zur Vereinheitlichung Von Dekodierung Und Superauflösungsausgabe; SA-3DAO: Ein Datensatz Mit 1000 Paaren Realer Bilder, Die Mit Von Künstlern Handgefertigten 3D-Netzen Gepaart sind.

Tencent Veröffentlicht Hy-MT1.5 Als Open Source: Das 440 MB Große Übersetzungsmodell Bietet Erstklassige Übersetzungsfähigkeiten; MIT Veröffentlicht Gemeinsam MathNet: Einen Multimodalen Benchmark Für Mathematische Inferenz, Der 27.000 Reale Mathematikaufgaben Der Olympiade abdeckt.

Ein Lokal Ausführbares Modell Zur Erkennung Von Datenschutzverletzungen: Privacy Filter Erzielt Eine Hochwertige Filterung Personenbezogener Daten Zu Geringen Kosten; Echte Open Source! Umfasst Den Strukturierten Fußballdatensatz Von Transfermarkt Mit Über 80.000 Spielen.

MiniCPM5-1B, Trainiert Mit RL+OPD, Erzielt Bestleistungen (SOTA) Bei Mehreren Komplexen Aufgaben; Der CHI-Bench-Datensatz Zur Evaluierung Von Medizinischen Agenten, Der Für Die Automatisierung Komplexer Prozesse Im Gesundheitswesen Entwickelt Wurde, Wurde veröffentlicht.

Anima V1, Ein Brandneues Rohbildmodell, Wurde Veröffentlicht, Das Sich Auf Die Bildgenerierung Im Anime-Stil Konzentriert; Der MemLens Multimodale Langzeitgedächtnis-Evaluierungsdatensatz Umfasst Mechanismen Für Die Dialogübergreifende Graph-Text-Schlussfolgerung Und Wissensaktualisierung.

Durchbruch Bei TTS Durch Zero-Sampling! Mit Nur Wenigen Sekunden Referenzaudio Hilft OmniVoice Ihnen, Hunderte Von Sprachen Mühelos Zu Klonen; 17 Sprachen Auf Einmal: MDPbench Löst Das Hauptproblem Des Parsens Ressourcenarmer Textsysteme.