Tencent Bringt PhotoMaker Auf Den Markt, Eine Neue Ebene Der Personalisierten Bilderzeugung; LawInstruct, Der Erste Groß Angelegte Datensatz Für Rechtsanweisungen, Wird Veröffentlicht

PhotoMaker ist ein KI-basiertes Bilderzeugungstool, das gemeinsam von Tencent und der Nankai-Universität entwickelt wurde. Es kann nicht nur die Gesichtszüge von Menschen erfassen, sondern auch realistische Bilder von Menschen entsprechend ihren Vorlieben erstellen und so die personalisierte Anpassung auf ein neues Niveau heben. Egal, ob Sie einen brandneuen Avatar für soziale Medien möchten oder einen einzigartigen Charakter für Ihr Spiel entwerfen möchten, wir können Sie zufriedenstellen.
Das One-Click-Run-Demo-Tutorial dieses Projekts ist jetzt auf der offiziellen Website von hyper.ai verfügbar.Damit jeder das Modell bequemer und schneller erleben kann, wird auch die ComfyUI-Workflow-Version eingeführt, die eine schnellere Generierungsgeschwindigkeit aufweist! Weitere benutzerdefinierte Formulare verfügbar! Kommen Sie und erleben Sie es~
Vom 17. bis 21. Juni gibt es Updates auf der offiziellen Website von hyper.ai:
* Hochwertige öffentliche Datensätze: 10
* Ausgewählte hochwertige Tutorials: 2
* Community-Artikelauswahl: 4 Artikel
* Beliebte Enzyklopädieeinträge: 5
* Top-Konferenzen mit Deadlines im Juni und Juli: 5
Besuchen Sie die offizielle Website:hyper.ai
Ausgewählte öffentliche Datensätze
1. TreeOfLife-10M biologischer Bilddatensatz
Mit über 10 Millionen Bildern, die 454.000 Taxa aus dem gesamten Stammbaum des Lebens abdecken, ist dieser Datensatz der bislang größte ML-Datensatz mit Bildern biologischer Organismen und den zugehörigen taxonomischen Bezeichnungen. Die Forschungsarbeit ist die beste Arbeit des CVPR 2024.
Direkte Verwendung:https://go.hyper.ai/jimyx
2. HAR 15-Datensatz zur Erkennung menschlicher Handlungen
Der Datensatz ist eine Basis mit 15 verschiedenen Kategorien menschlicher Aktivitäten und über 12.000 beschrifteten Bildern (einschließlich Verifizierungsbildern). Jedes Bild weist nur eine Kategorie menschlicher Aktivitäten auf und zielt darauf ab, menschliches Verhalten zu verstehen und jeder Aktion Beschriftungen zuzuweisen.
Direkte Verwendung:https://go.hyper.ai/3jmf1
3. Linux China Originalartikel-Datensatz
Dieser Datensatz ist ein Datensatz aus originalen technischen Artikeln von Linux China + übersetzten technischen Artikeln und bietet mehrere Felder wie Artikeltitel und -inhalt.
Direkte Verwendung:https://go.hyper.ai/KgFgf
4. DroneVehicle Großflächiger Datensatz zur Erkennung von Drohnen-Luftfahrzeugen
Der Datensatz besteht aus insgesamt 56.878 von Drohnen erfassten Bildern, von denen die Hälfte RGB-Bilder und der Rest Infrarotbilder sind. Dieser Datensatz bietet Unterstützung für intelligentes Verkehrsmanagement und Katastrophenhilfe in Städten.
Direkte Verwendung:https://go.hyper.ai/KhbuB
5. PianoMotion10M Datensatz zur Generierung von Klavierbewegungsgesten
Bei diesem Datensatz handelt es sich um einen Benchmark-Datensatz, der sich auf die Generierung von Klavierspielgesten konzentriert. Er umfasst 116 Stunden Klavierspielvideos aus der Vogelperspektive und enthält 10 Millionen kommentierte Handhaltungen. Diese Daten stellen eine wertvolle Quelle für die Erforschung des Zusammenhangs zwischen Klaviermusik und Handbewegungen dar.
Direkte Verwendung:https://go.hyper.ai/QAOi8
6. LawInstruct: Der erste groß angelegte Datensatz zu Rechtsanweisungen
Dieser Datensatz ist der erste groß angelegte Anweisungsdatensatz für den Rechtsbereich. Er deckt 17 Rechtsgebiete und 24 Sprachen ab, enthält 12 Millionen Trainingsbeispiele und deckt eine Vielzahl juristischer Aufgaben ab, wie etwa die Beantwortung von Fragen, Implikationen, Zusammenfassungen und Informationsextraktion.
Direkte Verwendung:https://go.hyper.ai/ARN3n
7. ASL-Alphabet-Gebärdensprachen-Datensatz
Der Datensatz enthält Bilder von Buchstaben der amerikanischen Gebärdensprache, die in 29 Kategorien unterteilt sind und unterschiedliche Buchstaben und Symbole der Gebärdensprache darstellen. Die Bildgröße im Datensatz beträgt einheitlich 200×200 Pixel und der Trainingsdatensatz enthält 87.000 Bilder.
Direkte Verwendung:https://go.hyper.ai/IhhZc
8. AZ-Datensatz handschriftlicher Briefe im CSV-Format
Dieser Datensatz ist eine umfangreiche Sammlung von Bildern handgeschriebener englischer Buchstaben, die speziell für Aufgaben zur Handschrifterkennung entwickelt wurde und zum Trainieren verschiedener Bilderkennungsmodelle verwendet werden kann.
Direkte Verwendung:https://go.hyper.ai/28lwk
9. CAT-Datensatz Bilddatensatz zur Annotation von Gesichtsmerkmalen einer Katze
Der Datensatz enthält über 9.000 Katzenbilder mit annotierten Gesichtszügen. Jedes Bild ist mit einem Katzenkopf versehen, der 9 Punkte hat: 1 für den Mund, 2 für die Augen und 6 für die Ohren.
Direkte Verwendung:https://go.hyper.ai/MkmTu
Der Datensatz enthält Hunderte von Audiodateien der Kategorien Katzen und Hunde: 164 WAV-Dateien für Katzen, entsprechend 1.323 Sekunden Audio; und 113 WAV-Dateien für Hunde, entsprechend 598 Sekunden Audio. Alle „WAV“-Dateien enthalten 16-kHz-Audio und haben eine variable Länge.
Direkte Verwendung:https://go.hyper.ai/e0RGg
Weitere öffentliche Datensätze finden Sie unter:
Ausgewählte öffentliche Tutorials
1. Demo zur Generierung beliebig stilisierter Bilder mit PhotoMaker
PhotoMaker ist ein effizientes benutzerdefiniertes Porträtmodell, mit dem schnell benutzerdefinierte Porträtfotos und künstlerische Fotos auf der Grundlage von Porträtfotos erstellt werden können. Neben der Erstellung personalisierter Porträts können auch Alter und Geschlecht einer Person geändert und die Merkmale verschiedener Personen integriert werden, um neue Personeninformationen zu erstellen. Es ist ein sehr nützliches KI-Malwerkzeug. Dieses Tutorial hat die Umgebung für Ihre Bequemlichkeit eingerichtet.
Online ausführen:https://go.hyper.ai/3B5Rd
2. ComfyUI PhotoMaker ZHO-Bildgenerierungs-Workflow
In diesem Tutorial erfahren Sie, wie Sie den ComfyUI-Workflow in PhotoMaker ausführen. Im Vergleich zur Gradio-Version der Demo bietet die ComfyUI-Workflow-Version die Vorteile einer schnelleren Generierung, Unterstützung für Knotenaufteilung und benutzerdefinierte Größe usw. Chao Neural Network hat die entsprechende Umgebung für Sie erstellt und Sie können sie ausführen, indem Sie sie mit einem Klick klonen.
Online ausführen:https://go.hyper.ai/XdSoQ
3. Songstilklassifizierung basierend auf HuBERT
In diesem Lernprogramm wird anhand des Basismodells HuBERT gezeigt, wie mit einem vortrainierten Audiomodell Audioklassifizierungsaufgaben durchgeführt werden können. Außerdem wird die Klassifizierung von Musikstilen durch Feinabstimmung des vortrainierten Modells implementiert.
Online ausführen:https://go.hyper.ai/7QjRj
Wir haben außerdem eine Tutorial-Austauschgruppe zum Thema „Stabile Diffusion“ eingerichtet. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen~

Community-Artikel
HyperAI veranstaltet am 6. Juli (Samstag) das 5. Offline-Treffen des Meet AI Compiler Technology Salon am Institute of Computing Technology der Chinesischen Akademie der Wissenschaften. Dieses Treffen ist in zwei Teile gegliedert: Technologieaustausch und Diskussion am runden Tisch. Die Gäste kommen von der Shanghai Jiao Tong University, Institute of Computing Technology, Chinese Academy of Sciences, Microsoft Research Asia und der Beijing Academy of Artificial Intelligence. Wir hoffen, dass das neue Treffen allen neue technologische Fortschritte bringt und neue Freunde auf demselben Gebiet schafft.Klicken Sie auf „Originaltext lesen“, um sich anzumelden und teilzunehmen!
Ereignisdetails anzeigen:https://go.hyper.ai/oAsLQ
Die weltweit erste Bildungs- und Forschungseinrichtung, die sich mit der Schnittstelle zwischen künstlicher Intelligenz und Finanzen befasst – das Shanghai Institute of Artificial Intelligence and Finance der East China Normal University – wurde vor Kurzem offiziell eröffnet. HyperAI hatte die Ehre, ein ausführliches Interview mit Dekan Shao Yile zu führen und die Vision und den Entwicklungsplan des neuen Colleges besser zu verstehen.
Lesen Sie das ganze Interview:https://go.hyper.ai/bp4Po
Professor Wu Sijin von der Huihu School of Pharmacy an der Xi'an Jiaotong-Liverpool University hat zusammen mit Professor Xie Songbo und dem Team von Professor Zhong Diansheng vom Tianjin Medical University General Hospital einen selektiven p53-R175H-Degrader – dp53m – entwickelt. Dieser Degrader kann das mutierte p53-R175H-Protein spezifisch erkennen und gezielt abbauen, wobei er eine signifikante Antitumorwirksamkeit aufweist und keine offensichtlichen toxischen Reaktionen hervorruft. dp53m kann auch die Empfindlichkeit von Krebszellen gegenüber dem Chemotherapeutikum Cisplatin erhöhen, was für die Krebsbehandlung von entscheidender Bedeutung ist. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe der Forschungsergebnisse.
Den vollständigen Bericht ansehen:https://go.hyper.ai/k80er
Forscher des GIS-Labors der Zhejiang-Universität führten eine Methode mit neuronalen Netzwerken ein, um mehrere räumliche Nähemaße zwischen Beobachtungspunkten nichtlinear zu koppeln und so ein optimiertes räumliches Nähemaß zu erhalten, das die Genauigkeit der Vorhersagen des Modells zu den Immobilienpreisen verbesserte. Die Studie kombinierte außerdem OSP mit der Methode der gewichteten Regression geografischer neuronaler Netzwerke, um das osp-GNNWR-Modell zu erstellen, und realisierte das Training des neuronalen Netzwerks durch Lösen der räumlichen nichtstationären Regressionsbeziehung zwischen der abhängigen Variable und der unabhängigen Variable. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe der Forschungsergebnisse.
Den vollständigen Bericht ansehen:https://go.hyper.ai/kWmHC
Beliebte Enzyklopädieartikel
1. Funktionsaufruf Funktionsaufruf
2. Spiking Neural Network (SNN)
3. Kontextpositionskodierung CoPE
4. Russische Puppen repräsentieren das Erlernen von MRL
5. Kolmogorov-Arnold-Darstellungssatz
Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:
Vorschau auf die Live-Übertragung von Station B
Jeff Dean ist leitender Forscher und Informatiker bei Google. Er ist bekannt für seine Pionierarbeit im Bereich verteilter Systeme und künstlicher Intelligenz, einschließlich der Entwicklung von MapReduce und TensorFlow, und eine der Schlüsselfiguren in der technologischen Entwicklung von Google. Diese Woche überträgt Super Neuro TV die Reden und Interviews von Jeff Dean live.
Die folgende Tabelle ist eine Vorschau der vom Herausgeber ausgewählten Inhalte ↓↓↓
Datum | Zeit | Inhalt |
Montag, 24. Juni | 18:00 | Jeff Dean über die fünf wichtigsten Trends im maschinellen Lernen |
Dienstag, 25. Juni | 18:00 | Lassen Sie KI allen dienen |
Mittwoch, 26. Juni | 18:00 | Jeff Deans positiver Ausblick auf die Zukunft der KI |
Donnerstag, 27. Juni | 18:00 | Jeff Deans Rede auf der Stanford Medical Big Data Conference |
Freitag, 28. Juni | 18:00 | Jeff Deans Vortrag über Deep Learning |
Samstag, 29. Juni | 18:00 | Google Brain & Brain Residency |
Sonntag, 20. Juni | 18:00 | So nutzen Sie Deep Learning zur Problemlösung |
Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:
http://live.bilibili.com/26483094
Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!
Bis nächste Woche!
Über HyperAI
HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:
* Bereitstellung inländischer beschleunigter Download-Knoten für über 1300 öffentliche Datensätze
* Enthält über 400 klassische und beliebte Online-Tutorials
* Interpretation von über 100 AI4Science-Papierfällen
* Unterstützt die Suche nach über 500 verwandten Begriffen
* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China
Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen: