HyperAI

Microsoft Und Tencent Konkurrieren in Der Technologie, TRELLIS Ist Führend in Der Neuen Richtung Der Multiformatunterstützung Im Bereich Der 3D-Generierung. Mehr Als 5.000 Fragen Beantwortet! VIS-Bench Ermöglicht KI Das Erlernen Des „räumlichen Gedächtnisses“

特色图像

Im vergangenen November brachte Tencent das generative Modell Hunyuan3D auf den Markt, das erste große Open-Source-Modell der Branche, das die 3D-Generierung von Text und Bildern unterstützt. Weniger als einen Monat später veröffentlichte Microsoft mit TRELLIS ein neues Framework, um im Bereich der 3D-Asset-Generierung in den Wettbewerb einzusteigen. TRELLIS unterstützt mehrere Ausgabeformate, darunter Strahlungsfeld, 3D-Gauß- und Netzformat, und bietet so maximale Flexibilität für unterschiedliche Anforderungen.

Beide Modelle sind jetzt auf der offiziellen Website von hyper.ai verfügbar. Kommen Sie und probieren Sie aus, welches besser ist.

Verwenden Sie Hunyuan3D online:https://go.hyper.ai/Rsrno

TRELLIS online verwenden:https://go.hyper.ai/JE5s5

Vom 6. bis 11. Januar gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 10

* Hochwertige Tutorial-Auswahl: 6

* Community-Artikelauswahl: 8 Artikel

* Beliebte Enzyklopädieeinträge: 5

* Top-Konferenzen mit Deadlines im Januar: 7

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. VSI-Bench Visuell-räumliche Intelligenz-Benchmark

Der Datensatz enthält mehr als 5.000 Frage-Antwort-Paare, die fast 290 echte Videos von Innenaufnahmen aus verschiedenen Umgebungen wie Wohnhäusern, Büros und Fabriken abdecken und mehrere Themen wie Objekterkennung, Positionsbeziehungen und Aktionsvorhersage behandeln.

Direkte Verwendung:https://go.hyper.ai/q0DYA

VSI-Bench-Aufgabendemonstration

2. Datensatz zur Gesichtsmerkmalextraktion Datensatz zur Gesichtsmerkmalextraktion

Dieser Datensatz ist ein beschrifteter Datensatz mit 750 Bildern zum Erkennen von Augenbrauen, Augen, Nase, Lippen und Bartbereichen des Gesichts. Der Datenbeschriftungsprozess wurde in Roboflow durchgeführt und im YOLOv8-Format exportiert.

Direkte Verwendung:https://go.hyper.ai/O3kER

Dataset-Beispiel

3. Datensatz zur Stimmungs- und Emotionsanalyse Datensatz zur Stimmungs- und Emotionsanalyse

Der Datensatz enthält 422.000 Sentimentanalyse-Sätze und 3.309 Sentimentanalyse-Sätze als Ergänzungen. Die Sentimentanalyse kennzeichnet sechs verschiedene Emotionen: Freude, Traurigkeit, Wut, Angst, Liebe und Überraschung.

Direkte Verwendung:https://go.hyper.ai/wFNO6

4. Eurus-2-RL-Data Trainingsdatensatz für mathematische Programmierprobleme

Bei diesem Datensatz handelt es sich um einen hochwertigen Datensatz, der speziell für das Training mit bestärkendem Lernen verwendet wird. Es wird hauptsächlich zum Lösen mathematischer und Programmierprobleme verwendet. Es enthält etwa 455.000 mathematische Probleme und 27.000 Programmierprobleme.

Direkte Verwendung:https://go.hyper.ai/Wdo1k

5. Medizinisches o1-Argumentation SFT Medizinischer Schlussfolgerungsdatensatz

Dieser Datensatz dient der Feinabstimmung des großen medizinischen Sprachmodells HuatuoGPT-o1, um seine Leistung bei komplexen medizinischen Denkaufgaben zu verbessern. Der Aufbau des Datensatzes basiert auf GPT-4o, das die Genauigkeit und Zuverlässigkeit der Daten gewährleistet, indem es nach überprüfbaren medizinischen Fragen sucht und die Antworten mithilfe eines medizinischen Prüfers überprüft.

Direkte Verwendung:https://go.hyper.ai/XMtXp

6. MCTS-Datensatz für vereinfachten chinesischen Text

Der Datensatz enthält 723 komplex strukturierte Sätze, die aus einem Nachrichtenkorpus ausgewählt wurden, das auf dem Penn Chinese Treebank (CTB)-Standard basiert, und jeder Satz ist mit mehreren manuell vereinfachten Versionen ausgestattet, was ihn zum größten und am häufigsten zitierten Bewertungsdatensatz für die Aufgabe der chinesischen Textvereinfachung macht.

Direkte Verwendung:https://go.hyper.ai/UR3CN

7. educhat-sft-002-data-osm Datensatz zum Bildungsdialog

Der Datensatz enthält 4 Millionen Datenpunkte und deckt eine Vielzahl von Bildungsbereichen ab, wie etwa offene Fragen und Antworten, Bewertung von Aufsätzen, heuristisches Lehren, emotionale Unterstützung und Kursbetreuung.

Direkte Verwendung:https://go.hyper.ai/nQw0K

8. Feinabstimmung des Datensatzes für die GOAT-Rechenaufgabe

Dieser Datensatz besteht aus zwei Dateien: dataset.json und dataset.ipynb. Die Datei dataset.json enthält etwa 1,7 Millionen synthetische Daten für Rechenaufgaben, die von dataset.ipynb generiert wurden.

Direkte Verwendung:https://go.hyper.ai/8ZAvG

9. NaturalProofs-Datensatz zum mathematischen Denken

Der Datensatz ist ein multidomänenbasiertes Korpus zum Studium mathematischer Argumentation in natürlicher Sprache. Es enthält ungefähr 30.000 Theoremaussagen und Beweise, 15.000 Definitionen und 2.000 zusätzliche Seiten (z. B. Axiome, Korollare), die alle in natürlicher mathematischer Sprache geschrieben sind.

Direkte Verwendung:https://go.hyper.ai/Bk4WE

10. TransGPT-pt&sft-Datensatz für den Verkehrsdialog vor dem Training

Dieser Datensatz ist Teil von TransGPT, dem ersten umfassenden Transportmodell in China. Es enthält etwa 346.000 Textdaten im Transportbereich, die für das Vortraining im Feld verwendet werden, und etwa 58.000 Dialogdaten im Transportbereich, die für die Feinabstimmung verwendet werden.

Direkte Verwendung:https://go.hyper.ai/vuDHa

Ausgewählte öffentliche Tutorials

1. Hunyuan3D: Generieren Sie 3D-Assets in nur 10 Sekunden

Hunyuan3D ist ein generatives 3D-Diffusionsmodell, das eine leichte und eine Standardversion umfasst, die beide die Generierung hochwertiger 3D-Assets aus Text- und Bildeingaben unterstützen. Nach der qualitativen und quantitativen mehrdimensionalen Bewertung schnitt Hunyuan3D-1.0 in Bezug auf geometrische Details, Texturdetails, Konsistenz von Textur und Geometrie, 3D-Rationalität und Anweisungskonformität sehr gut ab.

Dieses Tutorial ist eine abgespeckte Version von Hunyuan3D. Klicken Sie auf den Link unten und folgen Sie den Anweisungen des Tutorials, um die 3D-Modellerstellung kennenzulernen.

Online ausführen:https://go.hyper.ai/Rsrno

Effektbeispiele

2.  TRELLIS: Demo des Open-Source-Modells zur 3D-Asset-Generierung von Microsoft

TRELLIS ist ein auf Graphen-Neuralnetzwerken basierendes Interpretierbarkeitsframework, das 2024 vom Microsoft-Team entwickelt wurde. Es zielt darauf ab, eine effiziente Modellinterpretierbarkeit zu ermöglichen, indem es die Eigenschaften von graphisch strukturierten Daten lernt.

Das Modell und die Umgebung wurden bereitgestellt. Mit dem großen Modell können Sie Bilder nach Anleitung des Tutorials in 3D-Bilder umwandeln.

Online ausführen:https://go.hyper.ai/JE5s5

Effektbeispiele

3.Schnelle Bereitstellung von ChatGLM2-6b-32k

ChatGLM-6B ist ein Open-Source-Konversationssprachenmodell, das sowohl Chinesisch als auch Englisch unterstützt. Es basiert auf der General Language Model (GLM)-Architektur und verfügt über 6,2 Milliarden Parameter. In Kombination mit der Modellquantisierungstechnologie können Benutzer lokale (INT4-Quantisierung) auf Grafikkarten der Verbraucherklasse mit nur 6 GB Videospeicher durchführen.

Befolgen Sie die Schritte des Tutorials und kopieren Sie die generierte API-Adresse direkt, um ChatGLM-6B zu verwenden.

Online ausführen:https://go.hyper.ai/B0b7V

Modell-Weboberfläche

4. Natürliche Sprachverarbeitung mit NLTK

NLTK ist eine der beliebtesten Plattformen zum Erstellen von Python-Programmen mit Daten in natürlicher Sprache. Zusätzlich zu Textverarbeitungsbibliotheken für Klassifizierung, Tokenisierung, Stemming, Tagging, Parsing und semantisches Denken bietet es einfache Schnittstellen zu mehr als 50 großen strukturierten Textdatensätzen (Korpora) und lexikalischen Ressourcen.

Dieses Tutorial zeigt, wie Sie mit NLTK verschiedene NLP-Operationen in der Textverarbeitungsphase durchführen und mithilfe einiger NLTK-Tools zur Textklassifizierung mittels Sentimentanalyse ein Keras-Modell erstellen.

Online ausführen:https://go.hyper.ai/BFZ10

Beispiel für eine Worthäufigkeitsverteilung

5. Audio LDM Audiobearbeitungs-Tutorial

AudioLDM ist ein latentes Text-zu-Audio-Diffusionsmodell, das in der Lage ist, aus beliebigen Texteingaben realistische Audiobeispiele zu generieren. AudioLDM verwendet eine Textaufforderung als Eingabe und sagt das entsprechende Audio voraus. Es kann textkonditionierte Soundeffekte, menschliche Sprache und Musik erzeugen.

Dieses Projekt kann über die Gradio-Schnittstelle eine interaktive Front-End-Schnittstelle generieren. Die relevanten Modelle und Abhängigkeiten wurden bereitgestellt. Klicken Sie auf den Link unten, um den Ton zu bearbeiten.

Online ausführen:https://go.hyper.ai/BCOWL

6. ShowUI: Ein Vision-Language-Action-Modell mit Schwerpunkt auf GUI-Automatisierung

Das ShowUI-Modell unterstützt Web- und mobile Anwendungsszenarien, indem es den Inhalt der Bildschirmoberfläche versteht und interaktive Aktionen wie Klicken, Eingeben und Scrollen ausführt. Es kann komplexe Benutzeroberflächenaufgaben automatisch erledigen. ShowUI kann Screenshots und Benutzerbefehle analysieren, um interaktive Aktionen auf der Benutzeroberfläche vorherzusagen.

Dieses Tutorial ist eine Ein-Klick-Bereitstellungsdemo des Modells. Sie müssen nur den Container klonen und starten und die generierte API-Adresse direkt kopieren, um das Modell zu erleben.

Online ausführen:https://go.hyper.ai/reHs7

Modell-Weboberfläche

💡Wir haben außerdem eine Austauschgruppe für Tutorials zur stabilen Diffusion eingerichtet. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen~

Community-Artikel

1. Eine Sammlung von 10 tollen Weihnachtsdatensätzen: beliebte Lieder/Geschenkwunschlisten/Rezepte/10 Jahre Twitter-Texterstellung zu Weihnachten …

Während der Weihnachtszeit hat HyperAI 10 weihnachtliche Datensätze für Sie vorbereitet, die die Online-Nutzung und den beschleunigten Download unterstützen. Kommen Sie und erleben Sie sie.

Sehen Sie sich die Datensatzzusammenfassung an:https://go.hyper.ai/if7Lc

2. Die Kosten sind um das Hundertfache gesunken! Neue Forschungsergebnisse der gemeinnützigen Organisation E11 Bio kartieren Verbindungen zwischen Millionen von Zellen im Gehirn

Das Biotechnologieunternehmen E11 Bio hat die PRISM-Technologie auf den Markt gebracht, mit der sich die Verbindungen zwischen Millionen von Zellen im gesamten Gehirn zu sehr geringen Kosten abbilden lassen. Diese Reihe von Innovationen dürfte die Gesamtkosten der Ganzhirn-Konnektomik um mindestens das Hundertfache senken und Möglichkeiten für die zukünftige Erforschung des menschlichen Gehirns eröffnen. Dieser Artikel ist ein ausführlicher Bericht über das Unternehmen. Klicken Sie hier, um ihn schnell zu lesen.

Den vollständigen Bericht ansehen:https://go.hyper.ai/ISc4j

3. Multinationale Politik/wissenschaftliche Durchbrüche/Pioniere/Unternehmensstruktur...alle wichtigen Ereignisse der AI4S-Branche im Jahr 2024 in einem Artikel

HyperAI hat die wichtigsten Ereignisse im Bereich „KI für die Wissenschaft“ im Jahr 2024 zusammengestellt und überprüft. Klicken Sie hier, um den ausführlichen Bericht anzuzeigen.

Den vollständigen Bericht ansehen:https://go.hyper.ai/d2Dlv

4. Die globale Erwärmung lässt sich nur schwer umkehren. Stanford-Team nutzt KI, um die höchsten Temperaturänderungen vorherzusagen, mit einer Rekordwahrscheinlichkeit von 90%

Vor dem Hintergrund der fortschreitenden globalen Erwärmung kommt es immer häufiger zu seltenen extremen Klimaereignissen. Ein Forschungsteam der Stanford University, der Colorado State University und der ETH Zürich nutzte ein Convolutional Neural Network-System mit künstlicher Intelligenz zur Vorhersage der globalen Erwärmung und fand heraus, dass selbst bei einer schnellen Emissionsreduzierung die Wahrscheinlichkeit eines weiteren Anstiegs der globalen Temperaturen immer noch bei 90% liegt. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe des Dokuments.

Den vollständigen Bericht ansehen:https://go.hyper.ai/vDt3e

5. Team der Purdue University erreicht dateneffiziente taktile Darstellung für Roboterlernen durch Simulation des reaktiven Greifens des Menschen

Xu Zhengtong, ein Doktorand im dritten Jahr an der Purdue University, teilte seine beiden wichtigsten wissenschaftlichen Forschungsergebnisse, den reaktiven Greifcontroller LeTac-MPC und UniT für die einheitliche taktile Darstellung von Robotern, mit dem Thema „Dateneffiziente taktile Darstellung für Roboterlernen“. Dieser Artikel ist eine Zusammenstellung gemeinsam genutzter Inhalte. Klicken Sie hier, um ihn schnell zu lesen.

Den vollständigen Bericht ansehen:https://go.hyper.ai/IPIjj

6. Fünf Kämpfe um CASP, einen Maßstab für die Vorhersage von Proteinstrukturen, Zheng Wei von der Nankai-Universität: Wettbewerbsfähigkeit und Schwierigkeit nehmen zu, Fokus auf praktische biologische Probleme

CASP wird in der Branche seit langem als Barometer für die Vorhersage von Proteinstrukturen angesehen. In diesem Zusammenhang hatte HyperAI die Ehre, ein ausführliches Interview mit Professor Zheng Wei zu führen. Im Rahmen des CASP, einem internationalen Wettbewerb, der als Benchmark für die Branche dient, analysierte er für uns die aktuellen Entwicklungstrends im Bereich der Proteinstrukturvorhersage. Es enthält viele nützliche Informationen. Klicken Sie hier, um es schnell zu lesen.

Den vollständigen Bericht ansehen:https://go.hyper.ai/Y83iz

7. Nach 30 Jahren Beharrlichkeit strebt das MIT die nächste Generation von Lithiumbatterien an und nutzt generative KI, um einen großen Durchbruch bei Festelektrolyten zu erzielen

In einer aktuellen Studie hat sich ein Forschungsteam des MIT und des Toyota Research Institute mit der Komplexität verschiedener fortschrittlicher generativer Modelle bei der Polymererzeugung befasst und eine De-novo-Designmethode vorgeschlagen, mit der kontinuierlich neue GPT- und diffusionsbasierte Polymerelektrolyte erzeugt und bewertet werden können, wodurch neue Kandidaten für experimentelle Tests bereitgestellt werden. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe des Dokuments.

Den vollständigen Bericht ansehen:https://go.hyper.ai/PDc8J

8. Nur! Die weltweit schnellste GPU RTX 5090 kostet offiziell über 14.000 Yuan, und die chinesische Version der kastrierten 5090 D kostet über 16.000 Yuan

Auf der CES 2025-Konferenz wurde Nvidia RTX 5090 offiziell angekündigt. Es handelt sich um die bislang schnellste GeForce RTX-GPU. Der Anfangspreis beträgt 14.000 Yuan, und die Inlandsversion des 5090 D kostet 16.000 Yuan. Der RTX 5090 bietet außerdem FP4-Unterstützung, wodurch der Speicherbedarf reduziert wird und generative KI-Modelle bis zu doppelt so schnell ausgeführt werden können wie bei der vorherigen Generation. Dieser Artikel ist eine ausführliche Einführung in das Produkt. Klicken Sie hier, um ihn schnell zu lesen.

Den vollständigen Bericht ansehen:https://go.hyper.ai/dyyZS

Beliebte Enzyklopädieartikel

1. Nukleare Norm

2. Gepaarter t-Test

3. Groß angelegtes Multitasking-Sprachverständnis (MMLU)

4. Sigmoidfunktion

5. Die Methode der kleinsten Quadrate

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://go.hyper.ai/wiki

Januar-Frist für die Top-Konferenz

Zentrale Verfolgung der wichtigsten wissenschaftlichen KI-Konferenzen:https://go.hyper.ai/event

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1700 öffentliche Datensätze

* Enthält über 500 klassische und beliebte Online-Tutorials

* Interpretation von über 200 AI4Science-Papierfällen

* Unterstützt die Suche nach über 600 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai

Abschließend empfehle ich ein „Creator Incentive Program“. Interessierte Freunde können den QR-Code scannen, um teilzunehmen!