HyperAI

Wöchentliche Empfehlungen Der Redaktion | Der COIG-CQIA-Datensatz Ist Online Und Der ComfyUI Wenshengtu-Workflow Läuft Online

特色图像

Um die Lücke bei hochwertigen chinesischen Datensätzen zu schließen, haben zehn Institutionen, darunter die Chinesische Akademie der Wissenschaften, Zero One Everything und die Peking-Universität, gemeinsam den COIG-CQIA-Datensatz entwickelt. Überraschenderweise,Die Datenqualität von „Retarded Post Bar“ in diesem Datensatz ist viel höher als die von Wissensgemeinschaften wie Zhihu, Douban und Sifou. Der COIG-CQIA-Datensatz ist jetzt auf der Website hyper.ai verfügbar. Kommen Sie vorbei und schauen Sie vorbei!

Vom 8. bis 12. April gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 10

* Ausgewählte hochwertige Tutorials: 2

* Community-Artikelauswahl: 5 Artikel

* Beliebte Enzyklopädieeinträge: 5

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. COIG-CQIA Hochwertiger chinesischer Feinabstimmungsdatensatz für Anweisungen

COIG-CQIA steht für Chinese Open Instruction Generalist – Quality is All You Need. Es handelt sich um einen Open-Source-Datensatz zur Feinabstimmung von Anweisungen in hoher Qualität, der der chinesischen NLP-Community hochwertige Daten zur Feinabstimmung von Anweisungen bereitstellen soll, die dem menschlichen Interaktionsverhalten entsprechen.

Direkte Verwendung:https://go.hyper.ai/Pg37L

2. EgoExoLearn-Datensatz zum perspektivenübergreifenden Erlernen von Fähigkeiten

Der EgoExoLearn-Datensatz enthält 120 Stunden Videodaten, die aus Alltagsszenen und professionellen Laboren gesammelt wurden. Die Videos im Datensatz umfassen nicht nur Demonstrationsvideos, sondern auch Videos, die der Darsteller nach dem Ansehen der Demonstration aus seiner eigenen Ich-Perspektive (egozentrisch) aufgenommen hat.

Direkte Verwendung:https://go.hyper.ai/cYsPM

3. S2S-SIM-Datensatz zur kollaborativen Wahrnehmungssimulation von Schiffen

Der S2S-Sim-Datensatz ist der erste von der Universität Shanghai entwickelte Datensatz zur kollaborativen Wahrnehmungssimulation von Schiffen. Der Datensatz enthält insgesamt 7.000 Datenframes mit 96.881 genauen Anmerkungen zu Schiffsbegrenzungsrahmen. Sein Zweck besteht darin, eine effektive kollaborative Wahrnehmung zwischen Schiffen zu unterstützen, wobei ein besonderer Schwerpunkt auf der Forschung im Bereich der kollaborativen Wahrnehmung zwischen autonomen Fahrsystemen und Schiffen liegt. 

Direkte Nutzung: https://go.hyper.ai/AVWp2

4. Gemeinsamer chinesischer Public Domain-Datensatz Corpus-zh

Common Corpus wurde gemeinsam von Pleias, HuggingFace und anderen Institutionen erstellt. Es handelt sich derzeit um den größten Public Domain-Datensatz speziell für das Training großer Sprachmodelle (LLMs). Der Datensatz vereint 500 Milliarden Wörter aus verschiedenen Kulturerbeprojekten auf der ganzen Welt, darunter Englisch, Französisch, Chinesisch, Spanisch, Deutsch, Italienisch und andere Sprachen, und ist damit die bislang umfassendste Sprachressourcenbibliothek.

Direkte Nutzung: https://go.hyper.ai/hvuV5

5. TriviaQA Ein großer Datensatz zum Leseverständnis und zur Beantwortung von Fragen

TriviaQA ist ein Leseverständnis-Datensatz mit mehr als 650.000 Frage-Antwort-Beweistripel. TriviaQA umfasst 95.000 Frage-Antwort-Paare aus 662.000 Dokumenten aus Wikipedia und dem Internet.

Direkte Nutzung: https://go.hyper.ai/aant8

6. HalluQA Chinesischer Datensatz zur Bewertung großer Modellhalluzinationen

Der HalluQA-Datensatz enthält 450 kontroverse Fragen aus mehreren Bereichen, darunter zur chinesischen Geschichte, Kultur, Bräuchen und sozialen Phänomenen.

Direkte Nutzung: https://go.hyper.ai/pWyqe

7. Von KI-Modellen generierte Datensätze zur Hochwasseranalyse und -vorhersage

Bei diesem Datensatz handelt es sich um die Forschungsdaten des Artikels „Global prediction of extreme floods in ungauged watersheds“. Der Hauptinhalt besteht aus den vom KI-Modell generierten Daten der Hochwasser-Neuanalyse (1984–2021) und Neuprognose (2014–2021) sowie den entsprechenden GloFAS-Benchmark-Daten.

Direkte Nutzung: https://go.hyper.ai/bpsG3

8. MASSTAR Multimodaler Datensatz für große Szenen

MASSTAR ist ein multimodaler groß angelegter Szenendatensatz, der gemeinsam von der Sun Yat-sen-Universität, der Hong Kong University of Science and Technology und anderen Institutionen vorgeschlagen wurde. Es enthält mehr als 1.000 3D-Mesh-Modelle auf Szenenebene, von denen einige aus der realen Welt stammen.

Direkte Verwendung:https://go.hyper.ai/eLZUy

9. VideoBadminton-Badminton-Videoaktionserkennungsdatensatz

VideoBadminton ist ein hochwertiger Videodatensatz zum Thema Badminton, der von der Auburn University und der National Central University erstellt wurde. Der Datensatz enthält Badminton-Videodaten von 19 männlichen und weiblichen Athleten des Teams der National Central University und umfasst 18 Badminton-Bewegungen, insgesamt 7.822 Videoclips und eine Gesamtdauer von 145 Minuten.

Direkte Verwendung:https://go.hyper.ai/w5ToD

10. FineFake: Feinkörniger Multi-Domain-Datensatz zur Erkennung gefälschter Nachrichten

FineFake ist ein Datensatz zur feinkörnigen Erkennung von Fake News in mehreren Domänen, der gemeinsam von der Beihang-Universität und der Beijing University of Posts and Telecommunications erstellt wurde. Der Datensatz umfasst insgesamt 16.909 Datenbeispiele, die 6 semantische Themen und 8 verschiedene Plattformen abdecken. Jede Nachrichtenprobe enthält mehrere Inhaltsformen, darunter Text, Bilder und potenzielle soziale Kontextinformationen.

Direkte Verwendung:https://go.hyper.ai/CNWIn

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Die Kosten können um das bis zu 16-fache reduziert werden. Das ComfyUI Stable Cascade-Tutorial ist jetzt online und kann mit einem Klick bereitgestellt werden!

Dieses Tutorial ist ein Tutorial zur Verwendung des ComfyUI Stable Casecade-Workflows für KI-Malerei. Das Tutorial hat eine gute Umgebung eingerichtet und den stabilen Cascade-Standard-Textbild-Workflow integriert. Es verbindet die Knoten direkt, um den Nutzungsprozess zu vereinfachen, und kann in 2 Sekunden ein Bild erstellen.

Online ausführen:https://go.hyper.ai/lJGLF

2. Tutorial zur Klassifizierung von Bildern von Pflanzenkrankheiten

In diesem Tutorial geht es um die Verwendung von PyTorch zur Klassifizierung von Bildern von Pflanzenkrankheiten. Dies hilft dabei, Modelle für maschinelles Lernen zu trainieren, um Pflanzenkrankheiten zu erkennen oder automatische Lernalgorithmen für die Pflanzendiagnose zu entwickeln.

Online ausführen:https://go.hyper.ai/

Community-Artikel

1. Eine Sammlung supergroßer Modellressourcen | 30 hochwertige NLP-Datensätze und -Modelle, 8 Demos zur Verwendung mit einem Klick, zum Sammeln empfohlen!

Dieser Artikel fasst die Ressourcen zu großen Modellen zusammen, darunter 15 Datensätze, 15 Modelle und 8 Demos großer Modelle mit Download- und Verwendungslinks.

Den vollständigen Artikel ansehen:https://go.hyper.ai/sYC6h

2. Identifizieren Sie effektiv 630.000 dreidimensionale räumliche Konfigurationen und veröffentlichen Sie das Uni-MOF-Modell zur Vorhersage der MOF-Adsorptionskapazität.

Das Team von Professor Lu Diannan vom Institut für Chemieingenieurwesen der Universität Tsinghua übernahm die Führung bei der Entwicklung eines Uni-MOF-Maschinenlernmodells zur Vorhersage des Adsorptionsverhaltens dreidimensionaler MOF-Materialien. Dieses Modell kann nicht nur die dreidimensionale Struktur nanoporöser Materialien durch Vortraining erkennen und wiederherstellen, sondern auch Betriebsbedingungen wie Temperatur, Druck und verschiedene Gasmoleküle berücksichtigen. Es eignet sich sowohl für die wissenschaftliche Forschung als auch für praktische Anwendungen. Die entsprechenden Ergebnisse wurden in der Fachzeitschrift „Nature“ veröffentlicht.

Den vollständigen Bericht ansehen:https://go.hyper.ai/VWFVo

3. Eierstockkrebs kann durch Blutuntersuchungen, Urintests und andere Indikatoren identifiziert werden! Das Team von Liu Jihong von der Sun Yat-sen-Universität übernahm die Führung und vier große medizinische Fakultäten entwickelten gemeinsam ein KI-Fusionsmodell

Die Sun Yat-sen-Universität, die Southern Medical University, die Huazhong University of Science and Technology und die Zhejiang-Universität haben gemeinsam das MCF-Künstliche-Intelligenz-Fusionsmodell zur Diagnose von Eierstockkrebs entwickelt, das das Risiko von Eierstockkrebs durch Eingabe von Routine-Labortestdaten und des Alters berechnen kann. Die Modellgenauigkeit ist besser als bei herkömmlichen Biomarkern wie CA125 und HE4. Die entsprechenden Ergebnisse wurden in The Lancet Digital Health veröffentlicht.

Den vollständigen Bericht ansehen:https://go.hyper.ai/prEbC

4. Einblick in Insilico: Der Sprung, das Dilemma und der Durchbruch des KI-Pharma-Starunternehmens

Insilicon Valley Silicon, das 407,5 Millionen US-Dollar aufgebracht hatte, scheiterte im Januar dieses Jahres an der Hongkonger Börse und reichte am 27. März zum zweiten Mal einen Antrag auf Notierung ein. Inmitten des technologischen Wettbewerbs zwischen China und den USA hat die Situation des Unternehmens mit „amerikanischem Startup, chinesischem Co-CEO, amerikanischen Anteilseignern, chinesischem Hauptsitz …“ den Druck verdoppelt. Es bleibt abzuwarten, wie aus dieser Sackgasse herausgekommen werden kann und ob es gelingt, das Unternehmen zur „ersten KI-Pharmaaktie“ zu machen. Dieser Artikel bietet eine ausführliche Einführung in dieses KI-basierte Pharmaunternehmen aus der Perspektive der technologischen Entwicklung, Teamzusammensetzung und Geschäftsentwicklung.

Den vollständigen Bericht ansehen:https://go.hyper.ai/llREq

Beliebte Enzyklopädieartikel

1. Lang Chain

2. Expertenmischungsmodell MoE

3. Gruppenabfrage Aufmerksamkeit GQA

4. Reziproke Ranking-Fusion RRF

5. Rückrufrate

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://hyper.ai/wiki

Vorschau auf die Live-Übertragung von Station B

DatumZeitInhalt
Montag, 15. April10:00Google IO-Konferenzen im Laufe der Jahre
Dienstag, 16. April10:00MIT Deep Learning Kurs 2020
Mittwoch, 17. April10:00MIT Deep Learning Kurs 2021
Donnerstag, 18. April10:00Umfassender Kurs für Anfänger zur Python-API-Entwicklung
Freitag, 19. April10:00Flutter-Kurse für Anfänger
Samstag, 20. April10:00Harvard CS50 Python-Kurs für künstliche Intelligenz
Sonntag, 21. April10:00Stanford HAI Symposium

Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:

http://live.bilibili.com/26483094

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze

* Enthält über 300 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai