HyperAI

Wöchentliche Empfehlungen Der Redaktion | Hometown Chicken Open Source „Dish Origin Report“, Online-Nutzung Des SUPIR-Tools Zur Reparatur Alter Fotos

特色图像

Eilmeldung! Eilmeldung!Die „vertraulichen Dokumente“ von Lao Xiang Ji wurden tatsächlich veröffentlicht!

Vor Kurzem hat Lao Xiang Ji seinen 200.000 Wörter umfassenden „Lao Xiang Ji Food Traceability Report“ veröffentlicht, in dem alles von der Herkunft der Zutaten bis hin zu den Zubereitungsdetails klar und deutlich aufgeführt ist. Es steht jetzt bei Chao Shen Wang zum Download bereit. Schauen Sie vorbei und sehen Sie, ob etwas für Sie dabei ist!

PS: Der Herausgeber möchte nur fragen, ob ich eine Beschwerde einreichen kann, wenn die Arbeit gemäß dem Bericht fehlschlägt.

Vom 15. bis 19. April gibt es Updates auf der offiziellen Website von hyper.ai:

* Hochwertige öffentliche Datensätze: 10

* Ausgewählte hochwertige Tutorials: 2

* Community-Artikelauswahl: 3 Artikel

* Beliebte Enzyklopädieeinträge: 5

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. Rückverfolgbarkeitsbericht für hausgemachtes Hühnerfutter

Der Datensatz umfasst 1.218 aktuelle Lao Xiang Ji-Restaurants, 226 SKUs, 873 Zutaten und 305 Lieferanten. Lao Xiang Ji hat seinen 677 Seiten und 200.000 Wörter umfassenden „Lao Xiang Ji Food Traceability Report“ öffentlich zugänglich gemacht.

Direkte Verwendung:https://go.hyper.ai/nbESl

2. Öffnen Sie den Sora Dataset Project Video Dataset

Open-Sora-Plan ist ein Open-Source-Projekt, das darauf abzielt, Sora (T2V-Modell) von OpenAI zu reproduzieren. Dieser Datensatz ist ein Videodatensatz für sein Projekt. Das Forschungsteam hat 40.258 Videos von Open-Source-Websites unter der CC0-Lizenz gecrawlt. Alle Videos sind in hoher Qualität und ohne Wasserzeichen, davon sind etwa 60% Landschaftsdaten.

Direkte Verwendung:https://go.hyper.ai/75Ftc

3. MMVP Multimodal Motion Capture-Datensatz

Dieser Datensatz enthält viele großflächige und schnelle menschliche Bewegungen wie Laufen, Hüpfen, Standweitsprung usw. und insgesamt wurden mehr als 44.000 bildsynchronisierte RGBD-Bilder und Druckdaten von 16 Probanden gesammelt. 

Direkte Nutzung: https://go.hyper.ai/4edeR

4. OpenWebMath Open Web Mathematics Trainingsdatensatz

OpenWebMath ist ein Datensatz, der hochwertige mathematische Texte aus den meisten Teilen des Internets enthält. Es wird aus mehr als 200 Milliarden HTML-Dateien auf Common Crawl gefiltert und extrahiert, was zu einem Satz von 6,3 Millionen Dokumenten mit insgesamt 14,7 Milliarden Token führt. OpenWebMath ist für das Vortraining und die Feinabstimmung großer Sprachmodelle konzipiert.

Direkte Nutzung: https://go.hyper.ai/zjytq

5. Mathematischer Datensatz Proof-Pile-2

Proof-Pile-2 ist ein tokenisierter Datensatz mit 55 Milliarden mathematischen und wissenschaftlichen Dokumenten. Eine Mischung aus wissenschaftlichen Arbeiten, mathematikbezogenen Webinhalten und mathematischem Code auf dem Stand vom April 2023 (ausgenommen eine bestimmte Teilmenge der Lean-Proof-Schritte). Dieser Datensatz wurde zum Trainieren der Modelle Llemma 7B und Llemma 34B erstellt.

Direkte Nutzung: https://go.hyper.ai/aant8

6. Mizar-Mathematik-Datensatz

Die Mizar Math Library enthält formalisierte mathematische Theoreme und Beweise aus einem breiten Spektrum mathematischer Bereiche, darunter Logik, Algebra, Analysis, Geometrie usw. Ziel dieser Bibliothek ist es, eine solide mathematische Grundlage für automatisierte Theorembeweise und formale Argumentation zu bieten.

Direkte Nutzung: https://go.hyper.ai/IJeHa

7. Isabelle Parallel Corpus

Das Isabelle Parallel Corpus (IPC) ist eine Community-gesteuerte Initiative zur Erstellung eines parallelen Korpus von Isabelle-Dokumenten. IPC koppelt formale Dokumente in Isabelle (wie Theoreme, Lemmata, Definitionen usw.) mit ihren Gegenstücken in natürlicher Sprache.

Direkte Nutzung: https://go.hyper.ai/BEADY

8. Obst-Datensatz Datensatz zur Klassifizierung der Fruchtfrische

Dieser Datensatz enthält Bilder von drei Obstsorten: Äpfel, Orangen und Bananen. Jedes Bild ist entsprechend der Fruchtart und dem Frischezustand beschriftet, was überwachte Lernaufgaben wie Klassifizierung oder Objekterkennung ermöglicht.

Direkte Verwendung:https://go.hyper.ai/b7TNx

9. DeepFruit-Datensatz zur Klassifizierung von Fruchtbildern

DeepFruit ist ein gemeinsam von der Prince Mohammed bin Fahd University und anderen Forschungseinrichtungen veröffentlichter Datensatz zur Klassifizierung von Obstbildern. Der Datensatz enthält 21.122 Fruchtbilder basierend auf 8 verschiedenen Fruchtsätzen. Es kann für die Forschung im Bereich der Obsterkennung, -identifizierung und -klassifizierung sowie für andere innovative Anwendungen wie die Kalorienschätzung verwendet werden.

Direkte Verwendung:https://go.hyper.ai/ut4BA

10. 15 Datensätze zur Klassifizierung von Tierbildern

Der Datensatz enthält Bildordner mit 15 Tieren. Alle Bilder haben die Größe 224 x 224 und eignen sich für die Bildklassifizierung. Die Bilder wurden aus dem Internet heruntergeladen und mithilfe der OpenCV-Bibliothek vorverarbeitet (Größenänderung und Verbesserung). Daher kann dieser Datensatz ohne weitere Datenerweiterung direkt zum Training verwendet werden.

Direkte Verwendung:https://go.hyper.ai/tgMtH

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. Online-Tutorial | Niedrigschwelliger Einsatz! SUPIR ist auf die Auflösung aller Arten von unscharfen Bildern spezialisiert und kann auch Textbeschreibungen zur Feinabstimmung verstehen

Das Bildwiederherstellungstool SUPIR verwendet StableDiffusion-XL (SDXL) und Modellerweiterungstechnologie und kann die Bildwiederherstellungsqualität durch maschinelles Lernen und multimodale Methoden erheblich verbessern. Dieses Tutorial hat eine Umgebung für alle erstellt. Ohne aufwändige Vorarbeiten können Sie das Bild mit einem Klick reparieren.

Online ausführen:https://go.hyper.ai/3RBMH

2. Stellen Sie große Modelle mit Ollama und Open WebUI bereit

Dieses Tutorial ist ein One-Click-Ausführungspaket von Ollama + Open WebUI. Sie müssen nur den Schritten folgen und Befehle eingeben, um das große Modell auszuführen. Die derzeit enthaltenen Modelle sind: qwen 1.5 14b, qwen 1.5 32b, llava 1.6 34b. Sie unterstützen das Hochladen neuer Modelle durch Sie selbst.

Online ausführen:https://go.hyper.ai/FwREK

Community-Artikel

1. Beschleunigung des Katalysatordesigns: Die Forschungsgruppe von He Yulian an der Shanghai Jiaotong University extrahiert automatisch Wissen basierend auf AutoML

Die von Assistenzprofessor Yulian He vom Joint Institute der Shanghai Jiao Tong University geleitete Forschungsgruppe schlug eine neue Methode zur Bestimmung der wichtigsten physikalischen Größen vor, die Eads bestimmen, nämlich ein auf automatischem maschinellem Lernen basierendes Merkmalslöschungsexperiment, das die automatische Extraktion von Wissen aus der hochdurchsatzdichten funktionalen Theoriedatenbank realisiert. Dieser Artikel ist eine detaillierte Interpretation und Weitergabe der Forschungsergebnisse.

Den vollständigen Bericht ansehen:https://go.hyper.ai/LEVS1

2. Googles Hochwasservorhersagemodell wird erneut in Nature veröffentlicht, übertrifft das weltweit führende System und deckt über 80 Länder ab

Das Google-Team hat ein auf maschinellem Lernen basierendes Flussvorhersagemodell entwickelt. Die Vorhersagekraft des Modells ist besser als die des weltweit fortschrittlichsten Hochwasservorhersagesystems GloFAS. Es kann zuverlässige Hochwasservorhersagen 5 Tage im Voraus erstellen und mehr als 80 Länder abdecken. In diesem Artikel wird die Forschung weitergegeben und interpretiert.

Den vollständigen Artikel ansehen:https://go.hyper.ai/V4r4i

3. Die Genauigkeit der Vorhersage der Lebensdauer von Lithiumbatterien wurde durch 20% verbessert! Das Team der Shanghai Jiao Tong University veröffentlichte eine halbüberwachte Lernmethode PBCT, um versteckte Informationen aus unbeschrifteten Daten zu extrahieren

Das Forschungsteam der Shanghai Jiao Tong University schlug eine halbüberwachte Lernmethode PBCT vor, die die kostengünstigen und reichlich vorhandenen, nicht gekennzeichneten Daten, die während des gesamten Lebenszyklus von Lithiumbatterien generiert werden, voll ausnutzt. Durch das Extrahieren verborgener Informationen wird das Verständnis der zugrunde liegenden Datenmuster vertieft und die Genauigkeit der Vorhersage der Lebensdauer von Lithiumbatterien durch 20% verbessert. In diesem Artikel wird die Forschung weitergegeben und interpretiert.

Den vollständigen Bericht ansehen:https://go.hyper.ai/2EQGa

Beliebte Enzyklopädieartikel

1. Epoche

2. Lernrate

3. Gepaarter t-Test

4. Diffusionsmodell

5. Großes Sprachmodell

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://hyper.ai/wiki

Vorschau auf die Live-Übertragung von Station B

Google hat kürzlich angekündigt, dass am 14. Mai die I/O Developer Conference 2024 stattfinden wird. Um allen ein tieferes Verständnis von Google zu vermitteln,Super neuronaler Live-Übertragungsraum wirdAb nächstem Montag senden wir das Video „Google Special“ rund um die Uhr live.Beinhaltet: Google I/O-Pressekonferenzen der vergangenen Jahre, Interviews mit Führungskräften, zugehörige Dokumentationen und andere umfangreiche Inhalte.

Die folgende Tabelle ist eine Vorschau der vom Herausgeber ausgewählten Inhalte ↓↓↓

DatumZeitInhalt
15. April
Montag
18:00Google I/O-Konferenzen im Laufe der Jahre
Dienstag, 16. April18:00Google Cloud NEXT-Konferenzen
Mittwoch, 17. April18:00TIME100-Interview mit Sundar Pichai 
Donnerstag, 18. April18:00Google-CEO zum KI-Wettlauf zwischen den USA und China
Freitag, 19. April18:00AlphaGo-Dokumentation
Samstag, 20. April18:00Die Geschichte hinter dem Gründer von Google
Sonntag, 21. April18:00BBC-Dokumentation: Eine Welt ohne Google

Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:

http://live.bilibili.com/26483094

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze

* Enthält über 300 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai