Countdown 3 Tage! Buchen Sie Jetzt Einen Termin Für Die Live-Übertragung Von Apple WWDC24; Der Umfangreiche Multimodale Präferenzdatensatz RLAIF-V Ist Online Und Reduziert Effektiv Das Halluzinationsphänomen Verschiedener MLLMs

Vom 3. bis 7. Juni gibt es Updates auf der offiziellen Website von hyper.ai:
Hochwertige öffentliche Datensätze: 10
Auswahl an hochwertigen Tutorials: 2
Community-Artikelauswahl: 3 Artikel
Beliebte Enzyklopädieeinträge: 5
Top-Konferenzen mit Deadlines im Juni und Juli: 5
Besuchen Sie die offizielle Website:hyper.ai
Ausgewählte öffentliche Datensätze
1. ChartQA Chart-Fragen-Benchmark-Datensatz
Der Datensatz umfasst 9,6.000 von Menschen verfasste Fragen und 23,1.000 aus von Menschen verfassten Diagrammzusammenfassungen generierte Fragen und ist für die Lösung komplexer Probleme konzipiert, die visuelles und logisches Denken erfordern.
Direkte Verwendung:https://go.hyper.ai/5tJE9
2. RS5M-Datensatz zur Fernerkundung mit großflächiger Bild-Text-Paarung
Der RS5M-Datensatz enthält 5 Millionen Fernerkundungsbilder mit englischen Beschreibungen. Dieser Datensatz wird durch Screening öffentlich verfügbarer Bild-Text-Paarungsdatensätze und beschrifteter Fernerkundungsdatensätze (RS) mithilfe eines vortrainierten visuellen Sprachmodells (VLM) erhalten.
Direkte Verwendung:https://go.hyper.ai/jbwsV
3. CapsFusion-120M Multimodaler Bild- und Textdatensatz
Dieser Datensatz enthält Bild- und Textinformationen aus den Datensätzen LAION-2B und LAION-COCO, die für ein groß angelegtes multimodales Vortraining oder zur weiteren Untersuchung der Qualität von Bild- und Textdaten verwendet werden können.
Direkte Verwendung:https://go.hyper.ai/pEE7u
4. ShareGPT4V Großer, hochwertiger Bild- und Textdatensatz
Der Datensatz enthält 1,2 Millionen Bild-Text-Paare, die visuelle und sprachliche Merkmale effektiv aufeinander abstimmen, die Fähigkeit des Modells verbessern, Anweisungen zu befolgen, und mehr akademische Aufgaben wie ScienceQA, TextVQA, SBU usw. integrieren.
Direkte Verwendung:https://go.hyper.ai/9CVao
5. RLAIF-V-Datensatz Großer multimodaler Präferenzdatensatz
Der RLAIF-V-Datensatz ist ein KI-generierter multimodaler Präferenzdatensatz, der eine Vielzahl von Aufgaben und Domänen abdeckt. Der Datensatz enthält über 44.757 hochwertige Paare zum Trainieren und Bewerten multimodaler großer Sprachmodelle.
Direkte Verwendung:https://go.hyper.ai/cG6fp
6. FoodLogoDet-1500 Hochwertiger Datensatz zur Erkennung von Lebensmittellogos
Der Datensatz besteht aus 1.500 Kategorien, 99.768 Bildern und 145.400 Objekten. Dies ist der erste und größte öffentlich verfügbare Datensatz zur Erkennung von Lebensmitteletiketten.
Direkte Verwendung:https://go.hyper.ai/eco23
7. ZSFooD-Lebensmittelbilddatensatz
Der Datensatz enthält 20.603 Lebensmittelbilder aus 10 Restaurant-Szenen, von denen jede mehrere Lebensmittelobjekte enthält, die mit Begrenzungsrahmen annotiert sind, bestehend aus 95.322 Begrenzungsrahmen und 291 Klassen.
Direkte Verwendung:https://go.hyper.ai/6xrrC
8. Food-1K-Lebensmittelbilddatensatz
Der Datensatz enthält mehr als 1.000 detaillierte Lebensmittelkategorien und mehr als 500.000 Bilder und wurde vom ICCV 2021 für den Workshop LargeFineFoodAI, einen groß angelegten Wettbewerb zur detaillierten Lebensmittelanalyse, verwendet.
Direkte Verwendung:https://go.hyper.ai/sjZJi
9. ISIA Ingredient-201 Lebensmittelbilddatensatz
Dieser Datensatz enthält 201 Unterkategorien, die gängige Typen bestehender Lebensmittelkategorien abdecken. Die Lebensmittelbilder wurden in fünf Szenen mit Bezug zum Thema Essen gesammelt und in jeder Szene wurden mindestens 150 Lebensmittelkategorien erfasst.
Direkte Verwendung:https://go.hyper.ai/bGe45
10. ISIA Food-500-Datensatz zu Speisen
Der Datensatz enthält 399.726 Lebensmittel mit mehr als 500 Gerichten. Jeder Artikel enthält den Namen und das Bild des Lebensmittels.
Direkte Verwendung:https://go.hyper.ai/yqco5
Weitere öffentliche Datensätze finden Sie unter:
Ausgewählte öffentliche Tutorials
Das von der Chinesischen Universität Hongkong, dem Tencent AI Lab und anderen eingeführte Modell DynamiCrafter verwendet Videodiffusionstechnologie, um reale Bewegungsmuster zu simulieren und kann in Kombination mit Textanweisungen Bilder in dynamische Videos umwandeln. Dieses Tutorial hat eine ComfyUI-Workflowumgebung für Sie erstellt. Sie müssen sich keine Sorgen über Knotenverbindungsfehler machen. Laden Sie einfach Bilder hoch und geben Sie Text ein, um zu arbeiten!
Online ausführen:https://go.hyper.ai/PWzJR
2. Warten Sie nicht! Kommen Sie und erleben Sie die GLM-4-9B-Chat-Demo
Diese Woche hat Zhipu AI die neueste Open-Source-Errungenschaft des großen Basismodells GLM-4 – GLM-4-9B – veröffentlicht, das erstmals über multimodale Fähigkeiten verfügt. Damit jeder dieses Open-Source-Modell, das behauptet, „Llama3-8B zu übertreffen“, so schnell wie möglich erleben kann, hat Chao Neuro das Tutorial „GLM-4-9B-Chat-Demo“ veröffentlicht. Sie müssen keine Befehle eingeben. Klicken Sie einfach auf „Klonen“ und erleben Sie sofort die hervorragende Leistung von GLM-4-9B-Chat.
Online ausführen:https://go.hyper.ai/hc5OK
Community-Artikel
Die Forschungsgruppe von Hong Liang an der Shanghai Jiao Tong University hat das mikroumgebungsbewusste Graph-Neuralnetzwerk PROTLGN vorgeschlagen, das aus der dreidimensionalen Struktur von Proteinen vorteilhafte Aminosäuremutationsstellen lernen und vorhersagen und die Gestaltung von Einzelstellenmutationen und Mehrfachstellenmutationen von Proteinen mit unterschiedlichen Funktionen steuern kann. Die von PROTLGN entwickelten Einzelpunktmutantenproteine über 40% hinaus sind ihren Wildtyp-Gegenstücken überlegen. Die entsprechenden Ergebnisse wurden in „JCM“ veröffentlicht.
Den vollständigen Bericht ansehen:https://go.hyper.ai/6FkFu
Das Team von Kang Jianqiang von der Technischen Universität Wuhan schlug ein vereinfachtes elektrochemisches Modell des Ensemble-Lernens (ELM) + FIE vor. ELM sagt die Lithiumionenkonzentration der festen Elektrode präzise voraus und erreicht so eine genauere Spannungsvorhersage als ein einzelnes Modell. Zudem ist die Rechenkomplexität wesentlich geringer als beim P2D-Modell. FIE sagt die Lithiumionenkonzentration im Elektrolyt in der Nähe der Stromkollektoren der positiven und negativen Elektrode genau voraus.
Den vollständigen Bericht ansehen:https://go.hyper.ai/CWvce
Die Forschungsgruppe von Professor Mei Yongfeng vom Institut für Materialwissenschaften der Universität Fudan schlug eine mehrstufige quasistatische Methode zur Finite-Elemente-Analyse vor und entwarf und konstruierte sechs Arten von dreidimensionalen Mikrostrukturen aus Silizium-/Chrom-Nanofilmen und entsprechende dreidimensionale optische Detektoren, wodurch die gute Vielseitigkeit und industrielle Anwendbarkeit der Technologie bestätigt wurde. Die entsprechenden Ergebnisse wurden in „Nature“ veröffentlicht.
Den vollständigen Bericht ansehen:https://go.hyper.ai/2s73Q
Beliebte Enzyklopädieartikel
1. Nukleare Norm
2. Maskierte Sprachmodellierung (MLM)
3. Lang- und Kurzzeitgedächtnis Langzeit-Kurzzeitgedächtnis
4. YOLOv10 Echtzeit-End-to-End-Objekterkennung
5. Kolmogorov-Arnold-Netzwerke
Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:
Vorschau auf die Live-Übertragung von Station B
Apple wird die WWDC24 am 11. Juni (nächsten Dienstag) Pekinger Zeit abhalten. Der HyperAI Super Neural Video Account und Bilibili werden es in Echtzeit übertragen. Scannen Sie den QR-Code, um einen Termin für die Live-Übertragung zu vereinbaren ↓

Um Ihnen zu helfen, ein tieferes Verständnis der relevanten Informationen von Apple zu erlangen,Der Live-Übertragungsraum der Super Neuro B Station wird weiterhin das Video „Apple Special“ ausstrahlen.Beinhaltet: Vergangene WWDC-Konferenzen, Interviews mit Führungskräften, zugehörige Dokumentationen und andere umfangreiche Inhalte.
Die folgende Tabelle ist eine Vorschau der vom Herausgeber ausgewählten Inhalte ↓↓↓
Datum | Zeit | Inhalt |
Montag, 10. Juni | 18:00 | Steve Jobs |
Dienstag, 11. Juni | 1:00 | Apple WWDC24 |
Mittwoch, 12. Juni | 18:00 | Was macht Apple |
Donnerstag, 13. Juni | 18:00 | Erste Veröffentlichung des iPhone |
Freitag, 14. Juni | 18:00 | Geschichte von Steve Jobs |
Samstag, 15. Juni | 18:00 | Wie Apple die Beinahe-Pleite überlebte |
Sonntag, 16. Juni | 18:00 | Tim Cooks Geschichte |
Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:
http://live.bilibili.com/26483094
Anmeldeschluss für die Konferenz ist Juni-Juli

Zentrale Verfolgung der wichtigsten wissenschaftlichen KI-Konferenzen:https://hyper.ai/events
Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!
Bis nächste Woche!
Über HyperAI
HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:
* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze
* Enthält über 300 klassische und beliebte Online-Tutorials
* Interpretation von über 100 AI4Science-Papierfällen
* Unterstützt die Suche nach über 500 verwandten Begriffen
* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China
Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen: