HyperAI

Countdown 3 Tage! Buchen Sie Jetzt Einen Termin Für Die Live-Übertragung Von Apple WWDC24; Der Umfangreiche Multimodale Präferenzdatensatz RLAIF-V Ist Online Und Reduziert Effektiv Das Halluzinationsphänomen Verschiedener MLLMs

特色图像

Vom 3. bis 7. Juni gibt es Updates auf der offiziellen Website von hyper.ai:

Hochwertige öffentliche Datensätze: 10

Auswahl an hochwertigen Tutorials: 2

Community-Artikelauswahl: 3 Artikel

Beliebte Enzyklopädieeinträge: 5

Top-Konferenzen mit Deadlines im Juni und Juli: 5

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. ChartQA Chart-Fragen-Benchmark-Datensatz

Der Datensatz umfasst 9,6.000 von Menschen verfasste Fragen und 23,1.000 aus von Menschen verfassten Diagrammzusammenfassungen generierte Fragen und ist für die Lösung komplexer Probleme konzipiert, die visuelles und logisches Denken erfordern.

Direkte Verwendung:https://go.hyper.ai/5tJE9

2. RS5M-Datensatz zur Fernerkundung mit großflächiger Bild-Text-Paarung

Der RS5M-Datensatz enthält 5 Millionen Fernerkundungsbilder mit englischen Beschreibungen. Dieser Datensatz wird durch Screening öffentlich verfügbarer Bild-Text-Paarungsdatensätze und beschrifteter Fernerkundungsdatensätze (RS) mithilfe eines vortrainierten visuellen Sprachmodells (VLM) erhalten.
Direkte Verwendung:https://go.hyper.ai/jbwsV

3. CapsFusion-120M Multimodaler Bild- und Textdatensatz

Dieser Datensatz enthält Bild- und Textinformationen aus den Datensätzen LAION-2B und LAION-COCO, die für ein groß angelegtes multimodales Vortraining oder zur weiteren Untersuchung der Qualität von Bild- und Textdaten verwendet werden können.

Direkte Verwendung:https://go.hyper.ai/pEE7u

4. ShareGPT4V Großer, hochwertiger Bild- und Textdatensatz

Der Datensatz enthält 1,2 Millionen Bild-Text-Paare, die visuelle und sprachliche Merkmale effektiv aufeinander abstimmen, die Fähigkeit des Modells verbessern, Anweisungen zu befolgen, und mehr akademische Aufgaben wie ScienceQA, TextVQA, SBU usw. integrieren.

Direkte Verwendung:https://go.hyper.ai/9CVao

5. RLAIF-V-Datensatz Großer multimodaler Präferenzdatensatz

Der RLAIF-V-Datensatz ist ein KI-generierter multimodaler Präferenzdatensatz, der eine Vielzahl von Aufgaben und Domänen abdeckt. Der Datensatz enthält über 44.757 hochwertige Paare zum Trainieren und Bewerten multimodaler großer Sprachmodelle.

Direkte Verwendung:https://go.hyper.ai/cG6fp

6. FoodLogoDet-1500 Hochwertiger Datensatz zur Erkennung von Lebensmittellogos

Der Datensatz besteht aus 1.500 Kategorien, 99.768 Bildern und 145.400 Objekten. Dies ist der erste und größte öffentlich verfügbare Datensatz zur Erkennung von Lebensmitteletiketten.

Direkte Verwendung:https://go.hyper.ai/eco23

7. ZSFooD-Lebensmittelbilddatensatz

Der Datensatz enthält 20.603 Lebensmittelbilder aus 10 Restaurant-Szenen, von denen jede mehrere Lebensmittelobjekte enthält, die mit Begrenzungsrahmen annotiert sind, bestehend aus 95.322 Begrenzungsrahmen und 291 Klassen.

Direkte Verwendung:https://go.hyper.ai/6xrrC

8. Food-1K-Lebensmittelbilddatensatz

Der Datensatz enthält mehr als 1.000 detaillierte Lebensmittelkategorien und mehr als 500.000 Bilder und wurde vom ICCV 2021 für den Workshop LargeFineFoodAI, einen groß angelegten Wettbewerb zur detaillierten Lebensmittelanalyse, verwendet.

Direkte Verwendung:https://go.hyper.ai/sjZJi

9. ISIA Ingredient-201 Lebensmittelbilddatensatz

Dieser Datensatz enthält 201 Unterkategorien, die gängige Typen bestehender Lebensmittelkategorien abdecken. Die Lebensmittelbilder wurden in fünf Szenen mit Bezug zum Thema Essen gesammelt und in jeder Szene wurden mindestens 150 Lebensmittelkategorien erfasst.

Direkte Verwendung:https://go.hyper.ai/bGe45

10. ISIA Food-500-Datensatz zu Speisen

Der Datensatz enthält 399.726 Lebensmittel mit mehr als 500 Gerichten. Jeder Artikel enthält den Namen und das Bild des Lebensmittels.

Direkte Verwendung:https://go.hyper.ai/yqco5

Weitere öffentliche Datensätze finden Sie unter:

https://hyper.ai/datasets

Ausgewählte öffentliche Tutorials

1. ComfyUI DynamiCrafter-Tutorial | Untergraben Sie die KI-Videogenerierung! Konvertieren Sie Bilder in Minutenschnelle in Videos und passen Sie Details perfekt an

Das von der Chinesischen Universität Hongkong, dem Tencent AI Lab und anderen eingeführte Modell DynamiCrafter verwendet Videodiffusionstechnologie, um reale Bewegungsmuster zu simulieren und kann in Kombination mit Textanweisungen Bilder in dynamische Videos umwandeln. Dieses Tutorial hat eine ComfyUI-Workflowumgebung für Sie erstellt. Sie müssen sich keine Sorgen über Knotenverbindungsfehler machen. Laden Sie einfach Bilder hoch und geben Sie Text ein, um zu arbeiten!

Online ausführen:https://go.hyper.ai/PWzJR

2. Warten Sie nicht! Kommen Sie und erleben Sie die GLM-4-9B-Chat-Demo

Diese Woche hat Zhipu AI die neueste Open-Source-Errungenschaft des großen Basismodells GLM-4 – GLM-4-9B – veröffentlicht, das erstmals über multimodale Fähigkeiten verfügt. Damit jeder dieses Open-Source-Modell, das behauptet, „Llama3-8B zu übertreffen“, so schnell wie möglich erleben kann, hat Chao Neuro das Tutorial „GLM-4-9B-Chat-Demo“ veröffentlicht. Sie müssen keine Befehle eingeben. Klicken Sie einfach auf „Klonen“ und erleben Sie sofort die hervorragende Leistung von GLM-4-9B-Chat.

Online ausführen:https://go.hyper.ai/hc5OK

Community-Artikel

1. Ohne experimentelle Daten zur Steuerung der gerichteten Proteinevolution veröffentlichte die Forschungsgruppe der Shanghai Jiaotong University das mikroumgebungsbewusste Graph-Neuralnetzwerk ProtLGN

Die Forschungsgruppe von Hong Liang an der Shanghai Jiao Tong University hat das mikroumgebungsbewusste Graph-Neuralnetzwerk PROTLGN vorgeschlagen, das aus der dreidimensionalen Struktur von Proteinen vorteilhafte Aminosäuremutationsstellen lernen und vorhersagen und die Gestaltung von Einzelstellenmutationen und Mehrfachstellenmutationen von Proteinen mit unterschiedlichen Funktionen steuern kann. Die von PROTLGN entwickelten Einzelpunktmutantenproteine über 40% hinaus sind ihren Wildtyp-Gegenstücken überlegen. Die entsprechenden Ergebnisse wurden in „JCM“ veröffentlicht.

Den vollständigen Bericht ansehen:https://go.hyper.ai/6FkFu

2. Um die Leistungsgrenzen von Lithiumbatterien neu zu definieren, schlug das Team von Kang Jianqiang von der Technischen Universität Wuhan ein vereinfachtes elektrochemisches Modell auf Basis von Ensemble-Lernen vor

Das Team von Kang Jianqiang von der Technischen Universität Wuhan schlug ein vereinfachtes elektrochemisches Modell des Ensemble-Lernens (ELM) + FIE vor. ELM sagt die Lithiumionenkonzentration der festen Elektrode präzise voraus und erreicht so eine genauere Spannungsvorhersage als ein einzelnes Modell. Zudem ist die Rechenkomplexität wesentlich geringer als beim P2D-Modell. FIE sagt die Lithiumionenkonzentration im Elektrolyt in der Nähe der Stromkollektoren der positiven und negativen Elektrode genau voraus.

Den vollständigen Bericht ansehen:https://go.hyper.ai/CWvce

3. Die Mikroelektronik beschleunigt sich in Richtung der Post-Moore-Ära! Die Forschungsgruppe von Mei Yongfeng an der Universität Fudan integriert DNN- und Nanofilm-Technologie, um den Winkel des einfallenden Lichts genau zu analysieren

Die Forschungsgruppe von Professor Mei Yongfeng vom Institut für Materialwissenschaften der Universität Fudan schlug eine mehrstufige quasistatische Methode zur Finite-Elemente-Analyse vor und entwarf und konstruierte sechs Arten von dreidimensionalen Mikrostrukturen aus Silizium-/Chrom-Nanofilmen und entsprechende dreidimensionale optische Detektoren, wodurch die gute Vielseitigkeit und industrielle Anwendbarkeit der Technologie bestätigt wurde. Die entsprechenden Ergebnisse wurden in „Nature“ veröffentlicht.

Den vollständigen Bericht ansehen:https://go.hyper.ai/2s73Q

Beliebte Enzyklopädieartikel

1. Nukleare Norm

2. Maskierte Sprachmodellierung (MLM)

3. Lang- und Kurzzeitgedächtnis Langzeit-Kurzzeitgedächtnis

4. YOLOv10 Echtzeit-End-to-End-Objekterkennung

5. Kolmogorov-Arnold-Netzwerke

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://hyper.ai/wiki

Vorschau auf die Live-Übertragung von Station B

Apple wird die WWDC24 am 11. Juni (nächsten Dienstag) Pekinger Zeit abhalten. Der HyperAI Super Neural Video Account und Bilibili werden es in Echtzeit übertragen. Scannen Sie den QR-Code, um einen Termin für die Live-Übertragung zu vereinbaren ↓

Um Ihnen zu helfen, ein tieferes Verständnis der relevanten Informationen von Apple zu erlangen,Der Live-Übertragungsraum der Super Neuro B Station wird weiterhin das Video „Apple Special“ ausstrahlen.Beinhaltet: Vergangene WWDC-Konferenzen, Interviews mit Führungskräften, zugehörige Dokumentationen und andere umfangreiche Inhalte.

Die folgende Tabelle ist eine Vorschau der vom Herausgeber ausgewählten Inhalte ↓↓↓

DatumZeitInhalt
Montag, 10. Juni18:00Steve Jobs
Dienstag, 11. Juni1:00Apple WWDC24
Mittwoch, 12. Juni18:00Was macht Apple
Donnerstag, 13. Juni18:00Erste Veröffentlichung des iPhone
Freitag, 14. Juni18:00Geschichte von Steve Jobs
Samstag, 15. Juni18:00Wie Apple die Beinahe-Pleite überlebte
Sonntag, 16. Juni18:00Tim Cooks Geschichte

Super Neuro TV sendet rund um die Uhr live. Klicken Sie hier, um die „elektronischen Gurken“ im KI-Bereich zu erhalten:

http://live.bilibili.com/26483094

Anmeldeschluss für die Konferenz ist Juni-Juli

Zentrale Verfolgung der wichtigsten wissenschaftlichen KI-Konferenzen:https://hyper.ai/events

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bereitstellung von inländischen beschleunigten Download-Knoten für über 1200 öffentliche Datensätze

* Enthält über 300 klassische und beliebte Online-Tutorials

* Interpretation von über 100 AI4Science-Papierfällen

* Unterstützt die Suche nach über 500 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai