HyperAIHyperAI

Command Palette

Search for a command to run...

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.

Featured Image

Lance, 2026 von ByteDance veröffentlicht, ist ein natives, einheitliches multimodales Modell. Dank seines 3B-Aktivitätsparameterdesigns ermöglicht es die gleichzeitige Bild- und Videoanalyse, -generierung und -bearbeitung in einem einzigen Framework. Dieses Modell vereint Fähigkeiten für Text-, Bild- und Videoaufgaben durch einheitliche multimodale Repräsentation und kollaboratives Multitasking-Training. Sein Kern nutzt eine Zwei-Stream-Hybrid-Expert-Architektur (MoE) und modalitätsbewusste Rotationspositionskodierung (MaPE). Dadurch wird einheitliches Kontextlernen auf gemeinsam genutzten, verschachtelten multimodalen Sequenzen erreicht, während die Fähigkeiten der Analyse und Generierung geschickt entkoppelt werden. In Kombination mit einer phasenweisen Multitasking-Trainingsstrategie übertrifft Lance bestehende Open-Source-Modelle hinsichtlich der Bild- und Videogenerierungsqualität deutlich und behält gleichzeitig exzellente Fähigkeiten zur multimodalen semantischen Analyse bei.

Auf der HyperAI-Website wird jetzt „Lance: Unifying Multimodal Understanding, Generation, and Editing Models“ vorgestellt. Schauen Sie doch mal vorbei!

Online-Nutzung:https://go.hyper.ai/Okkmw

Besuchen Sie unsere offizielle Website für weitere Informationen:

https://hyper.ai

Ein kurzer Überblick über die Aktualisierungen der offiziellen Website von hyper.ai vom 23. bis 29. Mai:

* Hochwertige öffentliche Datensätze: 3

* Auswahl an hochwertigen Tutorials: 3

* Interpretation von Community-Artikeln: 3 Artikel

* Beliebte Enzyklopädieeinträge: 5

Besuchen Sie die offizielle Website:hyper.ai

Ausgewählte öffentliche Datensätze

1. ViMU-Datensatz zum Verständnis von Videometaphern

ViMU ist ein Benchmark-Datensatz für das Verständnis von Videometaphern, der 2026 von der National University of Singapore veröffentlicht wurde. Ziel ist es, die Fähigkeit multimodaler großer Modelle zu bewerten, tiefe semantische Bedeutungen von Videometaphern zu verstehen.

Online-Nutzung:https://go.hyper.ai/0DIpe

2. Datensatz zu Reisblattkrankheiten

Der Datensatz „Rice Leaf Disease Detection“ ist ein Bilddatensatz für Reisblätter, der speziell für die präzise Zielerkennung in der Landwirtschaft entwickelt wurde. Er findet breite Anwendung in Bereichen wie dem Training von YOLO-Modellen, der Erkennung von Pflanzenkrankheiten, dem Einsatz von Edge-Vision-Systemen und dem intelligenten Reisanbaumanagement. Der Datensatz umfasst 8.665 Bilder von Reisblättern in neun Kategorien, darunter gesunde Blätter und acht häufige Krankheiten: Bakterienbrand, Braunfleckenkrankheit, Blattwicklerbefall, Reisbrand, Blattbrand, Schmalfleckenkrankheit und Halsbrand.

Online-Nutzung:https://go.hyper.ai/IXOlY

Dataset-Beispiel

3. MRT-Datensatz zu neurodegenerativen Hirnerkrankungen

Der Datensatz „MRI Brain Neurodegenerative Diseases“ ist ein MRT-Datensatz, der für die Forschung und medizinische Bildanalyse neurodegenerativer Hirnerkrankungen entwickelt wurde. Er findet breite Anwendung in Bereichen wie Krankheitsklassifizierung, medizinischer Bilderkennung und dem Training von Deep-Learning-Modellen. Der Datensatz umfasst 2.846 MRT-Bilder des Gehirns mit einer Auflösung von 512 × 512 Pixeln, die nach zwei Gewichtungsfaktoren und vier Hauptkategorien organisiert sind.

Online-Nutzung:https://go.hyper.ai/VpFoh

Dataset-Beispiel

Ausgewählte öffentliche Tutorials

1. Lance: Ein einheitliches Modell zum Verstehen, Generieren und Bearbeiten multimodaler Daten.

Lance, 2026 von ByteDance veröffentlicht, ist ein natives, einheitliches multimodales Modell im 3-Milliarden-Bereich, das für Aufgaben wie Bild- und Videoanalyse, Text-zu-Bild- und Text-zu-Video-Konvertierung, Bild- und Videobearbeitung entwickelt wurde. Das Hauptmerkmal von Lance ist die Verarbeitung von Analyse, Generierung und Bearbeitung innerhalb desselben Modellrahmens. Dadurch können Text-, Bild- und Videoaufgaben eine einheitliche multimodale Repräsentation nutzen. Lance kann Bilder oder Videos aus Text generieren, visuelle Bearbeitungen durch die Kombination von Eingabebildern, Eingabevideos und Textanweisungen durchführen sowie Fragen beantworten, Beschreibungen erstellen und Schlussfolgerungen zu Bildern und Videos ziehen.

Online ausführen:https://go.hyper.ai/Okkmw

Demoseite

2. HY-World-2.0 Weltmodell

HY-World-2.0 ist ein multimodales Weltmodell-Framework, das 2026 von Tencent veröffentlicht wurde. Im Gegensatz zu Weltmodellen, die nur Pixelvideos generieren (wie Genie 3 und Cosmos), erzeugt HY-World-2.0 direkt realistische 3D-Assets (Mesh/3DGS), die bearbeitbar und persistent sind und direkt in Game-Engines wie Blender, Unity und Unreal Engine importiert werden können.

Online ausführen:https://go.hyper.ai/ZQpHM

Demoseite

3. AutoFigure: Ein LLM-basiertes System zur automatischen Generierung von Illustrationen für wissenschaftliche Arbeiten.

AutoFigure ist ein intelligentes System zur Generierung akademischer Illustrationen, entwickelt vom ResearchAI-Team der Westlake University und auf der ICLR 2026 vorgestellt. Das System nutzt ein umfangreiches Sprachmodell (LM) und einen iterativen Optimierungsmechanismus, um automatisch hochwertige, den Publikationsstandards entsprechende wissenschaftliche Illustrationen aus Textbeschreibungen oder Forschungsarbeiten zu erstellen. Es unterstützt sowohl SVG-Vektorgrafiken als auch das mxGraph-XML-Ausgabeformat (vollständig kompatibel mit draw.io).

Online ausführen:https://go.hyper.ai/ZrWS4

Demoseite

Interpretation von Gemeinschaftsartikeln

1. Das Argonne National Laboratory in den Vereinigten Staaten hat CVEvolve vorgeschlagen, einen Zero-Code-Algorithmus zur Selbstentdeckung für die wissenschaftliche Bildverarbeitung, der über umfassende Funktionen verfügt, darunter Codierung, Ergebnisselbstprüfung und Strategieoptimierung.

Ein Forschungsteam des Argonne National Laboratory (ANL) in den USA hat nach systematischer Analyse bisheriger KI-basierter Automatisierungsprojekte ein Framework für autonome Agenten ohne Programmieraufwand namens CVEvolve entwickelt. Dieses Framework dient der Ermittlung von Algorithmen für die wissenschaftliche Datenverarbeitung. Es zeichnet sich durch hohe Flexibilität aus, da es weder eine vordefinierte Problemarchitektur noch feste Prozessvorlagen benötigt. CVEvolve ermöglicht die nahtlose Verknüpfung verschiedener Elemente wie Code, Daten, Bewertungsmetriken, Suchergebnisse und Visualisierungsergebnisse und unterstützt so die Entwicklung ausführbarer Algorithmen für Computer Vision, Bildverarbeitung und weitere Anwendungsgebiete.

Den vollständigen Bericht ansehen:https://go.hyper.ai/UBS5q

2. In nur 30 Minuten integrierte das biologische Multiagentensystem Robin erfolgreich 550 Forschungsarbeiten, etablierte einen autonomen Forschungskreislauf und identifizierte Kandidaten für Therapien gegen dAMD.

Ein gemeinsames Team von FutureHouse in San Francisco, der Universität Oxford und der Fordham University hat das biologische Multiagentensystem Robin entwickelt. Es handelt sich um das erste biomedizinische intelligente System, das wissenschaftliche Hypothesengenerierung und experimentelle Datenanalyse gleichzeitig integriert und so einen durchgängigen, geschlossenen Arbeitsablauf ermöglicht.

Den vollständigen Bericht ansehen:https://go.hyper.ai/KnYpQ

3. Wissenschaftler haben unabhängig voneinander neuartige Materialien entwickelt, indem sie galliumhaltige Materialien mithilfe eines Bayes'schen Optimierungsverfahrens durch Reverse Engineering analysierten. Die Optimierungsergebnisse zeichnen sich durch Einzigartigkeit und Neuartigkeit aus.

Ein Forschungsteam der Flinders University in Zusammenarbeit mit der Khalifa University in den Vereinigten Arabischen Emiraten hat ein maschinelles Lernverfahren zur Bayes'schen Optimierung (BO) entwickelt. Dieses ermöglicht die gezielte Entwicklung von Gallium-basierten Verbindungen mit vorbestimmten elektronischen Eigenschaften unter Berücksichtigung chemischer Kriterien. Die Analyseergebnisse nach der Optimierung zeigen, dass das generierte Material 100% im Vergleich zu den Trainingsdaten einzigartige und neuartige Eigenschaften aufweist und die SMACT-Effektivität im Bandlückenbereich von 1,5–2,5 eV signifikant verbessert ist.

Den vollständigen Bericht ansehen:https://go.hyper.ai/kXS7f

Beliebte Enzyklopädieartikel

1. Hypernetzwerke

2. Konfusionsmatrix

3. Schnelle Entwicklung

4. Lernen während der Implementierung

5. Reziproke Rangfusion

Hier sind Hunderte von KI-bezogenen Begriffen zusammengestellt, die Ihnen helfen sollen, „künstliche Intelligenz“ zu verstehen:

https://go.hyper.ai/wiki

Das Obige ist der gesamte Inhalt der Auswahl des Herausgebers dieser Woche. Wenn Sie über Ressourcen verfügen, die Sie auf der offiziellen Website von hyper.ai veröffentlichen möchten, können Sie uns auch gerne eine Nachricht hinterlassen oder einen Artikel einreichen!

Bis nächste Woche!

Über HyperAI

HyperAI (hyper.ai) ist eine führende Community für künstliche Intelligenz und Hochleistungsrechnen in China.Wir haben uns zum Ziel gesetzt, die Infrastruktur im Bereich der Datenwissenschaft in China zu werden und inländischen Entwicklern umfangreiche und qualitativ hochwertige öffentliche Ressourcen bereitzustellen. Bisher haben wir:

* Bietet inländische beschleunigte Download-Knoten für mehr als 2100 öffentliche Datensätze

* Enthält über 700 klassische und beliebte Online-Tutorials

* Analyse von über 300 AI4Science-Fallstudien

* Unterstützt die Suche nach über 700 verwandten Begriffen

* Hosting der ersten vollständigen chinesischen Apache TVM-Dokumentation in China

Besuchen Sie die offizielle Website, um Ihre Lernreise zu beginnen:

https://hyper.ai