HyperAIHyperAI

Command Palette

Search for a command to run...

Online-Tutorial | Die Huazhong University of Science and Technology Und Das Xiaohongshu Hi Lab Open-Source-Projekt dots.mocr, Ein Hochmodernes OCR-Modell, Das Die Dokumentstruktur Perfekt Wiederherstellt Und Grafiken in SVG Konvertieren kann.

Featured Image

Herkömmliche OCR-Verfahren stoßen bei komplexen Diagrammen, Tabellen und mehrsprachigen Inhalten in umfangreichen Dokumenten oft an ihre Grenzen. Dies liegt hauptsächlich daran, dass ihre Kernfunktionen auf die Texterkennung ausgerichtet sind und komplexe visuelle Elemente wie Diagramme, Formeln und Benutzeroberflächen oft einfach in Bilder zerlegen. Dadurch wird die Dokumentstruktur zerstört und semantische Beziehungen gehen verloren, was die Anforderungen an eine qualitativ hochwertige Informationsextraktion und -rekonstruktion erschwert.

Als Reaktion darauf haben die Huazhong University of Science and Technology und das hi lab von Xiaohongshu gemeinsam dots.mocr als Open Source veröffentlicht. Dieses Tool kann alle visuellen Elemente eines Dokuments, wie Text, Diagramme und Tabellen, in einheitliche, strukturierte Daten umwandeln und Grafiken sogar direkt in bearbeitbaren SVG-Code konvertieren. Es verbessert nicht nur das Verständnis von Dokumenten erheblich, sondern erreicht auch branchenführende Standards bei der automatisierten Verarbeitung komplexer Dokumente.

Aktuell ist im Tutorial-Bereich der offiziellen Website von HyperAI (hyper.ai) das „dots.mocr Multimodal Document Parsing Tutorial“ verfügbar, mit dem Benutzer dieses neue Paradigma des multimodalen Dokumentenparsings online erleben können.

Online-Lauflink:

https://go.hyper.ai/tx8FW

Demo läuft

1. Nachdem Sie die Startseite von hyper.ai aufgerufen haben, wählen Sie die Seite „Tutorials“ aus oder klicken Sie auf „Weitere Tutorials anzeigen“ und wählen Sie „...“ aus.dots.mocr Multimodales Dokumentenparsing-TutorialKlicken Sie auf „Dieses Tutorial online ausführen“.

2. Nachdem die Seite weitergeleitet wurde, klicken Sie oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

Hinweis: Sie können die Sprache oben rechts auf der Seite ändern. Derzeit sind Chinesisch und Englisch verfügbar. Dieses Tutorial zeigt die Schritte auf Englisch.

3. Wählen Sie die Images „NVIDIA GeForce RTX 5090“ und „PyTorch“ aus und wählen Sie je nach Bedarf „Pay As You Go“ oder „Tagesplan/Wochenplan/Monatsplan“. Klicken Sie anschließend auf „Auftragsausführung fortsetzen“.

HyperAI bietet Neukunden Registrierungsvorteile.Für nur $1 erhalten Sie 20 Stunden Rechenleistung einer RTX 5090 (ursprünglicher Preis $7).Die Ressource ist dauerhaft gültig.

4. Warten Sie, bis die Ressourcen zugewiesen wurden. Sobald sich der Status auf „Wird ausgeführt“ ändert, klicken Sie auf „Arbeitsbereich öffnen“, um den Jupyter-Arbeitsbereich zu betreten.

Effektdemonstration

1. Nachdem die Seite weitergeleitet wurde, klicken Sie links auf die README-Seite und anschließend oben auf Ausführen.

2. Sobald der Vorgang abgeschlossen ist, klicken Sie auf die API-Adresse rechts, um zur Demoseite zu gelangen.

Erfolge

Link zum Tutorial:https://go.hyper.ai/tx8FW