Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 6 Monaten

1. Einführung in das Tutorial

Chandra ist ein hochpräzises Dokumenten-OCR-System (Optical Character Recognition), das im Oktober 2025 vom Datalab-to-Team entwickelt wurde und sich auf die Erkennung von Dokumentenlayouts und die Textextraktion konzentriert. Chandra kann PDF- und Bilddateien direkt verarbeiten und strukturierten Text, Markdown und HTML-Ausgaben generieren. Zusätzlich werden visuelle Layoutdiagramme zur einfachen Überprüfung der OCR-Ergebnisse bereitgestellt.

Kernfunktionen:

Hochpräzise OCROptimiert für Dokument-, Tabellen- und mehrspaltige Layouts, unterstützt komplexe Seitenlayouts.
LayoutbewusstseinErzeugt visuelle Layoutdiagramme und kennzeichnet Textblöcke, Tabellen und Bildbereiche.
Ausgabe in mehreren FormatenUnterstützt das Herunterladen von Markdown, HTML und Klartext.
Einfache BereitstellungBasierend auf der Streamlit-Oberfläche ermöglicht es eine schnelle Interaktion im Browser.
Leichtes ModellSie können das Modell direkt mit Transformers laden, ohne eine Abhängigkeit von vLLM hinzufügen zu müssen.

Dieses Tutorial verwendet Streamlit, um das Chandra OCR-Kernmodell mit "RTX_5090"-Rechenressourcen bereitzustellen, was eine schnelle Dokumentenerkennung und Layoutvisualisierung ermöglicht.

2. Effektanzeige

Chandra hat die Kernaufgabe hervorragend erfüllt:

OCR für einseitige DokumenteGenerieren Sie hochpräzisen Text und Markdown aus PDFs oder Bildern.
LayouterkennungEs erkennt Bereiche wie Textblöcke, Tabellen und Bilder präzise und unterstützt die Layoutvisualisierung.
Unterstützung für mehrseitige DokumenteEs kann PDF-Dateien seitenweise verarbeiten, wobei die Seitenzahlen bei 1 beginnen, um Bereichsüberschreitungen zu vermeiden.
Markdown- und HTML-AusgabeAutomatische Einbettung von OCR-Ergebnissen in Markdown oder HTML sowie Unterstützung für den Download.
Visuelles LayoutdiagrammGenerieren Sie PIL-Bilder von annotierten Textbereichen zur einfachen Überprüfung der OCR-Genauigkeit.

3. Bedienungsschritte

1. Starten Sie den Container oder führen Sie ihn lokal aus.

Nach dem Start des Containers klicken Sie auf die API-Adresse, um auf die Weboberfläche zuzugreifen:

2. Benutzerhandbuch

Wird „Bad Gateway“ angezeigt, bedeutet dies, dass das Modell initialisiert wird. Bitte warten Sie 1–2 Minuten und aktualisieren Sie die Seite.

HinweisWenn auf der Seite „Load_Model() wird ausgeführt“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Bitte warten Sie 1–2 Minuten und aktualisieren Sie die Seite anschließend.

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Notebook-Übersicht

Stufe

Einsteiger

Thema

Computer Vision Generative KI

Chandra-ocr-2 Wandelt Mathematische Inhalte, Tabellenkalkulationen Und Handschriftliche Inhalte Präzise in Strukturierte Inhalte um.

vor 3 Monaten

Nanonets-OCR2-3B: Genauere Interpretation Visueller Elemente in Komplexen Dokumenten

vor 8 Monaten

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

vor 8 Monaten

Nanonets-OCR-s: Tool Zur Extraktion Von Dokumentinformationen Und Zum Benchmarking

vor einem Jahr

RolmOCR: Szenarioübergreifende Ultraschnelle OCR-Open-Source-Erkennung – Neuer Maßstab

vor einem Jahr

GOT-OCR-2.0 Das Weltweit Erste Universelle End-to-End-OCR-Modell

vor 2 Jahren

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 6 Monaten

1. Einführung in das Tutorial

Kernfunktionen:

Hochpräzise OCROptimiert für Dokument-, Tabellen- und mehrspaltige Layouts, unterstützt komplexe Seitenlayouts.
LayoutbewusstseinErzeugt visuelle Layoutdiagramme und kennzeichnet Textblöcke, Tabellen und Bildbereiche.
Ausgabe in mehreren FormatenUnterstützt das Herunterladen von Markdown, HTML und Klartext.
Einfache BereitstellungBasierend auf der Streamlit-Oberfläche ermöglicht es eine schnelle Interaktion im Browser.
Leichtes ModellSie können das Modell direkt mit Transformers laden, ohne eine Abhängigkeit von vLLM hinzufügen zu müssen.

Dieses Tutorial verwendet Streamlit, um das Chandra OCR-Kernmodell mit "RTX_5090"-Rechenressourcen bereitzustellen, was eine schnelle Dokumentenerkennung und Layoutvisualisierung ermöglicht.

2. Effektanzeige

Chandra hat die Kernaufgabe hervorragend erfüllt:

OCR für einseitige DokumenteGenerieren Sie hochpräzisen Text und Markdown aus PDFs oder Bildern.
LayouterkennungEs erkennt Bereiche wie Textblöcke, Tabellen und Bilder präzise und unterstützt die Layoutvisualisierung.
Unterstützung für mehrseitige DokumenteEs kann PDF-Dateien seitenweise verarbeiten, wobei die Seitenzahlen bei 1 beginnen, um Bereichsüberschreitungen zu vermeiden.
Markdown- und HTML-AusgabeAutomatische Einbettung von OCR-Ergebnissen in Markdown oder HTML sowie Unterstützung für den Download.
Visuelles LayoutdiagrammGenerieren Sie PIL-Bilder von annotierten Textbereichen zur einfachen Überprüfung der OCR-Genauigkeit.

3. Bedienungsschritte

1. Starten Sie den Container oder führen Sie ihn lokal aus.

Nach dem Start des Containers klicken Sie auf die API-Adresse, um auf die Weboberfläche zuzugreifen:

2. Benutzerhandbuch

Wird „Bad Gateway“ angezeigt, bedeutet dies, dass das Modell initialisiert wird. Bitte warten Sie 1–2 Minuten und aktualisieren Sie die Seite.

HinweisWenn auf der Seite „Load_Model() wird ausgeführt“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Bitte warten Sie 1–2 Minuten und aktualisieren Sie die Seite anschließend.

Notebook-Übersicht

Stufe

Einsteiger

Thema

Computer Vision Generative KI

Chandra-ocr-2 Wandelt Mathematische Inhalte, Tabellenkalkulationen Und Handschriftliche Inhalte Präzise in Strukturierte Inhalte um.

vor 3 Monaten

Nanonets-OCR2-3B: Genauere Interpretation Visueller Elemente in Komplexen Dokumenten

vor 8 Monaten

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

vor 8 Monaten

Nanonets-OCR-s: Tool Zur Extraktion Von Dokumentinformationen Und Zum Benchmarking

vor einem Jahr

RolmOCR: Szenarioübergreifende Ultraschnelle OCR-Open-Source-Erkennung – Neuer Maßstab

vor einem Jahr

GOT-OCR-2.0 Das Weltweit Erste Universelle End-to-End-OCR-Modell

vor 2 Jahren

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Chandra: Hochpräzise Dokumenten-OCR

1. Einführung in das Tutorial

2. Effektanzeige

3. Bedienungsschritte

1. Starten Sie den Container oder führen Sie ihn lokal aus.

2. Benutzerhandbuch

Notebook-Übersicht

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Chandra: Hochpräzise Dokumenten-OCR

1. Einführung in das Tutorial

2. Effektanzeige

3. Bedienungsschritte

1. Starten Sie den Container oder führen Sie ihn lokal aus.

2. Benutzerhandbuch

Notebook-Übersicht

Verwandte Notebooks

Chandra-ocr-2 Wandelt Mathematische Inhalte, Tabellenkalkulationen Und Handschriftliche Inhalte Präzise in Strukturierte Inhalte um.

Nanonets-OCR2-3B: Genauere Interpretation Visueller Elemente in Komplexen Dokumenten

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

Nanonets-OCR-s: Tool Zur Extraktion Von Dokumentinformationen Und Zum Benchmarking

RolmOCR: Szenarioübergreifende Ultraschnelle OCR-Open-Source-Erkennung – Neuer Maßstab

GOT-OCR-2.0 Das Weltweit Erste Universelle End-to-End-OCR-Modell

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Chandra: Hochpräzise Dokumenten-OCR

1. Einführung in das Tutorial

2. Effektanzeige

3. Bedienungsschritte

1. Starten Sie den Container oder führen Sie ihn lokal aus.

2. Benutzerhandbuch

Notebook-Übersicht

Verwandte Notebooks

Chandra-ocr-2 Wandelt Mathematische Inhalte, Tabellenkalkulationen Und Handschriftliche Inhalte Präzise in Strukturierte Inhalte um.

Nanonets-OCR2-3B: Genauere Interpretation Visueller Elemente in Komplexen Dokumenten

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

Nanonets-OCR-s: Tool Zur Extraktion Von Dokumentinformationen Und Zum Benchmarking

RolmOCR: Szenarioübergreifende Ultraschnelle OCR-Open-Source-Erkennung – Neuer Maßstab

GOT-OCR-2.0 Das Weltweit Erste Universelle End-to-End-OCR-Modell

KI mit KI entwickeln

HyperAI Newsletters

Verwandte Notebooks

Chandra-ocr-2 Wandelt Mathematische Inhalte, Tabellenkalkulationen Und Handschriftliche Inhalte Präzise in Strukturierte Inhalte um.

Nanonets-OCR2-3B: Genauere Interpretation Visueller Elemente in Komplexen Dokumenten

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

Nanonets-OCR-s: Tool Zur Extraktion Von Dokumentinformationen Und Zum Benchmarking

RolmOCR: Szenarioübergreifende Ultraschnelle OCR-Open-Source-Erkennung – Neuer Maßstab

GOT-OCR-2.0 Das Weltweit Erste Universelle End-to-End-OCR-Modell

Verwandte Notebooks

Chandra-ocr-2 Wandelt Mathematische Inhalte, Tabellenkalkulationen Und Handschriftliche Inhalte Präzise in Strukturierte Inhalte um.

Nanonets-OCR2-3B: Genauere Interpretation Visueller Elemente in Komplexen Dokumenten

OCRFlux-3B: Intelligentes Texterkennungs-Toolkit

Nanonets-OCR-s: Tool Zur Extraktion Von Dokumentinformationen Und Zum Benchmarking

RolmOCR: Szenarioübergreifende Ultraschnelle OCR-Open-Source-Erkennung – Neuer Maßstab

GOT-OCR-2.0 Das Weltweit Erste Universelle End-to-End-OCR-Modell