Command Palette
Search for a command to run...
HunyuanOCR: End-to-End-OCR Von Tencent Hunyuan
1. Einführung in das Tutorial

Das HunyuanOCR-Projekt wurde im November 2025 vom Hunyuan-Team von Tencent veröffentlicht, und die zugehörigen Forschungsergebnisse lauten wie folgt:Technischer Bericht zu HunyuanOCR".
Projektübersicht: HunyuanOCR ist ein revolutionäres End-to-End-OCR-Modell mit einer Milliarde Parametern. Basierend auf Hunyuans eigener multimodaler Architektur umgeht es den umständlichen Prozess der traditionellen OCR, der Detektion, Erkennung und Zusammenfügen erfordert, und ermöglicht so die direkte Ausgabe eines einzelnen Bildes. Dieses Modell hat in Bereichen wie dem Parsen mehrsprachiger Dokumente, der LaTeX-Formelerkennung und der Rekonstruktion komplexer Tabellen herausragende Ergebnisse erzielt.
Dieses Tutorial demonstriert die Rechenleistung der OpenBayes-Plattform anhand einer einzelnen RTX 5090 GPU. Es kombiniert die native Transformers-Inferenz mit einer visuellen Weboberfläche, die mit Grado erstellt wurde und das Testen verschiedener OCR-Aufgaben mit nur einem Klick ermöglicht.
2. Projektbeispiele

3. Bedienungsschritte
1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

2. Bilder auf der Webseite hochladen und erkennen.
Wird „Bad Gateway“ angezeigt, bedeutet dies, dass das Modell geladen wird. Bitte warten Sie etwa 2–3 Minuten und aktualisieren Sie dann die Seite.

Zitationsinformationen
@misc{hunyuanvisionteam2025hunyuanocrtechnicalreport,
title={HunyuanOCR Technical Report},
author={Hunyuan Vision Team and Pengyuan Lyu and Xingyu Wan and Gengluo Li and Shangpin Peng and Weinong Wang and Liang Wu and Huawen Shen and Yu Zhou and Canhui Tang and Qi Yang and Qiming Peng and Bin Luo and Hower Yang and Xinsong Zhang and Jinnian Zhang and Houwen Peng and Hongming Yang and Senhao Xie and Longsha Zhou and Ge Pei and Binghong Wu and Kan Wu and Jieneng Yang and Bochao Wang and Kai Liu and Jianchen Zhu and Jie Jiang and Linus and Han Hu and Chengquan Zhang},
year={2025},
journal={arXiv preprint arXiv:2511.19575},
url={[https://arxiv.org/abs/2511.19575](https://arxiv.org/abs/2511.19575)},
}Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.