Command Palette
Search for a command to run...
HunyuanOCR : Tencent Hunyuan OCR De Bout En Bout
1. Introduction au tutoriel

Le projet HunyuanOCR a été lancé par l'équipe Hunyuan de Tencent en novembre 2025, et les résultats de l'article associé sont les suivants :Rapport technique HunyuanOCR".
Présentation du projet : HunyuanOCR est un modèle OCR révolutionnaire de bout en bout prenant en charge un milliard de paramètres. S'appuyant sur l'architecture multimodale native de Hunyuan, il s'affranchit du processus complexe de l'OCR traditionnel (détection, reconnaissance et assemblage) pour offrir une expérience optimale : « une seule image en entrée, une sortie directe ». Ce modèle a obtenu des résultats de pointe dans des tâches telles que l'analyse de documents multilingues, la reconnaissance de formules LaTeX et la reconstruction de tableaux complexes.
Ce tutoriel illustre la puissance de calcul de la plateforme OpenBayes à l'aide d'un seul GPU RTX 5090. Il combine l'inférence native de Transformers avec une interface web visuelle développée avec Grado, permettant de tester en un clic diverses tâches de reconnaissance optique de caractères (OCR).
2. Exemples de projets

3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Télécharger et reconnaître les images sur la page web.
Si le message « Bad Gateway » s’affiche, cela signifie que le modèle est en cours de chargement. Veuillez patienter 2 à 3 minutes, puis actualiser la page.

Informations sur la citation
@misc{hunyuanvisionteam2025hunyuanocrtechnicalreport,
title={HunyuanOCR Technical Report},
author={Hunyuan Vision Team and Pengyuan Lyu and Xingyu Wan and Gengluo Li and Shangpin Peng and Weinong Wang and Liang Wu and Huawen Shen and Yu Zhou and Canhui Tang and Qi Yang and Qiming Peng and Bin Luo and Hower Yang and Xinsong Zhang and Jinnian Zhang and Houwen Peng and Hongming Yang and Senhao Xie and Longsha Zhou and Ge Pei and Binghong Wu and Kan Wu and Jieneng Yang and Bochao Wang and Kai Liu and Jianchen Zhu and Jie Jiang and Linus and Han Hu and Chengquan Zhang},
year={2025},
journal={arXiv preprint arXiv:2511.19575},
url={[https://arxiv.org/abs/2511.19575](https://arxiv.org/abs/2511.19575)},
}Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.