Command Palette
Search for a command to run...
HunyuanOCR: Tencent Hunyuan エンドツーエンド OCR
1. チュートリアルの概要

HunyuanOCRプロジェクトは、2025年11月にTencentのHunyuanチームによってリリースされ、関連する論文結果は次のとおりです。HunyuanOCR技術レポート”。
プロジェクト概要:HunyuanOCRは、革新的な10億パラメータのエンドツーエンドOCRモデルです。Hunyuanのネイティブマルチモーダルアーキテクチャを基盤とし、検出、認識、スティッチングといった従来のOCRの煩雑なプロセスを打破し、「単一画像入力、直接出力」という究極の体験を実現します。このモデルは、多言語文書解析、LaTeX数式認識、複雑な表の再構築といったタスクにおいて、最先端(SOTA)レベルの成果を達成しています。
このチュートリアルでは、デモリソースとして単一のRTX 5090 GPUを使用し、OpenBayesプラットフォームのコンピューティングパワーを実証します。Transformersのネイティブ推論とGradoで構築されたビジュアルWebインターフェースを組み合わせ、様々なOCRタスクをワンクリックでテストできます。
2. プロジェクト例

3. 操作手順
1. コンテナを起動した後、APIアドレスをクリックしてWebインターフェースに入ります。

2. ウェブページに画像をアップロードして認識します。
「Bad Gateway」と表示される場合は、モデルの読み込み中です。2~3分ほどお待ちいただき、ページを更新してください。

引用情報
@misc{hunyuanvisionteam2025hunyuanocrtechnicalreport,
title={HunyuanOCR Technical Report},
author={Hunyuan Vision Team and Pengyuan Lyu and Xingyu Wan and Gengluo Li and Shangpin Peng and Weinong Wang and Liang Wu and Huawen Shen and Yu Zhou and Canhui Tang and Qi Yang and Qiming Peng and Bin Luo and Hower Yang and Xinsong Zhang and Jinnian Zhang and Houwen Peng and Hongming Yang and Senhao Xie and Longsha Zhou and Ge Pei and Binghong Wu and Kan Wu and Jieneng Yang and Bochao Wang and Kai Liu and Jianchen Zhu and Jie Jiang and Linus and Han Hu and Chengquan Zhang},
year={2025},
journal={arXiv preprint arXiv:2511.19575},
url={[https://arxiv.org/abs/2511.19575](https://arxiv.org/abs/2511.19575)},
}Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.