GOT-OCR-2.0
是一个基于通用 OCR 理论(General OCR Theory)的统一端到端模型,专注于提升光学字符识别(OCR)的准确性与效率。该项目由 StepFun 、旷视科技、中国科学院大学和清华大学的研究团队共同发布,相关论文成果为「General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model」,适用于场景文本、文档识别等多种应用场景。它采用了一体化的架构,能够高效处理文本的多样性和复杂性。 GOT-OCR 2.0 不仅支持场景文本识别,还能处理多页文档,为 OCR 领域带来更多灵活性。
GOT-OCR-2.0
的特点包括: