Command Palette
Search for a command to run...
온라인 튜토리얼 | 화중과학기술대학교와 샤오홍슈 하이 연구실에서 개발한 오픈소스 dots.mocr은 문서 구조를 완벽하게 복원하고 그래픽을 SVG로 변환할 수 있는 최첨단 OCR 모델입니다.

기존 OCR 기술은 복잡한 도표, 표, 다국어 콘텐츠가 포함된 방대한 문서를 처리할 때 종종 한계를 드러냅니다. 이는 OCR의 핵심 기능이 텍스트 인식에 집중되어 있어 도표, 수식, UI 레이아웃과 같은 복잡한 시각적 요소를 단순히 이미지로 잘라내는 데 그치기 때문입니다. 이로 인해 문서 구조가 손상되고 의미 관계가 손실되어 고품질 정보 추출 및 재구성에 필요한 요구 사항을 충족하기 어렵습니다.
이에 대응하여 화중과학기술대학교와 샤오홍슈의 hi lab은 문서 내 텍스트, 차트, 표 등 모든 시각적 요소를 통합된 구조화된 데이터로 분석하고, 그래픽을 편집 가능한 SVG 코드로 직접 변환할 수 있는 dots.mocr을 공동으로 오픈소스 공개했습니다. 이는 문서 이해의 깊이와 폭을 크게 향상시킬 뿐만 아니라, 복잡한 문서의 자동 처리 분야에서 업계 최고 수준을 달성합니다.
현재 HyperAI 공식 웹사이트(hyper.ai)의 튜토리얼 섹션에서 "dots.mocr 멀티모달 문서 파싱 튜토리얼"을 시작하여 사용자들이 멀티모달 문서 파싱의 새로운 패러다임을 온라인으로 체험할 수 있도록 하고 있습니다.
온라인 달리기 링크:
데모 실행 중
1. hyper.ai 홈페이지에 접속한 후, "튜토리얼" 페이지를 선택하거나 "더 많은 튜토리얼 보기"를 클릭하고 "..."를 선택하세요.dots.mocr 멀티모달 문서 구문 분석 튜토리얼"이 튜토리얼을 온라인으로 실행"을 클릭하세요.


2. 페이지가 리디렉션된 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.
참고: 페이지 오른쪽 상단에서 언어를 변경할 수 있습니다. 현재 중국어와 영어로만 제공됩니다. 이 튜토리얼에서는 영어로 된 단계를 안내합니다.

3. "NVIDIA GeForce RTX 5090" 및 "PyTorch" 이미지를 선택하고 필요에 따라 "종량제" 또는 "일일 요금제/주간 요금제/월간 요금제"를 선택한 다음 "작업 실행 계속"을 클릭합니다.
HyperAI는 신규 사용자를 위한 등록 혜택을 제공합니다.단 $1로 20시간 동안 RTX 5090의 컴퓨팅 성능을 이용할 수 있습니다(정가 $7).해당 리소스는 영구적으로 유효합니다.


4. 리소스 할당이 완료될 때까지 기다립니다. 상태가 "실행 중"으로 변경되면 "워크스페이스 열기"를 클릭하여 Jupyter 워크스페이스에 들어갑니다.

효과 시연
1. 페이지가 리디렉션된 후 왼쪽의 README 페이지를 클릭하고 상단의 실행을 클릭합니다.


2. 과정이 완료되면 오른쪽에 있는 API 주소를 클릭하여 데모 페이지로 이동하세요.


업적



튜토리얼 링크:https://go.hyper.ai/tx8FW








