Command Palette

Search for a command to run...

Granite-docling-258M: 가벼운 멀티모달 문서 처리 모델

1. 튜토리얼 소개

Granite-Docling-258M은 IBM이 2025년 9월에 출시한 경량 시각 언어 모델로, 효율적인 문서 변환을 위해 설계되었습니다. 이 모델은 레이아웃, 표, 수식 등의 요소를 그대로 유지하면서 문서를 기계가 읽을 수 있는 형식으로 변환할 수 있습니다. 이 모델은 258M개의 매개변수만 포함하고 있으며, 뛰어난 성능과 비용 효율성을 자랑하며 다국어 처리(아랍어, 중국어, 일본어 포함)를 지원합니다. 이 모델은 DocTags 형식을 사용하여 문서 구조를 정확하게 기술하여 정보 손실을 방지합니다. Granite-Docling-258M은 Docling 라이브러리와 완벽하게 통합되며, 강력한 사용자 정의 및 오류 처리 기능을 제공하고, 엔터프라이즈급 문서 처리에 적합하며, 문서 처리 분야의 강력한 도구입니다. 관련 논문 결과는 "SmolDocling: 엔드투엔드 멀티모달 문서 변환을 위한 초소형 비전 언어 모델", 관련 블로그는 "IBM Granite-Docling: 하나의 작은 모델을 통한 종단 간 문서 이해".

이 튜토리얼에서는 리소스로 단일 RTX 5090 카드를 사용합니다.

2. 프로젝트 예시

3. 작업 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
Granite-docling-258M: 가벼운 멀티모달 문서 처리 모델 | 튜토리얼 | HyperAI초신경