Command Palette
Search for a command to run...
Granite-docling-258M: 가벼운 멀티모달 문서 처리 모델
1. 튜토리얼 소개
Granite-Docling-258M은 IBM이 2025년 9월에 출시한 경량 시각 언어 모델로, 효율적인 문서 변환을 위해 설계되었습니다. 이 모델은 레이아웃, 표, 수식 등의 요소를 그대로 유지하면서 문서를 기계가 읽을 수 있는 형식으로 변환할 수 있습니다. 이 모델은 258M개의 매개변수만 포함하고 있으며, 뛰어난 성능과 비용 효율성을 자랑하며 다국어 처리(아랍어, 중국어, 일본어 포함)를 지원합니다. 이 모델은 DocTags 형식을 사용하여 문서 구조를 정확하게 기술하여 정보 손실을 방지합니다. Granite-Docling-258M은 Docling 라이브러리와 완벽하게 통합되며, 강력한 사용자 정의 및 오류 처리 기능을 제공하고, 엔터프라이즈급 문서 처리에 적합하며, 문서 처리 분야의 강력한 도구입니다. 관련 논문 결과는 "SmolDocling: 엔드투엔드 멀티모달 문서 변환을 위한 초소형 비전 언어 모델", 관련 블로그는 "IBM Granite-Docling: 하나의 작은 모델을 통한 종단 간 문서 이해".
이 튜토리얼에서는 리소스로 단일 RTX 5090 카드를 사용합니다.
2. 프로젝트 예시

3. 작업 단계
1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 사용 단계
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.
