HyperAI
Command Palette
Search for a command to run...
Docling: 문서 분석 도구
GPU 컴퓨팅 에어드롭
단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)
1. 튜토리얼 소개

Docling은 IBM이 2024년에 출시한 오픈소스 다기능 문서 변환 도구로, 문서 형식 변환 프로세스를 간소화하고 자동화하도록 설계되었습니다. PDF, Word, PPTX, 마크다운 등 다양한 일반 파일 형식을 텍스트, 마크다운, Doctags, JSON, YAML 등 다양한 출력 형식으로 변환할 수 있습니다.
Docling은 문서 변환 및 처리를 위해 모듈식 디자인을 채택했으며, 다양한 요구 사항을 충족하기 위해 필요에 따라 다양한 변환 모드를 교체할 수 있습니다.
주요 특징:
- 다양한 문서 형식의 변환을 지원합니다. 텍스트 , 가격 인하 , 문서 태그 , JSON , YAML 체재.
- PDF, DOCX, PPTX, MD, ASCIIDOC 등 다양한 입력 형식을 지원합니다.
- 다른 애플리케이션과 쉽게 통합할 수 있는 명확하고 간결한 인터페이스를 제공합니다.
- Gradio를 통해 시각적 인터페이스를 구축하여 사용자가 대화형 파일 업로드 및 변환 작업을 수행할 수 있도록 지원합니다.
지원되는 파일 형식:
- PDF: 텍스트, 마크다운, Doctags, JSON 및 YAML 형식으로 변환 가능합니다.
- DOCX: 텍스트, 마크다운, Doctags, JSON 및 YAML 형식으로 변환 가능합니다.
- PPTX: 텍스트, 마크다운, Doctags, JSON 및 YAML 형식으로 변환 가능합니다.
- 가격 인하: 텍스트, 마크다운, Doctags, JSON 및 YAML 형식으로 변환 가능합니다.
- 아스키독: JSON 및 YAML 형식으로 변환 가능합니다.
2. 작업 단계
1. 컨테이너를 시작하세요
通过 API 地址进入 Web 界面

2. 파일 변환
进入 web 界面后,按照以下步骤进行操作:

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@techreport{Docling,
author = {Deep Search Team},
month = {8},
title = {Docling Technical Report},
url = {https://arxiv.org/abs/2408.09869},
eprint = {2408.09869},
doi = {10.48550/arXiv.2408.09869},
version = {1.0.0},
year = {2024}
}이 노트북은 커뮤니티 사용자가 기여한 것으로 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.