@misc{godoy2025extract0specializedlanguagemodel, title={Extract-0: A Specialized Language Model for Document Information Extraction}, author={Henrique Godoy}, year={2025}, eprint={2509.22906}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2509.22906}, }

Date

8 months ago

Size

55.5 MB

Organization

Paper URL

2509.22906

License

Apache 2.0

Citation

@misc{godoy2025extract0specializedlanguagemodel,
title={Extract-0: A Specialized Language Model for Document Information Extraction},
author={Henrique Godoy},
year={2025},
eprint={2509.22906},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2509.22906},
}

Extract-0.torrent

Seeding 1Downloading 0Completed 51Total Downloads 173

Extract-0/
- README.md
  1.67 KB
- README.txt
  3.34 KB

This dataset is contributed by community users and is intended for educational and informational purposes only. If any content involves copyright infringement, please contact us at [email protected] for prompt review and removal.

Related Datasets

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started View Pricing

HyperAI Newsletters

Subscribe to our latest updates

We will deliver the latest updates of the week to your inbox at nine o'clock every Monday morning

HyperAI

Download

Discuss on Discord

Date

8 months ago

Size

55.5 MB

Organization

Paper URL

2509.22906

License

Apache 2.0

Citation

@misc{godoy2025extract0specializedlanguagemodel,
title={Extract-0: A Specialized Language Model for Document Information Extraction},
author={Henrique Godoy},
year={2025},
eprint={2509.22906},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2509.22906},
}

Extract-0.torrent

Seeding 1Downloading 0Completed 51Total Downloads 173

Extract-0/
- README.md
  1.67 KB
- README.txt
  3.34 KB

Related Datasets

MAKIEVAL Multilingual Cultural Knowledge Assessment Dataset

3 hours ago

Verbatim Spans Query Condition Evidence Extraction Dataset

in 4 hours

SAM 3D Artist Objects 3D Object Reconstruction Dataset

in an hour

FigureBench Scientific Illustration Generation Benchmark Dataset

10 minutes ago

Noisy Medical Document Image Dataset

a day ago

TACK Targeted Chimera Knowledge Base Dataset

15 days ago

SMOL Multilingual Translation Parallel Dataset

19 days ago

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

6 days ago

MemLens Multimodal Long Context Benchmark Dataset

19 days ago

LongBlocks Long Context Multilingual Question Answering Dataset

a month ago

Claw-Eval Real-World Benchmark Dataset

a month ago

Fundus Eye Disease Classification Dataset

a month ago

QCalEval Quantum Calibration Graph Understanding Dataset

2 months ago

RSRCC Remote Sensing Area Change Understanding Benchmark Dataset

a day ago

ParseBench Document Parsing Capability Evaluation Dataset

2 months ago

MDPBench Multilingual Document Parsing Benchmark Dataset

a day ago

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started View Pricing

HyperAI Newsletters

Subscribe to our latest updates

We will deliver the latest updates of the week to your inbox at nine o'clock every Monday morning

Command Palette

Extract-0 Document Information Extraction Dataset

Citation

Build AI with AI

HyperAI Newsletters

Command Palette

Extract-0 Document Information Extraction Dataset

Citation

Related Datasets

MAKIEVAL Multilingual Cultural Knowledge Assessment Dataset

Verbatim Spans Query Condition Evidence Extraction Dataset

SAM 3D Artist Objects 3D Object Reconstruction Dataset

FigureBench Scientific Illustration Generation Benchmark Dataset

Noisy Medical Document Image Dataset

TACK Targeted Chimera Knowledge Base Dataset

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

MemLens Multimodal Long Context Benchmark Dataset

LongBlocks Long Context Multilingual Question Answering Dataset

Claw-Eval Real-World Benchmark Dataset

Fundus Eye Disease Classification Dataset

QCalEval Quantum Calibration Graph Understanding Dataset

RSRCC Remote Sensing Area Change Understanding Benchmark Dataset

ParseBench Document Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Build AI with AI

HyperAI Newsletters

Command Palette

Extract-0 Document Information Extraction Dataset

Citation

Related Datasets

MAKIEVAL Multilingual Cultural Knowledge Assessment Dataset

Verbatim Spans Query Condition Evidence Extraction Dataset

SAM 3D Artist Objects 3D Object Reconstruction Dataset

FigureBench Scientific Illustration Generation Benchmark Dataset

Noisy Medical Document Image Dataset

TACK Targeted Chimera Knowledge Base Dataset

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

MemLens Multimodal Long Context Benchmark Dataset

LongBlocks Long Context Multilingual Question Answering Dataset

Claw-Eval Real-World Benchmark Dataset

Fundus Eye Disease Classification Dataset

QCalEval Quantum Calibration Graph Understanding Dataset

RSRCC Remote Sensing Area Change Understanding Benchmark Dataset

ParseBench Document Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Build AI with AI

HyperAI Newsletters

Related Datasets

MAKIEVAL Multilingual Cultural Knowledge Assessment Dataset

Verbatim Spans Query Condition Evidence Extraction Dataset

SAM 3D Artist Objects 3D Object Reconstruction Dataset

FigureBench Scientific Illustration Generation Benchmark Dataset

Noisy Medical Document Image Dataset

TACK Targeted Chimera Knowledge Base Dataset

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

MemLens Multimodal Long Context Benchmark Dataset

LongBlocks Long Context Multilingual Question Answering Dataset

Claw-Eval Real-World Benchmark Dataset

Fundus Eye Disease Classification Dataset

QCalEval Quantum Calibration Graph Understanding Dataset

RSRCC Remote Sensing Area Change Understanding Benchmark Dataset

ParseBench Document Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

Related Datasets

MAKIEVAL Multilingual Cultural Knowledge Assessment Dataset

Verbatim Spans Query Condition Evidence Extraction Dataset

SAM 3D Artist Objects 3D Object Reconstruction Dataset

FigureBench Scientific Illustration Generation Benchmark Dataset

Noisy Medical Document Image Dataset

TACK Targeted Chimera Knowledge Base Dataset

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

MemLens Multimodal Long Context Benchmark Dataset

LongBlocks Long Context Multilingual Question Answering Dataset

Claw-Eval Real-World Benchmark Dataset

Fundus Eye Disease Classification Dataset

QCalEval Quantum Calibration Graph Understanding Dataset