Date

3 months ago

Organization

Paper URL

2604.04503

License

MIT

Data Structure

This dataset contains the following components:

Training: Data for two-stage reinforcement learning (RL) training of the executor and planner.
Testing: Evaluate benchmarks across multiple datasets (e.g., LiveVQA, HotpotQA) to measure research and inference performance.
TTRL: Data specifically selected for continuous learning during testing, enabling the planner to adjust its strategy during inference.
Image search caching: Supports caching for image-to-image search tasks.

This dataset is contributed by community users and is intended for educational and informational purposes only. If any content involves copyright infringement, please contact us at [email protected] for prompt review and removal.

Related Datasets

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started View Pricing

HyperAI Newsletters

Subscribe to our latest updates

We will deliver the latest updates of the week to your inbox at nine o'clock every Monday morning

HyperAI

Use this Dataset Discuss on Discord

Date

3 months ago

Organization

Paper URL

2604.04503

License

MIT

Data Structure

This dataset contains the following components:

Training: Data for two-stage reinforcement learning (RL) training of the executor and planner.
Testing: Evaluate benchmarks across multiple datasets (e.g., LiveVQA, HotpotQA) to measure research and inference performance.
TTRL: Data specifically selected for continuous learning during testing, enabling the planner to adjust its strategy during inference.
Image search caching: Supports caching for image-to-image search tasks.

Related Datasets

PanScale Remote Sensing Pancolor Sharpening Dataset

3 months ago

ParseBench Document Parsing Capability Evaluation Dataset

3 months ago

Emotion-probes Emotion Detection Dataset

3 months ago

OpenMementos Context Memory Compressed Dataset

3 months ago

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

a month ago

MDPBench Multilingual Document Parsing Benchmark Dataset

a month ago

GPT-5.4-step-by-step-reasoning Dataset

3 months ago

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

3 months ago

Groundsource Global Flood Events Dataset

4 months ago

Open-RL Inference Problem Dataset

5 months ago

RubricHub_v1 Multi-Domain Generative Task Dataset

6 months ago

CL-bench Context Learning Evaluation Benchmark Dataset

5 months ago

RoVid-X Robot Video Generation Dataset

a month ago

DeepPlanning Long-Term Planning Capability Assessment Dataset

6 months ago

Vehicles OpenImages Vehicle Image Dataset

6 months ago

LightOnOCR-mix-0126 Text Transcription Dataset

6 months ago

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding

Ready-to-use GPUs

Best Pricing

Get Started View Pricing

HyperAI Newsletters

Subscribe to our latest updates

We will deliver the latest updates of the week to your inbox at nine o'clock every Monday morning

Command Palette

MIA Multistep Inference and Decision Trajectory Dataset

Data Structure

Build AI with AI

HyperAI Newsletters

Command Palette

MIA Multistep Inference and Decision Trajectory Dataset

Data Structure

Related Datasets

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench Document Parsing Capability Evaluation Dataset

Emotion-probes Emotion Detection Dataset

OpenMementos Context Memory Compressed Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-step-by-step-reasoning Dataset

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

Groundsource Global Flood Events Dataset

Open-RL Inference Problem Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

CL-bench Context Learning Evaluation Benchmark Dataset

RoVid-X Robot Video Generation Dataset

DeepPlanning Long-Term Planning Capability Assessment Dataset

Vehicles OpenImages Vehicle Image Dataset

LightOnOCR-mix-0126 Text Transcription Dataset

Build AI with AI

HyperAI Newsletters

Command Palette

MIA Multistep Inference and Decision Trajectory Dataset

Data Structure

Related Datasets

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench Document Parsing Capability Evaluation Dataset

Emotion-probes Emotion Detection Dataset

OpenMementos Context Memory Compressed Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-step-by-step-reasoning Dataset

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

Groundsource Global Flood Events Dataset

Open-RL Inference Problem Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

CL-bench Context Learning Evaluation Benchmark Dataset

RoVid-X Robot Video Generation Dataset

DeepPlanning Long-Term Planning Capability Assessment Dataset

Vehicles OpenImages Vehicle Image Dataset

LightOnOCR-mix-0126 Text Transcription Dataset

Build AI with AI

HyperAI Newsletters

Related Datasets

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench Document Parsing Capability Evaluation Dataset

Emotion-probes Emotion Detection Dataset

OpenMementos Context Memory Compressed Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-step-by-step-reasoning Dataset

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

Groundsource Global Flood Events Dataset

Open-RL Inference Problem Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

CL-bench Context Learning Evaluation Benchmark Dataset

RoVid-X Robot Video Generation Dataset

DeepPlanning Long-Term Planning Capability Assessment Dataset

Vehicles OpenImages Vehicle Image Dataset

LightOnOCR-mix-0126 Text Transcription Dataset

Related Datasets

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench Document Parsing Capability Evaluation Dataset

Emotion-probes Emotion Detection Dataset

OpenMementos Context Memory Compressed Dataset

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-step-by-step-reasoning Dataset

DRACO Cross-Disciplinary Deep Research Benchmark Dataset

Groundsource Global Flood Events Dataset

Open-RL Inference Problem Dataset

RubricHub_v1 Multi-Domain Generative Task Dataset

CL-bench Context Learning Evaluation Benchmark Dataset

RoVid-X Robot Video Generation Dataset