Command Palette
Search for a command to run...
AM-DeepSeek-R1-Distilled-1.4M 大規模一般推論タスクデータセット
AM-DeepSeek-R1-Distilled-1.4Mは、2025年3月にam-teamによってリリースされた大規模な一般推論タスクデータセットです。関連する論文の結果は「大規模言語モデルのトレーニングを強化する 140 万のオープンソースの蒸留推論データセット”。 このデータセットには、数学、コード、科学的な Q&A、一般的なチャットなど、さまざまな質問タイプを網羅した約 140 万のデータ エントリが含まれています。これらのデータは、データの品質と難易度の高さを確保するために、慎重に選択され、意味的に重複が排除され、厳密にクリーニングされています。データセットの各エントリには豊富な思考のトレースが含まれており、モデルに推論プロセスの例を提供するだけでなく、モデルが複雑な推論タスクをよりよく理解して解決策を生成するのにも役立ちます。 AM-DeepSeek-R1-Distilled-1.4M データセットのリリースは、特に大規模言語モデルの推論機能のトレーニングと最適化のための、自然言語処理および推論タスクのための強力なツールを提供することを目的としています。これにより、モデルは数学、コード、科学的な質問への回答などの重要な領域でパフォーマンスを向上させ、さまざまな複雑な推論タスクに適切に対処できるようになります。
引用
私たちの研究があなたの研究に役立つと感じられた場合は、星評価(:star:)と引用(:pencil:)をお願いします。
「BibTeX @misc{tian2025correctanswersequaldistillation、 タイトル={すべての正解が同じとは限らない:蒸留源が重要な理由} author={Xiaoyu Tian、Yunjie Ji、Haotian Wang、Shuaiting Chen、Sitong Zhao、Yiping Peng、Han Zao、および Xiangang Li}、 年={2025}、 eprint={2505.14464}、 archivePrefix={arXiv}、 primaryClass={cs.CL}、 url={https://arxiv.org/abs/2505.14464}、 } @misc{ji2025amthinkingv1advancingfrontierreasoning、 タイトル={AM-Thinking-v1: 32Bスケールでの推論の最前線を前進させる}、 author={Yunjie Ji、Xiaoyu Tian、Sitong Zhao、Haotian Wang、Shuaiting Chen、Yiping Peng、Han Zhao、Xianang Li}、 年={2025}、 eprint={2505.08311}、 archivePrefix={arXiv}、 primaryClass={cs.CL}、 url={https://arxiv.org/abs/2505.08311}、 } @misc{tian2025exploringpotentialofflinerl、 タイトル={LLMにおける推論のためのオフライン強化学習の可能性を探る:予備研究} author={Xiaoyu Tian、Sitong Zhao、Haotian Wang、Shuaiting Chen、Yiping Peng、Yunjie Ji、Han Zao、および Xiangang Li}、 年={2025}、 eprint={2505.02142}、 archivePrefix={arXiv}、 primaryClass={cs.CL}、 url={https://arxiv.org/abs/2505.02142}、 } @misc{tian2025deepdistillenhancingllmreasoning、 title={DeepDistill: 大規模な難易度別データトレーニングによるLLM推論能力の強化}, author={Xiaoyu Tian、Sitong Zhao、Haotian Wang、Shuaiting Chen、Yiping Peng、Yunjie Ji、Han Zao、および Xiangang Li}、 年={2025}、 eprint={2504.17565}、 archivePrefix={arXiv}、 primaryClass={cs.CL}、 url={https://arxiv.org/abs/2504.17565}、 } @misc{wang2025leveragingreasoningmodelanswers, タイトル={推論モデルの回答を活用して非推論モデルの機能を強化する}、 author={Haotian Wang、Han Zhao、Shuaiting Chen、Xiaoyu Tian、Sitong Zhao、Yunjie Ji、Yiping Peng、Xianang Li}、 年={2025}、 eprint={2504.09639}、 archivePrefix={arXiv}、 primaryClass={cs.CL}、 url={https://arxiv.org/abs/2504.09639}、 } @misc{ji2025difficultyawarestagedreinforcementlearning, タイトル={難易度を考慮した段階的強化学習がLLMの推論能力をどのように向上させるか:予備的な実験的研究} author={Yunjie Ji、Sitong Zhao、Xiaoyu Tian、Haotian Wang、Shuaiting Chen、Yiping Peng、Han Zhao、Xianang Li}、 年={2025}、 eprint={2504.00829}、 archivePrefix={arXiv}、 primaryClass={cs.CL}、 url={https://arxiv.org/abs/2504.00829}、 } @misc{tian2025thinktwiceenhancingllm、 タイトル={Think Twice: 複数ラウンドのテスト時思考をスケーリングすることでLLM推論能力を向上させる}, author={Xiaoyu Tian、Sitong Zhao、Haotian Wang、Shuaiting Chen、Yunjie Ji、Yiping Peng、Han Zao、および Xiangang Li}、 年={2025}、 eprint={2503.19855}、 archivePrefix={arXiv}、 primaryClass={cs.CL}、 url={https://arxiv.org/abs/2503.19855}、 } @misc{zhao202514millionopensourcedistilled, タイトル={大規模言語モデルのトレーニングを強化する140万件のオープンソース蒸留推論データセット}、 author={Han Zhao、Haotian Wang、Yiping Peng、Sitong Zhao、Xiaoyu Tian、Shuaiting Chen、Yunjie Ji、Xianang Li}、 年={2025}、 eprint={2503.19633}、 archivePrefix={arXiv}、 primaryClass={cs.CL}、 url={https://arxiv.org/abs/2503.19633}、 } “