Command Palette
Search for a command to run...
RubricHub マルチドメイン生成タスクデータセット
RubricHubは、Li Autoが浙江大学と共同で2026年に公開した、大規模かつマルチドメインの生成タスクデータセットです。関連研究論文には以下が含まれます。 RubricHub: 自動粗から細への生成による包括的かつ高度な識別力を持つルーブリックデータセット このデータセットは、オープンエンド生成タスクのためのスコアリング基準に基づいた高品質な教師データを提供します。このデータセットは、自動化された粗から細へのスコアリング基準生成フレームワークを用いて構築されており、原理に基づく統合、マルチモデル集約、難易度進化といった戦略を統合することで、包括的かつ高度な識別力を持つ評価基準を生成します。
データセットの構成:
- RuRL には、VeRL トレーニング形式のプロンプト、データ ソース、機能目標、報酬モデル、および追加情報のリストが含まれています。
- RuFT には、データ ソース、モデル入力ヒント、モデル生成応答、サンプル ID、スコアリング基準、スコアリング詳細が含まれます。