産業ベンチマークは人工的な実際の問題の属性データ セットを橋渡しします

Industrial Benchmark は、無料で記録された活動的な人間の問題と実際の産業問題の特性との間のギャップを埋めるデータセットです。オフライン RL とオンライン RL の現実に関するデータセット。現実世界のアプリケーションに最適な RL アルゴリズムを見つけるために使用されます。このデータセットは、解釈可能な RL トレーニング シナリオを提供し、メソッドの学習プロセスについての詳細な洞察を提供するように設計されています。 (結果として得られる産業データ (IB) は、OpenAI Gym ラッパーを含む Java および Python コードを Github で公開することで、RL コミュニティに公開されています)