17日前
高速かつ適応的な予測区間を実現する回帰木
Luben M. C. Cabezas, Mateus P. Otto, Rafael Izbicki, Rafael B. Stern

要約
予測モデルは誤りを犯すことがある。したがって、その予測に伴う不確実性を定量的に評価する必要がある。コンフォーマル推論(conformal inference)は、点予測の周囲に統計的に妥当な予測領域を構築する強力な手法として注目されているが、回帰問題への単純な適用では、適応性のない予測領域が得られる。この限界を克服するために、分位数回帰モデルや条件付き密度推定器に依拠する新たなコンフォーマルスコアが提案されている。これらのスコアは予測帯の構築には有用であるが、任意の予測モデルにおける不確実性を正確に評価するという元々の目的からは乖離している。本論文では、局所的カバレッジ保証を満たす回帰問題に対する予測区間のキャリブレーションを可能にする、モデルに依存しない新しい手法群を提示する。本手法の核心は、条件付きカバレッジを近似する最粗な特徴空間の分割を探索することにあり、これをコンフォーマルスコアを用いて回帰木やランダムフォレストを訓練することで実現する。本手法は、さまざまなコンフォーマルスコアや予測設定に適用可能であり、シミュレーションおよび実世界データセットにおいて、既存のベースライン手法と比較して優れたスケーラビリティと性能を示す。本研究の実装を可能にするPythonパッケージ「clover」を公開しており、標準的なscikit-learnインターフェースを採用している。