
要約
3Dソフトウェアは、現実の画像とほとんど区別がつかないほど高度にリアルな画像を生成できるようになっており、これにより「実際のデータセットに3Dレンダリングデータを活用して強化できるか」という問いが浮かび上がります。本研究ではこの問いに取り組みます。本論文では、3Dレンダリングデータを用いたプロシージャルデータを、画像データセットにおけるバイアス調整に活用する方法を示します。動物画像に対する誤分類のエラー解析から、一部の動物種の誤分類は主にデータの問題に起因していることが明らかになりました。そこで、誤分類が多発する種のプロシージャル画像を生成し、そのデータでモデルをさらに訓練することで、実画像における性能が低かった種の分類精度が向上することを確認しました。本研究のアプローチは、希少疾患を含む代表されないグループの視覚データ強化に応用可能であり、データバイアスの是正によりモデルの精度と公平性を向上させると考えられます。また、生成された表現は実データから直接学習した場合と同等、あるいはそれを上回ることを確認しましたが、優れた性能を得るためには3Dレンダリングプロシージャルデータの生成に細心の注意が必要であることも明らかになりました。3D画像データセットは、実データセットの圧縮・整理されたコピーと見なすことができます。今後、プロシージャルデータがますます普及し、データセットがますます巨大化、欠損、または機密性を持つようになる未来を想定した場合、本論文はそのような状況における視覚表現学習に向けたいくつかの手法を提案しています。