2ヶ月前

DCT表現における意味分割の探求

Shao-Yuan Lo; Hsueh-Ming Hang
DCT表現における意味分割の探求
要約

一般的畳み込みニューラルネットワークは、RGB画像で訓練および実行される。しかし、実際の応用では、メモリ節約や効率的な伝送のために画像が圧縮されることが多い。本論文では、JPEG標準によって定義される離散コサイン変換(DCT)表現を用いた意味分割の手法について検討する。まず、DCT係数を再配置して好ましい入力形式を作成し、次に既存のネットワークをDCT入力に合わせて調整する。提案された方法は、ほぼ同じネットワーク複雑さでRGBモデルと同等の精度を持つ。さらに、異なるDCT成分を選択することによるセグメンテーション性能への影響を調査した。適切な選択により、DCT係数のわずか36%を使用することで同じレベルの精度を達成できることが示された。また、量子化誤差下での当手法の堅牢性も示している。我々の知る限り、本論文はDCT表現を用いた意味分割に関する最初の研究である。

DCT表現における意味分割の探求 | 最新論文 | HyperAI超神経