2ヶ月前

効率的な多スケールアーキテクチャの探索:密集画像予測への応用

Liang-Chieh Chen; Maxwell D. Collins; Yukun Zhu; George Papandreou; Barret Zoph; Florian Schroff; Hartwig Adam; Jonathon Shlens
効率的な多スケールアーキテクチャの探索:密集画像予測への応用
要約

ニューラルネットワークアーキテクチャの設計は、幅広いタスクにおいて最先端の性能を達成する機械学習システムにとって重要な要素です。多くの研究が、探索空間の巧妙な構築と単純な学習アルゴリズムの組み合わせを通じて、アーキテクチャを自動的に設計・構築することに取り組んできました。最近の進展は、このようなメタラーニング手法が画像分類タスクにおいてスケーラブルな人間考案のアー�キテクチャを超える可能性があることを示しています。しかし、これらの手法が新しいドメインにどの程度汎化できるかは未解決の問題です。本研究では、シーン解析、人物部位セグメンテーション、および意味的画像セグメンテーションに焦点を当てた密集画像予測向けのメタラーニング技術の構築を探ります。このドメインでの有効な探索空間の構築は、視覚情報の多尺度表現と高解像度画像処理の必要性により困難です。密集画像予測に関する技術調査に基づき、再帰的な探索空間を構築し、効率的なランダムサーチを使用しても優れたアーキテクチャを見つけることができることを示しました。具体的には、Cityscapes(街路シーン解析)で82.7%、PASCAL-Person-Part(人物部位セグメンテーション)で71.3%、PASCAL VOC 2012(意味的画像セグメンテーション)で87.9%という3つの密集予測タスクにおける最先端性能を達成しました。さらに、得られたアーキテクチャは計算効率も高く、従来の最先端システムと比較してパラメータ数と計算コストが半分であることが確認されました。

効率的な多スケールアーキテクチャの探索:密集画像予測への応用 | 最新論文 | HyperAI超神経