17日前
$Λ$-DARTS:セル間の演算選択の調和によりパフォーマンス崩壊を軽減する
Sajad Movahedi, Melika Adabinejad, Ayyoob Imani, Arezou Keshavarz, Mostafa Dehghani, Azadeh Shakery, Babak N. Araabi

要約
差分可能なニューラルアーキテクチャ探索(DARTS)は、ニューラルアーキテクチャ探索(NAS)の代表的な手法であり、セル探索を実行し、勾配ベースの最適化によって探索効率を向上させるために連続的リラクセーションを用いる。DARTSの主な課題は「性能崩壊(performance collapse)」である。これは、探索過程において発見されたアーキテクチャの品質が徐々に低下する現象であり、近年、多くの研究が正則化やDARTSの根本的な構造変更を通じてこの問題を解決しようとしている。しかし、DARTSにおけるセル探索で用いられる重み共有フレームワークおよびアーキテクチャパラメータの収束特性については、これまで十分な理論的・実証的分析が行われていなかった。本論文では、DARTSおよびその収束点について、包括的かつ新たな理論的・実証的分析を提供する。我々は、DARTSが重み共有フレームワークに起因する特定の構造的欠陥を有しており、その結果、アーキテクチャパラメータの収束がソフトマックス関数の飽和点に制限されることを示す。この収束点は、出力に近い層に優位性を与えるため、最適なアーキテクチャの選択において不均衡を生じ、結果として性能崩壊を引き起こす。その後、層間の勾配を整合させることで演算選択を調和させる新たな2つの正則化項を提案する。6つの異なる探索空間および3つの異なるデータセットにおける実験結果から、本手法(Λ-DARTS)が実際に性能崩壊を防止することを確認した。これにより、我々の理論的分析および提案する修正手法の有効性が裏付けられた。