18 天前
基于层级神经架构搜索的深度立体匹配
Xuelian Cheng, Yiran Zhong, Mehrtash Harandi, Yuchao Dai, Xiaojun Chang, Tom Drummond, Hongdong Li, Zongyuan Ge

摘要
为减少神经网络设计中的人工干预,神经架构搜索(Neural Architecture Search, NAS)已在图像分类、语义分割等高层视觉任务中取得了显著成功。NAS算法的核心思想十分直观:通过赋予网络在一组可选操作(例如不同卷积核尺寸的卷积)中进行选择的能力,从而自动发现更适应具体任务的最优网络结构。然而,迄今为止,NAS在低层几何视觉任务(如立体匹配)中的应用尚未取得类似成果。这在一定程度上源于当前由人工设计的先进深度立体匹配网络本身已具有极大规模,直接对这类庞大结构应用NAS,在现有主流计算资源下计算开销过高,难以实现。本文提出首个面向深度立体匹配的端到端分层神经架构搜索框架,通过将任务相关的先验人类知识融入NAS流程,有效克服了上述挑战。具体而言,我们遵循深度立体匹配的标准流水线(即特征提取—特征体构建—密集匹配),对整个流程中的网络结构进行联合优化。大量实验表明,所搜索得到的网络在KITTI 2012、KITTI 2015、Middlebury等基准测试中均取得了当前最优的精度表现,位居榜首;同时在SceneFlow数据集上也达到了Top-1性能,且在显著减小网络规模的同时大幅提升了推理速度。相关代码已开源,地址为:https://github.com/XuelianCheng/LEAStereo。