
摘要
语义线(semantic lines)用于刻画图像的布局结构。尽管语义线在图像分析与场景理解中具有重要意义,但目前尚缺乏可靠的语义线检测研究。本文提出一种基于卷积神经网络与多任务学习的语义线检测方法,将线检测任务建模为分类与回归的联合问题。首先,通过卷积层与最大池化层对输入图像提取多尺度特征图;随后,设计一种线池化层(line pooling layer),从特征图中为每个候选线提取对应的特征向量;接着,将该特征向量输入并行的分类与回归分支网络:分类分支用于判断候选线是否为语义线,若判定为语义线,则回归分支进一步预测偏移量以精炼线段的位置。实验结果表明,所提出的检测器能够准确且可靠地提取语义线。此外,本文还验证了该检测器在三个实际应用中的有效性:地平线估计、构图优化与图像简化。