摘要
理解出行行为与出行需求对全球各国的交通研究机构与管理部门而言始终具有重要意义。近年来,研究者尝试通过自动解析位置数据(如GPS设备采集的数据)来推断交通方式,以显著降低传统出行日志调查在时间与预算上的成本。然而,现有文献在数据采集(样本量选择、研究时长、数据粒度)、变量选择(或变量组合)以及推断方法(用于学习的交通方式数量)等方面仍存在若干局限。为此,本文致力于全面探讨上述各环节在推断过程中的作用。研究目标是将GPS数据分类至不同的交通方式(包括汽车、步行、骑行、地铁、火车和公交车)。首先,我们分析了可能有助于分类的变量,并通过统计方法量化其区分能力。随后,提出一种基于支持向量机(SVM)分类框架的新型推断方法。该框架采用粗粒度GPS数据进行测试,而此类数据在以往研究中常被忽略,最终取得了88%的分类准确率,Kappa统计量表明分类结果达到近乎完全一致的水平,展现出良好的应用前景。