
摘要
当前,最先进的事件驱动深度神经网络在处理事件数据时,通常首先将原始事件转换为密集的网格状输入表示,再使用现成的网络架构进行处理。然而,传统上为特定任务选择最优表示需要针对每种表示形式分别训练神经网络,并基于验证性能进行筛选,这一过程极为耗时。本文通过引入原始事件与其表示之间的格罗莫夫-沃瑟斯坦差异(Gromov-Wasserstein Discrepancy, GWD)作为评估指标,彻底消除了这一瓶颈。该方法的计算速度比训练神经网络快约200倍,同时在多种事件表示、网络主干结构、数据集和任务之间,能够有效保持不同表示形式在任务性能上的相对排序。因此,寻找具有高任务性能的表示,等价于寻找GWD值较低的表示。基于这一关键洞察,本文首次在大规模事件表示家族中开展超参数搜索,成功发现了一系列新颖且强大的事件表示,其性能超越了现有最先进水平。所优化的表示在两个公认的物体检测基准测试中表现优异:在1 Mpx数据集上相比现有方法提升1.7 mAP,在Gen1数据集上提升0.3 mAP;在mini N-ImageNet分类基准上,分类准确率提升达3.8%。此外,在Gen1数据集上,性能优于当前最先进方法2.1 mAP;在1 Mpx数据集上,相比现有前馈式方法提升6.0 mAP。本研究开创了一个全新的、此前未被充分探索的研究方向——事件驱动学习中的显式表示优化,为未来事件感知智能系统的设计提供了高效、可扩展的新范式。