论文题目 |
Learning collision risk proactively from naturalistic driving data at scale |
论文作者 |
Yiru Jiao, Simeon C. Calvert, Sander van Cranenburgh, Hans van Lint |
发表期刊 |
Nature Machine Intelligence, 2026 |
核心方法 |
Generalized Surrogate Safety Measure (GSSM) |
主要任务 |
从自然驾驶数据中主动量化潜在碰撞风险 |
关键特点 |
不依赖标签;考虑上下文;输出连续风险水平 |
1. 背景与问题:为什么需要重新定义碰撞风险量化?
这篇论文面向主动交通安全中的一个核心问题:如何在碰撞或近失事件发生之前,准确且及时地量化交通交互中的潜在碰撞风险。传统交通安全研究往往依赖已经发生的事故数据进行事后分析,这类研究能够帮助道路设计和交通管理进行改进,但其局限在于改进通常发生在事故和损失之后。与之相比,主动安全研究更关心事故之前的风险前兆,例如近失事件、危险交互和正在演化的交通冲突。
论文首先指出,道路交通事故仍然是全球性安全问题。虽然车辆安全技术和政策改进使交通死亡人数相比过去有所下降,但这一下降趋势在近年来趋于平缓。更重要的是,少于6%的交通事故发生在高速公路,而多数事故发生在城市区域;城市道路中车辆、行人、骑行者等交通参与者之间存在多方向、高交互的复杂关系。因此,风险量化方法不能只面向简单跟车或单一车辆交互,而需要能够处理城市环境中的多样化交互。
现有方法主要存在三类不足。第一,传统代理安全度量如TTC、DRAC和人工势场等具有直观物理意义,但通常针对跟车、换道等特定行为设计,难以覆盖多类型道路使用者和复杂上下文。第二,基于运动预测和不确定性的风险评估方法依赖行为预测模型,但极端危险场景中常见的激进、分心或异常行为往往难以由正常预测模型可靠外推。第三,基于视频的事故预判方法需要事故或近失标签,而真实事故数据稀缺、长尾且标注成本高。
论文将上述问题概括为三点:可扩展性、上下文感知能力与泛化能力。也就是说,好的风险量化方法应当能利用大规模日常观测数据,能考虑环境与交互上下文,并能推广到不同道路类型和不同交通交互。

图1 论文给出的交通事故统计结果。图中显示交通死亡人数下降趋缓,且多数事故并非发生在高速公路,而是发生在城市道路和复杂交互场景。图片来源:原论文Figure 1。
2. 方法介绍:GSSM如何从正常交互中学习风险?
论文提出的核心方法是generalized surrogate safety measure,简称GSSM。它与传统SSM的根本区别在于,GSSM不直接依赖事故标签或人工风险标注进行训练,而是从自然驾驶数据中的正常交互学习交通参与者之间的空间关系。其基本判断逻辑是:如果某个交互在当前上下文中显著偏离典型安全交互,那么它就应被赋予更高的潜在碰撞风险。
GSSM将交通交互场景分解为空间间隔(spacing)变量s和上下文变量X。s表示交通参与者之间的空间间隔;X表示除s之外的上下文信息,例如运动状态、天气、光照、路面条件、交通密 度以及历史运动学信息。模型输出连续风险水平M,而不是简单的“安全/危险”二分类结果。这样做的意义在于,同一个s数值在不同上下文中的风险含义并不相同。例如,某个距离在低速拥堵环境中可能是正常的,但在高速、雨天或横向交叉场景中可能已经非常危险。
GSSM的理论基础来自两个假设。第一,潜在碰撞是实际碰撞的前兆,同时也是此前安全交互状态的延续。第二,在相同交互上下文中,s越小,碰撞风险越高。基于这两个假设,作者用极值理论衡量当前s在同类上下文中的极端程度。如果某个s在大量正常观测中都很少出现,或者需要在很多次观测中才可能成为最小s,那么该交互就具有更高的冲突强度。
在可训练实现上,论文假设给定上下文X时,s服从对数正态分布,并使用神经网络根据X估计该分布的参数。模型训练采用负对数似然损失,使估计分布尽可能贴近自然驾驶数据中的真实spacing分布。为避免连续交互中风险值突变,作者还加入平滑正则项,对相似上下文下的分布估计施加一致性约束。
组成 |
含义 |
在 GSSM 中的作用 |
spacing s |
交通参与者之间的空间间隔 |
作为碰撞风险的代理变量 |
context X |
运动状态、环境条件、历史运动学等 |
决定同一空间间隔在不同场景下的风险含义 |
条件分布 |
p(s | X) |
学习正常交互中空间间隔的上下文分布 |
风险水平 M |
临界冲突强度的对数值 |
表示当前交互在该上下文中的极端程度 |
这种建模方式并不是简单地直接学习“是否发生碰撞”,而更接近于学习正常状态下的交互分布,再根据当前状态偏离正常分布的程度量化风险。由于模型同时考虑了运动状态、环境条件以及历史动态信息,因此其风险判断本质上具有较强的上下文依赖性。这种“正常状态建模—偏离量化”的思路,在其他安全关键场景中同样具有一定参考意义。
3. 实验设置与结果:GSSM 是否真的更准确、更及时?
本文实验设计的一个关键点是:训练阶段不使用真实事故标签,而测试阶段使用真实安全关键事件进行评估。训练数据来自三个自然驾驶数据源,包括 highD、ArgoverseHV 和 SHRP2 Naturalistic Driving Study中的SafeBaseline 数据。这些数据覆盖不同国家、道路类型和采集设备,为模型提供多样化正常交互模式。
测试数据独立于训练数据,来自SHRP2 NDS中标注的安全关键事件。论文共评估2591个事件,其中包括2481个近失事件和110个碰撞事故。每个事件至少包含事故或近失发生前20秒的数据,因此可以同时考察模型是否能正确识别风险,以及能否提前给出预警。
评价指标分为两类。第一类衡量检测准确性,包括ROC曲线、PR曲线、AUPRC、AROC、precision和recall等。第二类衡量预警及时性,核心指标是time-to-impact(TTI),即模型发出风险预警到实际碰撞或最近接时刻之间的时间。论文特别强调,对于主动安全任务,漏报的代价通常高于误报,因此还设计了在高召回约束下的安全导向指标。

图2 GSSM的有效性、可扩展性和上下文感知实验结果。图中比较了GSSM与ACT、TTC2D、TAdv、EI等方法,并展示了增加交互数据和上下文特征后的性能变化。图片来源:原论文Figure 2。
主要结果表明,基础版GSSM仅使用瞬时运动学特征,就在2591个真实碰撞和近失事件上取得AUPRC=0.900,并获得2.60秒的最优准确性条件下中位提前量。相比TAdv、ACT、TTC2D和EI等基线方法,GSSM在检测准确性上整体更优。论文指出,在Figure 2a中,GSSM的ROC曲线和PR曲线包围其他方法,说明它在减少误报和漏报方面取得了更好的综合表现。

表1 GSSM与已有方法的数值结果对比。GSSM在AUPRC、AROC和高召回等准确性指标上整体领先,同时保持较稳定的预警提前量。图片来源:原论文Table 2。
可扩展性实验显示,GSSM能够从更多正常交互数据中受益。加入highD中更多换道交互后,相关场景中的检测准确性呈现一致提升;加入ArgoverseHV中的交叉和转弯交互时,性能先提升后下降,作者认为这与测试集中该类事件占比以及训练数据分布变化有关。这说明GSSM具有通过更多交互数据提升性能的潜力,但不同场景数据的比例仍需要合理控制。
上下文实验进一步说明,环境信息和历史运动学信息对风险量化有帮助。加入天气、光照、路面状态、交通密度等环境条件后,模型整体检测准确性和预警及时性提升;进一步加入过去2.5秒的历史运动学特征后,预警及时性提升更明显。相反,加入当前加速度并未带来稳定增益,论文认为这可能是因为加速度与历史运动学存在冗余,并且更容易受到轨迹处理噪声影响。
模型性能提升并不是依赖更多故障样本,而是依赖更多正常交互数据。这种思路与很多工业运维场景中的异常检测或健康状态建模其实较为接近,即通过学习正常运行分布,再利用当前状态偏离程度实现风险评估。
4. 结论与展望:GSSM的意义和局限
论文的主要结论是,GSSM能够在不依赖事故或近失标签训练的情况下,从自然驾驶数据中学习正常交通交互模式,并将其外推到安全关键交互中的风险量化任务。它同时回应了现有方法的三个限制:利用正常日常观测提升可扩展性,通过多类上下文特征提升场景感知能力,并在多种交互类型中展示出较好的泛化能力。
风险归因分析进一步说明,GSSM的风险判断并非完全黑箱。论文使用期望梯度方法分析不同特征对风险预测的贡献,结果发现,在横向交互场景中,交互间距方向对风险判断影响显著;在交叉或转向场景中,过去0.5秒、1.0秒和1.5秒的历史运动学特征对危险识别更加重要;而在雨天、非干燥路面、夜间以及不稳定交通流条件下,天气、路面状态和交互间距方向等因素也被模型识别为重要风险来源。

图3 GSSM的风险归因结果。结果显示 spacing direction、相对速度、历史运动学、天气和路面状态等因素对不同场景下的风险判断具有重要贡献。图片来源:原论文Figure 3。
不过,论文也明确指出了GSSM的局限。首先,本文主要关注潜在碰撞发生概率,而没有直接建模碰撞严重程度和碰撞发生时间。其次,模型对传感器噪声、缺失值和输入扰动的鲁棒性尚未得到形式化保证。第三,当前上下文特征仍以运动学和环境变量为主,未来可以进一步引入视觉、语言、地图语义、交通规则和驾驶意图等更丰富的信息。
作者还强调,要真正改善交通安全,仅研究上下文特征与风险分数之间的相关性是不够的,未来还需要进一步理解这些因素与碰撞风险之间的因果机制。因此,GSSM更像是一个面向主动风险量化的起点,而不是最终解决方案。它展示了如何从自然驾驶数据中学习上下文相关的风险度量,也为后续构建更大规模、更可解释、更可靠的安全基础模型提供了方向。
5. 研究启示:从正常状态中学习风险演化规律
从研究范式上看,这篇论文最值得关注的地方在于,它没有把碰撞风险量化做成一个依赖事故标签的监督分类问题,而是将其转化为正常交互分布学习问题。对于安全关键任务而言,真实事故样本天然稀缺,而日常自然驾驶数据相对丰富。GSSM利用正常数据学习交互规律,再用极端程度刻画潜在风险,这为长尾安全问题提供了一种更可扩展的思路。
在很多工业智能运维场景中,真实故障样本往往远少于正常运行数据,因此传统监督学习方法容易受到样本规模限制。GSSM的思路则表明,模型或许可以在不同运行上下文条件下学习正常状态分布,再利用当前状态相对于正常分布的偏离程度,对潜在风险进行连续量化,而不必完全依赖真实故障标签。
因此,GSSM的意义并不仅在于自动驾驶安全本身,更在于它体现了一种“从正常运行状态学习风险演化规律”的数据驱动思路。这种思想未来也可能进一步扩展到设备退化建模、异常演化分析以及复杂装备健康管理等问题中。
简要总结:GSSM的贡献不是提出一个更复杂的分类器,而是提出了一种更适合稀缺事故数据条件下的风险量化思路:从大规模正常交互中学习上下文条件分布,再用当前交互的极端程度表示潜在碰撞风险。
参考论文
标题:Learning collision risk proactively from naturalistic driving data at scale
作者:Yiru Jiao, Simeon C. Calvert, Sander van Cranenburgh, Hans van Lint
期刊:Nature Machine Intelligence
在线日期:2026年3月9日
DOI:https://doi.org/10.1038/s42256-026-01189-w
关键词:自然驾驶数据;主动碰撞风险量化;广义代理安全度量(GSSM);上下文感知风险建模;自动驾驶安全;交通交互分布学习
代码仓库:https://github.com/Yiru-Jiao/GSSM