同济大学的研究团队提出了一种创新的VLM驱动自适应引导扩散框架,旨在解决自动驾驶安全测试中场景生成动态响应不足的关键难题。该研究的核心突破在于将视觉语言模型(VLM)从被动的“翻译者”升级为主动的“策略师”,使其能通过链式思维推理自主分析场景并制定对抗性生成目标。配合一套“战略-战术-操作”三层架构与自适应引导机制,框架能让生成的背景车辆(BV)实时响应被测车辆的动态动作,从而创造出高交互性的安全关键测试场景。 实验验证表明,该框架能显著提升测试的严苛性与针对性。其生成的场景使不同自动驾驶算法(AUT)的平均责任碰撞率提升了4.2倍,并成功适配了多种类型的AUT与VLM基座。这为高效、自动化地暴露自动驾驶系统弱点,进行高保真安全测试提供了强有力的新工具。同济VLM as Strategist:VLM引导自适应安全关键场景生成框架