【论文分享】Ultra-AV: 一个规范化自动驾驶汽车纵向轨迹数据集

news/2025/2/3 12:16:09 标签: 自动驾驶, 汽车, 人工智能

和大家分享一份最近的工作!

统一自动驾驶纵向轨迹数据集(Ultra-AV)

摘要

自动驾驶车辆在交通运输领域展现出巨大潜力,而理解其纵向驾驶行为是实现安全高效自动驾驶的关键。现有的开源AV轨迹数据集在数据精炼、可靠性和完整性方面存在不足,从而限制了有效的性能度量分析和模型开发。

本研究针对这些挑战,构建了一个统一的自动驾驶汽车纵向轨迹数据集(Ultra-AV),用于分析自动驾驶汽车微观纵向驾驶行为。该数据集整合了来自14 个的数据,涵盖多种自动驾驶汽车类型、测试场景和实验环境。我们提出了一种数据处理框架,以获得高质量的纵向轨迹数据和跟驰轨迹数据。最后,本研究通过对安全性、通行效率、稳定性和可持续性等多个性能维度的评估,以及对跟驰模型变量之间关系的分析,验证了数据的有效性。我们的工作不仅为研究人员提供了标准化的数据和指标,用于分析自动驾驶汽车的纵向行为,还为数据采集和模型开发提供了指导方法


介绍

理解自动驾驶汽车纵向驾驶行为对于确保其安全性和优化交通流至关重要。然而,现有的开源自动驾驶汽车轨迹数据集缺乏精细的数据清理和标准化,导致:

  • 数据质量不均,影响模型开发和性能评估。
  • 缺乏完整性和可靠性,难以进行跨数据集研究。
  • 分析效率低,影响AV安全测试和仿真研究。

本研究提出了一种统一的自动驾驶汽车纵向轨迹数据集(Ultra-AV),有以下特点:

  • 大规模数据集: 数据总量 2.6GB,涵盖 14 个不同的自动驾驶数据源,涉及 30 多种测试和实验场景,包含 超过 1000 万个数据点,相当于 280 小时以上的行驶数据
  • 标准化数据格式: 统一不同数据源的数据格式,使其适用于跨数据集研究
  • 数据处理框架: 提供一种高效的数据处理方法,提高数据的可用性,支持自动驾驶仿真测试行为建模

请添加图片描述


方法

如图所示,我们的统一数据集涵盖了14个不同来源的数据集。这些数据集收集自美国和欧洲的多个城市,确保了所选城市的多样性和代表性,使研究具备更广泛的适用性。

在这里插入图片描述

此外,大多数被整合的数据集都包含自动驾驶汽车的长时间轨迹,这些数据广泛应用于自动驾驶行为分析。然而,一些特定数据集,如 Waymo Open Dataset中的 Waymo Motion Dataset 和Argoverse 2 Motion Forecasting Dataset,其轨迹时间较短,分别为9.1 秒和11 秒(采样频率为 10Hz)。 这些数据集主要用于Motion Forecasting领域的研究,尽管轨迹较短,但其采集地点通常位于复杂交通环境中的市区,能够提供在复杂场景下分析自动驾驶行为的机会。因此,本研究特别包含了对这两个数据集的分析,以确保数据集的全面性和适用性。

本研究提出了一种数据处理框架,用于标准化并清理自动驾驶汽车轨迹数据。该框架包含以下三步。

Step 1: 轨迹数据提取
从多个AV数据集中提取统一格式的纵向轨迹数据,包括汽车位置、速度、车头时距等关键变量。关键变量如下:

变量描述
Trajectory ID轨迹数据的唯一标识
Time Index轨迹数据时间索引
LV Position领航车(LV)位置
LV Speed领航车速度
FAV Position跟驰车(FAV)位置
FAV Speed跟驰车速度
Space Headway车头间距
Speed Difference车速差

针对处理过后的数据,我们通过三个方面对数据进行验证分析。

Step 2: 通用数据清理
为了提高数据的可靠性,采用以下清理策略:

  • 移除异常值: 删除超过 均值 ± 标准差 的数据点。
  • 缺失值填补: 删除时间戳不连续的数据点,并采用线性插值补全缺失数据。
  • 轨迹数据重构: 重新整理数据结构,确保数据的可解释性。

Step 3: 数据特定清理
针对车队跟驰场景,设定阈值去除异常数据,以提高分析准确性。下图展示了处理后的数据分布。其中 g , Δ v , v f , a f g, \Delta v, v^f, a^f g,Δv,vf,af分别代表车头间距,车速,车速差,和加速度。

$
数据采集

结合作者所在课题组的数据方案和文献,我们认为目前自动驾驶汽车的数据采集通常来自多种高精度传感器的数据整合,包括LiDAR(激光雷达),*GPS(全球定位系统),DSRC(车载通信单元),高清摄像头等。图中显示了作者课题组基于Lincoln MKZ的自动驾驶汽车测试平台。

请添加图片描述

关键性能指标
为评估自动驾驶汽车的性能,我们采用以下性能指标:

  • 安全性指标: Time-to-Collision ( T T C TTC TTC)。
  • 稳定性指标: 加速度变化率( α \alpha α)。
  • 可持续性指标: 燃油消耗( F F F)。
  • 通行效率指标: 车头时距( τ \tau τ)。

分析结果如图所示。
请添加图片描述

跟驰模型开发
最后,为了分析自动驾驶汽车的纵向行为,本研究探讨了加速度与输入变量(车头间距、车速和车速差)之间的关系。下图绘制了这些变量之间的散点图,其中y轴是加速度,绿/黄/橙色图片的横轴分别代表车头间距,车速,以及车速差。可以看出,车头间距和车速差对加速度的影响显著,而加速度与车速之间无明显线性关系。其中,加速度与车头间距呈非线性正相关,与车速差呈线性负相关。
请添加图片描述

结论

本研究回顾了多个自动驾驶轨迹数据集,并开发了统一自动驾驶纵向轨迹数据集,主要贡献包括:

  1. 标准化纵向轨迹数据集 - 统一并清理不同数据源的数据,提高数据可用性。
  2. 高质量的跟驰数据集 - 通过去噪和数据清理,保证数据分析的准确性。
  3. 跟驰行为分析 - 研究加速度与输入变量之间的非线性关系

本文的连接和相关代码、数据可以在以下链接里找到:

  1. Ultra-AV 数据集论文 - Scientific Data
  2. GitHub 代码仓库 - Ultra-AV Dataset

http://www.niftyadmin.cn/n/5840790.html

相关文章

Lesson 129 70 miles an hour

Lesson 129 70 miles an hour 词汇 wave n. 波浪,波【群】v. 漂扬,摇摆;挥手,招手;烫头 相关:wavy a. 波浪般的,带弯的    waveless a. 风平浪静的 搭配:brain wave 突如其来的…

深入核心:一步步手撕Tomcat搭建自己的Web服务器

介绍: servlet:处理 http 请求 tomcat:服务器 Servlet servlet 接口: 定义 Servlet 声明周期初始化:init服务:service销毁:destory 继承链: Tomcat Tomcat 和 servlet 原理&#x…

Alibaba grpc Dubbo view

什么是 Dubbo?它的作用是什么? 答: Dubbo 是一款高性能的 Java RPC 框架,是阿里巴巴公司开源的产品,用于提供高性能的分布式服务框架和面向服务的架构。Dubbo 的主要作用是帮助分布式应用程序进行服务治理,…

8.原型模式(Prototype)

动机 在软件系统中,经常面临着某些结构复杂的对象的创建工作;由于需求的变化,这些对象经常面临着剧烈的变化,但是它们却拥有比较稳定一致的接口。 之前的工厂方法和抽象工厂将抽象基类和具体的实现分开。原型模式也差不多&#…

1. 【.NET 8 实战--孢子记账--从单体到微服务--转向微服务】--前言

在我们的专栏《单体开发》中,我们实现了一个简单的记账软件的服务端,并且成功上线。随着用户数量的不断增长,问题逐渐开始显现。访问量逐渐增加,服务端的压力也随之加大。随着访问量的攀升,服务端的响应时间变得越来越…

【零基础学JAVA】数据类型

整型: byte num1 10;//占1个字节范围,-2^8~2^8-1(-128~127) short num2 10;//占2个字节范围,-2^16~2^16-1(-32768~32767) int num3 10;//占4个字节范围,-2^32~2^32-1 long num4 10L;//占8个字节范围,-2^64~2^64-1int i1 10;//十进制 in…

本地缓存~

前言 Caffeine是使用Java8对Guava缓存的重写版本,在Spring Boot 2.0中取而代之,基于LRU算法实现,支持多种缓存过期策略。 以下摘抄于https://github.com/ben-manes/caffeine/wiki/Benchmarks-zh-CN 基准测试通过使用Java microbenchmark ha…

STM32单片机学习记录(2.2)

一、STM32 13.1 - PWR简介 1. PWR(Power Control)电源控制 (1)PWR负责管理STM32内部的电源供电部分,可以实现可编程电压监测器和低功耗模式的功能; (2)可编程电压监测器(…