最全自动驾驶数据集分享系列一｜目标检测数据集

netouch 2023-09-26 发布于北京

展开全文

来源 |整数智能AI研究院

知圈 | 进“底盘社群”请加微yanzhi-6,备注底盘

导读

目前关于自动驾驶数据集你想知道的，应该都在这里了，这是自动驾驶数据集八大系列分享之系列一：

「八大系列概览」

在自动驾驶数据集分享系列中，我们将介绍目前为止各大科研机构和企业推出的所有公开自动驾驶数据集。数据集主要分为八个系列：

系列一：目标检测数据集
系列二：语义分割数据集
系列三：车道线检测数据集
系列四：光流数据集
系列五：Stereo Dataset
系列六：定位与地图数据集
系列七：驾驶行为数据集
系列八：仿真数据集

过去，研究人员创建和发布的数据集相对较小，这些数据集的数据来源也比较有限，通常仅限于摄像头数据。随着采集设备的升级，自动驾驶数据集也在不断升级。以谷歌自动驾驶汽车为例，谷歌自动驾驶汽车在外部车顶上装置了64束激光测距仪，能够使自动驾驶汽车把激光测的数据和高分辨率的地图相结合，使得做出不同类型的数据场景，以便在自动驾驶中躲避障碍物及遵循交通规则。除此之外，Pandset、nuScenes、BLVD等均采用了激光雷达传感器。

除了国外的一些知名数据集，百度、华为、滴滴和西安交大研究所也先后推出了国内的自动驾驶数据集，如Apollo Scape数据集、SODA10M 数据集、D²-City数据集和BLVD数据集，为国内自动驾驶技术的进展提供了重要的研究材料。

下面共包括44个数据集：

01 . Waymo数据集

发布方：Waymo
下载地址：https:///open/
大小：1.82TB
简介： Waymo数据集是到目前为止最大、最多样化的数据集，相比于以往的数据集，Waymo在传感器质量和数据集大小等方面都有较大提升，场景数量是nuScenes数据集的三倍
Perception Dataset： 1950个自动驾驶视频片段，每段视频包括20s的连续驾驶画面；汽车、行人、自行车、交通标志四类标签；1260万个3D框，1180万个2D框；传感器数据：1 个中程激光雷达、4 个短程激光雷达、5个摄像头；采集范围涵盖美国加州的凤凰城、柯克兰、山景城、旧金山等地区的市中心和郊区。同时涉及各种驾驶条件下的数据，包括白天、黑夜、黎明、黄昏、雨天、晴天

Motion Dataset：包括574 小时的数据，103,354个带地图数据片段；汽车、行人、自行车三类标签，每个对象都带有2D框标注；挖掘用于行为预测研究的行为和场景，包括转弯、并道、变道和交汇；地点包括：旧金山、凤凰城、山景城、洛杉矶、底特律和西雅图

02.PandaSet

发布方：禾赛科技&Scale AI
下载地址： https:///resources/download/pandaset
发布时间：2019
大小：16.0 GB
简介： Pandaset面向科研及商业应用公开。首次同时使用了机械旋转式和图像级前向两类激光雷达进行数据采集，输出点云分割结果
特征： 48000多个摄像头图像；16000个激光雷达扫描点云图像(超过100个8秒场景)；每个场景的28个注释；大多数场景的37个语义分割标签；传感器：1个机械LiDAR，1个固态LiDAR，5个广角摄像头，1个长焦摄像头，板载GPS / IMU

03 . nuScenes

发布方：无人驾驶技术公司Motional
下载地址：
https:///open-datasets/nuscenes/tutorial
论文地址：https:///abs/1903.11027
发布时间：2019
大小：547.98GB
简介：nuScenes 数据集是自动驾驶领域使用最广泛的公开数据集之一，也是目前最权威的自动驾驶纯视觉 3D 目标检测评测集。nuScenes数据集灵感来源于kitti，是首个包含全传感器套件的数据集。其中包含波士顿和新加坡的 1000 个复杂的驾驶场景。该数据集禁止商用
特征：全传感器套件：1个激光雷达、5个雷达、6个摄像头、GPS 、 IMU；1000个场景，每个场景20秒（850个用于模型训练，150个用于模型测试）；40万个关键帧，140万张相机图片，39万个激光雷达扫描点云图像，140 万个雷达扫描点云图像；为23个对象类标注的1400万个3D标注框

04 . Lyft Level 5

发布方：来福车（Lyft）交通网络公司
下载地址：https://obal/register/
论文地址： https:///pdf/2006.14480v2.pdf
发布时间：2019年发布Lyft-perception数据集，2020年发布Lyft-prediction数据集
Lyft-perception：简介：来福车的自动驾驶汽车配备了一个内部传感器套件，可以收集其他汽车、行人、交通灯等的原始传感器数据
特征：超过 55,000 帧，由人工进行3D标注； 130万3D标注； 3万激光雷达点云数据； 350个60-90分钟的场景
Lyft-prediction：简介：该数据集包括无人驾驶车队遇到的汽车、骑自行车者、行人等其他交通行为主体的动作记录。这些记录来自通过原始激光雷达、相机和雷达数据，是训练运动预测模型的理想选择
特征:1000 个小时的驾驶记录;17 万个场景：每个场景持续约 25 秒，包括交通信号灯、航拍地图、人行道等;2575 公里：来自公共道路的 2575 公里数据;15242 张标注图片：包括高清语义分割图以及该区域的高清鸟瞰图

05.H3D - HRI-US

发布方：本田研究所
下载地址：https://usa.//H3D
论文地址：https:///abs/1903.01568
发布时间：2019
简介：使用3D LiDAR扫描仪收集、大型全环绕3D多目标检测和跟踪数据集，该数据集仅供大学研究人员使用
特征: 360 度 LiDAR 数据集;160个拥挤且复杂的交通场景;27,721帧，1,071,302个3D标注框;自动驾驶场景中8类常见对象的人工标注;传感器：3个高清摄像头，1个激光雷达，GPS / IMU

06. Boxy vehicle detection数据集

发布方：博世
下载地址：https:///boxy/
论文地址： https://openaccess./content_ICCVW_2019/papers/CVRSUAD/Behrendt_Boxy_Vehicle_Detection_in_Large_Images_ICCVW_2019_paper.pdf
发布时间：2019
大小：1.1TB
简介：大型车辆检测数据集，该数据集的亮点在于其500万像素的高分辨率，但不提供3D点云数据以及城市道路交通数据
特征: 220万张、共1.1TB的高分辨率图像;500万像素分辨率;1,990,806个车辆标注，包括2D框标注和2.5D标注;包括晴天、雨天、黎明、白天、傍晚等多种场景;涵盖交通拥堵和畅通的高速公路场景

07.BLVD

发布方：西安交通大学人工智能与机器人研究所
下载地址：https://github.com/VCCIV/BLVD/
论文地址： https:///pdf/1903.06405.pdf
发布时间：2019

08.SODA10M 数据集

发布方：华为诺亚方舟实验室&中山大学
下载地址： https://soda-2d./download.html
论文地址： https:///pdf/2106.11118.pdf
发布时间：2021
大小：5.6GB（带标记的数据），2TB（未标记的数据）
简介：半/自监督的2D基准数据集，其主要包含从32个城市采集的一千万张多样性丰富的无标签道路场景图片以及两万张带标签图片
特征: 1000万张无标签图片以及2万张有标签图片，由手机或行车记录仪(1080P+)每10秒获取一帧图像;6种主要的人车场景类别：行人、自行车、汽车、卡车、电车、三轮车;覆盖中国32个城市;场景的多样性覆盖：晴天/阴天/雨天；城市街道/高速公路/乡村道路/住宅区；白天/夜间/黎明/黄昏;地平线保持在图像的中心，车内的遮挡不超过整个图像的15%

09.D²-City数据集

发布方：滴滴
发布时间：2019年
大小：131.21 GB
简介： D²-City是一个大规模行车视频数据集。与现有的数据集相比，D²-City胜在其数据集的多样性，数据集采集自运行在中国五个城市的滴滴运营车辆，并且涵盖不同的天气、道路和交通状况
特征: 10,000 多个视频，所有视频均以高清（720P）或超高清（1080P）分辨率录制，所提供的原始数据均存储为帧率25fps、时长30秒的短视频;其中大约有1000个视频对12类对象都进行2D框标注以及跟踪标注，包括汽车、货车、公共汽车、卡车、行人、摩托车、自行车、开放式和封闭式三轮车、叉车以及障碍物;所提供的原始数据均存储为帧率25fps、时长30秒的短视频;丰富的场景：涵盖了不同的天气、道路、交通状况，尤其是极复杂和多样性的交通场景，如光线不足、雨雾天气、道路拥堵、图像清晰度低等

10.Apollo Scape数据集

发布方：百度
下载地址： http://to/scene.html
发布时间：2018-2020年
简介：百度阿波罗数据集包括轨迹预测、3D 激光雷达目标检测和跟踪、场景解析、车道语义分割、3D 汽车实例分割、立体和修复数据集等
特征: 场景分割数据：ApolloScape发布的整个数据集包含数十万帧逐像素语义分割标注的3384 x 2710高分辨率图像数据;车道语义分割：110,000多帧的高质量的像素级语义分割数据;3D物体检测和追踪数据集：在中国北京的各种照明条件和交通密度下收集

11.BDD100K

发布方：加州大学伯克利分校AI实验室（BAIR）
下载地址： https://bdd-data./
论文地址： https:///pdf/1805.04687.pdf
发布时间：2018
大小：57.45GB
简介： BDD100K凭借其数据集的多样性赢得了很大关注，该数据集通过众包的方式由数万名司机进行采集，涵盖的城市包括纽约、旧金山湾区和其他地区。BAIR 研究者在视频上采样关键帧，并为这些关键帧提供标注
特征: 100,000个高清视频，超过1,100小时的驾驶记录，每个视频大约40秒长，清晰度为720p，帧率为30;视频还包含GPS位置信息、IMU数据和时间戳;涵盖晴天、阴天、雨天、雪天、多雾天气、多云6种天气；白天、夜晚；城市道路、隧道、高速公路、居民区、停车场和加油站等不同驾驶场景;研究者为每个视频的第10秒采样关键帧;包含以下几种标注类型：图像标注、车道线标注、可行驶区域标注、道路目标检测、语义分割、实例分割、多目标检测跟踪等

12.KITTI

发布方：德国卡尔斯鲁厄理工学院（KIT）、丰田工业大学芝加哥分校（TTIC）
下载地址： http://www./datasets/kitti/
论文地址： https:///abs/1803.09719
发布时间：2011
简介： KITTI是自动驾驶领域最重要的数据集之一，KITTI主要是针对自动驾驶领域的图像处理技术，主要应用在自动驾驶感知和预测方面，其中也涉及定位和SLAM技术。该数据集用于评测立体图像(stereo)，光流(optical flow)，视觉测距(visual odometry)，3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能
特征: 包括KITTI-stereo、KITTI-flow、KITTI-sceneflow、KITTI-depth、KITTI-odometry、KITTI-object、KITTI-tracking、KITTI-road、KITTI-semantics等数据集;立体图像和光流图：389对;39.2 km视觉测距序列以及超过200k 3D标注物体的图像组成，以10Hz的频率采样及同步;3D物体检测类别：汽车、货车、卡车、行人、自行车、电车、其他;包含场景：城市道路、乡村和高速公路;传感器：1个64线3D激光雷达，2个灰度摄像机，2个彩色摄像机，以及4个光学镜头

13. CityPersons

发布方：马克斯·普朗克学会（Max Planck Inst.(Info.)）
下载地址： https://www./login/
论文地址： https:///abs/1702.05693
发布时间：2017
简介： CityPersons是Cityscapes的一个子集，对Cityperscapes中的行人进行2D框标注。该行人数据集比以往的数据集如INRIA 、ETH、TudBrussels和Daimler等更具多样性和丰富性，涵盖的范围包括法国、德国和瑞士
特征: 进一步的细粒度标签：行人（步行、跑步、站立）、骑行者（骑自行车的人、骑摩托车的人）、坐着的人、其他（不同寻常的人体姿态例如伸展等）;除了真人之外，还标注了海报上的人、雕塑、镜子或的窗户上人的倒影等;数据集涵盖27个不同城市、3个不同季节以及不同的天气状况;数据集共包含35000个行人，平均每张图包含7个人的标注

14.TUD-Brussels Pedestrian &TUD-MotionPairs

发布方：马克斯·普朗克学会（Max Planck Inst.(Info.)）
下载地址：
https://www.mpi-inf./departments/computer-vision-and-machine-learning/research/people-detection-pose-estimation-and-tracking/multi-cue-onboard-pedestrian-detection
论文地址：
https://www.mpi-inf./fileadmin/inf/d2/wojek/wojek09cvpr.pdf
发布时间：2010
简介：马克斯·普朗克学会于2010年早期推出行人数据集，马克斯·普朗克学会通过这个数据集实现了当时一项具有挑战性的任务——即在汽车行驶过程中，通过样貌特征和运动特征来实现多视角的行人检测
TUD-Brussels Pedestrian:通过一辆驾驶汽车采集的布鲁塞尔市中心的数据;508对分辨率为640x480的图像;包含1326个行人标注

TUD- MotionPairs: 1092对图像，带有1776个行人标注的图像;192对包含正负片的图像;在城市行人区内记录的多视角图像

15. DAIR-V2X数据集

发布方：清华大学智能产业研究院（AIR）、北京市高级别自动驾驶示范区、北京车网科技发展有限公司、百度Apollo、北京智源人工智能研究院
下载地址： https://thudair./cooptest
发布时间：2022年
简介： DAIR-V2X数据集是全球首个用于车路协同自动驾驶研究的大规模、多模态、多视角数据集，全部数据采集自真实场景，同时包含2D&3D标注
特征：总计71254帧图像数据和71254帧点云数据；DAIR-V2X协同数据集(DAIR-V2X-C)，包含38845帧图像数据和38845帧点云数据；DAIR-V2X路端数据集(DAIR-V2X-I)，包含10084帧图像数据和10084帧点云数据；DAIR-V2X车端数据集(DAIR-V2X-V)，包含22325帧图像数据和22325帧点云数据；首次实现车路协同时空同步标注；传感器类型丰富，包含车端相机、车端LiDAR、路端相机和路端LiDAR等类型传感器；障碍物目标3D标注属性全面，标注10类道路常见障碍物目标；采集自北京市高级别自动驾驶示范区10公里城市道路、10公里高速公路、以及28个路口；数据涵盖晴天/雨天/雾天、白天/夜晚、城市道路/高速公路等丰富场景；数据完备，包含脱敏后的原始图像和点云数据、标注数据、时间戳、标定文件等；训练集和验证集已发布，测试集将随同后续Challenge活动发布

16.Argoverse

发布方：Argo AI、卡内基梅隆大学、佐治亚理工学院
下载地址： https://www./av1.html
论文地址： https:///pdf/1911.02620.pdf
发布时间：2019年
简介： Argoverse 数据集包含 3D Tracking 和 Motion Forecasting 两部分。Argoverse数据集与Waymo有些不同，虽然它也包含激光雷达和摄像头数据，但它只覆盖了在迈阿密和匹兹堡记录的113个场景。其特别之处在于，它是第一个包含高清地图数据的数据集
特征：第一个包含高清地图数据的数据集：包含匹兹堡和迈阿密290公里的车道地图，如位置、连接、交通信号、海拔等信息；传感器：2个激光雷达，7个高分辨率环形相机 (1920 × 1200)，2个立体相机（ 2056 × 2464 ）；Argoverse 3D tracking：包含 113 个场景的 3d 跟踪注释，每个片段长度为 15-30 秒，共计包含 11052个跟踪对象；对5米内的物体进行标注，共15个标签；70%的标注对象为车辆，30%行人、自行车、摩托车等；Argoverse Motion Forecasting：从在迈阿密和匹兹堡的1006小时驾驶记录中获取，总计320小时；包含324,557 个场景，每个场景 5 秒，且包含以 10 Hz 采样的每个跟踪对象的 2D 鸟瞰图

17.KAIST Multispectral Pedestrian

发布方：韩国科学技术院（Korea Advanced Institute of Science and Technology）
下载地址1： https://sites.google.com/site/pedestrianbenchmark/download
下载地址2： https://sites.google.com/site/pedestrianbenchmark/download
论文地址：https://openaccess./content_cvpr_2015/papers/Hwang_Multispectral_Pedestrian_Detection_2015_CVPR_paper.pdf
发布时间：2015年
简介：该数据集为多光谱行人检测数据集，提供白天和夜晚的彩色-热成像图像对。数据集通过彩色图像和热成像的优势互补，提高了行人检测的准确度，克服了以往行人检测数据行人被遮挡、背景混乱、夜间成像不清晰等问题
特征：同时提供白天和夜间的95328对彩色-热成像图像，并且通过分束器的处理对齐图像，消除图像视差；数据采集地点为韩国首尔，图像分辨率为640x480；103,128个人工2D框标注， 1,182 个行人；四种不同类型的标注：person、people（不清晰的人像）、cyclist、person?（不确定是否为行人）；采集设备：包含热成像仪、RGB摄像机、分束器等的采集设备

18.ETH Pedestrian

发布方：苏黎世联邦理工大学 (ETH Zürich)
下载地址： https://icu.ee./research/datsets.html
论文地址： https://www.vision./media/papers/ess08cvpr.pdf
发布时间：2009年
简介： ETH是一个行人检测数据集，使用摄像机拍摄共三个视频片段，数据集只有一个行人标签
特征：测试集包含3个视频片段，共4800帧，帧率为15，共1894个标注；使用2.5D标注，进行抽帧标注，每四帧标注一次；采集于瑞士苏黎世人员密集的街区；使用摄像机进行拍摄

19 . Daimler Pedestrian」

发布方：Daimler AG
下载地址： http://www./download-daimler-ped-det-benchmark/index.html
论文地址： http:///pami09.pdf
发布时间：2008年
大小：8.5GB
简介：戴姆勒行人检测数据集是采集于城市环境的行人检测数据集，采集的环境均为白天。数据集分为训练集和测试集两部分，训练集又包括行人图像和不包含行人的图像
特征： 27分钟的视频片段；15560张行人的图像（剪切后分辨率为48x96），6744张不包含行人的图片；21,790 张图片(640x480 分辨率)， 56,492个2D人工标注；视频通过行驶车辆上的摄像头采集，场景全部为日间城市道路

20. Tsinghua-Daimler Cyclist

发布方：Daimler AG、清华大学
下载地址： http://www./download-tsinghua-daimler-cyclist/index.html
论文地址： http://www./Publications/iv16_cyclist_benchmark.pdf
发布时间：2016年
简介：该数据集旨在丰富骑行者的数据，提高自动驾驶算法对骑行者检测的准确度，在此之前还没有推出过专门针对骑行者目标检测的数据集
特征：将近6个小时的视频数据，分辨率为2048×1024；14674帧带标注数据， 32361个标注对象，包括骑行者、行人和其他骑行者；数据集分为部分标注数据集和全部标注数据集。部分标注数据集只包括完整清晰的骑行者，而后者包括行人、自行车、三轮车、轮椅、摩托车等所有骑行者；使用车载立体相机进行采集，采集地点为北京的海淀区和朝阳区

21.Caltech数据集

发布方：加州理工学院（California Institute of Technology）
下载地址： http://www.vision./Image_Datasets/CaltechPedestrians/
论文地址： http://www.vision./Image_Datasets/CaltechPedestrians/files/CVPR09pedestrians.pdf
发布时间：2009年
简介：加州理工学院行人数据集采集于洛杉矶的城市道路，视频数据通过车辆搭载摄像头采集
特征：包含将近10个小时的640x480 30Hz 数据集；数据集分为训练集和测试集，训练集分为6个子集，测试集分为4个子集，每个子集大小大约为1GB；包含大约 250,000帧行人标注数据，350,000个2D框，2300个行人，总时长大约为137分钟；区分标注行人的可见部分和不可见部分；视频采集于洛杉矶行人较多的六个区：LAX, Santa Monica, Hollywood, Pasadena, and Little Tokyo

22.NightOwls

发布方：Oxford Visual Geometry Group
下载地址： https://www./download/
论文地址：https://www.robots./~vgg/publications/2018/Neumann18b/neumann18b.pdf
发布时间：2018年
简介： NightOwls数据集主要提供夜间的行人数据。与白昼相比，夜间照明度差，反射、模糊和对比度变化多，因此夜间行人检测更具挑战性
特征： 279,000帧数据，图像分辨率为1024 x 640，帧率为15；所有帧都带有2D框标注，且带有追踪信息，包含42,273个行人；四种行人标签： Pedestrians、Bicycledriver、Motorbikedriver、Ignore areas；四类标签属性： Pose、Difficulty、Occlusion、Truncation；多样性：覆盖三个国家（德国、英国、荷兰），春夏秋冬四个季节，黎明和夜晚，不同的天气状况如雨雪天气

23. EuroCity Persons Dataset

发布方：代尔夫特理工大学 (Delft University of Technology (TU Delft))
下载地址：https://eurocity-dataset./eval/user/login?_next=/eval/downloads/detection
论文地址： https:///pdf/1805.07193;The
发布时间：2018年
简介： ECP是一个多元化的行人检测数据集，数据收集于欧洲多个国家，由车载摄像头进行收集

24.Urban Object Detection

发布方：机器人和立体视觉小组（The Robotics and Tridimensional Vision Group, RoViT， University of Alicante ）
下载地址： http://www.rovit./dataset/traffic/#explore （邮件联系获取）
发布时间：2018年
简介：该数据集中的数据来自于现有数据集，例如PASCAL VOC 、UDacity、Sweden，同时通过安装在车辆上的高清摄像头收集了一部分数据（1%左右），该数据集在公开数据集等的基础上增加了标签的类别。其中有一些数据为弱标注数据，可以用于测试弱监督学习技术
特征：数据集被分成两部分： traffic objects 和 traffic signs；traffic objects数据集经2D标注，共包括汽车、摩托车、人、信号灯、公交车、自行车和交通标志；traffic signs 总共包含43种欧洲街道常见的交通标志，数据来自GTSRB以及Sweden；共包含12000个交通标志

25.Road Damage Dataset 2018-2020

发布方：东京大学
下载地址： https://github.com/sekilab/RoadDamageDetector/
论文地址：
发布时间：2018-2020
简介： Road Damage Dataset 2018：该数据集第一次收集了大规模的道路损坏数据集，收集了日本7个城市共40多个小时的数据。由安装在汽车上的智能手机拍摄的 9,053 张道路病害图像组成，这些道路图像中包含 15,435 个路面病害实例，包含8种病害类型。每幅图像中，道路病害位置和病害类型都被标注出来； Road Damage Dataset 2020：该数据集使用车载智能手机拍摄，包含来自印度、日本和捷克共和国的 26,336 张道路图像，其中有超过 31,000 个道路损坏实例。该数据集收集了四种类型的道路损坏：纵向裂缝、横向裂缝、鳄鱼裂缝和坑洼

26.FLIR Thermal Sensing

发布方：Teledyne FLIR
下载地址： https://www./oem/adas/adas-dataset-form/#anchor29
发布时间：2018年
大小：17GB
简介：感知热红外辐射或热量的能力为现有传感器技术（如可见光相机、激光雷达和雷达系统）提供了互补和独特的优势。该数据集通过热传感技术提供了热图像，在完全漆黑、烟雾、恶劣天气和眩光等具有挑战性的天气条件下，可检测并区分行人、骑行者、动物和机动车辆，促进可见光 + 热传感器融合算法 (“RGBT”) 的研究进展
特征： 26,442 个完全标注的帧，520,000个2D框，9,711 张热图像和 9,233 张 RGB 图像；15个标签类别：行人、自行车、汽车、摩托车、公共汽车、火车、卡车、红绿灯、消防栓等；热成像仪规格：Teledyne FLIR Tau 2 640x512，13mm f/1.0

27. TuSimple 车道线检测数据集

发布方：Tusimple
下载地址： https://github.com/TuSimple/tusimple-benchmark/issues/3
发布时间：2017年
简介： Tusimple举办了一次以摄像头图像数据做车道检测的比赛,公开了一部分数据及其标注信息
特征： 7,000 个 1 秒长的视频片段，每个片段 20 帧；环境特征：白天，良好或中等的天气，高速公路；训练集包含3626 个视频片段，测试集包含2782 个视频片段；采用线标注，每条线实际上是点序列的坐标集合，而不是区域集合

28.NEXET

发布方：Nexar
下载地址： https://www./solesensei/nexet-original
发布时间：2017年
大小：11G
简介： Nexar 包含丰富和多样化道路数据，采用行车记录仪和手机摄像头等拍摄，是目前为止涵盖最多国家和城市的自动驾驶数据集

29. Multi-spectral Object Detection

发布方：东京大学
下载地址：https://drive.google.com/drive/folders/1YtEMiUC8sC0iL9rONNv96n5jWuIsWrVY
发布时间：2017年
大小：6.85GB
简介：该数据集由RGB图像、近红外图像、中红外图像和远红外图像组成，图片拍摄于校园环境
特征： 7,512 张图片，3,740张日间的图片以及3,772 张夜间图片；采集：图片由RGB、近红外相机、中红外相机和远红外相机获取，为了模拟驾驶环境，相机被安装在一辆小推车上；环境：东京的大学校园，包括白天和夜晚的数据；标注：包含2D框及标签，包括行人、自行车、车辆等障碍物

30. Mapillary Traffic Sign Dataset

发布方：Mapillary
下载地址： https://www./dataset/trafficsign
论文地址： https:///abs/1909.04422
发布时间：2020年
简介：Mapillary 交通标志数据集是世界上最大、最多样化的公开交通标志数据集，用于检测和分类世界各地的交通标志
特征：100,000 张高分辨率图像，52,000 张全部标注，48,000 张部分标注；313个带有边界框标注的交通标志类别， 320,000 个标注的交通标志；多样性：覆盖各种天气、季节、一天中的各种时间，同时包含城市和乡村地区道路，图像和交通标志类别的全球地理范围，覆盖 6 大洲

31. DriveU Traffic Light Dataset

发布方：乌尔姆大学 (Ulm University)
下载地址：
https://www./in/iui-drive-u/projekte/driveu-traffic-light-dataset/registrierungsformular-dtld/
论文地址：
https:///10.1109/ICRA.2018.8460737
发布时间：2018年
简介：数据集提供差值图像，对宽度为 5 像素或更小的对象进行标注，非常适合在非常低的分辨率下进行物体识别领域的研究
特征：188个视频片段，3366张标注图片，分辨率为2048x1024，40951个标注对象，超过 230,000 个带注释的交通信号；标注：344 个不同的标签类别，2D标注，交通灯包含不同属性如灯的颜色、方向；采集环境：德国11个城市，包含不同天气和白天不同时间，2300公里驾驶路程；采集设备：2个百万像素级别相机进行采集

32 . Tsinghua-Tencent 100K Tutorial

发布方：清华大学
下载地址：
https://cg.cs./dataset/form.html?dataset=tt100k
论文地址：
https://cg.cs./traffic-sign/0682.pdf
发布时间：2016年
大小：10.8G
简介：清华大学依据100000张腾讯街景全景图中创建了一个大型交通标志基准。提供了100000张包含30000个交通标志实例的图像。这些图像涵盖了光照度和天气条件的巨大变化
特征：100000张包含30000个交通标志实例的图像，图像分辨率为2048 × 2048，数据来源于腾讯街景数据，该数据集选择了中国5个城市的街景图；包含交通标志但不包含信号灯；多样性：覆盖不同天气和光照条件下的数据；标注：采用多边形标注，分为三种类型的交通标志——警告、禁止和强制性的标志，各种标志的分布比例不均

33. Bosch Small Traffic Lights

发布方：Bosch（博世）
下载地址：
https://hci.iwr./content/bosch-small-traffic-lights-dataset
论文地址：
https://ieeexplore./document/7989163
发布时间：2017年
大小：25.24GB
简介：用于交通信号灯检测的数据集，包含了各种复杂多样性环境下的交通灯图像，该数据集提供了高分辨率的图像以及较为精确的标注结果
特征：13427 张图像，分辨率为 1280x720 像素， 24000 个带2D框标注的交通信号灯；数据集分为训练集和测试集；训练集：5093张图像、10756个带标注的信号灯、15种不同标签、中位信号灯宽度为8.6 像素；测试集：8334张图像、13486个带标注的信号灯、4个不同的标签（红色、绿色、黄色、关闭）、中位信号灯宽度为8.5像素；采集环境：旧金山湾区

34. KUL Belgium Traffic Sign dataset

发布方：苏黎世联邦理工大学 (ETH Zürich)
下载地址：
http://people.ee./~timofter/traffic_signs/
论文地址：
https://btsd./shareddata/publications/Timofte-MVA-2011-preprint.pdf
发布时间：2013年
大小：50GB
简介：用8个高分辨率摄像头安装在一辆面包车上，总计超过3个小时，带有交通标志标注，大约16000张背景图片
特征：145,000 张图片，分辨率为1,628 × 1,236 像素；标注：9,006张静态图像上的13,444个交通标志标注，距离采集的相机50m以内的范围；数据集分为三部分：训练集：8,851个标注，16,045张不包含交通标志的背景图片；2D测试集：4,593个标注，583 张背景图；3D测试集：1,625个标注，121,632张背景图；提供了一个名为BelgiumTSC的子集，其中有4,591个裁切过的训练样本和2,534个裁切过的测试样本。这些数据对应于原始的BelgiumTS训练和2D测试部分；采集地点：通过GeoAutomation在比利时，佛兰德斯地区的城市道路中采集

35.German Traffic Sign

发布方：Ruhr-Universität Bochum
下载地址：
https://sid./public/archives/daaeac0d7ce1152aea9b61d9f1e19370/published-archive.html
论文地址：
https://www./science/article/pii/S0893608012000457?via%3Dihub
发布时间：2011年
简介：该数据集是在2011年IJCNN上举行的一个多类别分类竞赛提供的，它提供了不同距离、光照、天气条件、部分遮挡等丰富背景下的交通标志。数据集包括43个类别，不同类别的出现频率不是均衡的。参与者必须对两个测试集进行分类，每个测试集有超过12,500张图像
特征：10个小时视频数据，帧率为25，图片分辨率为1360×1024 ，50000个交通标志；经过处理后的交通标志的数量为1700，图像分辨率为15x15～222x193像素；标注：半自动标注，133,000张带标注的交通标志图像，2,416个交通标志；采集环境：德国不同道路，日间，使用相机进行采集

36. LISA Traffic Sign

发布方：the University of San Diego
下载地址： https://www./mbornoe/lisa-traffic-light-dataset
发布时间：2012年
大小：5GB
简介：LISA数据集是一个包含美国交通标志的视频数据集。数据集分为两个阶段发布，即发布只有图片的数据集和发布带视频和图片的数据集
特征：43,007 帧和 113,888 个带的交标注通信号灯，同时提供彩色图像和灰度图像；分辨率为1280 x 960，交通标志分辨率为6x6 ~167x168 像素；标注：47种交通标志，标注包括2D框和属性包括交通标志类型、位置、尺寸、是否被遮挡、是否位于路侧；由安装在车辆车顶上的立体摄像机捕捉，该数据集中的图片仅包括左侧摄像机视图；采集环境：美国加利福尼亚州圣地亚哥，夜间和白天以及不同的光线和天气条件下行驶

37. LaRA ：交通信号灯视频数据集

发布方：法国La Route Automatisée
下载地址：http://www.lara./benchmarks/trafficlightsrecognition
论文地址：
https://ieeexplore./document/5164304
发布时间：2013年
大小：1.54GB
简介：城市道路场景中的交通信号灯数据集，相比于Bosch数据集，该数据集提供的交通灯图片像素比较低
特征：8分钟视频，11179帧数据，帧率为25，分辨率为640×480；9168个人工2D框标记的交通灯，四类标签（红灯、绿灯、黄灯、模糊），被标注的信号灯大小大于5像素；采集环境：巴黎交通密集的城市街道，采用车载摄像机拍摄，车辆行驶速度低于50km/h

38.Chinese Traffic Sign Database

发布方：北京交通大学
下载地址：
http://www.nlpr./pal/trafficdata/recognition.html
特征：6164张交通标志图像，包含58个标志类别；数据集分为训练集和测试集。训练集包括4170张图片，而测试集包含1994张图片；数据集收集于不同天气、光照条件等环境下，并包含部分遮挡等状况

39 . Udacity

发布方：Udacity
下载地址：
https://github.com/udacity/self-driving-car/tree/master/annotations
发布时间：2016年
简介：Udacity是Google开设的线上教育平台，其中有自动驾驶相关线上培训，它也为其自动驾驶算法比赛专门准备了数据集，对连续视频图片进行了2D标注，主要有汽车、行人、大型车辆等类别。数据集标注不如KITTI严谨
特征：数据集1：9,423帧图像，分辨率1920×1200，超过65000个标签；大小：1.5GB；标注：由CuldAI使用机器学习算法和标注员共同进行标注，包含汽车、卡车、行人三种标签；数据集2：15000帧，分辨率1920×1200；大小：3.3GB；包含汽车、卡车、行人、交通灯四种标签；采集环境：包括在加利福尼亚和邻近城市在白天条件下行驶拍摄的图像

40.JAAD

发布方：约克大学 (York University)
下载地址：
https://github.com/ykotseruba/JAAD
论文地址：
https://openaccess./content_ICCV_2017_workshops/papers/w3/Rasouli_Are_They_Going_ICCV_2017_paper.pdf
发布时间：2017年
大小：3.1GB
简介：JAAD 是用于研究自动驾驶背景下联合注意力的数据集。重点是行人和驾驶员在交叉路口的行为以及影响他们的因素
特征：包含 346 个视频片段，帧率为30，时长5-10秒，82,032帧；标注：2793名行人，378,643个2D标注框；不同的标签框：行走、站立、过马路、查看交通状况；行人属性：年龄、性别、服饰、运动方向；每个视频都带有时间和天气属性；采集环境：3个车载摄像头采集，北美和东欧各种天气条件下日常城市驾驶的典型场景

41. NYC3DCars数据集

发布方：康奈尔大学
下载地址：
http://nyc3d.cs./#download
论文地址：
https://www.cs./~snavely/publications/papers/nyc3dcars_iccv13.pdf
发布时间：2013年
简介：NYC3DCars中的每张照片都集合了现实地理空间的数据。集成了诸如OpenStreetMap和NYC OpenData提供的数据库，以便识别道路的地理特征
特征：2000张带标注图片，3787辆被标注车辆；标注：对车辆进2D标注。包括车辆位置，车辆类型，地理位置，被遮挡的程度和时间；图像数据背景：图片来自互联网，范围涵盖纽约交通密集地区、不同视角、一天中的不同时间

42. Elektra (CVC-14)

发布方：Universitat Autònoma de Barcelona
下载地址：
http://adas.cvc./elektra/enigma-portfolio/cvc-14-visible-fir-day-night-pedestrian-sequence-dataset/
论文：
Adapting Pedestrian Detection from Synthetic to Far Infrared Images
发布时间：2016年
大小：3.2GB
简介：该数据集利用远红外摄像机的优势，可以同时收集白天和夜晚的图像信息。通过合成图像作为训练数据，大大减少了人工标注工作量
特征：红外数据集分为白天和夜晚数据集：白天包括3110张训练集和2880张测试集，夜晚包含2198张训练集和2883张测试集：白天包含2000名行人，夜间包含500名行人：采集环境：巴塞罗那的城市街道，包括白天和夜晚场景

43.Highway Workzones

发布方：卡内基梅隆大学 (Carnegie Mellon University)
下载地址：
http://www.andrew./ user/jonghole/workzone/data/
论文地址：
https://ieeexplore./abstract/document/6876163
发布时间：2015年
简介：该数据集用于训练识别高速公路行驶区域边界和驾驶环境变化的算法
特征：6个高速公路上行驶视频数据，17000多张图片，共包含800多个交通标志；标注：9种标签，包括高速公路的起始位置、限速变化、道路施工、车道变换标志和文字提示；采集环境：春季/冬季，晴天/雨天/多云

44.TME Motorway Dataset

发布方：Czech Technical University in Prague & University of Parma
下载地址：
http://cmp.felk./data/motorway/
论文地址：http://cmp.felk./data/motorway/paper/itsc2012.pdf
发布时间：2011年
简介：数据采集于意大利北部的高速公路，与一般的道路相比，高速公路上没有行人、没有对向来车、道路标志清晰以及道路平缓，同时高速公路上高速行驶的车辆和大车较多也构成了挑战
特征：28个视频片段，总共27分钟视频数据，30000帧，图像分辨率为1024x768，提供的数据带有时间戳；根据关照情况分为两个子集：daylight/sunset；标注：半自动2D标注，只对车辆进行标注；采集环境：意大利北部高速公路，涵盖不同的交通状况、车道数量、光照情况等

- End -