2017年至2019年,特斯拉率先推出了HydraNet多任务学习神经网络架构,使得同一模型能够同时处理车道线检测、行人识别、交通信号灯判断等多种视觉任务,大幅提升了数据处理效率和实时性。随后,在2020至2021年间,特斯拉进一步引入“BEV+Transformer”的架构,将摄像头获取的二维图像转换为鸟瞰图(BEV),实现了多传感器数据在三维空间中的统一表达,从而解决了传统2D图像在距离估计和遮挡问题上的不足。紧接着,2022年占用网络(Occupancy Network)的出现,通过直接在3D空间中判断体素是否被占用,有效降低了对标注数据的依赖,并增强了系统对“corner case”情况的识别能力。 |
|