总体框架特斯拉的FSD(Full Self-Driving,全自动驾驶)是一套自动驾驶系统,旨在实现车辆在复杂道路环境中驾驶员脱手的自动驾驶功能。据报道,FSD目前仍属于 L2+ 级别的辅助驾驶,也就是说驾驶员可以脱手但不能离开视线,需驾驶员保持注意力以便随时接管,但按照tesla的想法,FSD可以在保持现有框架下,通过积累数据和训练模型,可以进化到L4自动驾驶。特斯拉FSD是纯视觉方案:采用8个摄像头(360°视野,最远250米探测),用Occupancy Network建模环境并预测运动,BEV生成鸟瞰图辅助决策。使用Transformer处理连续帧的视觉图像组成的时序数据,端到端训练从图像到控制指令(转向、加速减速)。在客户手动驾驶时,则启用影子模式在后台学习人工驾驶的决策(也就是AI模拟学习人类司机的操纵动作),增量训练现有模型,从而利用全球匿名驾驶数据闭环持续提升性能,其中匿名是指 环境-操纵指令 数据无法追溯到任何个人身份。![]() 整体架构![]() ![]() 硬件配置其8个摄像头分布的位置分别是:左、右前轮翼子板各一个、左右两侧B柱各一个、后方牌照上方一个、前挡风玻璃后有三个。![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
|