■ 更强大完善的数据处理,全面提升模型检测能力
在数据处理方面,比赛提供的体素(Voxel)标签包含了大量在图像中无法观测到的点,例如被物体遮挡的体素和物体内部不可见的体素,这些标签在训练过程中会对基于图像数据的预测网络训练产生干扰。在训练数据中,该AI团队通过模拟LiDAR光束的方法,生成可视化掩码,提升了模型的预测精度;另一方面,通过引入感知范围边缘的体素点参与训练,有效解决出现在感知边缘区域的误检问题,将模型的整体检测性能提升11%。

■ 更精细的3D体素编码,模型占据预测能力提升超5%
在3D体素特征编码模块中,该算法团队将具有较大感知范围和编码能力的可形变卷积操作应用于3D体素数据,以提升3D特征的表示能力。通过使用CUDA对可形变3D卷积(DCN3D)进行实现与优化,大幅提升了模型的运算速度,并有效降低了显存消耗。通过DCN3D替代传统3D卷积,模型整体占据预测能力提升超5%。
浪潮信息AI团队凭借“F-OCC”算法模型在占据栅格和运动估计赛道夺冠,不仅彰显了其OCC 3D空间感知算法的创新实力,还以48.9%的卓越成绩为自动驾驶技术突破树立了新标杆。展望未来,浪潮信息将继续依托其强大的算法与算力融合能力,深化AI全栈优化策略,从多个维度切入,引领自动驾驶技术领域的创新发展,为全球自动驾驶技术的进步贡献智慧与力量。