实习2: 阿里巴巴-达摩院-自动驾驶实验室-感知算法实习生
Date:
自动驾驶 多模态感知: 1) 主导构建 RobustBenchmark,收集 BEV 感知中常见噪声干扰样例,开发系统化鲁棒 性测试工具包;在 nuScenes 和 Waymo 上建立新鲁棒性基准,全面评估主流 BEV 融合方法的抗干扰性能。2) 参与 BEVFusion 框架设计:采用独立网络分别编码雷达与图像特征,统一投影至 BEV 空间再进行融合,实现近似 后融合的结构,打破视觉对雷达的主导依赖。 3) 参与设计 BEVHeight:为提升检测在参数扰动下的稳定性, 提出以目标高度回归替代直接深度预测,通过几何转换间接获取深度,显著缓解相机参数扰动对性能的影响。4) 参与开发 Opensight:提出基于 LiDAR 的开放词汇检测框架。通过图像生成通用 2D 检测框并回投至 LiDAR 空间估计 3D 位置;设计跨模态对齐与融合模块,将 3D 与 2D 特征对齐后进行语义解码,实现开放类目标检测能力。
