返回

第684章 启发和颠覆

首页
关灯
护眼
字:
上一页 回目录 下一页 进书架
    第684章 启发和颠覆 (第2/3页)



    杯底与桌面接触,发出一声轻微的脆响,瞬间吸引了所有人的注意。

    蒜鸟蒜鸟,本人陈默,向来只装高端局。

    “姚总的顾虑很实际。”陈默的声音不高,瞬间成为会议室的中心,“用户体验是检验技术的唯一标准。关于ALC的决策鲁棒性,还有BEV感知落地难的问题,我最近看了一些前沿论文和开源项目,有点不成熟的想法,可以抛出来供大家探讨。”

    “第一,关于感知。 ”陈默的指尖在桌面上虚点,仿佛在勾勒无形的蓝图,“BEV是方向没错。

    但传统基于摄像头和雷达点云生成BEV特征图,再去做目标检测、分割的方法,对算力和实时性要求极高。

    并且对非常规障碍物(比如掉落的轮胎、倒下的树、形状怪异的施工设施)的识别能力,存在理论瓶颈。

    我在想,是否可以引入一种更‘直接’的表达方式——占用网络(OCCUpanCy NetWOrk)。”

    “占用网络?”李鹏飞下意识地重复了一句,这位计算机视觉领域的顶尖专家,镜片后的眼睛瞬间亮了起来,身体也不由自主地坐直了。

    这个概念对他而言不算陌生,但从未在量产自动驾驶领域被认真讨论过。

    它太新,也太“重”了。

    “对,”陈默点头。

    “它不关心前方障碍物是车、是人、是锥桶还是别的什么具体类别。

    它只关心一个最本质的问题:车辆前方及周围的三维空间里,哪些体素(VOXel)被占用了?

    是刚性占用(如墙壁)还是柔性占用(如灌木丛)?

    是可穿越的还是不可穿越的?”

    他一边说,一边拿起桌上的白板笔,转身在旁边的白板上快速勾勒起来。

    寥寥几笔,画出一个粗糙的车辆前方视角,然后打上密集的三维网格。

    “输入多视角摄像头图像,甚至融合低线束激光雷达的稀疏点云,通过一个精心设计的3D卷积神经网络,直接输出一个稠密的三维占用栅格图。

    每一个小格子(体素)都有一个概率值,表示它被占据的可能性。

    同时,还可以预测每个被占

    (本章未完,请点击下一页继续阅读)
上一页 回目录 下一页 存书签