返回

第682章 提示和设想

首页
关灯
护眼
字:
上一页 回目录 下一页 进书架
    第682章 提示和设想 (第2/3页)

周多之前的一个会议说起。

    当时卞金鳞刚做完技术路径的汇报,就听到了一个声音。

    “卞总,”陈默的声音不高,却清晰地回荡在寂静的会议室里,他的目光落在卞金麟身上。

    “刚才你们汇报的感知融合方案,核心是不是还在沿用‘前融合+后融合’的传统架构?

    激光雷达点云、摄像头像素、毫米波雷达目标,先各自做目标识别和轨迹预测,然后再进行时间戳同步和决策层融合?”

    卞金麟被问得一愣,下意识地回答:“是...是的,陈总。这是目前行业主流,也是相对成熟的方案,特斯拉的HydraNet、小鹏的XPILOT 3.0架构都是基于这种思路做优化...”

    “主流?成熟?”陈默打断了他,嘴角似乎勾起了一个极淡的弧度。

    他起身走到白板前面,没有回头,背对着所有人,手中的黑色马克笔已经毫不犹豫地落在了白板上。

    笔尖划过光滑的板面,发出沙沙的轻响。

    陈默手腕沉稳,线条流畅而肯定,没有丝毫犹豫。

    一个简洁却完全不同于传统感知架构的图形框架迅速在他笔下成型。

    “把摄像头采集的原始视频流(RaW VideO),”陈默一边画,一边清晰地说道,声音不大,却字字如锤,敲在每个人的神经上,“直接输入到一个统一的、基于TranSfOrmer架构的编码器(EnCOder)。”

    他在白板左侧画了几个代表摄像头的抽象符号,用箭头指向一个代表神经网络的大方框,在方框里重重写下了“TranSfOrmer EnCOder”。

    “在这个编码器内部,通过强大的注意力机制(AttentiOn MeChaniSm),让模型自己学会在像素级别上,跨时间、跨空间、跨摄像头视角,去建立关联,去理解三维空间的结构!

    让AI自己‘看’懂这个世界的几何关系,而不是依赖我们人工预设的规则

    (本章未完,请点击下一页继续阅读)
上一页 回目录 下一页 存书签