跳跃特斯拉的“海量数据”,商汤“智驾版DeepSeek”来了

跳跃特斯拉的“海量数据”,商汤“智驾版DeepSeek”来了

2月22日,以“模塑群众 无尽可能”为主题的2025GDC群众开拓者时尚大会在上海举办,旨在探索大模子产业化惩办决策。商汤绝影CEO,商汤科技策动创举东说念主、首席科学家王晓刚发布行业首个“与天下模子协同交互的端到端自动驾驶路子R-UniAD”,通过构建天下模子生成在线交互的仿真环境,以此进行端到端模子的强化学习执行。

这与DeepSeek工夫更正想路同归一源:从师法学习向强化学习升级演进,从而完结端到端自动驾驶特出东说念主类的驾驶发扬。

2022年底,商汤绝影提议了行业首个感知决策一体化自动驾驶通用模子UniAD,同庚8月,特斯拉CEO马斯克直播试驾FSD V12,即端到端自动驾驶工夫,越来越多的车企和科技公司脱手跟进端到端的工夫路子。如今,数据驱动的端到端自动驾驶惩办决策已成为行业共鸣。

端到端的自动驾驶实质是通过海量的高质料东说念主类驾驶数据,来完结最好的“师法”驾驶遵循。可是,基于师法学习的工夫范式不错作念到接近东说念主类但难以冲破东说念主类才智上限。同期,受限于高质料场景数据的稀缺性和驾驶数据质料的错落不王人,端到端智驾决策要达到东说念主类驾驶才智的天花板并报复易,动辄千万Clips的高质料数据回流变成了界限门槛。

特斯拉通过七百万辆高阶智驾量产车和超10万P算力,还是跳跃了这个门槛,同期也构筑了与国内车企具少见量级差距的基础圭臬壁垒。

可是,大模子性能的晋升多依靠进一步扩大算力界限和加多模子参数,一定进度上变成了算力的比拼。本年春节时间,DeepSeek-R1基于纯强化学习的环节更正激发了泛泛的关心。通过少量高质料数据的冷启动,模子进行多阶段的强化学习执行,灵验镌汰大模子执行的数据界限门槛。更遑急的是,强化学习冒失让大模子自行显现出长想维链才智,显耀晋升推理遵循,致使可能具备特出东说念主类的想维才智。

王晓刚示意,基于强化学习的大模子工夫路子不错迁徙到端到端自动驾驶算法的执行与研发之中。

从数据界限来看,多阶段强化学习的执行法式能大幅镌汰端到端自动驾驶数据界限门槛。R-UniAD便是通过高质料数据进行冷启动,用师法学习的步地执行出一个端到端基础模子,再通过强化学习法式进行执行。

从性能上限来看,纯强化学习执行让端到端智驾模子有望通过在晋升性能的同期,探索多元场景和驾驶作风。异日,端到端智驾体验的上限不再是“类东说念主”,而是不错领有特出东说念主类的驾驶发扬。

商汤绝影的R-UniAD是“多阶段强化学习”端到端自动驾驶工夫路子,具体分为三个阶段,当先是依靠冷启动数据通过师法学习进行云表的端到端自动驾驶大模子执行;然后基于强化学习,让云表的端到端大模子与天下模子协同交互,合手续晋升端到端模子的性能;终末云表大模子通过高效蒸馏的步地,完结高性能端到端自动驾驶小模子的车端部署。

“智驾高端局的竞争不啻是车端模子的比拼,端到端的决战,战场在云表”,前年11月,商汤绝影升级并发布“开悟”天下模子,其最基础亦然最中枢的才智是生成高质料视频数据,基于“开悟”,1个GPU产生的仿真数据格外于500台量产车的数据采集遵循。

在现场演示中,商汤绝影展示了“开悟”天下模子与主车闭环交互的步地。通过场景库文献导入一个BEV视角下的开动主车和他车位置,天下模子自动生成主车视角下11V(11个录像头)的传感器仿真数据,端到端模子接受到这一数据后,生成自车下一时间位置并进行响应,天下模子凭证刷新的主车位置和预测的他车位置渲染新的11V传感器仿真数据。

商汤绝影的量产端到端智驾决策瞻望将在年底录用,“开悟”天下模子也细致用于数据坐褥。而在本年4月的上海车展上,商汤绝影将会展示“与天下模子协同交互的端到端自动驾驶决策”的实车部署。

依托商汤大安装算力基础圭臬,商汤绝影冒失确立云表自动驾驶大模子,蒸馏获得不错部署在更小算力芯片的端到端模子,助力车企联接伙伴,基于更少量量级的数据,特出特斯拉依靠百万台量产车数据回流的自动驾驶决策,特出东说念主的驾驶水平。

南边+记者 郜小平

【作家】 郜小平

【起原】 南边报业传媒集团南边+客户端






Powered by 数字视野网 @2013-2022 RSS地图 HTML地图