对话元戎启行CEO周光：VLA模型主要成本是AI芯片，已实现近10万辆辅助驾驶方案交付-硕谷新闻聚合

元戎启行创始人、CEO周光

国内VLA模型已开始“上车”。

8月26日消息，笔者获悉，AI公司元戎启行今天在深圳发布全新一代辅助驾驶平台——DeepRoute IO 2.0，该平台搭载自研的VLA（Vision-Language-Action）模型。

区别于传统AI，VLA模型融合视觉感知、语义理解与动作决策三大核心能力，并集成思维链（CoT），对比传统端到端模型，VLA模型更擅长应对复杂路况，在安全性、舒适性方面呈现断代式突破。

元戎启行表示，DeepRoute IO 2.0平台以“多模态+多芯片+多车型”适配为核心设计理念，支持激光雷达与纯视觉版本，可面向多种主流乘用车平台开展定制化部署。截至目前，基于DeepRoute IO 2.0平台，元戎启行已达成5个定点合作项目，首批量产车即将进入市场。

“当语言模型与辅助驾驶相遇，一切都变得简单了。VLA模型成为最优解。”元戎启行CEO周光在会上表示，此次DeepRoute IO 2.0平台的发布，是元戎启行技术发展的里程碑，也意味着未来智能驾驶将走向大模型时代。

周光进一步表示，公司在量产商业化方面已获得超过10款车型的定点合作，并实现近10万辆具备城市领航辅助系统的量产车型交付，在行业处于第一梯队。下一步，元戎启行将发力AGl in Robotics（机器人中的AGl），让VLA模型从道路场景走向物理世界的AGI。

会后媒体群访中，周光向笔者表示，当前VLA模型的核心成本是AI芯片。而芯片主要取决于制程工艺和投资多少资金，以及适配成本、时间成本、经济成本、数据成本等。他认为，未来15万元以上的车都可以应用VLA模型，随着成本优化有可能实现更多汽车适配。

周光强调，元戎启行的VLA模型主要为汽车打造，不会有专门数据（用于机器人），但当前其VLA模型可以对运动机器人做到很好地适配和泛化能力，所以他认为未来模型架构会自然而然拥有通用能力。

据悉，创立于2019年的元戎启行，是较早将 AI 技术引入自动驾驶行业的企业之一，致力于打造“物理世界的通用人工智能（AGI）”，推出不依赖高精度地图、应用端到端模型的量产方案，以及最新一代融合视觉、语言、动作等多种模态的VLA模型，以创新技术打造AI司机，实现RoadAGI，引领AI行业变革。

公开信息显示，元戎启行CEO周光毕业于清华大学基础科学班，曾加入清华大学高能物理研究中心、德州仪器Kilby实验室主导自动驾驶机器人项目等。2016年，周光加入百度美国研究院自动驾驶事业部，2019年回国创立了元戎启行。

截至目前，元戎启行集团总人数超1000人，研发人员占比达84%。

融资方面，元戎启行已完成6轮融资，累计融资金额超过5亿美元（约合人民币35.7亿元），投资方包括阿里巴巴、复星锐正、云启资本、耀途资本等。2024年11月6日，元戎启行宣布完成1亿美元C1轮战略融资，由国内头部主机厂（长城）独家投资。

商业化层面，元戎启行已与多家车企达成量产合作，共同推进十余款组合辅助驾驶汽车落地。预计到2025年，将有超过20万辆搭载元戎启行组合辅助驾驶方案的车辆进入消费者市场。

技术层面，元戎启行的VLA模型融合了语言模型，具备强大的思维链能力，能摆脱传统端到端模型的黑盒难题，并将信息串联、分析，从而推理出因果关系。同时，它天然集成海量知识库，泛化能力更强，能够更好地适应复杂多变的真实道路环境。

周光表示，当前整个辅助驾驶行业依然面临比较大的挑战，尤其随着辅助驾驶方案上车量级逐年增加，可能对于产品体系也有更多要求，所以“真的要用最敬畏的心去做”这个行业，而非类似做机器狗站起来就可以了。对于行业来说，当前处于增量阶段。此外，他认为可能需要良性竞争，这也是行业发展比较关键的一个因素。

“安全放在第一位，让AI学会害怕。”周光指出，公司会把辅助驾驶安全放在第一位，持续推进防御性驾驶。未来，元戎启行将围绕VLA模型持续拓展应用边界，在乘用车市场加速量产部署的同时，推进基于量产车平台的Robotaxi业务。在更广阔的Road AGI体系中，VLA模型也将向更多可移动智能体延展复用，逐步实现从单点功能到通用智能体的系统演进。

对于L4和L5发展方向，周光表示已经在规划，但会采用与特斯拉一样的 AI 大模型路径解决L4/L5面临的问题，而不是用Waymo路径和方式，靠规则和CNN等方式解决自动驾驶问题。

“其实关于自动驾驶的定义真的非常老了，已经有30多年历史了，它是AI产生之前的定义，其实我觉得（当前）并不是特别契合，L4跟L5的区别就在于，一个有图，一个全部（自动）都能开，所以你看现在 AI 发展里面完全没有这些概念。”周光称，当前，自动驾驶技术工作才刚刚开始，发展过程需要一些时间。

展望未来，周光表示，真正的自动驾驶离不开大模型，我们一定会全面走向基于GPT架构的端到端模型。而且，利用强化学习、VLA等技术，大模型已经从弱专家系统、通才系统，走向强专家系统。

“我们会全力推进我们的量产，而且把VLA技术放在对应领域，如Robotaxi、C端（乘用车）领域等。未来，我们还将把VLA模型运用到所有可移动物体上，实现物理AGI。”周光强调，他预测第一个能够达到10万级、百万级的机器人，一定是车。

（本文首发于钛媒体App，作者｜林志佳，编辑｜盖虹达）

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，硕谷新闻聚合所有文章均包含本声明。