具身智能领域再添重磅玩家。由清华大学车辆与运载学院与人工智能学院联合孵化的「光象科技」,宣布完成累计数亿元天使轮融资,并同步推出面向汽车产线的工业级具身智能机器人Phi-Bot X1。这家成立仅一年多的公司,选择了一条与主流VLA(视觉-语言-动作)截然不同的“物理原生基座模型”路线,且产品已在真实产线上完成零失误验证。
清华“产业+学术”团队,瞄准汽车制造30%数字化缺口
光象科技的创始团队呈现出鲜明的复合基因。创始人兼CEO张涛曾任高德空间感知引擎负责人,其主导的技术已量产落地至数百万车载终端;联合创始人李升波教授是强化学习与自动驾驶领域国际知名专家,发表论文超250篇,引用超3万次,连续5年入选爱思唯尔中国高被引学者。团队成员主要来自阿里巴巴、腾讯、华为、库卡、极智嘉等科技与机器人头部企业,兼具全栈技术研发与商业化落地经验。
这种“产业+学术”的配置,让光象科技从一开始就选择了务实且差异化的落地路径——聚焦汽车制造场景。在CEO张涛看来,汽车产业历经百年自动化,现有机械臂和PLC能解决的问题早已被覆盖,具身智能应当去啃那“30%的数字化缺口”。这些缺口主要包括三类:一是职业健康风险场景,如焊接上下料的灼伤风险、高/中/低工位装配对工人颈椎腰椎的损伤;二是质量一致性场景,如尾线质检中固定摄像头无法灵活调整角度导致AI质检召回率不足;三是柔性生产场景,如多车型混线时的动态调整需求。
物理原生基座模型:让机器人自己学会物理规律
技术路线上,光象科技提出了“物理原生基座模型”,核心逻辑是让机器人在与物理环境的交互中自主涌现对物理规律的理解,而非单纯模仿人类动作。这一路线与当前主流的VLA和视频预测式世界模型形成鲜明对比。
张涛指出,VLA本质上是感知与动作的映射器,依赖对人类演示数据的模仿,换任务、换传感器位置就要重训,泛化能力有限;而视频预测式世界模型仅聚焦于像素级预测,无法刻画质量、惯量、摩擦等物理属性,难以支撑通用泛化的动作生成。物理原生模型则通过强化学习算法,让机器人在高保真仿真环境中通过海量试错,自主掌握“卡住时往哪个方向调整能对齐”这类物理因果规律。一台显卡可虚拟1000台机器人同步迭代,成本远低于真机采集数据。
为支撑这一路线,公司构建了“三位一体”技术体系:自研强化学习算法矩阵Phi-RL Matrix,让机器人在仿真和真实环境中通过试错掌握物理规律;物理数据资产Phi-Space,利用三维与物理建模技术重建真实场景的几何形状与质量、摩擦、形变等属性,结合生成式模型实现指数级场景扩张;通用物理智能开发平台Phi-Arch,将数据、算法、工具沉淀为标准化资产,确保技术快速迭代的同时模型持续稳定性,并让学习成果快速迁移落地。
Phi-Bot X1:连续21.5小时零失误,部署周期压缩至周级
2026年6月,光象科技正式发布工业级自进化具身智能机器人Phi-Bot X1。该机器人采用四舵轮全向底盘,支持横向“蟹行”与原地回转;升降腰结构覆盖0至2.5米垂直工作区间;全身27个自由度,全关节力控双臂支持1kHz协同控制与实时力反馈,仅依靠本体感知即可实现10mm定位精度与0.05mm末端重复定位精度,且支持1分钟快速换电。
在正式发布前,Phi-Bot X1已完成真实产线验证。在2026 ATC展会上,机器人连续三天运行21.5小时,完成汽车产线焊接上下料全流程作业,零失误零中断;在双孔同时对准作业中,仅依靠本体感知将动态操作精度控制在毫米级,角度精准控制在0.3°以内,动态环境下连续工作成功率100%。在移动质检场景中,机器人相较非协同方式效率提升51%,较人工工位节拍节省25%至45%,部署周期从传统自动化的6个月以上压缩至周级甚至天级。
汽车场景破局,千亿市场等待深挖
光象科技目前已完成围绕汽车制造中上下料、质检等典型高价值工位的真实场景验证,并与多家国内外头部汽车企业达成商业合作。据张涛预计,国内汽车产线机器人市场规模约1000亿元。公司计划先用汽车场景做深做透,再用3到5年时间向更广泛的工业场景延伸。
本轮融资由珠海科技产业集团、兴证资本、松禾资本、顺禧基金、慕华科创、SeeFund、亿宸资本、上市公司行云科技等头部财投与产投深度参与,老股东零一创投、L2F光源创业者基金持续加注。资金将重点投入物理原生基座模型的研发迭代,并推进具身智能机器人在工业场景的商业化交付。
行业意义:具身智能从“讲故事”走向“啃硬骨头”
光象科技的案例折射出具身智能行业的重要转折点。此前多家具身智能公司尝试进入汽车场景未果,甚至出现“汽车场景被证伪”的声音。但张涛认为,失败的本质并非场景不行,而是“没准备好”——早期入局者大多先讲故事再适配产品,对场景工艺缺乏认知。例如某国际豪华汽车厂商合作的人形公司,采用双足+灵巧手方案做焊接上料,因行走震动导致工件掉落率80%,最终被迫挂载AGV才勉强跑通。
光象科技的成功验证表明,具身智能要真正落地工业,必须从产品设计阶段就深度匹配场景需求,而非简单套用人形或通用形态。物理原生基座模型通过强化学习让机器人自主掌握物理因果规律,为工业场景中那些“机械臂和PLC解决不了”的复杂、柔性、高危险性任务提供了可行方案。随着汽车产业对自动化和柔性生产需求持续提升,具身智能有望率先在汽车制造领域打开千亿级市场,而后向更广泛的工业场景渗透。