智驾网 2026-06-22 16:37
如祺出行发布具身智能数据平台:推进第一人称操作视频自动化处理能力
分享
如祺数据此次发布的具身智能数据平台,通过搭建面向Ego-centric数据的自动化处理流水线,覆盖数据导入、AI预处理、动作标注、多级质检到标准化格式导出全流程,核心目标是降低Ego-centric数据从采集到训练的边际成本,进而突破“最后一公里”困境。

今天(6月22日),如祺出行旗下数据业务板块正式发布具身智能数据平台。官方信息显示,该平台核心是一套Ego-centric第一人称操作视频自动化处理流水线,覆盖数据导入、AI预处理、动作标注、多级质检到标准化格式导出全流程。


这意味着,这家公司正式将其既有的AI数据服务能力延伸至高增长的具身智能数据处理场景。如祺出行称,新平台旨在将具身智能数据服务标准化、自动化,形成可追溯、可质检的闭环,降低第一人称数据从采集到训练的边际成本。


具身流程1.jpg 

▲具身智能数据平台六步式数据自动化处理全流程

 

今年以来,全国多地明确支持具身智能领域加快发展。


6月9日,工信部与国资委联合启动“2026年度人形机器人与具身智能实景实训专项行动”,计划今年底推动人形机器人等重点产品在代表性场景中开启“作业模式”,带动形成“万台级规模落地能力”。


市场预期,在一系列积极政策支持下,具身智能将加快进入大规模预训练阶段,而数据作为现阶段制约具身智能发展的最重要瓶颈,相关服务需求也将出现爆发式增长。

 

自动化流水线破解数据应用效率瓶颈


当前,具身智能的竞争重心正从本体硬件转向可供训练用的高质量物理数据。公开数据显示,全球高质量真实物理交互数据总量仅约50万小时,而具身智能通用模型训练则需要千万小时起步的数据量级。国泰海通证券在近期研报中直言,“数据饥荒”已成为制约具身智能泛化能力突破的主要瓶颈。


高质量物理交互数据供需严重失衡背后,除了采集困难,还有数据工具链碎片化带来的困境。


具身智能训练所需的多模态数据涵盖视觉、力觉、关节轨迹和语言指令等,对时空、因果对齐精度要求极高。但目前传统数据服务商推出的数据工具链功能大多较为分散,采集、标注、质检、格式转换和训练对接时常分布在不同工具和流程中。


业内人士指出,模型训练团队往往需要花费大量精力和时间在内部搭建数据管线连通数据生产、清洗、评估、筛选等不同环节,“有时候这些成本甚至是数据采集的3到5倍。”当行业朝着真实场景落地方向加速奔跑时,从原始数据到训练就绪之间的“最后一公里”,已逐渐成为拖慢整体效率的隐形卡点。


如祺数据此次发布的具身智能数据平台,通过搭建面向Ego-centric数据的自动化处理流水线,覆盖数据导入、AI预处理、动作标注、多级质检到标准化格式导出全流程,核心目标是降低Ego-centric数据从采集到训练的边际成本,进而突破“最后一公里”困境。


Ego-centric数据是具身智能模型训练的关键数据形态之一。


据介绍,该自动化处理流水线会在Ego-centric视频输入后,先将原始视频进行手部检测、相机位姿估计和手部3D姿态优化三阶段AI预处理,输出结构化轨迹,再借助面向长序列动作切片的标注工作台和五维自动质检报告,最终生成可直接对接LeRobot、HDF5、JSON、ROS 2 MCap等主流训练与仿真框架的标准化数据集。


具身21.jpg

▲平台全自动AI预处理三阶段流水线架构

 

这一过程打破了传统“数据工具链零散、标准不一”的局面,提升数据处理流程的标准化、自动化和可追溯水平,降低从原始视频到训练就绪数据之间的工程门槛,实现高质量数据开箱即用,显著优化模型训练团队的数据使用效率。

 

如祺出行已构建面向物理AI的数据能力


据了解,如祺出行自2023年起开始布局AI数据解决方案。近年,公司基于出行服务平台优势,不断合规积累高价值、多模态的物理世界数据,并围绕自动驾驶逐步构建面向物理AI的全链路数据能力,覆盖数据采集、处理、标注、合成及治理全流程。


目前,如祺出行在广州、上海、重庆等地常态化部署超300辆智能驾驶采集车,每日可贡献1600小时、130TB的多模态行车与泊车数据。公司在全国布局3大服务交付基地,团队规模超1,500人,可提供每月千万级的交付标注产能,客户覆盖小马智行、理想、腾讯等头部企业。


数据显示,2025年,如祺出行以AI数据解决方案为主要收入来源的技术服务板块录得营收1.60亿元,同比大增487.4%,商业化能力持续获得验证。


今年5月,如祺出行表示将持续围绕自动驾驶、具身智能、世界模型等方向拓展数据服务能力,并同步公开其布局的AI数据资产版图,包括标注数据、行为数据、合成数据及多模态训练数据集。


“具身智能与自动驾驶本质上都是物理AI,两个领域的数据服务能力在底层逻辑上相通,存在可迁移经验。”一位业内人士分析称,如祺数据的全链路AI数据能力已在自动驾驶领域获得验证,这成为其向具身智能扩展的基础。

x

收藏 0
打赏
相关标签:
电话:010-65030507
邮箱:editor@autor.com.cn
地址:北京市朝阳区朝外大街乙6号朝外SOHO D座5097室
北京智驾时代传媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版权所有 AutoR智驾 智能汽车网
京ICP备14027737号-1      京公网安备 11010502038466号
电信与信息服务业务经营许可证:京B-20211307
关注官方微信