5月18日,如祺出行旗下数据业务板块“如祺数据”首次向外界完整披露其AI数据资产版图。官方信息显示,如祺数据资产已覆盖标注数据、行为数据、合成数据及多模态训练数据集四大类。
如祺出行的AI数据服务近年保持高速增长。2025年,以该业务为主要收入来源的技术服务板块该录得营收1.60亿元,同比大增487.4%。截至2026年5月,公司已在广州、上海、重庆、沈阳等城市部署超过300辆智能驾驶数据采集车,每日可产出1600小时、130TB合规数据。

如祺出行表示,依托在真实出行场景的长期数据积累,公司正持续助力自动驾驶及多行业AI模型训练与高效迭代,也为具身智能、世界模型等面向真实物理世界的AI方向提供可延展的数据支撑。
在AI迈向“空间智能”时代,物理世界数据成为最稀缺、最有价值的“资产”。有分析人士认为,类似如祺出行这样的出行平台在真实运营中能够持续积累的海量多模态数据,天然包含驾驶员行为、道路交互、空间关系、时间序列等深层信息,是训练具备空间智能AI系统的理想数据源。
聚焦真实出行高价值场景 拥有具身智能训练“黄金数据矿”
随着AI技术的发展,以具身智能为核心应用场景的世界模型被业界视为下一个AI主战场。然而因可供训练的高质量交互数据极度短缺,让这一领域的发展面临重大挑战。
但类似如祺出行这样的出行服务平台,却具备生产、积累上述高价值数据资产的天然优势,伴随着每年数亿的出行订单量及规模巨大的车辆运行数据,海量司机行车、泊车以及高频交通场景的多模态数据也同时涌入平台。与传统图片、视频又或者人工搭建模拟场景数据相比,这些数据记录了“司机决策-车辆响应-环境反馈”的完整链条,天然具备因果关联与交互逻辑,是训练世界模型和具身智能的核心稀缺资产,有机会直接解决与出行场景相关的AI“数据枯竭”焦虑。
公开信息显示,如祺出行早于2023年开始布局AI数据解决方案,通过将搭载激光雷达、摄像头等传感器的智驾数据采集车投入常态化运营,同步合规采集真实驾驶及道路数据。
以在常见的泊车场景为例,如祺数据不仅记录3D障碍物位置,还同步采集汽车底盘CAN信号、毫米波雷达回波、激光点云与摄像头视频,围绕泊车形成多模态的“行为-状态-环境”联合数据集。
长期关注AI大模型训练的人士认为,这类数据具有完整的推理、决策和反馈链条,可直接为具身智能体、世界模型等理解空间关系、动态交互及长尾场景提供参考,其价值远超传统静态图片或合成视频,是训练空间智能模型的“黄金数据矿”。
向“数据集+全栈能力”进化 如祺出行已构建全链条数据服务能力
不同于传统AI数据服务商多数聚焦于基础标注服务,如祺出行正从单纯的“卖标注”向“数据集+全栈能力”升级。
官方信息显示,如祺数据已形成数据采集、规模化处理、精准标注、合成数据及多模态处理等全链路能力。这种能力构建使其不仅能服务于智能驾驶,更能向具身智能等高价值赛道延伸,实现数据服务能力的价值链攀升。
这也意味着,如祺数据已具备将包括数据集及服务能力在内的整套AI数据服务封装为标准化产品的综合能力。通过“数据即服务”模式,客户可直接获取如祺数据产品开箱即用,无需再投入高昂成本处理底层数据清洗与标注,显著降低使用高质量真实数据的门槛。
据介绍,如祺出行在全国已布局3大服务交付基地,服务团队人数超1,500人、拥有超1,000家BPO合作伙伴及近百万众包资源,可以提供每月千万级的交付标注产能、满足高并发任务量需求;公司自研的OCC自动化标注算法,能减少90%人工标注时间,交付准确率超98%。同时,如祺的合成数据已涵盖不同时段、不同天气环境和座舱场景等类别,有效弥补真实采集盲区,多模态训练数据集则覆盖图像、文本、音频与视频,并直接支持大模型的垂类微调。

目前,如祺数据服务已进入智能驾驶、具身智能、大模型、消费电子、医疗等多个领域,客户包括腾讯、小马智行、理想、火山引擎、百度智能云、广汽集团等头部企业,商业化路径可行性已得到初步验证。
x
-
给「物理AI」点颜色:激光雷达双雄的新战场 2026-05-14 16:30
-
段建军出任沃尔沃汽车大中华区新任总裁兼CEO,袁小林卸任 2026-05-11 17:55
-
天马走出「隐形冠军」舒适区:以天轩定义全球高端车载显示体验 2026-05-06 12:52
-
智界V9上市发布,售价38.98万-51.98万元 2026-05-15 17:26 -
乐道L80正式上市,24.28万元起,BaaS电池租用方式15.68万元起 2026-05-15 22:02 -
昊铂S600开启预售:权益价18.89万元起,全系标配双腔空悬+激光雷达 2026-05-17 19:27


京公网安备 11010502038466号
关注官方微信