智驾网 2021-12-18 10:58
商汤科技王晓刚:人工智能在快速从单一智能向通用智能转变
分享
人工智能在快速从单一智能向通用智能发展,商汤致力于打造基础设施,促进产业融合,不断拓展和智能汽车应用的边界和场景。

12月16日,在广州南沙区越秀喜来登酒店召开的世界智能汽车大会主论坛上,商汤科技联合创始人、移动智能事业群总裁王晓刚发表了“通用智能拓展智能汽车边界”的主旨演讲。


王晓刚认为未来我们的智能体包括智能汽车所需要完成的智能的任务越来越复杂、需要覆盖的场景越来越多,越来越需要通用化成为其发展的趋势。而商汤过去几年的技术发展路线也正与此相匹配,已推出智能汽车解决方案平台绝影和通用视觉模型书生。

 

以下为发言稿,未经本人审阅。

  

王晓刚:


各位领导,各位嘉宾,上午好!非常荣幸今天能有机会与大家分享通用智能作为人工智能未来发展的一个重要趋势,是如何去推动智能汽车边界的。

 

智能汽车时代正从传统的制造到制造+服务转变,我们的汽车连接了城市和个人,所以在个人消费、城市管理和企业服务方面都有着非常大的想象空间。其中的关键就是要发挥、深度挖掘智能汽车所产生的海量数据背后的价值。这也是未来的一个非常大的增长点。

 

这里我们就把智能汽车所产生的感知数据和其他赛道进行一个比较。比如说在智慧城市里,全国有200万路摄像头能够连到后端的智能分析平台,这里已经产生了巨大的价值。中国每年市场上有2000万台新车上市,未来每台车上都有10个摄像头和其他类型的传感器,这里所产生的数据量是巨大的,而且在智慧城市里我们看到的摄像头是静止的,车是移动的,所以它的信息量和质量都是更高的。

 

在手机端,中国每年有4亿台手机上市,每台手机上也有几个传感器和摄像头,这些摄像头大部分时间是关闭的,所捕捉的场景也是非常有限的。所以车载未来产生的数据体量、信息量和质量上都是非常高的。

 

如果从算力的角度看,智能汽车的算力是智慧城市摄像头的百倍、是手机的几十倍,我们就可以把智能汽车看成一个巨大的、移动的数据生产源,这里的核心关键就是如何通过人工智能去挖掘这些数据背后的价值。

 

我们认为有四类人工智能模型:


    一是智能感知模型。车载产生了大量的视频、图像、3D非结构化数据,需要通过智能的感知将这些数据高效地进行结构化。


    结构化之后是智能的决策,能够决策智能,包括更好的人机交互。通过人工智能、增强现实、混合现实技术的发展,为我们的物理世界打造了一个平行、虚拟的世界。


    智能内容的生成能够为我们的虚拟世界高效地产生大量的内容,让这个虚拟世界更加精彩。


    最后是智能内容的增强,如何在高速运动、各种极端的情况下还能得到高质量的图像和视频,这都是人工智能模型能够给我们带来的价值。


通过人工智能去推动、拓展智能汽车的边界,需要解决两方面的问题:


一是要解决大量的长尾问题。比如说在智能驾驶的过程中,我们可以看到很多长尾的问题需要解决。这些场景出现的频次很低,也没有大数据的支撑去做训练,但是它一旦出现,所产生的后果非常严重。将来,不同的汽车的自动驾驶功能的差异化就在于谁能够去解决更多的长尾问题,去满足消费者更好的体验。


二是要不断地丰富智能汽车的应用场景,比如说在智能驾驶里,从高速路的自动巡航到普通城区的自动驾驶到最后一公里,从有高精地图到没有高精地图覆盖的广泛区域。


在我们的车舱里,从比较传统的对驾驶员的各种监控分析,到对老人、儿童、宠物的关爱,包括智慧的健康引入到车舱,包括我们把汽车和城市元宇宙、增强现实、混合现实联系在一起。


现在又有多模交互,通过基于视觉的姿态、表情、唇语的识别、语音和自然语言理解相结合,能够带来更好的人机交互的体验。 


所有这些都可以看到,对人工智能功能的要求、场景不断丰富。


在这里,就对我们的通用人工智能提出了要求,不同于以往传统的单一智能,一个人工智能的模型输入的数据类型是单一的,只能完成单一的任务、适应单一的场景。


在通用智能的条件下,从技术层面,一个模型能够输入语音、图像、文字,比如说激光雷达、3D点云等多种类型的数据,同时由一个模型去完成各种各样的任务。


通用模型的出现也是能够帮助我们实现不同行业之间的融合,能够汇聚各行业的数据去共同打造一个通用能力更强的模型,同时能够实现我们的产品和场景的创新。


商汤致力于打造人工智能的大装置、软硬件基础设施SenseCore,同时支撑四个领域的众多行业,包括智慧商业、智慧城市、智慧生活和智能汽车。


在这些领域里,它们所获得的这些数据包括各个行业的反馈共同汇集,能够帮助我们打造通用智能的研发平台和模型。当人工智能大装置不断地升级换代、探索下一代研发体系时,它能够同时去推动各行业研发体系的升级和飞跃,这将成为推动社会生产力发展非常有效的一种迭代方式。


我们也是基于人工智能大装置以一横一纵的方式去打造智能汽车创新的新底座,推出了智能汽车解决方案平台——绝影。一纵是提供智能驾驶和智能车舱的全站解决方案,一横是把基础软硬件设施提供给车厂和合作伙伴,作为我们的平台去赋能多个主机厂。


另外,我们也建立起路云感知平台,将车载数据、路边感知数据和其他行业的数据汇集,不断地拓展智能汽车的应用场景。


绝影的战略定位有三个:


一是帮助生态合作伙伴和客户深度地挖掘汽车的感知数据的价值,这也是商汤的强项。


二是连接智能汽车和商汤的智慧产业生态,实现服务的输出。


三是我们和车厂一起实现共生共赢的新模式。


我们从2016年开始进入智能汽车的方向,到现在已经有30家车企、50多个合作伙伴,覆盖了超过50多个车型。


下面,我们会具体地讲:


一是通用智能。


二是产业融合具体是怎样实现的。


通用智能已经成为人工智能行业的一个故事,是未来发展的一个非常重要的方向。今年,谷歌也宣布了他未来几年的发展战略,就是走通用智能的路线。在这样的愿景里,单一的非常庞大的模型会接收各种不同类型的多模态的数据的输入,同时一个模型能够完成成千上万的不同的任务,这也是因为未来我们的智能体包括智能汽车所需要完成的智能的任务越来越复杂、需要覆盖的场景越来越多,越来越需要通用化成为其发展的趋势。


这也是与我们过去几年的技术发展路线相匹配的。今年,我们也是发布了通用视觉模型书生,去训练这样一个通用世界模型分几个阶段:


首先汇集行业里的数据,共同打造一个通用、通才的模型,这个书生不仅会写文章,可以有琴棋书画非常全面的能力,这样他遇到不同的问题时,他的适应性会更强。


在此基础上,我们会再结合各个专业领域、各个场景里少量的数据去打造某个专业专才的模型,比如说智慧城市、自动驾驶、文化旅游等各个不同领域的专才模型,这几个阶段打造下来,让我们的模型能力、通用性都变得非常强。

 

这背后需要非常强的算力支持,我们在临港新建了一个新的AIDC超算中心,有3.7百亿次的算力、全套自动数据标注、隐私保护和数据安全要求,并且能够从前端形成数据的闭环,从车载去选择哪些数据进行回流,回流之后进行自动的标注和模型的更新,所有这些都是基于大数据超算中心和超大模型。


我们也把智能汽车和多个行业紧密地结合在一起,给大家举一些例子:比如说随着增强现实、混合现实技术的发展,打造虚拟的平行世界,就有了元宇宙。


我们认为智能汽车也是进入城市元宇宙的一个最好的入口,所以我们在今年世界人工智能大会上发布世界上第一款增强现实的无人巴士,把上海的一个城区进行了三维的数字化,借助车载的这些大屏,包括这些车外的摄像头,就可以把虚拟的世界和外面的物理世界进行一个非常好的结合,坐在车里面,就可以体验到城市的发展,各种经济文化的创新,就像坐在穿越的博物馆里面。


另外,包括数字人是应用在各行各业不同形象的数字人,我们也把它引入到智能车厢里,根据消费者的喜好千人千面。


智慧健康,能够在其中检测心跳、呼吸频率以及血压等等,通过视觉这些手段,能够给消费者、乘客带来关爱和长期的关怀。


在移动手机端、互联网过去十年打造非常先进的智能影像技术,能够拍出非常好的图像和视频。现在可以看到汽车这些摄像头的质量也是越来越高,旅行时能够得到高质量驾驶中高速运动中有高质量视频进行分享。今年5月和广汽发表奇妙相机,可以增强拍照的体验。


人工智能在快速从单一智能向通用智能发展,在过去三年里,最好的模型大小提升超过一百万倍,我们也是致力于打造基础设施,能够促进产业融合,不断地拓展和智能汽车应用的边界和场景,和合作伙伴迎接智能汽车新未来。

x

收藏 1
打赏
电话:010-65030507
邮箱:editor@autor.com.cn
地址:北京市朝阳区朝外大街乙6号朝外SOHO D座5097室
北京智驾时代传媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版权所有 AutoR智驾 智能汽车网
京ICP备14027737号-1      京公网安备 11010502038466号
电信与信息服务业务经营许可证:京B-20211307
关注官方微信