分享

小鹏汽车首席科学家郭彦东:交互的关键在于全方位和自适应

 cheyunwang 2020-09-11
 
“AI能力”是互联网汽车的新标志。

新鲜血液注入百年汽车制造产业的旗帜,恐怕就是将“人工智能”这个标签牢牢地焊进产业链的关键环节。

“基于自研,深度学习能力和数据闭环,通过OTA让智能汽车越来越聪明,也越来越懂你,从而完成人工智能在车载环境中的进化之路。”小鹏汽车首席科学家郭彦东在第六届国际智能网联汽车技术年会(CICV 2019)的演讲中说道。

这与“大师兄”何小鹏的观点遥相呼应。小鹏汽车董事长兼CEO何小鹏曾多次表示,在从功能汽车到智能汽车的演变过程中,“AI能力”是互联网汽车的新标志。

于是,这也成为小鹏产品的重要标签。作为公司首款上市量产车型,小鹏G3自2018年12月上市后,即凭借自动驾驶辅助能力、交互体验、整车OTA能力打入年轻互联网消费者群体。小鹏官方数据显示,自2019年1月起,“你好 小P”AI语音助手唤醒435,370次,多场景全自动泊车系统触发28,860次,ACC自适应巡航系统独立驾驶里程511,840公里。

截止到2019年4月份,小鹏G3通过OTA升级,已新增逾40项功能,逾200项功能优化升级。其中,不仅新增了如遥控泊车、ATC自适应弯道巡航、智能导航、哨兵模式、冥想模式、斜列式车位泊车辅助等多项功能,同时优化了如超级自动泊车辅助、ACC自适应巡航系统、XPILOT 2.5多场景全自动泊车系统、X_ID账号服务、“你好 小P”AI语音助手、在线音乐服务及充电服务等。

在小鹏团队看来,以上增强智能化属性的操作某种程度上可以让电动车避免残值率过低的天然窘境。具体而言,小鹏汽车目前通过在AI领域的自研工作,试图寻找最合适中国特色场景的解决方案,进而在量产车型中实现落地。

当下,智能系统仍停留在高级辅助功能的尴尬期,驾驶员并未被完全替代,交互体验就成了驾乘的核心技术。

郭彦东在与车云菌交流过程中提到,交互方式的关键在于:全方位、自适应。“好的交互方式一定不仅限于按键,还可以通过触屏、声音、眼神、表情等等。在不同场景下,针对不同用户习惯,可以动态地提供交互方式,伴随感就会增强,冰冷的机械感也会减弱。”

更重要的是,多模态的感知交互方式不仅可以提升车辆智能感,而是能够提升驾驶安全。郭彦东以小鹏自家产品举例来说,其研发的免唤醒策略便是基于视觉感知的精准、实时的实现检测功能。车内智能摄像头根据视线的某些特定落点位置判断驾驶意图。“比如看左右后视镜就表达了转向的意图,不一定要通过转向灯。此外,屏幕按键也可以进行一些自适应的调整,不同情景下车辆反应和反馈方式都不一样,这也是交互的另一个智能层面。”

为了达到最终理想的交互状态,小鹏汽车AI产品中心内部形成了强紧密合作。据了解,小鹏汽车的互联网中心、人工智能产品中心和自动驾驶中心三个部门几乎每天都在一起工作。譬如小鹏自动泊车功能,其主打的“全方位、伴侣式、沉浸式的体验”是通过语音、泊车两个功能实现的,需要诸多相应功能的紧密结合才能形成一个有机的、完整的场景体验。


关于小鹏汽车AI产品中心的更多细节,车云菌也进行了较为详尽的记录:

Q:AI产品中自研的比例大概有多少?

A:小鹏汽车AI产品中心聚焦人脸识别与分析,多模态智能人机交互系统,带有健康监测的驾驶员监控,环境感知,智能视觉导航等多项人工智能技术研发。

除此之外,现阶段人工智能芯片、嵌入式设计,车载系统以及车载应用系统都不是自研的,其上搭载的算法、功能演进是100%自研的。

Q:我们为何选择自研这条路?

A:第一,不管是团队、联合费用、周期还是生态的培育,自研算法无疑时间长、投入大。但是相比芯片或者电池本身的研发,自研算法的投入相对较小,其中大部分投入还是人员、数据以及一些研发工具和平台的投入。

第二,任何一个技术,都经历了从学术界,到技术供应商,成熟后到整车厂量产。小鹏汽车主要的竞争力之一就是智能化,如果我们等着tier1技术成熟了再去用这个东西,我们就失去了竞争优势。我们就是要通过自研,把Tier-1提供不了的成熟产品率先用在自己的车上面(在技术上或者是tier2成熟的阶段)。

第三,更有意思的是后续OTA升级的问题。我们的数据都来源于自己的车辆,我们把大量的数据拿回来做智能模型的更新、迭代、升级。G3虽然上市时间不长,但已经进行了多次OTA升级,来不停增进智能功能。有自己的技术研发能力才能够做功能的升级和迭代。

选择自研的核心在于,小鹏希望持续为客户提供功能的升级和迭代。市面上已有的功能,我们的用户能够早一点使用,小鹏才能有更大的用户基数,有更好的功能运营经验,这可能也是我们能够实现差异化的点。

这个过程中自然会涉及到软硬件适配期的问题。实际我们工作的很大一部分时间都用于软件和硬件的适配。这也是为什么Tier 2虽然手握技术,却仍旧需要通过Tier 1与整车厂进行合作。小鹏的计划是希望通过自研算法后自己进行算法适配、传感器补足、调试成像系统等等,才能顺畅完成落地。

Q:小鹏G3在人工智能技术上有哪些差异化的竞争点?

A:就现阶段市售量产车而言,小鹏汽车可以说是在量产车上实现全功能的唯一一款量产车,包括人脸识别、疲劳分神等。虽然目前市面上大概有20%-30%的车都号称有疲劳驾驶功能的,但他们的疲劳驾驶都是通过方向盘的扭矩传感器来实现的,而非通过视觉系统。

后者不仅能够检测驾驶行为,还能感知交互行为。视觉传感器对你的情绪、健康状况也有感知,这都是方向盘扭矩传感器得不到的。所以如果有视觉传感器,对司机状态的把控会更精准,反映也更迅速。

相比成熟车厂,我个人认为,有一些欧洲的企业动作或做事情非常认真,但同时也很强调员工的生活和工作平衡,我们在合作的时候遇到过对方企业放暑假的,也遇到过他们10月、11月开始准备过圣诞节的。

从几个维度来看,这些企业不是不重视,其实一直把这个当做一个生命线一样的基准来做,但其实有几点挑战。比如,如果你去找外部合作的话,他们要找科技公司实际上是比较难的。虽然科技公司有很好的人脸识别、疲劳、计算机视觉、目标监测、车辆跟踪等之类的技术,但他们不一定有非常强的意愿做硬件的适配和服务,其中的工作量和工作难度相对都是比较大的。除此之外,这能否符合他们当前最核心的商业模式,有没有意愿把算法适配硬件。基于这些考量,双方很难达成紧密的合作,但是Tier-1供应商目前还没有能提供特别成熟的技术。

Q:与特斯拉车载技术相比,小鹏汽车有何异同?

A:我觉得大家的侧重点可能不同,我们目前认为小鹏汽车在车载智能,尤其是司机的驾驶的状态,意图的识别,包括身份认证上,都更投入,功能也更完善。

Q:现在这款车相比于年前的版本多了两个功能:行车记录仪摄像头和观察驾驶员的疲劳驾驶摄像头。那么在硬件方面,小鹏如何进行OTA升级?

A:硬件方面的升级需要进行提前规划和计划。像包括我们下一款车会用英伟达和高通这种主要的主板芯片,在车辆销售的时候,我们会预留一部分硬件算力,用于后续OTA升级。

在我们销售的过程中,很多智能化功能其实是没有完全通过OTA更新进去的,车辆只有硬件,没有软件。但是我们分析销售数据发现,相对于不花钱买硬件,绝大部分消费者都喜欢买一个硬件完备,但功能尚未齐全的汽车。

Q:下一步系统升级会有哪些技术上的更新?

A:我们对内、对外慢慢地淡化L2、L3的概念,因为本身它的定义也不是那么清晰。我们更关注一个一个功能,让驾乘体验更完善。比如,我们年底即将上市的小鹏P7,搭载的运算芯片的算力要更强,可靠性、安全性也要更强。所以,我们不仅是增加更多跟交互、跟预警相关的功能,也会增加很多强安全的功能。在成本方面,小鹏汽车有能力把所有成本控制在合理范围内。

Q:您如何看待未来传感器的发展路径?

郭彦东:其实我觉得有几个趋势大家可能都需要去关注。

第一,激光雷达越来越可靠、越来越便宜,因为成本只是其中的一个制约因素,技术本身的可靠性,能否通过车规级验证,都是我们需要关注的。

第二,摄像头的成像范围越来越广。以前的摄像头晚上都不能工作,摄像头原先是拍了照片给人看的,现在摄头越来越成为一个测量工具,它能看到很多人本来看不到的地方,所以摄像头的可靠性也越来越强。

第三,除了摄像头视觉、激光雷达,其实毫米波雷达也做了很多这样的尝试和努力。摄像头是被动接收,激光是主动发射的,而毫米波雷达也是有主动发射的, 77赫兹、79赫兹等等,现在毫米波雷达在控制自己成本和可靠性前提条件下也越来越便宜,而且效果越来越好,正逐渐向激光雷达去靠拢,比如SAR雷达等等。

所以我们可以看到,不同的传感器都有向好的趋势,最终可能还是一个多传感器融合的方式,但是有哪些传感器可以入围,我觉得现在下结论还为时尚早,一方面需要考虑技术本身的局限,另一方面也在于整个产业的投入。

Q:小鹏怎么看待分布式计算、以及边缘计算技术?

A:首先,你如果想把运算分离在不一样的地方,你要有一个很可靠的、低时延的通信系统,但与此同时,有一些功能如果对实验要求低,可靠性要求低,就可以适当地往云端去放,比如语音。

很多语音控制、语音交流的数据都是在云端做的,包括小鹏在内的主流车厂都利用了这种思路。当你唤醒功能之后,把这些语音传到云端处理,包括NL大数据,分析后再反馈回来。但视觉感知、包括道路情况的分析工作,目前是没有办法在云端完成的,主要还是要靠端上的算力。

Q:在未来实现车路协同方面,主机厂需要做哪些事情?

A:车路一体化标准化的组织非常重要,小鹏一直很重视,也很积极地参与这种协议的开发。我认为主机厂商不应该是被动接受协议的制定,而是主动地去参与,跟政府也好、跟这些技术建设方也好,一起去探讨、研讨什么样的协议是能够从核心辅助车辆实现车路一体化协同的。

Q:消费者最需要的智能功能是什么?

A:一个是安全,一个是体验。娱乐可能算体验的一部分,但并不是最核心的。体验最核心的一个是交互,一个是信息的流畅度。

有一项研究发现,如果用户在开车的时候跟副驾驶人聊天,其实他的驾驶表现是在提升的,但是如果你频繁地使用语音交互系统,对你的驾程体验是没有帮助的。我们的伴随系统,语音系统,能不能够有一天像副驾一样聪明,跟你的交互、沟通那么顺畅。在用户通过语音交互的同时,提升驾驶安全,我觉得这个是所有造车人的梦想。


车  云  推  荐

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多