分享

出门问问CEO李志飞:为什么AI创业公司应该做硬件?

 小饭桌 2020-08-27

+

- 整理丨岳珊 -

编者按

出门问问创始人兼CEO李志飞是美国约翰霍普金斯大学博士,前Google总部科学家,世界级自然语言处理及人工智能专家,世界主流机器翻译开源软件Joshua主要开发者。

2012年,李志飞从谷歌美国总部辞职回国创办了出门问问,经过4年的发展,出门问问成为了一家拥有自主研发的语音识别、语义理解、垂直搜索、基于视觉的ADAS和机器人SLAM等核心技术的人工智能科技产品公司。出门问问致力于以人工智能技术为中心,通过软硬结合产品落地到生活场景,来打造下一代的人机交互方式。其代表性的软硬结合产品包括智能手表Ticwatch、车载智能后视镜问问魔镜Ticmirror以及高级驾驶辅助系统问问魔眼Ticeye。出门问问在人工智能领域积累了丰富的产品和实践经验,正在逐步将先进的人工智能技术通过软硬结合的产品落地在“可穿戴、车载、家居”三大人机交互频次高的生活场景中,改变人们的生活。

近日,在小饭桌人工智能创业班上,作为导师的李志飞分享了其创业历程,出门问问从一个专注做语音识别的科技公司发展为软硬结合的AI公司,但其初心一直都是定义下一代的人机交互方式。

小饭桌做了不修改原意的整理:

定义下一代人机交互方式

AI创业公司里,我们是独一无二的:第一我们是2C,99%的AI公司是2B;第二我们是以AI为核心的软硬结合。

大家可能觉得硬件很LOW,但其实这是很有利的一件事情,因为技术型公司不像运营型公司,比如团购、P2P或者O2O,那种只要有钱就可以快速砸起来。对技术型公司来说,你给我10亿美金,我也解决不了自然语言理解的问题,这不是钱能砸出来的。但是前期有了时间的积累,有了对整个行业的认知和人才的积累,当这个技术真正成为一个热点,或者成为用户需求的时候,就可以快速地把价值释放出来。

2012年创业的时候,我跟投资人讲的是,我要定义下一代的人机交互。

那个时候我在硅谷,移动设备刚刚起步,当时我就认为用键盘打字不是移动设备最有效的交互方式,语音交互才合适,刚好我的科研背景就是机器翻译,那个时候我就想,我可能会做出一家伟大的公司,定义下一代的人机交互,就是语音搜索

这个愿景是非常大的,我们叫define the next generation of human-computer interaction。虽然今天还没有实现这个愿景,但是我们在这4年做的事情,基本和这个愿景是一致的,就是创业初心:你为什么创业?创业要干嘛?不管我们的形态怎么变,我们做的所有事情都是跟定义下一代人机交互有关的。

创业前面一年半的时间,我们都是非常清晰的,别人说的任何话对我都没有干扰,我就是要做语音交互,实现所有的这种算法。

做原生态AI消费产品

2013年底,我们融到了1000万美元的资金,但是当时却比较迷茫。因为语音识别我也做出来了,所有的技术我也都做好了,但是短期内我看不到它有任何变化,用户也没有那么喜欢你这样东西,你也没流量,更别说收到钱了。那时候就在琢磨,语音交互到底用在什么地方?这个状态持续到2014年上半年,直到开始做智能手表。

当时很多人看不懂,说你把一个高大上的人工智能科技公司搞成一个硬件公司,其实这是AI的一个清晰发展方向,要把AI落地到消费产品里,没有自己的硬件,基本上不可能

为什么AI落地消费一定要做硬件?因为自己做操作系统、软件、交互,硬件交由厂商去做的模式根本起不来,为什么?

1.AI技术不成熟;

2.大家对AI的理解不一致,对硬件进行修改时要是双方不一致,很难做出很好的作品。

但是如果你自己是软硬结合,控制自己所有的平台,可能你就能快速把你一些关于AI的想法实现。因为你直接面对消费者,他们面临什么问题,你都能快速地知道,进而快速迭代。

我们公司在AI行业有非常独特的一个地位,就是因为我们可以软硬件全部搞定。搞定完,我们还大概知道怎么卖?比如搞个发布会,或者做一些线上的营销,或者跟渠道搞好关系。

智能手表我们从2015年9月开始量产,至今卖了接近18万台,平均客单价1300元左右,所以差不多有2.4亿人民币的销售额。

这当然跟手机没法比,手机动不动就卖几千万台。但是大家要知道卖智能手表其实还是挺不容易的,它不像手机那样属于刚需,而且今天中国这种真正新类别的智能硬件,做的能超过10万台的,一只手可以数过来。像手环、运动手表这些可能卖个几百万台或者怎么样,但这些东西长期来讲对我这个公司没有任何价值,第一没有任何壁垒,第二它不能定义我所谓的下一代的交互方式,因为它都没有交互。

去年7月份,我们在Kickstarter上做众筹,筹了200万美金,在美国没有人知道我们,200万是中国所有项目中最高的一个。上线Kickstarter之前,我们跑到纽约去,两天约了八个媒体,来的时候,他们的第一反映是Apple Watch不是挺好的,这个有什么用?但是当我把产品demo给他看时,他们觉得这个东西,确实跟Apple Watch有些不一样,有很多创新,不是他想象中的粗制滥造,无论是产品的设计还是外观。

从技术层面,我们是屏占比最高的纯圆智能手表,屏占比就是显示的屏幕跟外面的边框比例,这个比例肯定越高越好。做技术的都知道,这个特别难做,因为你要把屏占比做高,意味着你的空间非常小。另外,除了Apple Watch我们是第一个用磁吸式无线充电的,第一个拿到MFI(苹果认证)的,第一个同时支持GPS和3G,第一个支持NFC(近距离无线通讯技术)的,带着这个表你就可以去刷公交和地铁。

从支付层面,我们是第一个在智能手表上做移动支付的,这对银联、银行来说都是巨大的挑战,因为涉及支付安全,他们之前也从来没搞过,所以我们得陪着银联、银行每天做测试,还得告诉他这是一个很好的应用场景。公交也是一样,公交是比较偏国有化的体系,每个城市都不一样,我们搞定这些城市,其实要做很多事情。

所以今天出门问问就是一个以AI为核心的软硬结合及多场景联动,我们早就不是一个做语音识别的公司了,我们是一个AI的产品公司,这是我们的定位。

未来做多产品联动

我们做了手表,做了车载,我们还会加一些产品,我们接下来要做的事情,就是把这个打通,使这个产品能够联动。大家可以想象一下,我们现在有一个功能,在手表上问一个餐馆,里面有地址,我可以选择把它发送到车里面,如果你装了智能后视镜,一上车就问你说要不要导航到这里去。再比如,家居产品做出来之后,傍晚回家的时候我就可以跟车里说,帮我把客厅的空调打开,调到多少度。这就是一个联动。

这个东西,其实比尔盖茨讲了很多,但是都没有实现,原因就是以前的设备都不联网,第二就是每一个领域都是不同的公司和生态,很难打通。今天由于物联网的发展,所有都联网了,而且每一个场景都有了自己交互性的设备,这时候我们有能力快速把它打通,比如刚才我说的智能手表和车载互动。

这看起来可能不像一个小公司做的事情,我只不过描绘了我们未来能够达到的地方,或者我们能做的一些事情,并不是所有事情都是我们做。首先我们有AI,这是最核心的东西,所有AI的算法、交互,甚至是视觉,我们都会自己把它慢慢地迭代;围绕AI我们做交互系统,比如智能手表操作系统、智能车载操作系统、智能家居等;在这之上,再做硬件,硬件可能跟别人联合开发,也可能硬件本身就做得很好,我们没必要自己做。重要的是我们要能够把各个场景连起来。

今天我觉得整个AI还是非常笨的,说白了还是我们用机器探索世界的方式是不对的,或者我们没找到一个正确的方式。我们现在无论做语音识别还是图像、视觉,所有的算法都有非常清晰的理解,然后我们再有设备可以采样,采样完之后,我有了离散的数据库,这个数据库我用机器学习的方法去深度学习,然后挖掘应用,做一个执行。

这里面有几个特别关键的东西,第一是对这个原理要有一个大概的了解,第二个是传感器,人类是通过交互的方式来探索世界的。比如我们今天能够坐在这里一起讨论话题,很重要的一点就是大家都有思考能力,而不是一个只做语音识别的机器,机器非常机械。

但事实上,第一从传感器方面上讲,机器还不能像人一样思考、判断;第二个带宽有限。人跟世界探索的方式是24小时的,如果睡觉时间不算的话也是十几个小时,十几个小时你每天看到、听到、思考多少东西?如果我们的腕表有这么一个传感器可以采样的话得需要多大的带宽?但显然我们今天这种传输,没法支撑我去做刚才说的那些后续的设想。

还有一个更深层次的问题,大家想象一下,人的交流是通过语言、手势各种方式进行的,我可以不跟你们说话,但我的大脑可以做很多思考和想法,或者你在听我说话,你完全可以闭着眼睛听,但是你在听的过程中,会思考,会推理,有自己的判断。但是计算机没有这种东西,说白了,它是一个矛盾体,一方面没有简单的直觉,比如下个棋,你要告诉Alpha Go一步一步到底怎么弄。第二个它又没有复杂的推理,没有这种推理很重要的一部分原因就是没有这些知识,这是早年人工智能最核心的问题。

这些问题的突破,像知识表示、直觉建模、复杂推理的算法,一定是学术界或者谷歌这种研究院天天干这个事情才能做得好。作为我们创业者更应该关注的,是面对人们的生活,把人工智能的落地,去真正地改变消费者的生活。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多