单霆 鹰眼科技创始人兼CEO 我的第一次人工智能方面的创业,发生在十年以前,我创建了全球最早的图片可视化搜索引擎。 2006年我从澳大利亚昆士兰大学博士毕业,然后在澳大利亚国家信息中心NICTA工作。我是一个“非常规”博士,比较能折腾。 我在博士二年级的时候就参与了一个创业项目,把一个人脸识别专利和卧龙岗大学系主任的图搜图专利结合到一起,做了一个图搜图Demo。我还清晰地记得,当时这个Demo是用C#,盗版的Matlab跑的,只能在我自己的笔记本上跑,放到别人的笔记本上还跑不了。 比较幸运的是,在2006年左右,我们从英国独立媒体集团INM(当时世界上仅次于默多克的第二大媒体集团),拿到了400万美金的风险投资。这个数字对于第一轮的投资来说,直到今天都是一个很大的数字,更不要说是在十年以前。 所以当下我就从澳大利亚国家信息中心辞职,放弃一个很稳定、很舒适的工作,从布里斯班搬去了悉尼,创办了Imprezzeo。现在讲起辞职,说得很轻松,但是在那会儿,我是下了一个非常大的决心。 我的导师再三挽留我,他是世界模式识别协会主席。那时,我是从昆大最快博士毕业的学生,用了两年零八个月,我就完成了博士论文,顺利毕业。所以在他看来,我的职业前景,包括学术前景,都是一条阳光大道,可我偏偏要去走一个独木桥。 当时我的考虑是,07年,我29岁,早上起来坐哪班地铁上班,中午和哪个同事吃饭,下午做哪班地铁回家,几乎是固定的。 周六、周日的日常生活也就是清清前院的草,清清后院的游泳池...... 未来30年的生活,我都看得一清二楚。这种生活并非不好,但这肯定不是我想要的那种生活。 最终让我下定决心辞职的,是当时的投资人跟我讲了一句话:你想把你的研究成果一辈子放到学校里边做论文呢,还是说你想去改变世界? 我记得我当时毫不犹豫地回答:我要改变世界。 多年后回过头来看,当真是被人忽悠了,其实老外也是很能忽悠人的。 我可以很自豪地说,Imprezzeo是世界上最早给企业市场提供可视化搜索引擎的一家公司。 2010年,Imprezzeo被一家数字管理集团联合几家基金收购。 第一次的创业经历,让我从一个学术人、研究员、科学家,变成了一个创业者、企业人,会从全产业的高度,去看待整个人工智能这样一个行业。 我们同期的其他一些创业公司,像face.com,它是世界上第一家做人脸识别的开放平台,09年被Facebook收购; like.com是一家可视化购物搜索比价的搜索引擎,被谷歌收购。你今天如果打like.com,将直接跳转到shopping.google.com。 还有Viewdle、瑞典的Polar Rose。Polar Rose的创始人和我还有一些渊源。我们是同一期的博士生,经历也比较相似,之前也有非常多的交流。他们是做3D人脸识别,后来卖给了苹果。 还有比价搜索引擎Snapshot卖给了亚马逊。 我们是最早的一批把图像识别,人工智能技术应用在互联网领域创业的科学家。十年以前的技术和现在相比,还真有点“小米加步枪”的感觉。 身为一个十年之前就开始尝试人工智能创业的科学家,这个行业的从业者,或是人工智能老兵,我有立场说:这其实是一件非常非常苦逼的事。 为什么这么说? 第一,创业的周期非常长。其实我挺羡慕我那些做游戏,做电商的朋友,因为他们变现非常快。反观人工智能创业,没有十年的积累,你在这个市场上是赚不到钱的。 所以我第二次开始创业的时候,很清楚自己跳入了一个更大的“坑”,我进入自动驾驶领域。 我相信在未来自动驾驶替代司机开车以后,你可以做更多更有意义的事,比抢手机更有意义的事。 我们为什么选择自动驾驶来做第二次人工智能创业的方向? 这两年我们经过和做自动驾驶的前装车厂,Tier1的供应商、芯片厂商以及深圳的后装厂商一起合作交流这么多,我们发现,现在的汽车正处在有点像08、09年做手机APP时的感觉,就是从一个功能车往智能车升级换代这样一个过程当中,需求非常非常大。 第二,从安全角度来讲,其实现在我们发生了很多很多的交通事故,并不是因为车本身的原因,而是人的原因。 到现在我看到了几个不同成长的波段,以智能感知模块,以图像识别为例,它的图像识别准确率在几何级般的提升。给无人驾驶、自动驾驶提供了一个非常好的技术支撑。 100万 vs 1万 假如汽车有进化史的话,它可以分为三个阶段。 第一个阶段是高级驾驶辅助阶段,就是我们通常讲的ADAS阶段。汽车仍然由人来控制,但是我们通过摄像头或者雷达,给驾驶员提供包括车道偏移预警,前方碰撞预警等功能。 它们采取激光雷达配合高精度地图的方式,采取一步到位来做无人驾驶,但是这种方式存在一个问题,就是传感器昂贵,成本非常高。 在谷歌汽车顶上的这套激光雷达成本至少在100万人民币以上,很多时候传感器本身比车都贵。 我们所采取的这种方式叫做循序渐进型,最大的优势就是成本非常便宜,开车基本靠“算”。 我们利用低成本传感器,比如毫米波雷达,超声波雷达以及光学摄像头,配合我们的人工智能的算法,实现这种半自动驾驶或者自动驾驶。 下面我稍微简单介绍一下我们这样一个技术的解决方案。 ![]() 大家看到的在红圈这部分是超声波雷达,因为它有效距离最短,我们可以起到360度环视以及自动泊车的一个功能。 这个方案的好处在于,第一,成本非常低,可能你的摄像头成本只有一两百块,几百块人民币左右。 第二,为什么人可以在开车的时候,自如地、安全地做出很多指令或者控制呢?因为你能看到。人有眼睛,眼睛传给大脑,可以做出很多这样的判断。 ![]() 光学摄像头在汽车里面也起到了汽车的眼睛这样的作用,它一定要实时地感知自己所处的环境。大家可以看到,这是我们的一个智能感知模块现在所做的一些工作。 可以看一下我们一个视频。这个是在广州的一个闹市,我们随意拍下来的一个视频。这是一个非常嘈杂,非常热闹的环境。有的时候我们也开玩笑讲,能够在中国做到自动驾驶,在全世界都没什么问题了。因为中国是司机开车自由度最高的国家。 ![]() 包括各个角度的车辆,包括遮挡的车辆,包括遮挡的行人,我们都能做到非常好的检测识别,真正做成像汽车的眼睛一样。其实也是我们公司的命名所来,慧眼科技,就是说智慧的眼睛,汽车的智慧的眼睛。 大家想问了,你们为什么敢和谷歌这样的大科技公司竞争?这样的一个领域非常烧钱,需要很大的资金投入,为什么有这个信心呢?我们的信心来自于这儿。我列了一个数字,谷歌高精度激光雷达成本至少在100万人民币。 ![]() 那我们的成本呢?1万块人民币。相差了100倍,而且我认为哪怕在未来的三年之内,不会有人去为一个自动驾驶的功能花100万,但是一万块,很多人可能会加装这样的一个功能。这是我们敢去和这种科技巨头去PK,去竞争同一个领域的信心所在。 那么通过我们的技术路线通过各种低成本传感器,比如说像雷达加光学摄像头这种方向,成本低廉,相对的准确性也就没有激光雷达那么高。 我们不懈努力的,就是不断地提高人工智能算法。实际上,我们的技术水平已经达到了可以商用化的地步。 在图像识别准确率,以及雷达识别准确率保障基础之上,我们会选择一些结构化的场景,简单的、低速的、路线固定的一些场景作为我们无人驾驶车落地的场景。 ![]() 中国原来是个自行车大国,现在变成了一个汽车大国。保有量在1.5亿辆,而且每年按照2500万辆新增汽车这样的一个增长水平,在不断地刷新车辆的数量。 ![]() 但是每年全世界120万人因为人为开车而丧失自己的性命,这其实是一个非常恐怖的数字,其中93%是由于人为操作不当而引起的。 2017年,也就是明年,车联网、汽车智能化会有一个全面爆发。我们跟很多车厂,包括后装的厂商聊下来,大致得到这样一个共识:汽车在今年和明年,就已经要开始变成一个在路上跑的”手机”。越来越多的汽车会联网。 ![]() 2018年会实现非常多的车普及半自动驾驶。所谓半自动驾驶,就是通过雷达和光学摄像头来帮助你控制汽车,目前高档车上有,但是在2018年,也就是两年以后,我们很多国产车、中低档车都会配备这样的功能,会逐渐变成一种标配。 2026年,也就是十年以后,自动驾驶会实现全面普及。 做了数十年的人工智能,我觉得人工智能技术其实和我们人生非常相似,借用某一句广告词:Impossible is nothing。 谢谢大家。 |
|