分享

交大90后男神博士:3年看1800篇论文,研发成果超越谷歌,还入选福布斯精英榜

 jdycs1234 2020-08-18

在号称平均年龄仅24岁的旷视研究院,28岁的他已经开始领导团队,为来自清华、北大等名校的员工讨论和规划研究方向,决定着公司下一个突破性的基础技术;在高智商选手云集的AI领域,自诩靠'刷题'成功的他,研发出多个重量级算法模型,已然成为AI领域最具影响力的学者之一。他就是旷视科技研究院基础模型组负责人、西安交通大学2017届校友张祥雨

交大90后男神博士:3年看1800篇论文,研发成果超越谷歌,还入选福布斯精英榜

始于西交大的科研之路

1990年6月出生的张祥雨,是一名'土生土长'的西交大人,从本科到博士都在西安交通大学就读。他于2008年考入西交大,2009年申请转专业进入软件工程专业学习,2012年获得推荐免试资格在西交大进行硕博连读。在大三那年(2011年),张祥雨拿下了美国大学生数学建模竞赛(MCM)特等奖提名奖,当时创下西安交通大学参加该项竞赛以来历史最好成绩。凭借这次获奖经历,张祥雨获得了后来到微软亚洲研究院实习的资格。

获得实习资格的有三人,但最终只有一个人能留下。当时还在微软亚洲研究院担任首席研究员的孙剑博士给这三人出了一道题:用一个月的时间,将人脸检测的速度提升十倍。这个任务现在来看比较容易实现,但当时还没有引入深度学习,张祥雨就靠着对模型调参,用了三天左右的时间完成任务,孙剑看过之后当场决定留下张祥雨

张祥雨之前并没有做科研的经验,这次实习考验让他初尝到做科研的成就感。他也意识到走学术路线,需要到产业界去锻炼。到了微软之后,张祥雨加入了视觉计算组,这个小组里的每一位成员名字放在当下来看都是业界大牛:小组负责人孙剑,组员包括何恺明、危夷晨、代季峰、袁路、曹旭东、任少卿等。2013年,张祥雨面临一个重要选择——博士课题。当时受微软亚洲研究院工作的一些影响,张祥雨倾向于做人脸识别这个领域。但是导师孙剑果断让他去做深度学习,'孙老师认为深度学习以后必然会火,他一直非常有前瞻力,我很相信他'。于是,张祥雨就成了孙剑组里第一个做深度学习的博士生

张祥雨做的第一个深度学习相关的工作,就是复现深度学习经典论文AlexNet。他花了两个月的时间对论文进行了复现,包括写完底层全部代码。复现 AlexNet 的经历算是深度学习的入门,当时深度学习的框架非常少,于是张祥雨干脆自己写了一个。2013年底 Caffe 问世,为了对 Caffe 的模型做兼容,张祥雨就把接口也改成Caffe一样,还起了个名字叫 Caffe Pro。它关键的一个亮点是支持图优化,支持多卡,这为后来 ResNet 的诞生打下了基础。

交大90后男神博士:3年看1800篇论文,研发成果超越谷歌,还入选福布斯精英榜

渐入佳境的科研生涯

在完成Caffe Pro后,孙剑就把何恺明、任少卿、张祥雨拉到一起做深度学习,在组队之前,何恺明做了图像重建和哈希计算,任少卿做人脸。经过一年的磨合,'何张任'组合在孙剑的带领下小有所成,ECCV、TPAMI 等国际视觉会议的论文中开始出现这三个二十多岁中国人的名字

这几位年轻人真正爆发是在2015年。当时包括谷歌、百度在内的大厂都在参加 ImageNet 大规模视觉识别挑战赛,当时人类识别图像正确分类的误差率为5.1%,谁能打破5.1%,就代表在这一领域机器超越了人类。而2014年最好的成绩是6.67%,由谷歌创造,但依旧没能实现5.1% 。'何张任'组合决心跟大厂们硬刚一下。事实证明,想要突破大厂们都还没打破的记录并非易事。

在刻苦钻研后,张祥雨推导出一组公式,后来在微软内部命名为'xiangyu初始化法'。接着,'何张任'组合又引入一种新的修正线性单元(ReLU),将其称为参数化修正线性单元(PReLU),并且通过对修正线性单元的非线性特征进行直接建模,推导出一种符合理论的初始化方法,并直接从头开始训练网络,将其应用于深度模型的收敛过程。

他们将这种方法应用到比赛之后,识别错误率已降低至4. 94%,超越了人类。不过,张祥雨认为,打破记录确实可以长点脸,但是并不足以证明AI直接超过了人类。随后,他们研发了ResNet,在当年取得了5项挑战赛第一。'何张任'组合在导师孙剑的指导下获2016年CVPR最佳论文奖,单篇引用超20000,ResNet 也成为计算机视觉领域最流行的框架之一

交大90后男神博士:3年看1800篇论文,研发成果超越谷歌,还入选福布斯精英榜

成长为公司的主力研发成员

2016年7月,孙剑加盟旷视,担任首席科学家,张祥雨也在博士毕业后追随导师,开启了在旷视工作的历程。而刚刚来到旷视,张祥雨便遇到了一个非常严峻的问题:产品落地较为困难,特别是在手机领域,实在没有一个靠谱的网络可以去依赖。

张祥雨和同事周昕宇开始一起,在前期的工作基础上提出了一个高性能模型Shuffle。二人以共同一作的身份中标了 CVPR,并且不论是从实验结果还是对业界的影响上,ShuffleNet 都是成为移动端网络模型的杰出代表之一。2017年,苹果推出带有 3D 人脸解锁功能的 iPhoneX ,安卓手机厂商随后跟进,ShuffleNet 凭借轻量级低功耗和高性能,成功拿下 OPPO、小米等手机大厂的订单,让各种配置不一的手机都能实现毫秒级人脸解锁。

在科研之路上,张祥雨的导师孙剑博士的建议起到了非常重要的作用。当年张祥雨还是博士生时,孙剑建议他做深度学习;2017年,孙剑建议他做高性能网络,2018年,孙剑建议做 AutoML。AutoML 领域的研究,之前一直是被国外如谷歌、微软等大企业'垄断'的状态。经过一年多的研究,2019年4月,张祥雨作为共同一作发表了旷视的第一篇AutoML技术论文。实验结果表明,在精度、内存消耗、训练时间、模型搜索的有效性及灵活性方面最优,超过了谷歌、Facebook 等公司的成绩。可以说,张祥雨的工作直接影响着公司未来业务。

在旷视研究院的工区,张祥雨的工位很难不被注意到,在他桌子上高垒着两摞纸,全都是他最近在看的论文。他说:'从2016年到现在,我已经看了1800篇了,看过的都用软件记下来。'粗略算一下,张祥雨平均每天看两篇论文。而这只是他每天做实验、管理团队之余,停歇片刻去做的事情。

交大90后男神博士:3年看1800篇论文,研发成果超越谷歌,还入选福布斯精英榜

张祥雨工位上厚厚的论文

2019年11月,张祥雨入选'福布斯中国30岁以下精英榜';今年4月,他又入选'AI 2000人工智能全球最具影响力学者'。作为西安交通大学的优秀学子,张祥雨也为后辈们提出了两个建议:脚踏实地以夯实基础,开拓视野以保持前瞻。他认为这两点是AI领域从业者的必要素质,而他一直身体力行。对于他而言,征途仍在继续!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多