分享

独家 | 亚马逊帝国的侧面:最赚钱的部门如何解放AI

 知行合一ing 2017-09-23

在当今全球新兴科技产业,谈到勇于开放前瞻、布局未来的领导人除了 Tesla 创办人 Elon Musk,肯定还会想到另一人,那就是亚马逊(Amazon)创始人 Jeff Bezos。

图丨Jeff Bezos

从 One Click Shopping 一键购物打响名号,到机器人仓储大军、无人机送货,以及 7x24 小时在全球 44 个区域运作、提供企业使用的云端服务 Amazon Web Service(AWS),亚马逊已经建立起一个网络帝国,尽管如此,这些似乎还是无法满足 Jeff Bezos。

于是,打造崭新购物体验的 Amazo Go 、逆向操作开了实体书店 Amazon Books 、以 137 亿美元高价收购有机生鲜超市 Whole Foods。自五岁就有对太空探险梦的他,也和钢铁侠一样玩火箭发射,不惜在一年内卖出价值 10 亿美元的亚马逊股票,资助旗下的太空公司 Blue Origin。不论是那看不见的网络服务,还是摸得着的线下体验,都让人见识到他的野心。

内部文化重视科学、数据优先

亚马逊之所以能成为传奇,除了 Jeff Bezos 的领袖风格之外,以客户至上(customer obsession)、数据优先(data driven)的企业文化绝对是关键。例如,在机器学习还不如当今火红的时候,Jeff Bezos 在 2003 年招募了斯坦福大学出身的机器学习教授 Andreas Weigend 出任首席科学家,尽管 Andreas Weigend 只待了一年多就离职,后续他曾公开表示:“Bezos 最大的创新就是把数据摆在企业文化的中心。”

图丨机器学习教授 Andreas Weigend

DT 君采访到一位曾经任职于亚马逊的华人机器学习科学家,不便具名的他透露,大体来说,公司内部运作分两块:零售(Retail)以及云端服务 AWS。跟科技应用相关可以分为两大板块,一类是工程(engineering),另一类就是科学。亚马逊内部文化非常看重科学研究,科学家是出了名的多——他们被赋予引导工程师执行方向的任务,因此地位也很高,工作就是完全专注于理论及前瞻科学的研究以及可行性论证。

他进一步指出,亚马逊目前非常仰赖三种人,首先是经济学家,早期亚马逊的电商业务相当倚重经济学家的预测模型,但近年开始大量招聘机器学习科学家和研究科学家(Research Scientist)

实际上,科学家散落在各个单位。例如,在零售部门就有一个很大的科技团队,其中最重要的职责就是供应链优化(supply chain optimization),可以说是研发方面最重要的部门之一。

不过,也有整个团队都是科学家,像是负责核心机器学习(Core ML)的部门规模至少超过百人,销售预测的团队也是百人以上,主要位在西雅图、纽约、德国,而 AWS 科学家主要位于硅谷的 Palo Alto,近来备受瞩目的智能语音助手 Alexa 则是由加州团队负责,运作相当神秘,连内部员工也难窥一二。

AWS 才是 Amazon 的主要获利来源

一般大众对于亚马逊的理解主要是电商,或者是智能音箱 Echo 及 Alexa。不过,打开亚马逊财报就会发现,AWS 才是贡献主要利润的关键部门。根据亚马逊最新一季财报(2017 年第二季),AWS 只占整家公司净收入的一成,但是其运营利润(operating income)竟高达 9.16 亿美元,远远领先北美电商(运营利润为 4.36 亿美元)——这已经是 AWS 连续五个季度超过北美电商。

更重要的是,不论是从营收或运营利润来看,AWS 几乎是呈现季季上扬的良好表现,可以说是为亚马逊持续投入前瞻科技研发提供了稳定的财务支持。

本月19日,亚马逊AWS宣布,从10月2日开始,将向使用EC2虚拟服务器的客户按照秒来收取费用,这意味着收费方式变得更加精致化,让客户更加精确地核算成本,并且更加审慎的使用EC2。

毫无疑问,AWS 不仅是亚马逊本身的聚宝盆,对全球诸多企业同样有重要的影响力。今年二月初,位于弗吉尼亚州北部的云端数据储存服务 S3 数据中心停摆四小时,立刻造成上千个网站及手机 APP 无法正常运作。

图丨在云服务市场,AWS 市占排名第一,大幅领先其他业者。(图片来源:Synergy Research Group)

现在,AWS 不只是要提供给企业稳定、具有扩充弹性的云服务,更放眼人工智能,将机器学习引入数据中心。因此,招募了众多的科学家及研究员,在 AWS 里拥有博士学位的人就超过 1,000 位。

这其中不乏大神级的人物——例如被誉为 Java 之父的计算机科学家 James Gosling 刚在今年五月加入,其他的大牛还包括在云端领域最具影响力人物之一的 Werner Vogels(现为亚马逊 CTO)、机器学习界大师 Alex Smola(现为 AWS 机器学习总监)、曾在 Netflix 担任云端架构师 Adrian Cockcroft(现为 AWS 云端架构副总裁)等。

不过,在男性为主的科技圈里,有一颗耀眼的“女星”令人关注,那就是从加州大学尔湾分校(UC Irvine)副教授加入亚马逊的 AWS 深度学习首席科学家 Anima Anandkumar。她率先投入张量(tensor)研究,加快机器学习的效率,她要为亚马逊达到 AI 民主化的目标。

图丨AWS 深度学习首席科学家 Anima Anandkumar(图片来源:DT 君)

首席科学家在做什么?

深度学习可以说是当今最红的名词之一,那为什么 AWS 需要使用深度学习?DT 君在硅谷专访了负责担任开发深度学习相关技术的 Anima Anandkumar,她告诉我们: Amazon AI 主要从事尖端研究,尤其是“解放云服务的效率”,从基本的基础研究开始,开发更好的算法、优化的软件框架(framework),让用户简单方便地使用机器学习。她的工作一言以敝之:就是让 AWS 服务跑得又快又好,设计可供客户轻松使用的工具。

举例来说,随着人工智能兴起,企业对于使用计算机视觉识别,或是打造一个聊天机器人(chatbot)服务,进行文字转语音服务等需求不断提升,AWS 借由将机器学习、深度学习引入数据中心,协助客户快速实现目标。

目前,在大量的的深度学习框架中,TensorFlow 和 CNTK 分别是由 Google 和微软所主导,Facebook 选择 Caffe 2,为了不替对手抬高声势,AWS 选中了基于开放原始码的 Apache MXNet 作为官方的深度学习框架,并且提供软件代码、文档,参与协助发展 MXNet 生态圈。

MXNet 源于卡内基梅隆大学和华盛顿大学,具备高可扩展性、开发速度、移植性等特色,支援深度学习模型中的各种技术,包括卷积神经网络(CNN)、长短期记忆网络(LSTM)。另外,亚马逊近期增加了动态图界面 Gluon,让开发者可以简单、快速编程。

Anima Anandkumar 也透露了两个她正在进行的专案,第一个是基于她先前的张量(tensor)研究。

当 Anima Anandkumar 加入 UC Irvine 担任教职人员,那时候是大数据革命的开始,大家正在试图找出能够大规模处理数据的演算法,以及做出有用的推论。她开始研究潜在变量(latent variables),“当信息不够多的时候,我们就无法发现一些被隐藏的因素,但是如果只是受限于运算能力的话,其实是可以被辨识出来的。”

矩阵最简单的意义是行与列,张量(tensor)则是高级的矩阵扩张,通过张量可以让多线性概念发展出很丰富的应用,扩展到更多维度,“如果你考虑一对变量之间的关系,这些就是成对的相关性,但是如果你想考虑三倍或更高倍数之间的关系,这就需要张量。”她在 AWS 就是在研究如何利用这一个特点来发现数据中的隐藏因子。

举几个简单的例子,A 和 B 在一个社群网络互结好友,可以通过这两个人的共同兴趣来推荐好友,通过这些演算法能够在一小时内,处理具有数百万个节点的大型图形。

另外,每一家企业都拥有大量的文件,假设不告诉你这些文件是什么,你没有先前的知识,那么你该如何分类呢?最简单的技术是聚类(clustering),但是在许多情况下,这些文件可以共享多个主题,像是新闻文章,它可能谈论政治,也许是外交关系、科学等等。张量其中一个应用就是学习如何快速、自动分类文档的模型。

在电脑科学里,经典的 Kruskal 演算法是一种用来寻找最小生成树的演算法,也让人知道能够通过张量来识别,也就是唯一性定理(uniqueness theorem)。“从此以后,深度学习跟如何能够大规模地解决非凸问题(non-convex problem)就产生了很深的关系。”

另一个正着手研究的项目则是利用张量来让深度学习变得更有效率,可以在多个应用场景中获得更好的性能。以及张量是否能解决强化学习(reinforcement learning)的问题,让演算法变得能具有适性化。智能的概念来自于能够适应环境变化,但多数的学习演算法却是被动的。

商场没有永远的敌人

一项只是为了满足内部使用的系统,却发展成整家公司主要的获利来源——这就是 AWS 的故事。

最初,亚马逊原来是想要帮助第三方供应商如 Target 、 Marks & Spencer 在亚马逊的电商引擎之上建立购物网站,所以推出一个 merchant.com 的服务,没想到想得太简单,导致平台一片混乱。

为了解决这问题,团队决定改为采用应用程序接口(API)的方式,再加上,当时亚马逊业务成长相当快,高层团队却发现,每个单位都在建立自己的系统。因此,内部决定打造一套通用的基础架构服务,可以进行分散式管理,虚拟化服务器及云端资源等——这就是 AWS 的前身。

到了 2006 年,亚马逊开始正式对外提供 AWS 云端服务,企业不必自己建机房、买硬件,只需要向亚马逊承租即可——这种弹性的公有云服务模式快速攻占了市场。很快,微软及 Google 纷纷加入战局,分别推出 Microsoft Azure 及 Google Cloud Platform(GCP),三巨头一直在云端市场展开激烈竞争,业界也不时传出微软调降收费,要抢 AWS 的市占率。

但前阵子有一个消息引起了骚动,就是亚马逊语音助手 Alexa 与微软旗下语音助手 Cortana 将在今年底互通,Echo 使用者可以对装置说:Alexa,启动 Cortana。尽管亚马逊跟微软在云端市场斗得激烈,但商场没有所谓的敌人,双方在语音助手领域携手有望做大市场。

对于 Alexa 与 Cortana 的合作,Anima Anandkumar 低调表示:我不方便评论 Alexa,不过,亚马逊文化是以顾客为中心,公司不考虑竞争对手,只专注于有利于客户和生态圈的事。

图丨AWS 在全球的数据中心分布(图片来源: AWS)

三云端巨头全球基础设施一览

数据来源:DeepTech深科技整理

图丨Microsoft Azure 全球数据中心分布(图片来源:Microsoft Azure)

图丨Google Cloud Platform 全球数据中心分布(图片来源:GCP)

通过云端实现 AI 民主化

云端服务巨头之间既竞争又合作,这很正常。不过,这些巨头近期又不约而同喊出新的口号——那就是人工智能民主化(Democratized AI)

微软在去年十月的 Ignite 大会,喊出人工智能民主化口号,Google 在今年三月的 Cloud Next 云端大会,Google Cloud 首席科学家李飞飞以“让 AI 民主化”为主题进行演说,而领导 Amazon AI 的 AWS 副总裁 Swami Subramanian 同样宣布目标是实现人工智能民主化。

对此,Anima Anandkumar 表示,所谓民主化就是通过云端服务解放 AI,让人人都能取用。因此,AWS 会让所有数据中心及服务都具备 AI 功能(AI enabled)。不过,目前只有部分数据中心支持。

这意味着,更多的企业需要接轨云端以提升商业竞争力,因为现在机器学习也上了云端,未来所有的事都会发生在云端世界里,“我们策略是以 AI 为中心(AI centric)”。

除了上述提及深度学习演算法及模型开发外,AWS 也率先推出 FPGA 运算服务 F1 Instances,让客户可以通过编程,为应用程式设计自订的硬件加速。每个执行个体最多包含八个 FPGA,依照使用运算容量和时数来收费。

不过,这项服务目前仅在部分的数据中心提供,后续会推广到全数的数据中心。

数学和舞蹈一样优雅

为了实现 AI 民主化,亚马逊除了协助企业用户快速打造支持深度学习的应用,也展开了许多计划,从基础研究、教学、学生项目与非营利组织合作等,帮助他们跨越障碍。“不过,比较可惜的是,女性目前在这个领域还是比较少。”Anima Anandkumar 说。

图丨谷歌云团队机器学习负责人李飞飞

的确,在科技产业,女性一直处于相对少数。Anima Anandkumar、李飞飞则是在数据科学、AI 领域的重要人物。

Anima Anandkumar 出生在一个理工家族,她的祖父是数学老师,母亲是电子工程师,父亲则是印度一流学府印度理工学院马德拉斯分校(IIT Madras)的机械工程师,后来自己创业,常常带着她到工厂晃晃,了解机器运作原理,“数学对我而言,很自然的就是一种交流和理解世界的语言。”

到了大学阶段,她就读 IIT Madras 的电机工程系,还跟同学一起向老师请愿,希望成立机器人社团(Robotics Club),之后就到了美国康乃尔大学攻读博士学位。

从求学到工作、从张量到机器学习,她始终与艰深的理论为伍,不过,她也是一名舞蹈家,从三岁就开始学印度传统舞 Bharatnatyam 的她表示:“我一直认为,如果我不是在科技领域发展,应该就是一个舞者吧。”舞蹈和数学给了她一样的感觉,“都是许多细节及韵律的整合,舞蹈通过编排组合达到优雅及美丽,这就跟数学一样,我们利用基础原理开发出新的算法,我在里头看到了优雅。”

图丨Anima Anandkumar从小学舞

随着人工智能在学界、行业界有所突破,很多国家也都积极提出相关政策。对此,Anima Anandkumar 认为,每个国家都有自己的应用点,不可讳言,目前美国在前端研究还是具有优势。不过,世界的脚步变化快速,许多组织及学校都推出相关课程,随着交流增加、教育推进,各个国家都可以累积 AI 实力。

与此同时,“印度和中国的优势就是年轻一代非常优秀且积极”,例如她今年到上海的经验,从打车到每一个生活环节,都让她感受到互联网的普及,这就是年轻一代的力量。“我想见证 AI 在世界的发展,比起先前其他的科技革命都更为普及,就是我的心愿”她说。

-End-

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多