分享

?探秘阿里巴巴信息技术发展战略【观察 】

 湘楚狂士 2015-02-23

新朋友:点击标题下面蓝色字 ?“软件定义世界(SDX)
老朋友:点击屏幕右上角●●●,分享该文章至朋友圈。


新陈观察
   

阿里巴巴构建起面向未来十年的计算基础设施(云计算)和数据基础设施(数据存储、标准和规范,暂称为马云讲的DT)。


有关云计算的认识,我写过一篇“云计算为何叫好不叫座”(回复20140308查阅),核心观点是:如火如荼的消费IT领域的云计算是“隐性的云计算”,大家虽能体验得到,但意识不到;而面向企业IT领域的“显性的云计算”,涉及到企业应用系统的重新设计,设计架构迁移、重新设计等问题,是一个漫长的过程,即使亚马逊也才每年获得20亿美元的云收入,阿里大概在6亿元左右,与谷歌的500多亿美元(预计2014年)、腾讯的500亿人民币(预计2014年)的隐性云收入相比简直不值得一提。


有关数据或者大数据的认识,我门看下淘宝网上店家应用大数据的例子。2013年6月,我到阿里巴巴调研过一次,我相信国内500强企业的大数据应用都不如淘宝上的店家。因为阿里巴巴为他们搭建好了很好的数据基础设施(DT),规范了各种物品数据、消费行为数据、流量数据,阿里巴巴应该有数百名数据工程师研究、分析、实践这些问题,还有围绕阿里巴巴大生态系统上700家提供数据诊断、服务的企业(如访客热力图分析、客户购买行为分析、商品价格分析等等),国内即使中国移动、工商银行又有多少数据工程师呢?


本篇是《ITVALUE》的张宇婷根据实地调研、访谈撰写的有关阿里巴巴信息技术发展战略的深度分析文章,无论您是政府行业管理者、企业管理者还是从业人,都建议您深入阅读下,未来十年信息技术架构应该就是阿里巴巴这条路子。


by:陈新河


【观察+】探秘阿里巴巴信息技术发展战略

文:张宇婷,原载于《ITVALUE

探秘阿里·Day1:马云确定“从IT到DT”战略


阿里的“从IT到DT”战略是什么?

阿里的未来将由“云计算+大数据”组成。阿里正在建设一个大数据环境,让数据变成工程,围绕数据提供一整套的精细化服务。云计算使中小企业可以在阿里云上获得数据存储、数据处理服务,也可以构建自己的数据应用。阿里的大数据开放之后,线上线下的数据能够串联起来,所有人都是数据提供方,也是数据的使用者。

马云已经在整个数据应用上确定了两个方针,第一从IT到DT,从管理、控制到点燃和激发,DT就是点燃整个数据和激发整个数据的力量,被社会所用,被销售所用,为制造业所用,为消费者信用所用。第二个让阿里巴巴的数据、让阿里巴巴本身今天所有做的这些工具能够成为中国商业的基础设施,能够成为整个中国经济变革的正能量。

在阿里数据平台事业部的服务器上,攒下了超过100PB已处理过的数据,约等于1.04亿个GB,相当于4万个西雅图中央图书馆,580亿本藏书。淘宝和天猫每天会产生丰富多样的数据,阿里巴巴已经沉淀了包括交易、金融、SNS、地图、生活服务等多种类型的数据。这些数据相互关联或产生巨大的能量。

阿里大数据类型最丰富的应用是什么?在小微金融企业融资领域,由于银行无法掌握小微企业真实的经营数据,不仅导致很多企业无法拿到贷款,还因为数据类型的不足导致整个判断流程过长,阿里已经通过交易、信用、SNS等多种数据来决定是否可以发放贷款,发放多少。贷款申请人像在ATM机上取款一样,一提交货款的申请时,即时就能获贷、支用,整个流程在网上实现。

对于马云所提到“云+端”到底什么含义?阿里巴巴集团商业智能部副总裁、数据委员会会长车品觉解释:云有两个很大的功能,一个是他的计算能力,一个是他的储存能力。端是终端,手机、PC、可穿戴设备。能不能利用云的计算能力与储存能力,快速计算到端去用,非常考验云的计算能力跟储存能力。如果我们做了一个数据模型,猜到一个人在他现在行为里面,有人用了他的手机,但是用这个手机的人并不是他的。在这种情况下,能不能停止他的手机使用。就是实时能从计算得知的。但是端到云的时候,他是收集及时的数据给到云那边,让云那边能够存储关于判断刚才这件事情的能力,所以端到云、云到端的数据是流动的。端的能力在于收集,云的能力在于计算存储,是一种循环。



数据开放规则

小微金服集团首席风险官胡晓明总结阿里目前大数据开放必须解决2个问题。第一,必须要给全球的数据开发者一个数据的工作平台,阿里分布式的存储平台和在这个平台上的算法工具,足够形成数据开发。第二还没有做好数据的脱敏,把数据的商业定义,每个标签打得足够清晰,能够让全球的数据开发者在阿里巴巴平台展开数据思维,让数据为政府所用、消费者所用、行业所用,这一点阿里还没准备好。

车品觉对数据开放的态度是:阿里如果认可一个BU,他首先要数据开放,首先去谈这个项目的时候,必须要上报给到数据的安全小组。安全小组就会有安全的专家开始去看案例的本身是不是合理的开放,而且有没有侵犯个人的隐私以及商务的隐私。有时候虽然包括了表面上没有侵犯隐私,但是后面出现了侵犯隐私也不会给他开放的,所以我们要数据安全小组一起参与。我们会把这些案例积累在档案里面,当时我们的判断是因为这样,为什么我要判断不给,将来这种可能都成为案例,为判断做积累。

车品觉还提出了自己思考的大数据十诫:认为当下大数据有十点最需要考虑:1、好的问题,答案就在里面。2在实践中提炼数据。3让数据变成Technology,Enable更多人。4让数据跟着“人”走。5木有数据质量,神马都是浮云。6以假设数据都能获取去思考问题。7大数据安全,不是监管。8利用数据拿到更有用的数据。9建立数据的数据,才有进步。10让人做人擅长的事,让机器做机器擅长做的事。

修正经济学理论

比较有趣的是,在首届西湖品学大数据峰会上,小微金服集团首席风险官胡晓明并没有针对金融领域详谈大数据应用,而是分享了对大数据的宏观思考。他发现大数据带来四个巨大改变:

第一,当数据出现以后,市场经济和计划经济之间,哪个是对的,哪个是错的?在亚当斯密或者金融学这个时代,是没有数据的,没有人的行为数据,没有社会的数据,没有资金流的数据。但是,今天有了数据以后,很多经济学的一些基础理论甚至可能会被修正,原来我们所有的在商业行为当中,都是有了先生产或者先制造才会有销售行为,但今天有了互联网,我们产生了先有销售行为,才会有制造行为,他会影响到整个供应链。

第二,数据没有大小之分,数据只有是否被商业认知之分。很多人对阿里巴巴的数据垂涎欲滴,认为有大数据以后才能做。当年带领团队做小微企业信贷,我们去看消费者信用的时候,所有的金融从业者都在笑话我们。但是通过整体的大数据,已经为70多万家小微企业贷了款,整体贷款累积量是1800亿,没有见面,包括西藏的、新疆的,山东的、云南的,用的就是数据,尽管没见见面,但是我们的风险率和不良率比商业银行还要低,而且我们今天是没有抵押和担保的。我们在分析很多消费者的金融行为,目的只有一个,让数据能够产生商业价值。

第三,阿里巴巴对数据的未来看法是:要让数据激发它的活力,让数据成为一种信仰,让数据发挥它的商业价值。

第四,是关于数据的消费者的隐私保密问题。随着互联网的开放性,特别是移动互联网,数据、个人的隐私性数据,你的身份证、电话号码,你的相关的数据,甚至连密码都可能存在泄露。在数据不再隐私的情况下,怎么去保护消费者的整个资金安全、帐户安全,我们在研究这个课题。

阿里的大数据是否也有自己的困惑?集团副总裁叶鹏: 面对每天产生的巨大的量,我们的心情第一是感到很欣慰,因为我们具备了那么多的数据。第二我们也感到很敬畏,因为我们真的不知道,这个当中蕴含着什么,这个当中价值怎么挖掘。

阿里巴巴平台上面,平均有超过1亿的消费者,几亿的商品数,上千万的商家。他们之间的互动,他们之间的行为、交易,是无价之宝,可以帮助商家更好地提供服务于商品。网站上面纸尿裤的销量某一个区域如果婴儿的纸尿裤量上升了,那么肯定是婴儿的出生率比较好,但是从另外一个角度讲,如果一个区域老年型的纸尿裤量逐步上升,就说明这个区域实际上已经开始步入老龄化了。站在更宏观的角度来看,很多数据实际上是可以提供很多社会和经济的价值的。包括对产业有指导意义。(文/张宇婷)

探秘阿里·Day2:云生态上的新商业模式

文/张宇婷

采访人物:阿里云业务总经理陈金培
阿里年龄:10岁
历任:网站运营、平台和产品规划、销售团队、B2B部门
采访地点:撒野地

“垂直的产业形态加上流动的数据生产资料”这是阿里云业务部总经理陈金培为我描述的云生态体系,听起来有些晦涩,但在这个丰富的云生态体系上,每时每刻都在衍生出新的商业模式。阿里十年,金培最大的感受是世界变化太快,面对云计算丰富的生态体系,他每天都能观察到快速崛起的新商业世界。
在阿里,金培的工作是如何把云计算变成一个优质服务递送到客户手上,对客户认知云计算、到购买、售前和售后整个过程的润滑。当我问及如何说服企业领悟到云计算真正价值时,金培回答,他并不急于说服CIO非得接受公有云的这个思想,市场的成熟会逼着CIO转变。但他认为今天的CIO才发挥了真正的价值,CIO要做的事情不仅仅是如何规划公司的IT架构,更多的是把公司里面的这些真正跟业务相关的数据资源,信息资源更好地利用起来,去驱动整个公司业务的成长。
意外得知金培最喜欢的电视剧是《还珠格格》,“这部剧里的所有角色都心怀梦想、充满激情、懂得信赖”金培说这也是他带团队的方法,他愿意做一个又傻又天真,又猛又持久的阿里人。

Q:我们可以从哪些维度描述一个云计算生态体系?
A: 像电一样,要有很多电器,这个电器其实就是云计算上面的应用,这些应用是要第三方的人来开发的,这些人一方面开发应用,一边可以享受到云计算带来的各种各样的好处。另外一方面,一些传统的行业,他们需要在别人的帮助下迁移到云计算上面,所以怎么样培养一大批基于阿里云的合作伙伴,是我的很大一个工作重心。
云计算未来会在各个领域形成新的垂直整合产业集群,就如同以前传统经济里所叫产业带,比如说像福建专门生产鞋,像宁波专门生产衣服,他其实是一个产业的垂直整合,从原材料到生产商,销售的体系及配套的服务。
云计算也是一样的,未来云计算会成为新的产业集成平台,在这个集成平台上面,会产生一个一个垂直的产业集群,就像聚石塔和聚宝盆,就是典型产业的垂直整合,这里边有几个要素:第一,云计算作为一个基础的平台,是一个新产业的基础设施。第二,各种各样的数据和API基于云计算的平台开放出来,其实相当于有传统产业里边的生产资料。这个里面光有一个基础设施和原材料还不够,要让更多的人参与进来共同建设这个产业,就象聚石塔里有很多ISV他们在云上可以便捷的基于淘宝的数据和API,构建他们的应用,服务更多卖家,逐渐形成垂直的产业聚集。
这里面的人相互依存,少了一环可能都转不起来。聚宝盆其实也是一样的,聚宝盆就是在金融领域的垂直整合,底层是阿里云,上面既有支付宝各种各样与金融相关的接口,也有很多服务金融业务的ISV,有证券的,银行的,基金的,我们共同为上层的银行、证券和基金客户服务。
现在,这些垂直产业集群还比较初级。未来生态里面的流动生产资料不仅有淘宝、支付宝的这些数据,平台上的商家产生的数据也会在这个体系里面流动起来的,他们之间的数据一方面跟淘宝支付宝在交互;他们之间也会发生交互,产生很多新的交叉增值,有可能是新的业务,有可能是新的产品,有可能是新的服务。

Q:您怎样看阿里云与阿里数据开放的关系?
A:实际上我们可以把数据理解为一种生产资料。阿里已经在数据开放上做了很多。
真正的数据开放要有好的技术支持,能把原始数据整合好,挖掘出来,产生真正有意义的数据。还要有安全的机制,又不触犯法律的规定。同时,数据开放也必须有商业模式,要让数据真正转起来。未来云上的企业数据交互,就是建立在平台和商业模式的基础之上。
当然,数据的开放还取决于市场的成熟度,目前真正有可分享数据又愿意分享的人还不多。但随着越来越多的企业接入互联网,随着数据在爆发增长,人们会逐渐认识到这一点并会逐步进入到分享的行列中。

Q:为什么说99%的企业拥抱互联网的唯一途径是云计算?
A:云生态的形成如同所有产业变迁一样,都是一个过程。云计算是企业互联网化的唯一机会。大部分人认为云是IT基础设施,没有把大数据和云结合起来,对于这个理解有两个重要的理解需要更正:其一大数据是在线的数据;其二数据变成生产资料是可以交换的商业模式,如果企业内部的数据不和行业相通,就融入不到产业环境中。CIO不仅要规划公司的IT架构,更要把数据和业务资源利用起来,驱动业务的成长。
有很多人单纯把云计算作为一个基础设施,但实际上他把云用小了,因为所有的产业竞争都是生态系统的竞争,你要么依附于一个生态,要么自己发展出来一个生态。云计算今天正是新的产业迁移的时候,你会有这么一个机会,重新在这个产业里,在新的经济形态下面去站位的一个机会,你站在哪个生态上面,决定了你后面几年的发展会是什么样子。
三年前上线这个aliyun.com网站的时候,别人都不懂我们为什么把云计算公司定为以数据为中心。其实我们从那个时候就看到了云计算和大数据是天然在一起的。99%的企业拥抱互联网的唯一途径是云计算,这是一个条件,传统产业迁移到互联网的模式,云计算是唯一的方法。第二,数据的处理存储是需要有云计算这样的平台,这是云计算对社会带来的意义,会推动大数据时代的到来,这个是非常关键的,未来数据确实会成为生产资料的,生产资料一定要交换加工,分享,才会产生价值,这是我们当初说阿里云是数据第一分享平台的本质原因。

Q:阿里云与东软的合作背后有哪些细节可以分享?
A:东软是中国传统IT市场上最大的一家公司,从人员的数量和销售额、市值各角度看都是最大的,这也是这次合作倍受关注的原因之一。以前东软的解决方案是基于IOE(IBM、Oracle、EMC等传统软件硬件),以后则会基于阿里云平台。阿里和东软都有一张运营数据图,从数据上看东软和阿里都服务了将近10亿人,而员工都是2万多人,东软可能更多一些,但不同的是阿里的的运营数据图是活的,实时的,流动的,可运营的。 
其实一个最核心是说,阿里拥有的是实时可运营的数据,而东软以前的数据不可运营,不能交叉产生新的商业价值,所以东软和阿里云合作是实现自我转型,逐步成为一个解决方案提供商,变成一个服务运营商的过程。未来他可能不光给客户提供一个解决方案,他还可以帮这个机构运营对客户的服务。基于阿里云这个平台,这些服务天然就是接入了互联网,而且不用过多考虑互联网的基础设施相关的事情。
当然,东软也看到了云计算一定是一个趋势,他们也决定了自己不会做云计算基础平台。其次,他们发现有很多客户主动问你可不可以用云帮我做解决方案,还提到阿里云不错,所以这个合作就一拍即合。和东软的合作是时代的必然,也是一场传统IT的颠覆之旅。
面对的挑战肯定会有的,一方面东软自己要转型所面临的挑战。其次是整个云计算遇到的挑战,就是传统的IOE的厂商,他们还是会去维系原来商业模式,包括私有云或是包装一个新的概念,这是整个产业在迁移的过程中都会遇到的阻力。

Q:您如何看待AWS入华,亚马逊是否会影响到阿里云在中国的市场?
A:我觉得亚马逊进来是有好处的,他让所有的人都知道云计算是未来,云计算是一种公共服务,在这一点上和我们的认识高度一致,他的到来让更多人开始关注云计算这件事情了。 
亚马逊也是我们在云计算领域的榜样,但在中国推出更好的公有云服务还会面临几个挑战:,第一件事情是网络,如何构建优质的网络 。第二点是安全,这个安全不是指国家安全的层面,就是本身企业的跑在云计算上的业务安全。第三是备案,就是信息安全问题。我们相信有了亚马逊的加入,

Q:您怎么看现在的传统IT市场的变革?就是在这一场变革中,谁会站在下一个浪潮之巅?
A:IT的变革是非常的深刻的,就象传统的解决方案供应商,从卖一个解决方案给人家做维护,变成一个服务的提供商,IT服务的提供商。这种转变对他们是有好处的,他们会跟客户的业务、运营会更紧密,把一个买卖交付的过程变成一个长期的战略合作。
与此同时,小的IT厂商也要面临挑战,不仅因为大的IT厂商有经验做好服务和运营,也云计算带来的服务交付便捷性,会让以前做本地生意和本地服务的小厂商生存空间会越来越小,本地化优势没有了,所有的东西都会在云上面完成。小的IT公司未来也会面临基于云的转型,单纯做软件的公司也一定会转变。
一些硬件提供商,就像IBM、HP,戴尔、联想、浪潮等,他们的生意模式会变成从零售变成B2B,以前他们其实他们的服务器是卖给一个一个企业,但以后单个企业其实不再买服务器了,他们要面对的是像阿里巴巴这种大的企业,阿里云这种大的服务商。他们生意会比以前难做,难做是在于像阿里云这样的大企业要求会很高,议价能力会很强。好处在于只要技术好,搞定几家客户,就可以占领较大市场份额。

探秘阿里·Day3 硅谷来的工程师:We believe in it

文/ ITValue 张宇婷

此刻,采访进行到第三个问题,我已预感到坐在对面的这位年轻小伙-唐洪,是一位智商极高,颇具挑战的采访对象。采访之前得知,唐洪对待所有经手审阅的文字会精细确认到每一个标点符号,与检查代码如出一辙。
唐洪是谁?先说飞天。
如今“飞天”已经成为阿里各业务部门频繁提及的词汇。阿里大数据的计算能力依赖于飞天技术平台;双十一、三八节,每一次促销活动背后,架设在飞天之上的聚石塔平台支撑了一笔笔交易的完成;此外,余额宝、阿里金融、聚宝盆等业务顺利展开也和飞天密切相关。
唐洪第一次听到飞天是2009年,那时候他还在美国雅虎,对阿里能做成飞天表示了高度怀疑。一年后,他却在阿里云计算CEO王坚博士的“忽悠”下,离开了硅谷,加盟阿里,成为飞天的技术负责人,带领美国、杭州、北京多个团队肩负阿里云计算整个技术底层的研发至今。2013年8月,服务器规模达到五千台的飞天集群正式上线(内部叫做“5K”集群),阿里巴巴也因此而成为中国第一个独立研发拥有大规模通用计算平台的公司。在此之前,全球仅有以谷歌为首的屈指可数几家公司拥有这一技术能力。
当我把技术、管理以及关于IT趋势的问题抛给他时,唐洪会先开朗一笑,然后转一圈炯炯有神的眼睛,琅琅作答。期间穿插着各种硅谷创业公司和各种IT技术英文。这是我在阿里西溪园区采访的第三天,唐洪的回答信息量丰富、逻辑缜密,让我兴奋起来!

硅谷来的工程师
2010年底,唐洪加入阿里巴巴。最早,他在硅谷的Ask.com做底层分布式系统,这是北美第四大搜索公司。当这家公司决定逐渐放弃自主研发底层技术,而是向谷歌购买搜索结果再做上层应用定制时,唐洪去意渐生。
  唐洪接下来的东家是雅虎,他在那里做大规模分布式计算系统Hadoop。“2010年的时候雅虎在Hadoop上的投入也在逐渐减少,而当时雅虎已经确定了把所有与数据相关的业务和处理都搬到Hadoop上。越来越繁重的业务压力,让程序员们为支持线上系统疲于奔命。所以我们有很多好的想法,都无法实现。”
  在雅虎的经历,使唐洪开始重新思考自己的职业发展:是放弃自己执着多年的东西去一些新领域尝试新的技术挑战,比如当时在硅谷火热的社交网络Startup;亦或加入一家真正有决心和坚持的公司去共同攀登大规模分布式计算系统的技术巅峰。
  在美国, 谷歌、 微软、亚马逊的分布式底层已经比较成熟了,而当时阿里云做了两年的“飞天”项目还处于起步阶段,整个系统有很大提升空间,唐洪认为这是一个机会,跟王坚博士的一通越洋电话,让他感受到阿里对做成云计算的决心。国内也有其他大型互联网公司向他伸出了橄榄枝,高层面谈,对方率先发问“你打算如何做到降低成本”的时候,唐洪意识到这个将结果当作目标的认识,显然低估了做云计算的难度。
“世界上除了谷歌、微软和亚马逊,就只有阿里了,我们找不到第五家公司能有决心长期投入在自主研发大规模分布式系统上。”

   谷歌、Facebook、亚马逊与阿里云:We are doing something different 
   对比阿里的云计算与目前发展最成熟的北美大公司,笔者归结为勇于向优秀的先行者学习,发挥阿里集团电商优势,积累丰富的本地化服务经验。
  阿里云飞天更接近谷歌的底层架构,将所有的存储放到统一体系下,利于提高资源使用和数据交换提炼的效率。亚马逊则将几个垂直服务独立并行,例如S3、EC2以及EC2对应的EBS均是各建存储系统的垂直体系。在服务上,阿里云充分借鉴亚马逊通过Web API接口,用互联网的方式向开发者提供服务。
  微软则背负着已有巨量企业级客户的business目标,如何保住原有用户,使其顺利迁移到其Azure平台上,不无掣肘。
  当然Facebook也是分布式计算系统的实践大家,追求实用性决定了Facebook的拿来主义风格。不用太多精力自主研发,采用MySQL、Hadoop、HBase等多套系统支撑,对于领导研发大规模分布式系统技术来驱动业务并无野心。
  谈到对做云计算的决心,谷歌似乎并没有将向公众提供计算能力作为战略重心,这是因为云计算与其公司“organize the world’s information”的使命联接有限。唐洪认为,阿里云跟亚马逊一样有“believe in it”的情怀,对于产业的判断也将不局限于电商领域的视野。
   AWS入华对阿里云的影响,是我此次采访最常问及的问题。诚然亚马逊的影响力必将让云计算公共服务的理念更加深入人心,起到与国内公司共同教育市场的效应。唐洪坦诚说到,短期来看,由于市场足够大,竞争不是最大的问题。亚马逊在技术、产品的成熟度上强过阿里云,阿里云在机房管理、带宽部署、运维人才储备、本地化服务体系的积累上都留给对手不小的挑战,为阿里云的产品打磨追赶提供了条件。
   “将云计算在美国运维好和在中国运维好,These are two different things.”

“飞天”=阿里云技术体系
  飞天是整个阿里云的核心技术部分,唐洪对她的定义是“飞天等同于整个阿里云的技术体系”,是云计算的后台。飞天由两部分组成,底层管理数据中心的资源,把数据中心里面的物理机器管理起来。上层是以Web API的方式为开发者提供服务。飞天提供的服务归根结底是计算和存储两类,表现为阿里云目前主要的产品,未来还将产生更多的服务。 
   提到做云计算的困难,唐洪认为,首先是人,国内有分布式系统经验的人不多。当时的团队里只有少数工程师在谷歌或微软算是做过或用过分布式系统,所以整个研发的过程是一个探索学习的过程。只有遇到实际的问题,团队才会对工程上的难题有所领悟,这个是没有办法可以走捷径的。对于其他公司已知的经验,也需要审慎对待,不能盲目照抄。有些功能是在第一天开始就要做?还是等到有了具体需求再计划?都需结合业务场景和研发力量综合考虑。
   其次,唐洪认为云计算是实践科学而非理论科学。在系统设计的时候,工程师会设定相应的工作场景、硬件环境的完备性。但在实际生产环境下,各种硬件环境、参数配置,往往会打破设计时的假设,因此总是会碰到各种问题。在解决这些问题过程中积累的经验,显然不是教科书上可以学到的理论。
   第三,云本身的运营和服务也是一个非常挑战的事情,从专注于解决单个集群的技术挑战,到服务好迅速增长的客户群,“我们对云计算的理解逐渐丰满”。提供7×24小时的公共服务,和支持内部应用的底层支撑系统,有很多不一样的地方,甚至可以说挑战更大。对外服务是很大的事情,需要技术和业务部门协同持续提高和运营。我们在借鉴了一些亚马逊的经验同时,不断摸索积累经验。
  
   移动互联网、数据、云是铁三角,“Triangular Match” Made in Heaven
  早在2008年,阿里集团已经将大数据、云计算作为战略,确立了阿里云做“以数据为中心的云计算”的愿景。近期马云的内部邮件,明确“云+端”战略,打造“数据”公司,舆论或许有些意外,唐洪却认为这是水到渠成,集团过去五年多对云计算的默默坚持,走到今天公司各业务对云计算越来越Open。
  大数据是原油,工业时代可以从原油中提炼出各种原油产品,参与了工业发展的诸多环节,深刻影响了许多产业的发展。而云计算则是提炼原油的炼油炉,提供数据加工的计算能力。移动互联网本身就是互联互通,产生数据并与云联接,当然云上也会产生数据反馈到移动互联网端。
  未来有活力的端,一定是与云相联的!
   
Q&A
Q:为什么要把飞天平台架设在华数的机房里?
A:与华数的合作,是优势互补的选择。一方面华数在数据中心的物理建设和管理上经验更加丰富,而造房子并不是阿里云的优势。我们的核心竞争力是大规模分布式计算的技术,做好飞天是我们的优势。另外,华数也有很大一部分需要应用云计算的用户,如政务、教育、医疗、交通等领域客户的转型升级,都需要用到云计算的能力。今天,中国有许多运营效率不高的IDC数据中心,我们也希望通过这样的合作,来尝试将飞天平台部署到第三方的IDC数据中心,帮助他们提升运营效率,从而改变中国IDC产业的格局。
  
Q:如何理解云计算是互联网、移动互联网发展的基础设施?
A:首先,互联网业务本身的应用特性要求较大的规模,传统单机无法满足。
  第二,互联网的业务发展不是一个可预期的平滑增长曲线,很有可能在某一个阶段,遇到爆发点,后台计算和存储的需求也很难预测,云计算的灵活弹性刚好满足了这一需求。当业务爆增时,无需重新架设硬件服务器,雇佣更多的运维人员,这无疑是更低成本更高效的解决方案。
  第三,绝大多数人其实对于IT架构的持续维护、软硬件升级的挑战是相当低估的。往往系统开始架设好没问题,等到跑了几年之后才发现各种硬件更新、软件升级的IT维护是非常繁琐的工作,更不用说如何在升级过程中保持服务不中断。而云计算作为基础设施公共服务,在一开始就考虑到整体平台的升级,用户只需要在网页端做简单的指令,即可以在不中断服务的情况下,顺利的在线迁移。
  第四,对于互联网创业者,云计算把机房部署、多线网络接入、DBA等等大部分IT的活都干掉了,可能需要的IT人力也省掉了,创业者可以将更多精力和资本投入到产品创新上,能帮助项目快速实现的同时降低最初的投入成本。
   云计算会改变一批创业者的生存环境。美国硅谷的创业公司大部分都在云计算上发展,云计算让他们无需建立专业的IT后台团队,几台虚拟机足以满足创业初期的需求。中国的IT环境对创业者来说更加恶劣。中国不但IT人才更短缺,比如DBA;而且连合格的机房条件,网络条件都很难保证。 
  
Q:开源技术已经很火热了,为什么阿里一定要做自己的“飞天”呢?
A:很多人认为开源可以让你在技术上走一些捷径,我认为需要从几个维度看这件事。首先,云计算是一个是需要有技术含金量的business。对于这类business,关系到核心竞争力的技术,决定了你与竞争对手本质上的差别,所以必须自己能掌控。我们为什么一定要做飞天,因为云计算本身有很高的技术门槛,产品的80%~90%都是技术,这个云计算后台的核心技术一定是阿里云的核心竞争力,我们要有很好的把控力。我不认为Hadoop是一个能够把控的东西。
  开源可能在某些领域,比如说一些桌面级的产品,一些small scale的系统上可以满足需求,大规模的分布式系统很难用开源的方式做好。即便有分布式系统背景的人能开发出来,也需要相应的环境去做测试,而大多数人或公司是没有条件在几千台机器上去做验证的。当时很多人用雅虎版本的Hadoop,就是因为雅虎的版本是在雅虎的几万台机器上验证过了才会发布。事实上,几家做Hadoop的startup公司最多是在几百台机器上验证过,到底能否在几千台机器上跑得好,是要打一个问号的。因此用开源软件做分布式系统是不现实的。
  今天基本上所有采用Hadoop的规模比较大的公司,用的都是定制版的Hadoop,比如Facebook、EBay、雅虎等。他们维护自己的版本分支,然后自己再打补丁。开源可以在一开始让你走一些捷径,但事后不断打补丁,依然要花费很大的精力,此后再想要跳到新的Hadoop版本上是非常困难的。
第三, Hadoop本身缺乏一个类似Linux社区里Linus Torvalds这样比较权威的一个人物去把控这个社区(这样的人有个名字叫做Benevolent Dictator)。Hadoop社区里,因为利益驱使,大家很难达成一致,在一个vision指导下研发。像微软、亚马逊、谷歌的云计算平台都没有用Hadoop,也都没有把自己的代码开源出去,本质上的思考跟我们是一样的,Hadoop是无法作为一个云计算底层平台基础的。另外一方面,云计算服务商真正自己研发的东西也不会开源出去,因为这是他们的核心竞争力。纵观计算机产业历史,一般都是第二、三名把代码开放出去,希望联合力量颠覆掉第一名,这是他们的战略,但没有人会把自己最核心的知识产权完全开源出去。 
  
Q:平时您如何学习?
A:互联网是一个很重要的获取信息的渠道,通过它观察各个产业可以学到很多东西。如果说要读书的话,我可能会看各行业一些具体公司成长历史,比如关于谷歌的书,星巴克的书。有些新兴产业没有书可参考,比如像Tesla,我会想办法去搜集相关的资讯,并将他周边的信息关联起来,去理解这个产业会是怎么样的变化。

Q:现在阿里云已经完成了飞天这样的一个大的目标,下一个更伟大的目标是什么呢?
A:飞天谈不上“做完”,今天做到了5000台,下次可以10000台,这是一个规模上的事情。另外成本是很重要的东西,在容灾、服务的质量、性能提升上,还有很多事情要做,再做个5年、10年也是有可能的。

 如果您认为该文章不错,请转发至朋友圈。分享知识,分享快乐!


【软件定义世界(SDX)】2014年2月份不容错过的TOP10:

“查看信息”中,回复日期代码即可。

回复“20140301”-->互联网的未来【PPT】
回复“20140302”-->大数据信用评估【深度专题】
回复“20140210”-->德勤:大数据时代下的新商务战略
回复“20140304”-->邬贺铨:大数据时代的发展趋势【院士大数据论坛】〖NO2〗
回复“20140218”-->马化腾2013十大总结:移动互联网是一场巨大的颠覆【企业+】
回复“20140303”-->李国杰院士谈大数据时代的国家治理【院士大数据论坛】〖NO1〗
回复“20140228”-->安筱鹏:2014美国消费电子展(CES)深度分析报告【研究报告】
回复“20140306”-->『独家』倪光南:迎接大数据时代的来临【院士大数据论坛】
回复“20140207”-->大国的兴起和衰落
回复“20140301”-->从丰田凯美瑞暴冲看软件定义汽车的复杂性【周末阅读】


订阅“软件定义世界(SDX”后,阅读更多精彩文章。“查看信息”中,回复【  】内数字快速到达。

《软件定义世界,数据驱动未来》(订阅人数S=4,一周阅读人数W=6681,转发率R(分享转发人数/图文页阅读人数=10.27%,下同)【001

《国务院副总理汪洋眼中的大数据》(S=349,W=16719,R=6.33%)【002

《2013年世界软件产业发展回顾与展望》(S=223,W=1625,R=9.78%)【003


软件定义世界(SDX)

软件定义世界(SDX),数据驱动未来(DDF)!

微信公众号:软件定义世界(SDX)
微      信   号:SDx-SoftwareDefinedx

                                      
软件定义世界(SDX)由陈新河运营维护,本人在IT领域超过15年的观察和思考,产业数据控,同样的数据不同的思考!IT思想贡献:互联网是以人均GDP为基数的产业,移动互联网是以人口数为基数的产业;首次量化移动操作系统平台经济,首次提出Android微生态概念。现供职于工业和信息化部电子科学技术情报研究所,任中关村大数据产业联盟副秘书长。
希望在各位朋友的鼎力支持下,共同把软件定义世界(SDX)打造成大数据思想的策源地、政府和企业家的智库、连结创业者与VC的桥梁、从业人员的加油站。

                                      
投    稿     邮   箱:sdxtime@gmail.com
我的个人微信号: sdxtime



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多