《纸牌屋》背后的大数据生产力 一辆车撞到了邻居家的狗。安德伍德蹲下身查看狗的伤情,然后面对镜头说:“世界上有两种痛苦,一种让你更加强大,另一种毫无价值,后者只会徒增折磨。我对毫无价值的东西没有耐心。这种时候需要有人采取行动,做一些不好的事,也是必要的事。” 安德伍德掐死这只受了重伤的狗:“好了,痛苦消失了。”随后,他盛装出席了白宫的新年晚会。 数据预测未来 Netflix是一家美国公司,在美国、加拿大提供互联网随选流媒体播放,定额制DVD、蓝光光碟在线出租业务。该公司成立于1997年,总部位于加利福尼亚州洛斯盖图,1999年开始订阅服务。2009年,该公司可提供多达10万部DVD电影,并有1千万的订户。早在2007年2月25日,Netflix宣布已经售出第10亿份DVD。现在Netflix 在美国有 2700 万订阅用户,在全世界则有 3300万,它比谁都清楚大家喜欢看什么样的电影和电视。有研究表明每天的高峰时段网络下载量都是出自Netflix 的流媒体服务,去年人们在网上看流媒体视频的时间比看实体DVD 的时间还多。每天用户在Netflix 上产生 3000万多个行为,比如你暂停、回放或者快进时都会产生一个行为,Netflix 的订阅用户每天还会给出 400 万个评分,还会有 300 万次搜索请求,询问剧集播放时间和设备。 从成立伊始起,Netflix就把计算作为公司的核心竞争力和发展战略的核心。通过推荐引擎、数据算法等方式,Netflix可以提前知晓观众喜欢看的内容,从而进行准确的影视内容采购,此外流媒体的广泛应用彻底改变了观众以往静态守候电视节目的习惯,让Netflix颇为受益。作为世界上最大的在线影片租恁服务商,Netflix几乎比所有人都清楚大家喜欢看什么。它已经知道它的用户很喜欢大卫芬奇(社交网络、七宗罪的导演),也知道凯文史派西主演的片子表现都不错,还知道英剧版的《纸牌屋》很受欢迎,三者的交集表明,值得在这件事上赌一把。 对于《纸牌屋》剧集的播放,Netflix采取这样的策略——一开始就把整季内容全放出来,而不是以前传统美剧采用的周播制,以每周一集的方式的掉观众胃口。可能有人会质疑这样会剥夺观众等待剧集的乐趣。但Netflix的观点是,由于 DVD和网络剧集的流行,很多观众已经习惯了一下子就能得到整部剧集。总体来说,后者会让观众获得更大的满足感。这就是互联网用户的观看习惯。网络的让用户有更多选择的同时,用户也期望得到更多。 网络让用户能够在一个集中的时间看喜欢的视频或内容,这一点从bbs时代就有所显现,bbs存在很多的文章连载,有些确实很扣人心弦,不少的用户看到有吸引力的开头后会将帖子保存养肥了再看。显然Netflix比其他的电视剧制作商更了解网络用户。也正是基于用户大数据的挖掘才让Netflix有更多的底气投入1亿美元来赌《纸牌屋》的成功。 永不停止的计算 Amazon是Netflix最重要的一个合作伙伴之一,Netflix几乎每时每刻都会调用到 Amazon数据中心一万到两万台的服务器,这些计算机需要控制用户资料的存储、视频推荐、数字版权管理、视频文件转码以及控制不同系统中的播放效果。当有最新的Xbox 或者 Samsung 智能手机面市,Netflix还需要调用额外的服务器来转换视频格式,以保证这些新设备上的用户可以正常观看视频。所以每一个白天,服务器得忙着流媒体视频的传送分发,而到了晚上,这些服务器又得转身变为数据分析的计算机。同时由于Netflix 依赖着 Amazon 的数据中心,所以 700 位 Netflix工程师必须不断开发软件工具,让数以千机的云服务器可以自动实现启动并且完成配置。这种永不停息的计算模式,让Netflix能在任何时刻了解他得观众。 未来是全局数据的时代 大数据时代不可抗拒,应该是毋庸置疑的,但对于绝大多数企业大数据本身仅是一个空泛的概念,不仅难以参与更难于控制。大数据与传统的数据分析有很大的不同,大数据有4个特点:第一,数据体量巨大,从TB级别跃升到PB级别;第二,数据类型繁多,网络日志、视频、图片、地理位置信息等等无所不包;第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒;第四,处理速度快。这都和传统的数据挖掘技术有着本质的不同。 几乎任何规模企业,每时每刻都在产生大量的数据,但这些数据如何归集、提炼始终是一个困扰。这种感觉好像是守着金山却无从下手。大数据技术的意义确实不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的信息,但前提是拥有大量的数据。这个全局数据的时代很快来临,现在所要做的就是拥有并尊重数据(沈禄政/文)。
|
|
来自: 人生之初ABC > 《无法 分类(37)》