配色: 字号:
大数据应用与实践(1)
2022-05-05 | 阅:  转:  |  分享 
  
大数据应用与实践(1)

胡经国



大数据应用的13个案例个大数据应用案例来了解最真实的大数据故事,了解大数据在人类社会各个领域中应用与实践。电视媒体

对于体育爱好者来说,追踪电视播放的最新体育运动赛事几乎是一件不可能的事情,因为有超过上百个体育运动赛事在8000多个电视频道播出。

然而,现在在市面上开发出了一款可以追踪所有的体育运动赛事的应用程序RUWT它已经可以在iOS和Android设备以及Web浏览器上使用它通过不断地分析体育运动数据流,来让球迷知道他们应该转换哪个电视台看到想看的节目,在电视台的哪个频道上可以找到想看的节目并且可以在比赛中进行投票。对于谷歌电视和TiVo一种数字录象设备它能帮助人们非常方便地录下和筛选电视上播放过的节目用户来说,实际上RUWT就是让他们改变频道,调到一个想看的体育比赛中。

该程序能够基于体育赛事的紧张激烈程度对比赛进行评分排名,用户可以通过该应用程序找到值得收看的频道和赛事。社交网络社交网站社交网络加利福尼亚州App(



链接:SNS

SNS(SocialNetworkingServices,社交网络服务),属于互联网应用服务类型。它包括社交软件SocialNetworkSoftware)和社交网站(SocialNetworkingSites)。它是一个采用分布式技术,通俗地说是采用P2P(PeertoPeer)技术构建的下一代基于个人的网络基础软件。

链接:P2P技术

P2P(PeertoPeer或Peer-to-Peer)技术,即是点对点技术,又称为对等互联网带宽节点点对点网络沟通PSP、DMA等用的就是AdHoc连接。在家庭无线局域网无线网卡带宽网际协议多媒体互联网

VoIP可用于包括VoIP电话、智能手机、个人计算机在内的诸多互联网接入设备,通过蜂窝网络、Wi-Fi进行通话及发送短信。



医疗行业

SetonHealthcare是采用IBM最新沃森技术的医疗保健内容分析预测的首个客户。该项技术允许企业找到大量与病人相关的临床医疗信息,通过大数据处理,更好地分析病人的信息。

在加拿大多伦多的一家医院,针对早产婴儿,每秒钟有超过3000次的数据读取。通过对这些数据的分析,医院能够提前知道哪些早产儿出现问题并且有针对性地采取措施,避免早产婴儿夭折。

它让更多的创业者更方便地开发产品,比如通过社交网络来收集数据的健康类App。也许在未来数年后,它们搜集的数据能让医生给你的诊断变得更为精确,比方说不是通用的成人每日3次1次1片;而是检测到你血液中的药剂已经代谢完成时,会自动提醒你再次服药。

ExpressScripts(快捷药方)就是这么一家处方药管理服务公司,是北美最大的药房福利管理公司之一目前它正在通过一些复杂的模型来检测虚假药品这些模型还能及时提醒人们何时应该停止用药。ExpressScripts能够解决该问题的原因在于所有有关数据。因为,它每年管理着1.4亿处方,覆盖了一亿美国人和65000家药店虽然该公司具有能够识别潜在问题的信号模式,但是它也使用数据来尝试解决某些情况下之前曾经发现的问题。

同时,ExpressScripts还着眼于其他的一些事情,如他们所开处方的药物种类,甚至有人在网上谈论医生。如果一个医生的行为被标记为红色的旗帜,那么他在网络上就是个好人的形象,更是你所需要的医生。保险行业

保险行业并非技术创新的指示灯,然而MetLife(美国大都会人寿保险公司)已经投资3亿美金建立一个新式系统其中的第一款产品是一个基于MongoDB是一个基于分布式文件存储的数据库的应用程序,它将所有客户信息放在同一个地方。

MongoDB汇聚了来自70多个遗留系统的数据。它运行在两个数据中心的6个服务器上,目前存储了24TB数据。包括MetLife的全部美国客户它的目标是扩大它的国际客户和多种语言,但是同时也可能创建一个面向客户的版本。它的更新几乎是实时的,当新客户的数据输入时,就好像Facebook墙一样。

大多数疾病可以通过药物来达到治疗效果但是如何让医生和病人能够专注参加一两个可以真正改善病人健康状况的干预项目却极具挑战。安泰保险目前正尝试通过大数据达到此目的。

安泰保险为了帮助改善针对代谢综合症患者的预测,从千名患者中选择102个进行实验。在一个独立的实验室内,获得患者的一系列代谢综合症的检测试验结果在连续三年内,扫描600000个化验结果和18万索赔事件。将最后的结果组成一个高度个性化的治疗方案,以评估患者的危险因素和重点治疗方案。这样,医生可以通过食用他汀类药物及减重5磅等建议,来减少未来10年内50%的发病率。或者针对你目前体内高于20%的含糖量,而建议你降低体内甘油三酯总量。职业篮球赛

专业篮球队会通过搜集大量数据来分析赛事情况然而他们还在为这些数据的整理和实际意义而发愁。通过分析这些数据,可否找到两三个制胜法宝,或者至少能保证球队获得高分?Krossover公司正致力于此。Krossover也是一个球类运动赛事分析平台。

在每场比赛过后,教练只需要上传比赛视频。接下来,来自Krossover团队的大学生将会对其进行分解。等到第二天教练再看昨晚的比赛时,他只需检查任何他想要的——数据统计、比赛中的个人表现、比赛反应等等。通过分析比赛视频,毫不夸张地分析所有的可量化的数据。能源行业

智能电网现在欧洲已经做到了终端,也就是所谓的智能电表。在德国,为了鼓励利用太阳能,会在家庭安装太阳能设备除了卖电给用户以外,当用户的太阳能设备有多余电的时候,电网还可以买回来。通过电网每隔5分钟或10分钟收集一次数据收集来的这些数据可以用来预测客户的用电习惯等,从而推断出在未来23个月时间里,整个电网大概需要多少电。在有了这个预测以后,就可以向发电或者供电企业购买一定数量的电。因为电有点像期货一样,如果提前买就会比较便宜,买现货就比较贵。通过这个预测,可以降低采购成本。

维斯塔斯风力系统依靠BigInsights软件BigInsights是基于Hadoop的数据分析平台和IBM超级计算机,对气象数据进行分析,找出安装风力涡轮机和整个风电场的最佳地点。这种分析以往需要数周时间,而利用大数据分析现在仅仅需要不足1小时便可以完成。社会生活

印度有一档非常受欢迎的电视节目SatyamevJayate该节目整理并分析社会民众关于争议话题的各种意见,包括女性堕胎、种姓歧视和虐待儿童等社会热点问题,并使用这些数据来推进政治改革。

虽然目前这档电视节目只播放了13集,但是来自各方面的反馈数据却不容小觑来自印度电视和世界各地的YouTube的观众达400万超过1.2亿人在其网站、Facebook社交服务网站Twitter(推特:微博)、YouTube和移动设备上已经连接SatyamevJayate800多万人通过Facebook、网络注释、文本消息及电话热线等方式,发送了14万个回应,每周有超过10万个新观众发送回应。公路交通

在洛杉矶开过车的人一定都经历过那里噩梦般的交通拥堵情况。目前在I-10和I-110州际公路上,建立了一条收费的快速通道(ExpressLanes)。管理部门可通过大数据引导驾驶人员在该条通道上的行驶情况,以保证交通畅通。

施乐就是参与此次项目的公司它的抗拥塞项目,包括用快速通道动态定价、上升的需求等等以维持某种秩序的想法。施乐公司的首席技术执行官表示,如果司机付费给“驾驶热车道”高占用收费系统,那么他必须保证车速每小时45英里左右。如果交通开始拥堵,那么私家汽车的支付价格将上升,以减少他们进入,而将车道用于高占用率的车辆,例如公共汽车和大巴车。

施乐还有另一个项目在洛杉矶称为ExpressPark(快车公园),目标是让人们知道,他们何时即将离开房子,在哪能找到停车场和花费的金额。不仅要确保定价,同时更要确保数据实时到达用户手中。例如,应当提前40分钟告知用户停车的位置。汽车制造

当问起汽车的制造过程,大多数人脑子里随即浮现的是各种生产装配流水线和制造机器。然而在福特,在产品的研发设计阶段,大数据就已经对汽车的部件和功能产生了重要影响。

比如,福特产品开发团队曾经对SUV是否应该采取掀背式即手动打开车后行李箱车门或电动式进行分析。如果选择后者,那么行李箱车门会自动打开,便捷而智能但是,这种方式会产生车门开启有限的困恼。此前,采用定期调查的方式并没有发现这个问题但是后来,根据对社交媒体的关注和分析,发现很多人都在谈论这些问题。零售业

有一家公司是领先的专业时装零售商,通过当地的百货商店、网络及其邮购目录业务为客户提供服务。该公司希望向客户提供差异化服务。但是,如何定位公司的差异化他们通过从Twitter和Facebook上收集社交信息,来更加深入理解化妆品的营销模式随后他们认识到,必须要保留两类有价值的客户,即:高消费者和高影响者。希望通过接受免费化妆服务,让客户进行口碑宣传这是交易数据与交互数据的完美结合,从而为应对业务挑战提供了解决方案。Informatica全球领先的独立企业数据集成软件提供商的技术,帮助这家零售商用社交平台上的数据充实了客户主数据,使其业务服务更加具有目标性。

零售企业也监控客户的店内走动情况以及与商品的互动。它们将这些数据与交易记录相结合来展开分析从而在销售哪些商品、如何摆放货品以及何时调整商品售价上给出意见此类方法已经帮助某领先零售企业减少了17%的存货,同时在保持市场份额的前提下,增加了高利润率自有品牌商品的比例。总统竞选

许多人通过Facebook更新个人状态、分享图片以及他们喜欢的内容。奥巴马的总统竞选运动也通过使用社交网络的各种数据功能完成了竞选他们不仅通过社交网络寻找支持者,而且还通过社交网络召集了一批志愿军。

早在2006年,Facebook联合创始人克里斯·休斯就建议扎克伯格在网站上推出相关服务,帮助总统候选人在Facebook上建立个人主页,以便他们进行形象推广。2006年9月,Facebook全面开放,用户数量爆炸式增长,在年底达到1200万。这一过程恰好有地了奥巴马的知名度。此后,在克里斯的辅佐下,奥巴马掀起了一系列的网络活动在Facebook、MySpace等社交网站上发表公开演讲、推广施政理念,从而赢得大量网民支持,募集到5亿多美元的竞选经费。

最终,黑人平民战胜了实力雄厚的对手,成为美国历史上第一位黑人总统之后,在第二次的选举中更获得连任。此次选举被认为是美国民主的巨大进步而互联网则提供了前所未有的实施手段其中尤以Facebook代表的社交网站表现最为突出,以至于有人戏称为Facebook之选。电子邮件

MailChimp的核心业务是提供电子邮件服务它在一年内为大约300万用户发送了350亿封邮件。不过真正能体现MailChimp未来价值的是该公司对这些邮件数据的处理和分析。

MailChimp的一个重要任务就是搞清楚如何帮助客户更好地了解他们所发送的信息。考虑到这一点,该公司建立了一个服务叫做Wavelength,向客户展示与他们发送的信息相似的其他讯息。这意味着告诉你用户打开了什么样的邮件,何时打开的,他们点击了什么链接,还订阅了什么邮件。



链接:MailChimp

MailChimp直译是“邮件猩猩”,是一个免费的电子邮件发送工具(或邮件发送器),也是一家公司或网站的名称。该邮件发送器创始人把它做得非常简单,所以他们就将这套发送器昵称为“MailChimp”,意思是说,这套发送器简单到连猩猩都会用。



音乐

在10多年以前,音乐元数据公司(Gracenote)收到了来自苹果公司的神秘忠告,建议其购买更多的服务器。Gracenote照做了。其后,苹果推出iTunes一款媒体播放器的应用程序和iPod系列便携式多功能数字多媒体播放器,Gracenote从而成为了元数据的帝国。

在车内听的歌曲很可能反映你的真实喜好,Gracenote就拥有此种技术。它采用智能手机和平板电脑内置的麦克风识别用户电视或音响中播放的歌曲,并且可以检测出掌声或嘘声等反应,甚至还能够检测出用户是否调高了音量。这样,Gracenote可以研究和了解用户真正喜欢的歌曲以及听歌的时间和地点。





2016年5月30日编写于重庆

2019年11月28日修改于重庆

2022年5月5日修改于重庆

5







献花(0)
+1
(本文系胡经国图书...原创)