共 32 篇文章
显示摘要每页显示  条
梅宏院士:真正的大数据应用体现在数据挖掘的深度 梅宏院士:真正的大数据应用体现在数据挖掘的深度 2016-09-27 明略数据 明略数据。我今天的题目叫做大数据与数据驱动的智慧,首先我大概分成四个部分,谈谈我对大数据的认识,我想讲四个部分,第一个谈谈对大数据的认识,第二个大数据给我们带来什么挑战,第三个大数据应用,最后结合...
当一个tablet没有被分配,并且一个具有足够空间可以容纳该tablet的tablet服务器是可用时,主服务器就把当前这个tablet分配给这个tablet服务器,主服务器会向tablet服务器发送一个tablet负载请求。BigTable使用Chubby来跟踪tablet服务器。为了防止分裂通知丢失(或者由于主服务器死亡或者由于tablet服务器死亡),当主服务器要求一个tablet服务...
大数据时代的教育革命。在线教育本身很难改变学习,在这场教育革命的浪潮中,由在线教育引发的教育由数字支撑到数据支撑变化(教育环境,实验场景, 时空变化,学习变化,教育管理变化等等),确是很多人没有在意的巨大金矿 。教育环境的设计、教育实验场景的布置,教育时空的变化、学习场景的变革、教育管理数据的采集和决策,这些过去靠拍脑袋或者理念...
云计算(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。云计算的基本原理是,通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将更与互联网相似。
什么是大数据,大数据为什么重要,如何应用大数据?驾驭大数据 驾驭未来文/林海龙 虎嗅网友大数据的流行,也引发了图书业大数据出版题材的升温。我认为,《驾驭大数据》的作者提出的网络数据作为大数据的“原始数据”其实也蕴含着另外一重意蕴,即只有电子商务才具备与顾客进行深入的互动,也才具有了收集这些数据的条件,从这点看,直接面向终...
百度大数据质量保障方案探索。百度日新增数据量3P左右,这些数据将用于搜索、广告等核心业务系统。注:“基础技术体系”,包含深度机器学习、自然语言处理、基础架构、测试运维等所有非直接提供业务产品的技术团队,“大数据质量”是一项公司级的技术战略方向。大数据能力是一支优秀测试团队未来需掌握的一种新的技能,大数据本身带来的质量挑...
浅谈Spark和Hadoop作业之间的区别。Spark目前被越来越多的企业使用,和Hadoop一样,Spark也是以作业的形式向集群提交任务,那么在内部实现Spark和Hadoop作业模型都一样吗?答案是不对的。熟悉Hadoop的人应该都知道,用户先编写好一个程序,我们称为Mapreduce程序,一个Mapreduce程序就是一个Job,而一个Job里面可以有一个或多个Task,Task又可以...
40页PPT解密:京东大数据基础架构与创新应用。京东大数据平台从无到有,从集中式到分布式,从Oracle数据仓库到JDW2.0,在演变过程中一直在思考的两个问题:1、如何建设电商特有的复杂业务的数据仓库?2、如何在保障安全的情况下降低使用数据的成本?从下面的内容中似乎能够看到这些问题的答案。
【强烈推荐】阿里内部163页PPT:95后的消费与社交。男人和女人的核心弱点:女人最大的弱点就是高估自己的魅力。不约,简单的两个字,就是对你魅力的最好否定。——摘自以下163页PPT内容。2014年10月17日贺华成阿里巴巴集团演讲PPT(163页),较腾讯演讲PPT增加了大量新内容,进一步梳理了中国青少年亚文化的现象和实质,并结合阿里的无线战略作...
用户画像数据建模方法。一、什么是用户画像?用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重。综合上述分析,用户画像的数据模型,可以概括为下面的公式:用户标识 + ...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部