OTPUB带你走进Aleiye《大数据学堂》,带你领略大数据的魅力炎炎夏日,OTPUB又为大家带来干货了,Aleiye《大数据学堂》,本期为 第一期开讲,后面每一期OTPUB将会在第一时间整理现场视频上传平台!公司介绍北京数介科技有限公司是一家专注于企业大数据分析、挖掘和 应用的高新科技企业,依托于国产自主化的Aleiye大数据平台,形成了Aleiye平台+应用服务+行业解决方案的综合大数据产品,为企 业在IT运维、网站运营、系统安全以及业务分析等多方面提供深度服务。Aleiye学堂介绍大数据技术的深入浅出数据处理演进历程传统数据 处理方式要求、技术、分析能力要求能用要求扩展性要求廉价要求简单要求技术传输技术存储技术搜索技术分析技术可视化技术算法建模?技术分析 能力实时分析离线分析智能分析Hadoop简介起源Hadoop由ApacheSoftwareFoundation公司于20 05年秋天作为Lucene的子项目Nutch的一部分正式引入。它受到最先由GoogleLab开发的Map/Reduce 和GoogleFileSystem(GFS)的启发。发展Hadoop原本来自于谷歌一款名为MapReduce的编程模型包。 谷歌的MapReduce框架可以把一个应用程序分解为许多并行计算指令,跨大量的计算节点运行非常巨大的数据集。使用该框架的一个典型例 子就是在网络数据上运行的搜索算法。Hadoop最初只与网页索引有关,迅速发展成为分析大数据的领先平台。建模Distributed FileSystem分布式文件管理系统很多,HDFS只是其中一种。适用于一次写入多次查询的情况,不支持并发写情况,小文件不合适 。MapReduce是一种分布式计算模型,由Google提出,主要用于搜素领域,解决海量数据的计算问题。spark简介简介现有的集 群编程,有自己的适用场景,不同的类型的计算任务,需要开发不同的计算模型。优势??在相同的运行环境下,支持批处理、交互式、迭代和流计 算,结合这些模式提供丰富的应用编程,并且相随与单一模式的系统能更好的发挥其性能。??以很小的代价在这些计算模式上提供结点故障和st raggler的容忍功能。??实现的性能往往比MapReduce高100倍,并可媲美各个应用领域的专业系统。??适合多组织用户管理 ,允许应用程序弹性地扩缩容和响应式弟共享资源。??源码量小??编程和运行都非常快快的原因高效的sheduler高效的容错处理Ale iye的优势未完待续OTPUB是国内首家直接与厂商合作的领先IT在线学习平台。平台致力于为用户提供互联网最前沿与热门的产品及技术解 决方案,从而打造最为全面和实用的IT在线教育培训平台。 |
|