太平盛世在等你 IP属地:贵州

文章 关注 粉丝 访问 贡献
 
共 260 篇文章
显示摘要每页显示  条
求推荐大数据、机器学习及人工智能必读书目?全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和...
求推荐大数据、机器学习及人工智能必读书目?全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和...
MapReduce把map任务生成的数据按商品种类排序。Spark对早期的DAG模型作了改进,提出了基于内存的分布式存储抽象模型RDD(Resilient Distributed Datasets,可恢复分布式数据集),把中间数据有选择地加载并驻留到内存中,减少磁盘IO开销。Spark以批处理模型为核心,实现了交互式分析框架Spark SQL、流计算框架Spark Streaming(及正在实现的Str...
MapReduce把map任务生成的数据按商品种类排序。Spark对早期的DAG模型作了改进,提出了基于内存的分布式存储抽象模型RDD(Resilient Distributed Datasets,可恢复分布式数据集),把中间数据有选择地加载并驻留到内存中,减少磁盘IO开销。Spark以批处理模型为核心,实现了交互式分析框架Spark SQL、流计算框架Spark Streaming(及正在实现的Str...
MapReduce把map任务生成的数据按商品种类排序。Spark对早期的DAG模型作了改进,提出了基于内存的分布式存储抽象模型RDD(Resilient Distributed Datasets,可恢复分布式数据集),把中间数据有选择地加载并驻留到内存中,减少磁盘IO开销。Spark以批处理模型为核心,实现了交互式分析框架Spark SQL、流计算框架Spark Streaming(及正在实现的Str...
MapReduce把map任务生成的数据按商品种类排序。Spark对早期的DAG模型作了改进,提出了基于内存的分布式存储抽象模型RDD(Resilient Distributed Datasets,可恢复分布式数据集),把中间数据有选择地加载并驻留到内存中,减少磁盘IO开销。Spark以批处理模型为核心,实现了交互式分析框架Spark SQL、流计算框架Spark Streaming(及正在实现的Str...
数据越多,价值就越大,这是大数据产业的共识,不仅可以通过海量数据进行交叉分析,而且数据是可以重复利用的,一份数据可以同时为多个企业提供服务,因此可以呈现出更高的商业价值。数据来自于各式各样的IT系统,要纳入到大数据平台里成为可用的数据,需要进行格式转换和数据加载。对大数据平台来说,要维持平台能有高价值的产出,就必须保证...
大数据时代是个什么样的时代呢?数据的爆炸是“三维”的,是立体的,这三个维度,主要表现在:同一类型的数据量在快速增长;数据的多样性,即新的数据来源和新的数据种类在不断增长。在当前这个数据爆炸的时代,数据带给我们什么呢?我想最重要的是带来了思维模式的转变。用另一本类似着作《大数据时代》的作者维克托的一句话:“大数据是未来,...
《数据科学与大数据技术训练营》大数据开发工程师-初级。本期《大数据开发工程师》初级课程,采用网络教学方式,深入学习大数据主要的三大生态系统NoSQL(MongoDB)、Spark和Hadoop的历史及目前发展的现状、以及它们的技术特点,通过贯穿课程的项目进行实战锻炼,掌握平台部署、开发和调优,把握分布式计算框架及未来发展方向,助你在大数据时...
数据分析/hadoop/机器学习面试题集锦,可能是最全的了!数据分析/hadoop/机器学习面试题集锦。http://www.ppvke.com/Blog/archives/39116.http://www.ppvke.com/Blog/archives/39735.http://www.ppvke.com/Blog/archives/36811.该文总结了一些面试常见的hadoop知识,包括1. hdfs原理,以及各个模块的职责2. map reduce 的工作原理3. hadoop1 与...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部