lcjcx / 2大数据 / 大数据书籍总览

0 0

   

大数据书籍总览

2016-03-07  lcjcx

大数据的互联网思维 /1




段云峰/秦晓飞 著


编辑推荐

《大数据的互联网思维》基于15年的大数据理论探索和实践经验,首次将互联网思维应用于大数据中,并取得了一定的成绩。互联网思维像当年的“文艺复兴”一样,燃起了一把希望之火,给了中国一次难得的弯道超车的历史机遇。

《大数据的互联网思维》对互联网思维中主要的几条原则,逐一进行分析,并将其应用到大数据发展中。给出了大数据产品设计的原则,并提出了改善客户体验的各种方法,在数据可视化方面积累了大量案例。通过降低大数据的使用门槛,能够让更多的人参与到应用中。结合大数据的发展过程,给出了大数据产品的内容和分类,然后基于“极致”的思维,给出了产品设计的原则和要求。


内容提要 ◎

《大数据的互联网思维》是国内第一本将互联网思维应用到大数据领域的专著,记录了笔者在大数据时代的一些感想、心得。

本书共分10章,其中第1章阐述了大数据发展的现状,以及大数据发展需要互联网思维的原因;第2章提出了借鉴互联网思维,大数据可以实现一次“凤凰涅槃”般的新生,从传统IT项目“脱胎换骨”为咨询服务项目;第3章写到大数据将重塑资源格局,未来会成为国家资产,同时将促进理性社会的到来;第4章介绍了大数据的客户体验如何提升,需要明确客户是谁,客户想要什么,笔者指出融入娱乐思维的个性化管家式服务是一种可行之道;第5章介绍了大数据的产品思维,有哪些好的经验可以学习;第6章和第7章分别阐述了如何打造出极致的大数据产品,以及大数据如何进行快速迭代;第8章介绍了大数据的平台思维,同时提出传统的互联网平台升级为拥有智慧的大数据平台是大势所趋;第9章介绍了大数据的跨界会带来什么,提出“大数据×”的概念,指出“大数据×”是“互联网+”的有机组成部分;最后一章笔者对多年收集的大数据实践案例进行了介绍,帮助读者深入了解本书前面提到的理论部分。本书中穿插了许多诙谐的小故事和小案例,能够让读者在轻松、幽默的氛围中快速体会笔者的一些感悟。

与市面上现有的介绍大数据以及互联网思维的书籍不同,本书是笔者十多年大数据相关从业经验的积累,是在实践过程中不断总结出来的,书中许多具体案例都是真实存在并且被广泛使用的。有志于从事大数据事业或者数据分析领域相关工作的管理人员或IT人员都值得拥有本书。





智能大数据SMART准则:数据分析方法、案例和行动纲领 /2




(美)马尔(Bernard Marr)著;秦磊/曹正凤 译


编辑推荐

大数据是智能革命的核心。大数据背后的基本思想是,人类一切行为都会留下数字痕迹(或数据),我们(或他人)可以对其加以利用,变得更加智慧。掌握数量日益增加的数据并利用技术能力将其转化成具有商业价值的想法,是推动新世界的主要力量。无疑大数据正在改变世界,我们的居住、择偶、治疗癌症、科研、提升绩效、管理城市、治理国家和管理企业的方式都因此而发生完全改变。

《智能大数据SMART准则:数据分析方法、案例和行动纲领》从如何使用大数据的角度入手,给出了一套详细且可行的分析框架,以简明扼要的方式教会我们如何从庞杂的数据中生成一个完整的解决方案。尤为重要的是,该书深刻地揭示了大数据分析所需要的智能化思维方式,对企业的科学决策有着至关重要的作用,同时对政府和学者掌握大数据技术有着非常好的指导意义。


内容提要 ◎

本书提出一种SMART方法,助你建立智能业务,掌控大数据的力量,无论企业大小。全文结构依据SMART方法展开,每章讲解模型的一部分,然后提供一些有用的案例。

全书共6章,第1章主要介绍当前使用大数据进行商业分析的一些成功案例,从这些案例中可以发现大数据的魅力。第2章介绍制定战略时,需要先抛开数据,从企业目标和愿景开始,切合实际地找到适合自己企业的战略。第3章主要介绍商业数据的分类,可分为文本数据、声音数据、图像数据、视频数据和传感器数据,并介绍这些不同类别数据的特点。第4章介绍数据的分析方法,包括文本分析、语义分析、视频/图像分析、联合分析等分析方法,通过使用这些方法,从大数据中提取有用的想法,回答战略问题。第5章着重介绍数据可视化的形式,包括图形和表格、传统的报告、显示地图、文本、数据、行为、情绪和联系的信息图,并介绍进行数据可视化应注意的问题。第6章介绍使用大数据改变商业运行模式的典型案例,主要包括:美国零售超市Target的怀孕预测模型、沃尔玛超市通过大数据处理改进优化业务流程、亚马逊运用大数据分析来改进业务流程和零售体验、早产婴儿房的大数据监控、个人分析和健康监控设备、IBM的智能分析平台SlamTracker研究网球锦标赛、飞机引擎制造商劳斯莱斯的大数据运营商业模式等。

通过对这些案例的讲解,使读者进入大数据的世界了解到大数据前沿应用者正在以闻所未闻的方式改变着商业模式。





触手可及的大数据分析工具:Tableau案例集 /3



沈浩/王涛/韩朝阳/李健 著


◎ 编辑推荐

Tableau在中国的第一批客户,不仅包括眼明手快的年轻精英们,而且包括了许多近花甲之年的老教授、研究员和管理者。它作为一款商业智能与数据分析软件,能够满足企业与科研绝大多数的分析需求。相比于专业的SPSS Statistics与SAS等,它入门简单且功能强大;相比于各种品牌的大型IT平台,它易于实施与部署,通过拖、拉、点击几步操作即可完成,无需太多的专业背景,每个人都可以轻松掌握,真正实现了“亲自上阵”,“所见即所得”。为了帮助更多的人了解Tableau能够实现哪些图表的制作与分析,我们与沈浩教授共同编写了本书。


内容提要 ◎

本书对Tableau的产品、优势、Tableau 9.0的新特性及其功能做了全面的介绍,并且从15个不同行业的案例入手,让你在阅读本书后能够从一个新手成长为能够创建出复杂仪表板的高手。

本书分为五个部分共14章:Tableau使用概述、新手上路、成功晋级、高手秘籍以及实际应用。

Tableau使用概述包含四章,分别从为何要进行数据可视化、Tableau的发展历程、Tableau的产品介绍、Tableau 9.0的新特性、Tableau的应用优势以及如何利用Tableau进行数据连接和了解工作区几个方面做了详尽的阐述。

新手上路包含两章,该部分以各行业案例为依托,带你从Tableau的排序、筛选、分层和分组、参数和函数等方面来全面了解Tableau 9.0的新功能。

成功晋级包含四章,分别从不同行业的案例入手介绍Tableau的高级功能。

高手秘籍包含三章,该部分介绍如何利用Tableau中的颜色和形状进行异常值检测、如何利用背景图像进行货架分析以及如何使用Tableau中的超级链接使用WMS地图服务和动态调用外部网页。

实际应用自成一章包含八个数据可视化分析实例,全面展示Tableau进行数据可视化分析的各种技术细节和实用技巧。

本书对于初次接触Tableau软件的读者会有很大帮助,书中对Tableau创建可视化视图的每一步操作都有详尽的说明。如果你是Tableau软件的老用户,本书中不同行业案例的可视化分析和展现方式也会给你带来全新的思路和视角。





Apache Spark源码剖析 /4




徐鹏 著


编辑推荐

Spark Contributor,Databricks工程师连城,华为大数据平台开发部部长陈亮,网易杭州研究院副院长汪源,TalkingData首席数据科学家张夏天联袂力荐

1.本书全面、系统地介绍了Spark源码,深入浅出,细致入微

2.提供给读者一系列分析源码的实用技巧,并给出一个合理的阅读顺序

3.始终抓住资源分配、消息传递、容错处理等基本问题,抽丝拨茧

4.一步步寻找答案,所有问题迎刃而解,使读者知其然更知其所以然


内容提要 ◎

本书以Spark 1.02版本源码为切入点,着力于探寻Spark所要解决的主要问题及其解决办法,通过一系列精心设计的小实验来分析每一步背后的处理逻辑。

本书第3~5章详细介绍了Spark Core中作业的提交与执行,对容错处理也进行了详细分析,有助读者深刻把握Spark实现机理。第6~9章对Spark Lib库进行了初步的探索。在对源码有了一定的分析之后,读者可尽快掌握Spark技术。

本书对于Spark应用开发人员及Spark集群管理人员都有极好的学习价值;对于那些想从源码学习而又不知如何入手的读者,也不失为一种借鉴。





Hadoop硬实战 /5


梁李印/宁青/杨卓荦 译

编辑推荐

Hadoop是一个开源的MapReduce平台,设计运行在大型分布式集群环境中,提供查询和分析服务。尤其适用于大数据系统,Hadoop为苹果、eBay、LinkedIn、雅虎和Facebook等公司提供重要软件环境。它为开发者进行数据存储、管理以及分析提供便利的方法。

《Hadoop硬实战》收集了85个问题场景以及解决方案的实战演练。在关键问题领域对基础概念和实战方法做了权衡,例如导入导出、序列化,以及LZO压缩。你将会学习到每个技术的细节,以及当遇到一个具体问题时能够给出对应的解决方案。本书提供了结构良好且易于理解的例子,可用于应对你所遇到的问题。

本书包含:

·Hadoop和MapReduce的基本概念

·85个实战和测试技术

·真实的场景,实用的解决方案

·如何整合MapReduce和R


内容提要 ◎

Hadoop 是一个开源的MapReduce 平台,设计运行在大型分布式集群环境中,为开发者进行数据存储、管理以及分析提供便利的方法。《Hadoop硬实战》详细讲解了Hadoop 和MapReduce 的基本概念,并收集了85 个问题及其解决方案。在关键问题领域对基础概念和实战方法做了权衡。

《Hadoop硬实战》适合使用Hadoop 进行数据存储、管理和分析的技术人员使用。





Mesos:大数据资源调度与大规模容器运行最佳实践 /6




(印度)Dharmesh Kakadia(哈米斯·卡卡迪尔)著;崔靖雯/刘梦馨 译


编辑推荐

Apache Mesos是集群管理器,它能够为分布式的应用程序或框架提供高效的资源隔离和共享。它允许开发人员在一个动态共享节点池上并行运行Hadoop、Spark、Storm和其他应用程序。有了Mesos,你就可以在多租户环境里管理各种资源了。
  能从书中学到什么
  ◎能够在数据中心或者云环境中搭建Mesos集群。
  ◎能够在Mesos上使用Hadoop、Spark和Storm等框架进行数据分析。
  ◎熟悉如何在Mesos上使用Marathon、Chronos和Aurora来管理服务。
  ◎深入理解如何使用Mesos API编写分布式应用程序。
  ◎学会如何自动化并管理Mesos集群,以及其他运维技能,比如日志和监控。
  ◎深入理解Mesos的基础和内在工作机制。


内容提要 ◎

《Mesos:大数据资源调度与大规模容器运行最佳实践》结合大量实例介绍了Mesos 的使用方法、核心原理及框架开发的相关内容。通过这些内容读者可以在数据中心环境中利用Mesos搭建分布式系统、进行大数据分析及开发分布式应用。

《Mesos:大数据资源调度与大规模容器运行最佳实践》分为8章分别从使用、开发和运维等角度全面展示了Mesos 作为数据中心内核的强大能力、设计方面的精髓及在工程中的最佳实践。书中还介绍了Mesos 项目的最新进展和未来的发展方向,并给出了大量参考文献和相关链接方便读者进一步深入了解Mesos。适合分布式系统的研发、运维人员及相关技术爱好者阅读。





R语言核心技术手册(第2版)/7




(美) Joseph Adler(约瑟夫·阿德勒)著;刘思喆/李舰/陈钢/邓一硕 译


编辑推荐

如果你打算用R进行统计计算和数据可视化,本书就是关于使用开源R语言(软件环境)快速解决上述问题的实用指导教程。通过本书,你将学会如何编写R函数以及借助R包进行数据预处理、可视化以及数据分析。作者用取自制医学、商业和体育领域的丰富案例对上述问题进行了讲解。

√ 多达数百个实例的R教程,快速入门R语言

√ 探索R语言的语法、对象和其他语言细节

√ 在网站上可找到包括Bioconductor在内的数千个用户共享的R包

√ 学习如何用R完成数据分析预处理

√ 基于R graphics、lattice和ggplot2包 进行数据可视化

√ 使用R语言计算概率分布、统计检验以及拟合模型

√ 基于Hadoop并行编程提升大规模运算的效率

√ 学习R语言的完整参考手册

第二版的内容依据R 2.14和R 2.15进 行了更新,并新增了R高性能计算、基于ggplot2的数据可视化和利用Hadoop做并行运算等章节。


内容提要 ◎

R 是一款优秀的开源统计应用语言,它直观、易用、低成本,而且还有庞大的社区支持,随着数据挖掘技术的兴起,R 语言得到了广泛的应用。《R语言核心技术手册(第2版)》介绍从安装R 软件到基本语法以及应用的全过程,可以帮助你全面地学习和使用R。《R语言核心技术手册(第2版)》共6部分,26 章,基本涵盖了R 语言的所有功能,而且提供了大量的实例说明运用R 语言绘图、分析数据以及拟合统计模型的过程。书中虽然涉及很多统计学理论和知识,但并不是《R语言核心技术手册(第2版)》的重点。

作为第2 版,本书增加了一些处理数据的新章节,将绘图章节集中放在“可视化篇”,同时针对R 的版本变化做了一些升级。

《R语言核心技术手册(第2版)》适合从事数据挖掘、机器学习、统计及数据分析的人士阅读。





Spark大数据处理技术 /8



夏俊鸾/程浩/邵赛赛等 著


编辑推荐

全球首部全面介绍Spark及Spark生态圈相关技术的技术书籍

俯览未来大局,不失精细剖析,呈现一个现代大数据框架的架构原理和实现细节

透彻讲解Spark原理和架构,以及部署模式、调度框架、存储管理及应用监控等重要模块

Spark生态圈深度检阅:SQL处理Shark和Spark SQL、流式处理Spark Streaming、图计算Graphx及内存文件系统Tachyon


内容提要 ◎

《Spark大数据处理技术》以Spark 0.9版本为基础进行编写,是一本全面介绍Spark及Spark生态圈相关技术的书籍,是国内首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的软件和模块,包括SQL处理引擎Shark和Spark SQL、流式处理引擎Spark Streaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了一定的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的平台。

《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、软件开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学习《Spark大数据处理技术》,读者能够熟悉和掌握Spark这一当前流行的大数据框架,并将其投入到生产实践中去。





大数据Spark企业级实战 /9




王家林 著


编辑推荐

Life is short, you need Spark!

Spark是当今大数据领域最活跃最热门的高效的大数据通用计算平台。基于RDD,Spark成功地构建起了一体化、多元化的大数据处理体系。

雅虎、Conviva、淘宝、网易、大众点评、优酷土豆、腾讯、华为等公司均在生产环境中部署了大规模的Spark。

本书完全从企业处理大数据业务场景的角度出发,完全基于实战代码来组织内容,从零起步,不许任何基础,完全无痛地掌握Spark大数据处理实战技术,源码解析:

Spark集群的动手构建

Spark架构

Spark内核的深入解析

Spark四大子框架的细致剖析和实战

Tachyon文件系统揭秘

Spark多语言编程

SparkR

Spark性能调优和最佳实践

一站式实现Spark企业级开发实战!


内容提要 ◎

Spark是当今大数据领域最活跃、最热门、最高效的大数据通用计算平台,是Apache软件基金会下所有开源项目中三大顶级开源项目之一。

在“One Stack to rule them all”理念的指引下,Spark基于RDD成功地构建起了大数据处理的一体化解决方案,将MapReduce、Streaming、SQL、Machine Learning、Graph Processing等大数据计算模型统一到一个技术堆栈中,开发者使用一致的API操作Spark中的所有功能;更为重要的是Spark的Spark SQL、MLLib、GraphX、Spark Streaming等四大子框架之间可以在内存中完美的无缝集成并可以互相操作彼此的数据,这不仅打造了Spark在当今大数据计算领域其他任何计算框架都无可匹敌的优势,更使得Spark正在加速成为大数据处理中心首选的和唯一的计算平台。

《大数据Spark企业级实战》详细解析了企业级Spark开发所需的几乎所有技术内容,涵盖Spark的架构设计、Spark的集群搭建、Spark内核的解析、Spark SQL、MLLib、GraphX、Spark Streaming、Tachyon、SparkR、Spark多语言编程、Spark常见问题及调优等,并且结合Spark源码细致的解析了Spark内核和四大子框架,最后在附录中提供了的Spark的开发语言Scala快速入门实战内容,学习完此书即可胜任绝大多数的企业级Spark开发需要。

《大数据Spark企业级实战》从零起步,完全从企业处理大数据业务场景的角度出发,基于实战代码来组织内容,对于一名大数据爱好者来说,《大数据Spark企业级实战》内容可以帮助您一站式地完成从零起步到进行Spark企业级开发所需要的全部核心内容和实战需要。





大数据日知录:架构与算法 /10




张俊林 著


◎ 编辑推荐

这是一本心血之作,历时3年,质量上乘。

从架构与算法的角度,比较全面地分门别类梳理了大数据相关技术。

本书内容紧跟技术前沿,讲解深入浅出,适合大数据领域所有技术人员。

书中还列有作者优选的高质量文献,能为读者节省选择的时间,绝对值得一读。


内容提要 ◎

大数据是当前最为流行的热点概念之一,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。

《大数据日知录:架构与算法》从架构与算法角度全面梳理了大数据存储与处理的相关技术。大数据技术具有涉及的知识点异常众多且正处于快速演进发展过程中等特点,其技术点包括底层的硬件体系结构、相关的基础理论、大规模数据存储系统、分布式架构设计、各种不同应用场景下的差异化系统设计思路、机器学习与数据挖掘并行算法以及层出不穷的新架构、新系统等。《大数据日知录:架构与算法》对众多纷繁芜杂的相关技术文献和系统进行了择优汰劣并系统性地对相关知识分门别类地进行整理和介绍,将大数据相关技术分为大数据基础理论、大数据系统体系结构、大数据存储,以及包含批处理、流式计算、交互式数据分析、图数据库、并行机器学习的架构与算法以及增量计算等技术分支在内的大数据处理等几个大的方向。通过这种体系化的知识梳理与讲解,相信对于读者整体和系统地了解、吸收和掌握相关的优秀技术有极大的帮助与促进作用。

《大数据日知录:架构与算法》的读者对象包括对NoSQL 系统及大数据处理感兴趣的所有技术人员,以及有志于投身到大数据处理方向从事架构师、算法工程师、数据科学家等相关职业的在校本科生及研究生。





大数据时代小数据分析 /11




屈泽中 著


◎ 编辑推荐

《大数据时代小数据分析》可帮助你学会通过数据分析解决以下问题:

使用手机,用合约机包月还是自费机月付,哪个更省钱?选择哪个电话套餐更适合自己更划算?

为什么出口产品被退运?

如何运用已有的销售数据来确定未来进货,进设备,扩充门面?

鸡兔同笼问题原来还可以这样解决?

假设某家工厂生产某系列3种型号的产品。这3种产品的使用原材料相同,但材料消耗量和产品市场销售价格有所不同,那么如何安排生产能使利润最大化?

某产品如何选择5种原有原料进行配比可以使得产品满足质量要求的情况下成本最低?

如何测算投资最大收益化?

如何做一个精明的老板,如何决定各种产品生产的数量以获取最大的利润?

如何根据今年的销售确定明年进货才能使利润最大化?

公司如何搬家又省力又省钱,还能照顾所有人情绪?

吃海参能让人变聪明吗?

用户调查当中如何知道支出与收入有什么关系?

如何配比各种原料使产品的用户体验最佳?

咖啡商如何添加辅料,既可以改善口感,又可以降低咖啡因含量?

如何选择适合自己的早餐?

海拔是否影响血压?

哪些熊猫已足够强壮到可以适应野外生活?

如何找男友?


内容提要 ◎

《大数据时代小数据分析》是一本大数据时代下进行小数据分析的入门级教材,通过数据分析的知识点,将各类分析工具进行串联和对比,例如:在进行线性规划的时候可以选择使用Excel或LINGO或Crystal Ball。工具的应用难易结合,让读者循序渐进地学习相关工具。JMP和Mintab用来分析数据,分析的结果使用Excel、LINGO、Crystal Ball来建立数据模型,最后使用Xcelsius来动态展示数据分析的结果。《大数据时代小数据分析》中以两个人的对话为叙述方式,场景描写多,容易进入学习状态,完全是用生动的故事和实用的案例尽可能地贴近生活和工作,让数据分析生动有趣,基本上有高中数学知识就可以理解线性规划等数据分析内容。

《大数据时代小数据分析》不仅介绍Excel而且介绍使用其他工具软件进行数据分析,可用来拓展互联网公司、传统企业、电商企业、管理咨询公司等各行各业从事数据分析工作的分析师和管理者对数据分析的认知,也适合初中级数据分析师或者想进入数据分析行业的有志之士参考阅读。





大嘴巴漫谈数据挖掘 /12




易向军 著


◎ 编辑推荐

大嘴巴带你玩转数据挖掘

让你知道啤酒君和尿布君为什么会相遇,大数据的小科普让你成为“读心”魔法师!

数据挖掘私人定制 轻松掌控再无敌手

拒绝枯燥越过三境 火爆网络疯狂下载

同作者阅读推荐:软件需求十步走——新一代软件需求工程实践指南


内容提要 ◎

《大嘴巴漫谈数据挖掘(全彩)》从最基本的概率统计学开始,全面、系统、形象而又深入地描述了数据挖掘的基础概念、应用领域以及常用算法。其中每一种数据挖掘算法都辅以通俗易懂的实例,读者能够在直观性、趣味性中学习算法的具体流程,明白算法的实现过程。通过《大嘴巴漫谈数据挖掘(全彩)》的学习,读者可以对数据挖掘的概念、应用和算法技术有一个清晰的理解和认识,并可以熟悉相关统计学的基本原理。

《大嘴巴漫谈数据挖掘(全彩)》适合想从事数据挖掘方面的工作的初学者、数据分析爱好者、分析师,以及一线的数据挖掘开发人员参考阅读,也适合客户经理针对如何开展针对性的营销活动,避免客户流失而阅读学习,更适合产品经理阅读,因为针对如何预测产品的目标用户,促进用户活跃和业务有效使用,靠经验已经不行了,数据才最有说服力,更适合企业管理者将其作为一本通俗易懂的数据挖掘基础读物阅读学习,对下属的工作方向给予指导,以及适合教师学生数据挖掘课程辅导之用。





颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用 /13




(美)Vijay Agneeswaran(维贾伊·阿涅斯瓦兰)著;吴京润/黄经业 译


◎ 编辑推荐

《颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用》中,VijayAgneeswaran博士介绍了这些技术,以及它们的应用案例,并从架构到代码的不同层面对应用它们做了演示。


内容提要 ◎

《颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用》每章一个主题,介绍了各种大数据分析技术与机器学习算法。本书能够让读者掌握大数据分析和机器学习的相关技术的大致脉络,为之后的进阶学习提供参考与指导。《颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用》适合大数据技术入门者、希望对大数据技术有所了解,以及想要学习大数据技术但是不知道应该从何处入手的读者阅读。





发现数据之美:数据分析原理与实践 /14




彭鸿涛/聂磊 著


◎ 编辑推荐

空谈无益,实干兴邦!

只有从纷繁的数据中找到线索,发现价值,大数据才能真正为我所用,成为真正意义上的数据资产!

《发现数据之美》提供了全面的数据分析思路、方法和技巧,一步一步地教会您如何寻找数据、鉴别数据、分析数据,并从数据分析中看到未来,做出富于远见的决策与管理。

作者是资深数据分析师,在该领域有近十年的丰富实践,对数据分析及数据价值有着扎实、透彻的理解,认为只有做好最基本的数据分析,才能真正把数据变成资产,产生价值——这在“大数据神话”甚嚣尘上的今日,无疑是一剂清凉贴,让我们冷静下来,重新审视自己的基本功。

不必犹豫,无须等待,数据分析之旅,始于《发现数据之美》。


内容提要 ◎

大数据时代已经来临,这将引起深刻的行业变革。但是,大数据的真意在于数据分析,即从繁多的数据中找出洞见,并将其应用于实际决策中,以产生更明智的决策。这是一个看起来简单、做起来较难的事情。

本书从一个自底向上的角度,全面地阐述了数据分析所涉及的知识和技术,对于经典算法和工具的介绍也不止于泛泛而谈,而是加入了作者的经验和理解。所谓自底向上的角度,即从数据分析实践开始时所需要的数据准备、数据探查、数据再处理等,到经典的统计分析和数据挖掘算法及应用,还讲述了模型的部署,优化技术的引入,最终到决策自动化。

本书对企业管理者、数据分析从业者及高校的学生都有参考意义。管理者能看到一个较全面的数据分析的阐述,明确自身的需求;从业者能看到经验的总结及经典工具的使用;高校学生能看到数据分析所涉及的知识,对数据分析有一个全面的认识。





精通D3.js:交互式数据可视化高级编程 /15




吕之华 著


◎ 编辑推荐

1 全面介绍了D3.js,是比较系统完整的教程

2 由浅入深,既有基础入门知识,又有相对深入的内容

3 图文并茂,语言流畅,讲解清晰易懂


内容提要 ◎

《精通D3.js:交互式数据可视化高级编程》以当前流行的数据可视化技术D3.js为主要内容,分为三大部分,共计13章。第一部分讲述基础知识,第二部分学习制作各种常见图表,第三部分讲解交互式图表及地图的进阶应用。《精通D3.js:交互式数据可视化高级编程》是一个相对完整的D3.js教程,讲解此技术所有重要的知识点,既有基础入门知识,又有相对深入的内容。笔者秉持以下原则:由易到难,循序渐进,图文并茂,清晰易懂。

《精通D3.js:交互式数据可视化高级编程》适合有一定计算机基础的读者,需要熟悉C、C++、Java、JavaScript等至少一门编程语言,能够理解基础的数据结构和算法。





敏捷数据科学:用Hadoop创建数据分析应用 /16




(美)Russell Jurney(拉塞尔·朱尔尼)著;冯文中/朱洪波 译


◎ 编辑推荐

对大数据的挖掘需要投入大量的人力和时间。怎么才能确保构建的是一个正确的模型?通过这本实践指南,你可以学到一套灵活的工具和方法论,在Hadoop上构建数据分析应用。

使用诸如Python、Apache Pig和D3.js等轻量级工具,你的团队能够创建一个敏捷环境来探索数据。我们会开发一个样例应用程序,挖掘你自己的电子邮箱数据。你也会学习到一种迭代式的开发方法,使得你能根据数据中的信息快速切换,进行不同类型的数据分析。书中所有的代码样例都可以在 Heroku 中以 App 形式运行。

■ 用敏捷式大数据开发方法论创建分析应用

■ 用数据-价值栈,在一系列敏捷周期中创建价值

■ 用多种数据结构从单个数据集中提取特征,获取洞察

■ 用图表可视化数据,通过交互性报表从不同角度展示数据

■ 用历史数据进行预测,将预测转化为行动

■ 在每个迭代周期过后获取用户反馈,确保项目方向正确


内容提要 ◎

《敏捷数据科学:用Hadoop创建数据分析应用》面向大数据挖掘,以敏捷视角呈现高效构建数据模型的全程实践和思路。在一组以一个真实电子邮箱数据挖掘为例的数据-价值金字塔进阶模式中,你将学到:一整套实用工具及其方法论,可快速实现在Hadoop 上构建数据分析应用;用Python、Apache Pig 及D3.js等轻量级工具创建用于探索数据的敏捷环境;一种可根据数据中信息快速切换,进行不同类型数据分析的迭代式开发方法。

《敏捷数据科学:用Hadoop创建数据分析应用》适合所有与数据工作相关的从业者,同时也适合有志成为数据科学工作者的广大读者作为入门读物。





企业数字化转型架构:互联网+时代的创新技术与实践 /17




王保育/李纪华/吴筱英 著


内容提要 ◎

《企业数字化转型架构:互联网+时代的创新技术与实践》全面地介绍了企业数字化转型,包括API经济与物联网发展的演变趋势,深入地阐述了企业数字化支撑能力与转型战略、传统记录型架构与新型交互型架构的融合及对分析洞察、集成交互与业务创新的支持,《企业数字化转型架构:互联网+时代的创新技术与实践》系统地分析了Cloud、Analytics、Mobile、Social 和Security(合称为CAMSS)架构转型的技术途径、架构原则、实现方法、最佳实践和关键成功要素。同时为读者提供了企业数字化在转型准备、试点、推广过程中所急需的CAMSS参考架构、架构构建模块、持续交付(DevOps)、 API管理的理论知识和实际应用案例参考。





深入浅出数据分析 /18




(美)Milton·M(米尔顿)著;李芳 译


◎ 编辑推荐

我们生活在数据的天地里,你的工作就是淋漓尽致地发挥数据的作用。从哪里起步?米尔顿编著的《深入浅出数据分析》将为你提供帮助:利用Excel或0penoffice应用程序组织数据,在R应用程序中进行进一步整理,通过散点图和直方图找出有意义的模式,借助启发式算法做出结论,通过实验和假定测试预见未来,再以清楚直观的图形展示分析结果。无论你是研究新产品可行性的开发人员,还是评估广告效果的市场营销经理;无论你是向客户呈报数据的营销员,还是管理所有这些数据密集型部门及种种其他事务的个人企业家,《深入浅出数据分析》都能为你带来全面的学习体验,让你将数据转变为事业中有用的工具。


内容提要 ◎

《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文之后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。

本书构思跌宕起伏,行文妙趣横生,无论读者是职场老手,还是业界新人;无论是字斟句酌,还是信手翻阅,都能跟着文字在职场中走上几回,体味数据分析领域的乐趣与挑战。




数据场效应:基于硬件、算法与体验的未来商业/19




(美)Malcolm Frank(马尔科姆·弗兰克)/PaulRoehrig(保罗 ·罗里格)/ Benjamin Pring(本杰明·普林)著;盛杨燕 译


内容提要 ◎

Code Halo(数据场)是围绕在人们、设备、企业和行业周围的数据,通过破译这些数据所提供的信息和洞见,我们能够创造出新的商业模型,抓住此次基于数据场实现的技术变革所带来的巨大机遇,以在数据场时代立于不败地位。书中呈现了抓住此次机遇的方式方法,以及如何在自己所处的行业内为此次机遇的到来做好万全的准备,并适时出手抓住这次机遇。





数据化管理:洞悉零售及电子商务运营 /20




黄成明 著


◎ 编辑推荐

赫基国际集团CEO徐宇、唯品会高级VP蒋泾、知名自媒体人鬼脚七、中国传媒大学教授沈浩等17位企业老总及行业大腕联袂推荐;

教你如何用最常见的Excel工具建立商业运营模型;

从数据中发现商业规则、洞察消费者行为、量化商业价值,让你的商业价值算得出。


内容提要 ◎

《数据化管理:洞悉零售及电子商务运营》讲述了两个年轻人在大公司销售、商品、电商、数据等部门工作的故事,通过大量案例深入浅出地讲解了数据意识和零售思维。作者将各种数据分析方法融入到具体的业务场景中,最终形成数据化管理模型,从而帮助企业提高运营管理能力。

《数据化管理:洞悉零售及电子商务运营》全部案例均基于Excel,每个人都能快速上手应用并落地。





谁说菜鸟不会数据分析(入门篇)/21




张文霖/刘夏璐/狄松 著


◎ 编辑推荐

1. 60000多读者的支持,小黄书内容升级了,不过价格降级了。

2. 口碑的力量:小蚊子乐园是国内数据分析领域非常有影响力的牛人之一,在数据分析的职场领域中数以百万计的粉丝量。万千读者亲切的叫《谁说菜鸟不会数据分析》为小黄书。

3. 小说式的数据分析书:作者花费多年时间来精心写作,小范围试读获得15位数据分析领域专家的一致好评,并获得了广泛推荐。 作者文笔风趣幽默,通过小说式的写作方式,让人有一口气阅读完全书的冲动。升级版征求了读者的广泛意见,内容精益求精,调整了框架结构,新增了实践经验。

4. 精品值得珍藏:本书全彩色印刷,书中的每个插图都是花费了大量的时间精力来处理的,不论是图形风格、文字风格、色彩搭配都是完美的配合。此外,本书还有非常专业而精美的插画。这一切可以让我们的阅读成为一种享受,而且本书也值得珍藏在书架上。

5. 让你的工作更出彩:深入浅出的小说式讲解,让我们拉近了数据分析与普通职场人士的距离。通过本书学习,能够极大提升职场的竞争力。职场新人,市场营销、金融、财务、人力资源等管理工作中需要数据分析的人士,经常阅读经营分析、市场研究报告的各级管理人员和从事咨询、研究、分析等专业人士都能从这本书书中获得启迪和提升。

6. 广泛关注构建畅销动力:本书从创作过程中就吸引了大量人群的关注,博客超百万的点击量、微博人气不断飙升、知名论坛的顶贴支持、QQ群的广泛热议。知名作者、小说式的讲解、魅丽作品、全面营销的支持,构建起畅销动力!


内容提要 ◎

这是一本有趣的数据分析书!

本书基于通用的Excel工具,加上必知必会的数据分析概念,以小说般通俗易懂的方式讲解。本书基于职场三人行来构建内容,完全按照数据分析工作的完整流程来讲解。全书共8章,依次讲解数据分析必知必会知识、确定数据分析的结构化思维、数据处理技巧、数据展现的技术、通过专业化的视角来提升图表之美以及专业分析报告的撰写等内容。本书有足够的魅力让你一口气读下去,在无形之中掌握数据分析的技能,提升职场竞争能力。





信息之美(修订版)/22




(英)David Mccandless(大卫·麦克坎德莱斯)著;盛卿/温思玮/叶超/曹鑫 译


◎ 编辑推荐

《信息之美(修订版)》内容涉及流行、网络、思想、自然、科学、健康、食物、权利、生命、影视、媒体、音乐,是互联网时代最具创意的一本书。本修订版更新了原版中三分之一的内容,值得推荐。

由信息设计专业团队“图研所”翻译,吕敬人教授、刘振生教授、王捷老师联合推荐。

全方位展现信息之美,它将枯燥、抽象的信息变成通俗、有趣、便于理解的图形语言。

《信息之美(修订版)》还是一本优秀的视觉化图集,是信息设计、版式设计、色彩设计和图形设计的创意参考书。


内容提要 ◎

我们生活在一个信息爆炸的时代,每一分、每一秒,我们都能从电视、报纸或互联网上获得信息。我们甚至来不及思索,就已经被这些信息淹没。所以,我们需要一种新的方法来发现信息的美和乐趣。

《信息之美(修订版)(全彩)》作者花费了数年时间,整理了几百个图像信息设计案例,归纳出一系列视觉主题,希望通过这些案例告诉读者,如何使信息的视觉效果与信息关联,以及与这些信息相关的事实,让信息设计更有意思,也让信息决策更高效。

《信息之美(修订版)(全彩)》适合图像、信息、设计相关工作者及爱好者在学习和研究时使用。





寻路大数据:海量数据与大规模分析 /23




(美)Michael Manoochehri(迈克尔.马诺切里)著;戴志伟等 译


◎ 编辑推荐

微博副总|高德技术副总裁|百度主任架构师|百度技术委员会主席|UCloud创始人&CEO联合作序推荐

大数据包罗万象,谷歌大数据平台技术权威独具匠心,站在全局高度析缕分条,让你不再迷失,能快速得其门而入

本书是大数据实战用书,包含大量真实案例、实际代码、详细解决方案。

掌握大数据成功及避开常见陷阱的4个指导原则

强调协作,避免数据孤岛带来的问题

高效且经济地托管和共享数TB的数据集

“为未来而构建”以支持快速增长

使用Redis开发NoSQL Web应用来收集众包数据

使用Hadoop、Hive和Shark在大数据集上运行分布式查询

使用Google BigQuery构建数据信息面板

使用高级可视化技术探索大数据集

实现高效流水线以转换海量数据

使用Apache Pig和Cascading库将复杂处理过程自动化

运用机器学习方法进行分类、推荐及预测

使用R语言统计分析大数据集

建立合理的采购策略:何时选择自制、购买或外包

使用Python和Pandas构建高效分析工作流

展望可伸缩数据技术的新趋势及数据科学家的角色演变


内容提要 ◎

这是一个数据爆发的时代,更是一个数据技术爆发的时代,各行各业都在因此进行深刻的变革。如何从众多的数据技术中选择正确的工具、如何使用这些工具从海量数据中挖掘出有价值的东西,无疑是非常具有挑战性的问题。

《寻路大数据:海量数据与大规模分析》作者结合自己在Google 大数据平台工作的丰富经验,阐述了数据技术的方方面面。从数据收集、共享到数据存储,从分布式数据平台、分析型数据库到数据可视化,从数据工作流构建到大规模数据分析,作者不仅进行了全面而深入的介绍,更覆盖了目前流行的各种数据技术与工具,同时对技术选型提出了指导性的建议。最后,作者对数据挑战的非技术因素进行了深刻的分析,并对数据技术的发展趋势进行了展望,引人深思。

《寻路大数据:海量数据与大规模分析》对企业管理者、技术经理、数据分析师、数据应用开发人员和相关从业者都有很好的参考价值。决策者可以从中看到技术趋势,把握时代发展脉搏;数据分析人员可以看到经验的总结和工具的应用;其他从业者可以从中了解数据技术所涉及的各个方面。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。如发现有害或侵权内容,请点击这里 或 拨打24小时举报电话:4000070609 与我们联系。

    猜你喜欢

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多
    喜欢该文的人也喜欢 更多