分享

「书籍推荐」学习数据科学,这5本非技术书籍不可错过哦~

 天下小粮仓 2019-03-28

前两天在toward science上看到有个作者推荐了关于数据科学学习的10本书籍,于是我特地去搜索了一下,发现确实还不错,于是想着给大家推荐过来。

话不多说,直奔主题~

No. 1 Weapons of Math Destruction算法霸权:数学杀伤性武器的威胁

作者:凯西·奥尼尔

「书籍推荐」学习数据科学,这5本非技术书籍不可错过哦~

我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。

但是,正如凯西·奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。

读完本书,你会发现,大数据的武器化是无处不在的。也许,当你看到世界上最强大的数据系统做的这些事,你会产生一些焦虑,但是,对于那些我们未能认识到的问题,我们谁都无法解决。

如果你想从事数据科学相关的工作,这本书绝对是必读之作。

No.2 Everybody Lies 人人都在说谎:赤裸裸的数据真相

作者:赛思·斯蒂芬斯·达维多维茨

「书籍推荐」学习数据科学,这5本非技术书籍不可错过哦~

赛思·斯蒂芬斯·达维多维茨是前谷歌数据科学家和专栏作家。他的研究发现,世界充满了谎言,人类或出于善意或出于恶意,无时无刻不在说谎。对于以上以及类似的很多问题,传统的统计调研方法得出的结论很多是错误的,误导了我们的认知。

但是,人们往往在一个地方放下戒备、吐露心声,那就是互联网。每一次搜索、每一次点击、每一次停留、每一次关闭……在线生成了大量的数据,暴露着你的真实想法、欲望、恐惧和职业,而海量的数据形成的真实而庞大的数据宝库会总结出意想不到的结论和趋势。

读完这本书,你将收获:1)找到筛选正确数据的方法,了解人们实际在做什么;2)拓展认知思维,正确认识世界运转的方式;3)掌握未来的发展趋势,让你的规划更有远见。

No.3 Big Data大数据时代:生活、工作与思维的大变革

作者:维克托·迈尔-舍恩伯格

「书籍推荐」学习数据科学,这5本非技术书籍不可错过哦~

本书作者维克托·迈尔·舍恩伯格现任牛津大学网络学院互联网研究所治理与监管专业教授,系国际资深大数据专家。他在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。

他明确指出了大数据时代处理数据理念上的三大转变:不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系。这些都颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。本书认为大数据的核心就是预测。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。

No. 4 Algorithms to Live By: The Computer Science of Human Decisions 算法之美:指导工作与生活的算法

作者:布莱恩·克里斯汀&汤姆·格里菲思

「书籍推荐」学习数据科学,这5本非技术书籍不可错过哦~

"我们所有人的生活都受到有限空间和有限时间的限制,因此常常面临一系列难以抉择的问题。在一天或者一生的时光里,哪些事是我们应该做的,哪些是应该放弃的?我们对杂乱无序的容忍底线是什么?新的活动与熟悉并喜爱的活动之间如何平衡,才能取得令人愉快的结果?这些看似是人类的难题,其实不然,因为计算机也面临同样的问题,计算机科学家几十年来也一直在努力解决这些问题,而他们找到的解决方案可以给我们很多启发。

通过丰富的跨学科研究,作者指出,计算机算法也可以用来解答人类面临的这些问题。这本书告诉我们如何更地利用直觉、什么时候应该把选择权交给命运、无所适从的时候应该如何做出选择,以及如何地与他人保持联系。从找配偶到找停车位,从组织管理个人邮箱的收件箱到理解人类记忆的作用原理,这本书把计算机科学的智慧转化为人类生活的策略,引导我们做出明智的选择。

No.5 The Signal and the Noise 信号与噪声

作者:西尔弗

「书籍推荐」学习数据科学,这5本非技术书籍不可错过哦~

本书可能是世界上最受欢迎的统计相关的书籍之一。信号与噪声是常用在数据科学中的一种比喻手法。“信号”指的是我们想要和需要的事实,比如能帮助我们侦破早期鞋子案的信号。“噪声”则是另一回事,通常指的是不相干的信息,它阻碍或误导我们搜索信号。

在信息爆炸的大数据时代,随着我们的生活节奏变得越来越快,我们所要做出的预测的速度和数量都在不断增加。一个不容忽视的事实是,现实世界中的很多预测都失败了,由此付出了巨大的社会代价。本书检视了从飓风到地震、从经济到股市、从NBA到政治选举在内的众多领域的预测事例,旨在回答一个问题:如何才能从繁杂的海量数据中筛选出真正的信号,摒弃噪声的干扰,从而做出接近的预测。

真正的预测者会用概率的方法思考问题,他们谦虚而且勤恳,他们能清楚地区分什么是不可预测的、什么是可预测的,他们注重能带领他们接近的成千上百个小细节,他们能辨识出什么是噪声、什么是信号。

从全球经济的健康到战胜恐怖主义,都依靠预测的质量。《信号与噪声》可以给你想要的答案。


另外还有几本书,目前我还没看到有中文版本,如果你英文也很ok的话,也建议看看:

1)The Information: A History, a Theory, a Flood by James Gleick

2) Dataclysm: Love, Sex, Race, and Identity-What our online Lives Tell Us About Our Offline Selves. by Christian Rudder

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多