分享

《大数据时代》 (2018年11月整理)

 三禾子恒 2018-12-10

一、作者:(英)维克托·迈尔—舍恩伯格 肯尼思·库克耶    盛杨燕 周涛译

二、简论:

1、有利于端正认识论,强化思维的时代性;

2、缘于盛名而阅,却时日已远,乃2013年之版,在日新月异之际,未免担忧其滞后;

3、在于领略其思维与明辨其发展理念;

4、作为一般的读者,即专业知识的局限性,于第一遍阅读,似是蒙昧,收获不大,而第二遍却多有感触;

5、应调阅该行业最新之论;

6、必须辩证看待维克托等的观点,理解其局限性。

7、其核心观点在于三大转变。

三、辨析与理解

1、理解序一中,田溯宁关于大数据与云计算的辩证关系?及其在中国的影响、趋势?(P2

2、理解维克托关于大数据时代处理数据理念上的三大转变,即要全体不要抽样、要效率不要绝对精确、要相关不要因果。(P8

3、辨析:译者周涛关于对“相关关系比因果关系更重要”观点的批驳?(P10

①内禀的实用主义魅影,绝非大数据自身的诉求。放弃人类凌驾于计算机之上的智力优势,是人类自身的放纵和堕落,未亡之始。

②苏珊·朗格在《哲学新视野》关于对万能概念的善意批评。

③人类学家克利福德·吉尔兹在《文化的解释》的劝说,强调对一个新领域或新概念应有的态度。

4、辨析:怎样正确认识大数据思维中量变导致质变的观点,在阅读中理性应用,避免机械化?(P14

5、了解:小数据时代随机采样的产生及发展、特征及局限性,结合当前的民调工作思考?(P31

①成功依赖于采样的绝对随机性,但是实现采样的随机性非常困难。一旦采样过程中存在任何偏见,分析结果就会相去甚远。

②在宏观领域起作用的方法在微观领域失去了作用。随机采样就像是模拟照片打印,远看很不错,但是一旦聚焦某个点,就会变得模糊不清。

③随机采样需要严密的安排和执行。人们只能从采样数据中得出事先设计好的问题的结果,即其方法并不适用于一切情况,因为这种调查结果缺乏延展性,调查得出的数据不可以重新分析以实现计划之外的目的。

④在大数据时代进行抽样分析就像是在汽车时代骑马一样。在某些特定的情况下,我们依然可以使用样本分析法,毕竟我们仍然活在一个资源有限的时代,但这不再是我们分析数据的主要方式。慢慢地,我们会完全抛弃样本分析。

⑤社会科学是被“样本=总体”撼动得最厉害的学科。

⑥事例:乔布斯的癌症治疗、谷歌流感趋势预测、日本国民体育运动“相扑”中非法操纵比赛结果案。

6、辨析:维克托关于大数据时代不是精确性,而是混杂性的思维转变论。(P46-66

①大数据通常用概率说话,而不是板着“确凿无疑”的面孔。整个社会要习惯这种思维需要很多的时间,其中也会出现一些问题。但现在,有必要指出的是,当我们试图扩大数据规模的时候,要学会拥抱混乱。

②大数据不仅让我们不再期待精确性,也让我们无法实现精确性。接受数据的不精确和不完善,我们反而能够更好地进行预测,也能够更好地理解这个世界。

③错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在。因为拥有更大数据量所能带来的商业利益远远超过增加一点精确性,所以通常我们不会再花大力气去提升数据的精确性。

④“一个唯一的真理”的存在是不可能的,而且追求这个唯一的真理是对注意力的分散。要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。

⑤事例:量子力学的发现、谷歌翻译系统、信用卡公司VISA使用Hadoop (海杜普)软件。

7、辨析:维克托关于数据时代相关关系的重要性?(P68-94

①事例:林登与亚马逊推荐系统至书评组解散、沃尔玛将蛋挞与飓风用品摆在一起的销售法、美国折扣零售商塔吉特与怀孕预测。

②相关关系的核心是量化两个数据值之间的数理关系。

③通过找出一个关联物并监控它,我们就能预测未来。

8、理解:美国莫里的导航图及日本先进工业技术研究所教授越水重臣的坐姿研究与汽车防盗系统,说明:①数据,可以最不可能的地方提取出来。②创新性的应用可创造出信息独特的价值。(P103

9、辨析:维克托关于数字化和数据化的差异?(P112

①数字化带来了数据化,但是数字化无法取代数据化。数字化是把模拟数据变成计算机可读的数据,和数据化有本质上的不同。

2004年谷歌数字图书馆的探索与变革。

③诱发新的学术方向——文化组学

1971年古登堡计划

⑤亚马逊的kindle电子书比较。

10、了解:地理位置的数据化发展历程及应用?(P113-118

①在西方,对位置信息的量化起源于希腊。公元前200年,埃拉托色尼发明了用格网线来划分区域的系统,类似于经纬度法。

②公元1400年,托勒密著成的《地理学》传到佛罗伦萨,轰动一时,地图上标上了经纬度和比例尺。

1884年,美华盛顿召开国际子午线会议,将英格兰格林尼治定为本初子午线和零度经线点。

20世纪40年代,墨卡托方位法把世界划分成了60个区域,提高了地理定位的精确性。

1978年,全球定位系统(GPS)发射成功,中国和欧洲也正研发。

⑥麻省理工彭特兰和伊格尔的“现实挖掘”研究,即指通过大量来自手机的数据,发现和预测人类行为。

11、理解:数据化的使用探索走向个人化,即将日常生活的无形元素提取出来,再转化为可作新用途的数据。如Facebook (脸书)——将关系数据化, Twitter(推特)——使情绪数据化, Linkedln(领英)——将过去漫长的经历进行数据化处理,转化为对现在和将来的预测。(P119

12、辨析:维克托关于“本质上世界是由信息构成的,数据化的影响会使水渠和报纸的影响微乎其微”论断。(P125

13、辨析:维克托关于数据的创新探索与潜在价值释放方式的阐释。(P136-151

①再利用——以亚马逊早期与Aol协议例。

②重组数据——以丹麦癌症协会针对手机是否增加致癌率研究。

③可扩展数据——谷歌街景与Gps采集。

④认识数据的折旧值。

⑤数据废气利用——微软与谷歌的拼写检查。

⑥开放数据的共识。

14、理解:马克·扎克伯格的“脸书”上市交易为例,数据估值的趋势及探索。((P153

15、理解:维克托关于大数据价值链的三大构成及运用现状?(P160

①出现了三种大数据公司,即基于数据本身(如推特)、技能(如沃尔玛值助天睿公司)、思维(letpac——分享到网上的旅行照片)的公司。

②新的职业——数据科学家,是当今和未来稀缺的资源。

③过分强调技术和技能而忽视数据本身的重要性不可取,数据才是最核心的部分。

④人类从依靠自身判断决定到依靠数据作决定的转变,也是大数据做出的贡献之一。

16、辨析:维克托关于让数据主宰一切所产生的隐忧?(P194-213

①以民主德国的全面监控等为例,互联网时代隐私受到威胁,那么,大数据时代肯定加深这种威胁。

②以荷兰著名的综合民事记录数据被纳粹分子用来搜捕犹太人为例,说明运用大数据预测来判断和惩罚人类的潜在行为,这是对公平公正以及自由意志的一种亵渎,同时也轻视了决策过程中深思熟虑的重要性。

③把罪犯的定罪权放在了数据手中,借以表达我们对数据和我们的分析结果的崇尚,但是这实际上是一种滥用,有可能会变成权贵用来镇压民众的工具。

④以美国在线(Aol)的案例,我们被我们所搜索的内容出卖了。而奈飞公司的情况则是因为不同来源数据的结合暴露了我们的身份。说明:在大数据时代,不管是告知与许可,模糊化还是匿名化,这三大隐私保护策略都失效了,情况将更加不堪设想。

⑤举例电影《少数派报告》等,洞察:大数据预测可以为我们打造一个更安全、更高效的社会,但是却否定了我们之所以为人的重要组成部分——自由选择的能力和行为责任自负。大数据成为了集体选择的工具,但也放弃了我们的自由意志。

⑥以美国军方麦马纳马拉等在越战时对数据的使用、滥用和误用,及中国“大跃进”、谷歌的数据独裁等,给我们提了一个醒,在由“小数据”时代向大数据时代转变的过程中,我们对信息的一些局限性必须给予高度的重视。数据的质量可能会很差;可能是不客观的;可能存在分析错误或者具有误导性;更糟糕的是,数据可能根本达不到量化它的目的。我们比想像中更容易受到数据的统治——让数据以良莠参半的方式统治我们。其威胁就是,我们可能会完全受限于我们的分析结果,即使这个结果理应受到质疑。或者说,我们会形成一种对数据的执迷,因而仅仅为了收集数据而收集数据,或者赋予数据根本无权得到的信任。

17、辨析:维克托关于大数据时代规范管理变革的四大趋势及策略。如何调整自我意识与行为?(P218-232

①在个人隐私保护方面,从个人许可转移到让数据使用者承担责任。(即更明白、责利相应、促进创新途径——差别隐私)

②在个人动因与预测分析方面,身处大数据时代,必须拓宽对公正的理解,必须把以个人动因的保护纳入进来,个人可以并应该为他们的行为而非倾向负责,防范“数据独裁”危害。

③在运用新技术的专门人才需求方面,击碎黑盒子,大数据算法师崛起。如德国的企业数据保护代表。

④必须防止数据的垄断性。

18、辨析:维克托关于依据大数据预测作出决策,必须制定的四大防护措施,即四原则:①公开原则(公开用来进行预测分析的数据和算法系统),②公正原则(第三方专家公证),③可反驳原则(个人反驳的具体方式),④防范数据独裁的原则。(P224

19、辨析:维克托关于大数据预测在社会管理上的矛盾性?(P225

①风险评估的必要性②犯罪预设及惩罚先定③个人责任意识贬值④保姆式国家的僵局,摧毁人们自由选择行为的权力。

四、字、词、句

1、大数据发展的障碍,在于数据的流动性和可获取性。(P2

2、整个世界可能被割裂为大数据时代、小数据时代和无数据时代。(P6

3、技术成熟度曲线即技术循环曲线。(P9

4、采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物。 (P17)

5、当我们拥有海量即时数据时,绝对的精准不再是我们追求的主要目标。适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力。(P18

6、大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。(P19

7、大数据标志着人类在寻求量化和认识世界的道路上前进了一大步。社会因此放弃了寻找因果关系的传统偏好,开始挖掘相关关系的好处。寻找原因是一种现代社会的一神论,大数据推翻了这个论断。(P23

8、这是一种无意识的自省:我们把与数据交流的困难看成是自然的,而没有意识到这只是当时技术条件下的一种人为的限制。(P29

9、基于未来可能行为之上的惩罚是对公平正义的亵渎,因为公平正义的基础是人只有做了某事才需要对它负责。社会关于个人责任的基本信条是,人为其选择的行为承担责任。如果有人在被别人用枪威胁的情况下打开了公司的保险柜,他并不需要承担责任,因为他别无选择。(P205

10、大数据预测结果也并非铁定,而只是提供了一种可能性,也就是说,只要我们愿意,结局可以改写。我们可以判断出迎接未来的最佳方式,摇身变作未来的主人。(P245

11、在大数据的世界中,包括创意、直觉、冒险精神和知识野心在内的人类特性的培养显得尤为重要,因为进步正是源自我们的独创性。(P247

12、大数据是一种资源,也是一种工具。它告知信息但不解释信息。它指导人们去理解,但有时也会引起误解,这取决于是否被正确使用。大数据的力量是那么耀眼,我们必须避免被它的光芒诱惑,并善于发现固有的瑕疵。(P247

五、应用与探索方向

1、怎样看待当前民调工作的局限性?如何以大数据思维调整民调工作?

2、如何以大数据思维提升城市管理能力?

3、怎样在新形势下以谨小慎微无死角的理念规范行为?

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多