分享

大数据的困惑

 颂月山房 2016-01-07

大数据,是我们这个时代鲜亮的符号,也是我们这个时代有用的工具。


在读过数本大数据的作品后,我产生了颇大的困惑。“革命性”、“颠覆性”和“终结性”等词语或隐含意义,被毫不吝啬地赋予了它。与以往工具性革命不同的是,大数据大有取代人类的组织、制度,甚至于道德、价值观和宗教信仰的超常力量,那全然是一个主体或主宰的角色。那句“除了上帝,任何人都必须用数据来说话”的名言,应当是对大数据神奇功能的最经典表达。在这里,人,已经退居于次位了。


那么,大数据究竟是人类的工具还是主宰?如果只是工具,我们只需要回答工具运用的利弊和风险;但如果超出了工具的范畴,整个人类社会便都在大数据的幽灵管控之下,那将是什么样的场景?


万能的大数据?


记得有这样的说法,历史是不可能的。意思是说,人类社会要将自身全部的历史真实地记录下来,没有可能性。这是因为,每个人都是人类的一部分,每个人每分每秒的活动都是人类历史的一部分,当且仅当这些活动被完整地记录时,人类真正的历史才得以存在下来。现在我们看到的“通史”、“专门史”之类,即使认定它们真实,也只是人类历史极少部分的记录。就在此时,我一边思考,一边用文字组成文本,却没有谁为我记录。历史,真的不可能。


经验告诉我们,管理是不可能的。现代社会将一个组织内部自然分裂为管理者和被管理者。不论管理者使用何种监督、管理、控制、激励、评估和考核等方法,他根本不可能使被管理者每分每秒都严格服从管理者的要求。因为管理者根本不可能完全掌握被管理者每分每秒的活动情况。看看你所在的组织吧,管理者是不是常常因为被管理者“不听话”却又束手无策而头痛?必须承认,管理也是不可能的。


历史和管理不可能,预测未来就更不可能了。明天股票市场的走势如何?2016年巴西奥运会上哪支队伍将登鼎足球冠军?谁将赢得下一届美国总统的选举?尽管人们乐此不疲地预测这、预测那,用尽了参数、算法、模型,最后却从未有过“一致的”预测结论。就是“预测准确”者,事实证明也大多不过是运气加猜测。当然,有另外一种情况,“如果你要准确地预测未来,你必须制造未来”。原来一些预测准确者,玩了个事先猫腻,做了一个未来确定的“局”,再来“预测”。国际上某些金融大鳄就有过这样的“能力”,他们操纵市场后,“准确预测”了市场走势,用谋财害市的恶行,实则诠释了预测的不可能。


就在我们将如此“不可能”演进到更为广泛的领域时,大数据来了。


所谓大数据,核心就是“量大”,或称全量数据。既然全量,数据就是混杂的,不精确也不需要精确,有可计量和可计算的,也有不可计量和不可计算的。正因为如此,以往关于数据之间的“因果关系”,在大数据时代就只存在“相互关系”了——你不需要由部分去推测全部,全部都可视或都可掌握。举例说,当年泰坦尼克号撞上了冰山,船长能够看到的只是冰山一角;他只能通过这一角冰体,去推测整个冰山大小,建立海面上可见部分和海里不可见部分之间的“因果关联”,如此认知冰山具有极大的盲目性。结果,悲剧发生了。


如果能够掌握整个冰山大小和运动的全部状况,船长就将避开冰山。冰山大数据在此给予船长决策的信息,完备到了没有丝毫的遗漏,不需要任何的推测,当然就不需要任何的参数、算法和模型了。可见的一切决定了可控的完美。


但是,人类有如此的可能,记录和保存下来全部关于自然和人类社会的大数据么?撇开几千年历史没有记录下来的信息,就是当下的时代,我们能够记录和保存全部的数据?


我们注意到,许多学者对于巨量的现代信息记录和储存有足够的信心。特别是,对于人类活动所有信息的自动记录,以传感器为代表的科技手段显示出了强大的功效;甚至于,关于人类大脑记忆、思维活动和逻辑预测,这些看不见的存在,随着脑科学和信息科学的进一步发展,也将被记录、可视化和可掌握。大数据就将是“大全”无疑了。


这样,我在此时的写作,很可能就被身边无所不在的传感器所记录,并传递到某个存储中心。相应而来的,就是管理者能够十分清楚被管理者分分秒秒的言行,管理轻车熟路。至于预测未来,再也不能称之为“预测”,因为将要发生和出现的事项,由于自然和人类社会的全量数据,包括人们脑子里想要做的,都已经确定存在了。你要问明天的股市走势?好,所有投资者的想法都已经被清楚掌握,是涨是跌完全确定。这与其说是预测明天,不如说是今天决定明天。


这是一幅奇妙诱人的画卷。然而,基于它人类生活逻辑的缺失,我们只能认为这是现代人类思维创造出来的新型“乌托邦”。要知道,不论是记录、整理、分析全量的数据,还是由这些数据演化出判断或结论,都是需要耗费资源的。而且,数据越大,耗费的资源也就越多。在人类生存的地球上,不可能有足够多还能再生的资源支持日益增长的大数据。至少,这个问题的答案是不确定的,这正如地球资源无法支持无限扩展的人类数量一样。因此,再大的大数据,也无法尽收自然和人类社会全部的存在和活动内容。


更为重要的在于,大数据不可能仅仅由机器设备自身运转来实现其功效,总是要有人的介入或至少是协调,抑或是管控。人的非机器属性,决定了有人在的大数据必定有不确定的“人为”因素。管理也好,预测也罢,依据于“人在”的不确定数据,就难得有完全正确并精确的管理方略,更谈不到将明天未定的格局确定在今天了。


如果我们被大数据主宰


与他种工具相比,由于不断进步的储存、移动和网络技术,大数据工具很容易被提升到更高层级,大有“超级工具”的意味。这种进阶常常让人的思维走得更远,大数据似乎有对其他工具的取代功能,甚至有超越工具的功能。显然,我们无法认同。


从人类社会发展史来看,技术、制度(包括组织和规则)和道德理念(或文化价值意识形态)是三个不可或缺又不可相互替代的社会要素。这三种要素,都是由人类自我创造、变革和积累起来的。相对于人的主体地位,它们都是工具性质的,是从属性的存在。当技术进阶特别是出现突变时,既存的制度和道德理念就将受到巨大的冲击,从而产生制度和道德理念变革的需要。通常的结果是,基于技术进阶的直观、直接进步性,适应性的新制度和道德理念就将逐渐形成,一个新的技术、制度和道德融合的时代到来。


有点可悲的是,人们常常忽略了另外的一面:技术进阶或变化并非必定、长久和全面地意味人类社会的进步,制度和道德要素经常会反过来,抑制、协调甚至于取消某些技术的进阶。在这种意义上,可以说,几千年的人类文明史,就是这样“三大要素”不断变化、影响和组合的历史。


让我们看一个生活案例,那是城市的十字路口。


在我儿时的记忆里,一些城市的十字路口是没有指挥交通的警察和红绿灯的。那时人少车少,无需路口的管控。在繁华的十字路口,则有挥动红白小棒的警察。后来,几乎所有的路口都装配上了红绿灯。再后来,许多路口又安装了可视的“探头”。管控的工具从无到有、从简到繁,从人直接指挥到机器协助控制,标示了时代的技术进阶。然而,红白小棒被红绿灯及“探头”代替,管控者并未由人变成机器。人还是管控者。相应地,由人管控的制度仍在。


对于通过路口的驾车者和行人而言,历史的变迁并没有改变他们必须遵循的通行规则和道德要求,改变的只是他们行事的具体方式。在路口没有管控时,通行者遵循某种“自然规则”和“自发德性”,如靠右通行,礼让他人;在有人指挥或是红绿灯管控时,服从指挥或遵循“红灯停、绿灯行”的制度规则;“探头”则是一种支持性的技术工具,用以提醒或是警示通行者,遵守路口规则或是共认的道德。在这里,工具的进步根本无法取代通行者的制度意识和道德感觉,更谈不到工具可以取代制度和道德本身了。


如果我们将路口管控工具的进阶神化,如认定“探头”类可视设备的全面运用,可以自行监视路口通行,并通过大数据,指挥通行者安全、顺畅地通过,从而消灭通行的制度和通行者的道德感觉,那么,我们就会在技术进阶中产生某种奇特认知——机器将代替人。就这样,机器在神化中被主体化,技术在夸张中被霸权化,而制度和道德意识则退却得不知去向。恰恰是后者的退位,人的主体地位被挤了出去。


时下关于大数据作用的突出化或神化意味,是相当浓厚的。当我读完那些故事生动、激情四射的作品时,也一时笃信这个新鲜的造物,不只是一种新的技术工具,更有那跨越疆界、取制度和道德意识而代之的功用。如此逻辑再往前走一步,那就是取代人的主体地位了——大数据时代的全面到来,人的主体地位终结。


想象一下那种逻辑达到的巅峰。


当大数据大到完全无遗漏地记录人类社会所有个体、在所有地方和所有时间里的言行,并可以自动分析和掌握所有个体的言行规律、习惯,甚至于偶然的例外时,每一个人便都被完全地“数据化”,以往定义的“自然人”、“经济人”等,就被“数据人”所替代;同时,储存、传递和使用数据的技术手段日新月异,数据越来越失去其私密控制的可能,每个人不只是“数据化”,还被“透明化”。例如,现在的“人肉搜索”,未来就会为“透明人展示”所取代。大数据能够达到的巅峰,就是如此“透明数据人”的出现。这意味着什么呢?


当你清楚在通过路口时,你的言行都被“探头”等工具“数据化”而完全“透明”在公众面前时,你便会自动地服从路口通行的规则。所有通行者都是如此时,路口便展示出机器对于人的管控特征来:人人都听机器的。人在此时,似乎不再自我、自在和自由,只有对于机器设定流程和技术标准的完全、绝对和终极服从。如果有“出格”言行,因“数据”完整,又透明公开,你将受到惩罚。可见,“透明数据人”的第一意味,就是服从机器或是技术工具。人,屈从在自己的创造物面前。


进一步看,基于全量数据和全透明,人性中的三大“恶”,即贪婪、懒惰和恐惧就会受到极端性的抑制,甚至被消灭。既然你的一切都“数据”和“透明”,那些“见不得人”的东西就不会让其见人了。人皆如此,这个世界就不仅没有见不得人的东西,连相关的想法都没有了,人性里的“恶”就此消失殆尽。那是一个多么简单和谐的世界!


与“恶”相对应的,是人性中的同情、怜悯、关爱等“善”。当“恶”消失时,“善”因为缺乏“恶”的对比,自然地平常化,其“善”的程度也必定日益淡化,最后成为日常言行而社会性地被漠视,至少不会被突出、敬重和褒扬。这样的“善”,与其说是“善”,不如说是常态之为更贴切。“善”一旦成为常态,便不需要张扬、鼓励和推动。在这一点上看,人性实则已无善恶,事物完全去却是非。


再往前行,组织、制度、道德和价值观还有宗教理念等,这些基于人性的“善恶”复杂结构而形成的社会历史形态就没有必要存在。当路口人人都基于大数据而完全无误地遵循规则通行时,监督的交警和处罚或褒奖的机构都是不必要的,相应的制度也多余。就是那些所谓的道德要求和理念,大数据加透明化,人们不再以道德的良好感知为驱动去守则,守则成了固化行为,道德等意识形态类的东西还能够存在么?


这是大数据时代,还是大数据统治人的时代?在巅峰的想象里,当然是后者。人一旦被外在物统治,不论这种外在物是人类自己创造的,还是大自然生成的,它们都将抑制人的主动性,将人归化到机械性的生存和生活轨道中去,一直演化到最后彻底地剥夺人的主体性。那个场景,人不再是人,只是机器的服从者;甚至于,人也由于机械性替代了天然的自我、自在和自由特性,成了机器世界里的一员。人类无需去发明创造“机器人”,自身已经变化成了机器人。人终结了,人类社会也终结了。


“人类一思考,上帝就发笑。”这也未免太耸人听闻了。但我必须说,当你细心读几本传播颇广的大数据作品,你就很可能走入上面的逻辑通道,除非你停留在大数据故事的层面,不展开思维的前行。


人之所以为人,在于人性有别于世间他类存在物的本质。这一点表明,人性不可更改,人的主体性也不会变化。虽然如此,人类历史的经历表明,人性和人的主体性是一直受到自然、人类社会自身和人的创造物的限制、冲击和挑战的,不时的、局部的人性丧失和主体性疑惑与徘徊都是存在的。为什么在人类社会思想和实践的长河里,追求人的自我、自在和自由的声音,至今不绝于耳,就在于人性和人的主体性一直都处在存在和反存在的对抗之中。许多的思想家甚至于认为,在这种存在和反存在的过程中,保有人性和人的主体性就是人类的基本使命。在我看来,这一使命至今未见得有丝毫的变化。


众所周知,改造世界和创造世界是人类赢得主体性存在的途径。人们希冀,在这一过程中,获得最大限度的人的解放。不幸的是人类的确改造又创造了世界,却常常受到自身创造物的束缚和统治。这也就是许多思想家都指出过的“异化”——人的主体性被自己的创造物所统摄,解放自己的过程却时常被自己的创造物剥夺了自我。最经典的例子,就是人类创造了“货币”,带来了经济交往便利,使人类获得了一种经济自由。悲哀的是,人类时常是货币的奴隶。


大数据,这个人类最新的大创造,无论如何看待它的巨大功用,它与货币类创造没有什么不同,也只是一种人类的造物。既然只是为人使用的技术工具,就不应当成为统治人的主体,事实上也成不了统治主体。


“伊卡洛斯悲剧”和“大数据霸权”


人类的悲喜剧总是交替上演的。终极而言,人类并不会被大数据类技术工具所主宰,但过于相信技术工具而导演的悲剧,真没有少出现。希腊神话里的“伊卡洛斯悲剧”,就是人类此种悲剧的写照。那位叫伊卡洛斯的孩子,用羽毛和蜡制造的双翼飞行时,没有听从父亲代达罗斯的警示,过于相信双翼,越飞越高,结果蜡被太阳融化,双翼脱落,坠海身亡。这一悲剧告诉我们,工具是有用的,但它也是有局限性的。如果我们夸大甚至于神化某种工具的作用,结果就很可能是一个悲剧。


大数据当然是有用的工具。虽然说,它并不可能让“历史可能”,却的确让“许多的历史成为可能”,也的确让“许多的管理成为可能”,并大大地提高了预测未来的水准。同样,大数据并不可能消除“因果分析方法”,但的确省略了大量的因果分析,还为复杂的因果分析提供了厚实的基础。重要的是许多自然、社会和经济等风险,通过大数据可以得到更为确定的掌控。在这个意义上讲,大数据时代里,不会很好运用它的个人,必定落后;不会很好运用它的机构,必定会被淘汰;而不会很好运用它的国家或民族,将必定处处被动。


再有用的工具,也只是工具。应当清楚,作为工具的大数据,自身并无所谓利弊。它的利弊,完全产生于人们对它的认知和使用。在这里,认知是第一位的——正确或说有利地使用它,取决于明确、客观的认知。


是一种工具,就不可能万能。这一认知的价值,表现在重申人的主体性和人性本质的顽固上。或者说,只有人才是“万能的”。在使用的层面上,基于大数据工具的非万能性,人就应当也必须主动、积极和智慧地运用大数据,来造福于人类社会;同时,清楚大数据的工具局限,以人的自我主体觉醒,努力地弃“恶”从“善”,而不是仅仅寄望和依赖于大数据类工具,试图通过消灭人的主体性来消除人性中的“恶”。


是一种技术工具,就还需要其他的工具,共同服务于人类社会。如组织、制度、道德和信仰等,都是服务于人的工具,大数据只是“工具箱”中的一种,它并没有对于其他工具的取代功能。必须承认,在一定的历史环境下,由于人类面对的主要问题不同,“工具箱”中的一种或多种,通常会表现出突出的效能,也就常常会被推举到相对重要的位置。但是,重要却不是替代一切工具的理由。更何况,今天处于重要位置的工具,明天或许就将退居次位,毕竟人类社会需要不同的主要工具,面对变化多端的外面世界。


不难看出,时下对于大数据功能过大的渲染,大有培育和强化一种“大数据霸权”或“技术霸权”理念的味道,推崇技术至上的社会生存和生活模式,淡漠并弱化社会组织、制度、法律、道德等他类工具,使得社会各种管理畸重于技术工具。如果不过于较真,从大数据推演来看,现在我们的社会有了某种“技术霸权”的特征。人们在遇到各种问题时,首先和最后想到与采取的策略绝大部分是技术性的。看看现代城市里几近全覆盖的“探头”监视,比较曾经“夜不闭户”、“路不拾遗”的人们内心道德约束,当下社会管理工具的“技术性”展露无遗。


那么,这种“技术霸权”会带给我们什么呢?


一方面,“技术霸权”强烈地忽略人的主体性,忽略人的主体性对于自我人性中“恶”的抑制,必将加大社会问题的冲突程度,加大社会管理成本,甚至于引发巨大的社会对抗。试想,当技术至上成为社会普遍的行为驱动意识时,人们就都会以追求技术工具的执掌和使用为常态,淡化人自我的内心约束。一旦人性中的“恶”没有了自我主体性的抑制,如法律意识的内化、道德感觉和信仰要求,技术工具竞争和对抗中的人性“恶”就将极端化,进而逼迫更为强大的技术工具出现、争夺和争斗,社会问题更趋严重,管理难度和成本巨量增加。如当下网络世界里的病毒和反病毒,信息的盗窃和反盗窃,就是“技术霸权”问题的最为生动的例子。


另一方面,“技术霸权”下对于其他工具的漠视和削弱,加重了人性“恶”的放纵。包括技术工具在内的“工具箱”,虽然都是由人自我创造出来的,但它们对于人性中的“恶”是有一定的外在抑制力的。有些工具,还是就人性之“恶”而创设出来的。大数据基于它“全量”加“透明”,有助于扬善止恶。然而,单一的技术工具根本无法发出较为理想的抑制作用,这是因为“技术霸权”理念的普遍化,人们相信技术工具的抑制一定会有相应的反抑制技术工具出现;与此同时,制度和道德等工具的失位,让这种技术性反抑制能够轻而易举地实现。当行车人用高新技术手段遮住了车牌,让“探头”照不到时,其违规行为就有了“道高一尺,魔高一丈”意味,而制度处罚和道德谴责的空缺,无疑会助长人们与“探头”对抗的“恶”行。


令人担忧的是,大数据正在向如此的“技术霸权”行进,懂它和不懂它的人们都在试图“抢占”大数据的制高点,努力去获得那种技术神奇。如果说,获取“霸权”不是用来管控、对抗他人而是造福于社会,那么,这种“抢占”就是人类社会的福音。可怕的是,过于推崇大数据的“技术霸权”本身,就意味着人的主体性削弱,意味人主体对人性之“恶”强力抑制的失位。“抢占”不过是谋取权威和利益的别名,这和人类历史上推崇货币的神奇,结果引出你死我活的货币争斗一样。而且,人创造出来的组织、制度、道德和信仰类的力量,也由于大数据“万能”神奇的过度张扬,不得不退避三舍。一旦遇到有人用大数据来“作恶”时,人们对付其的策略也只会在大数据类的技术世界里寻找,企望用一种新的技术霸权,对付强大的“作恶”工具。我们真有点如同伊卡洛斯,已经用大数据的双翼开始起飞,而且感觉似乎越来越妙。


当然,现实也在给予我们明确的警示。人们不仅发现真正完全无漏的“全量数据”根本无法获取,也就无法由其来掌控外部世界,更无法用“确定”代替预测。而且发现,谁来使用大数据成了最为关键的问题,这如同当年居里夫人发现了镭一样,使用者的不同,决定了对人类意义的完全不同,或是用镭治疗人类疾病,或是用镭制造杀人武器。这也如同在“伊卡洛斯悲剧”里,儿子和父亲使用人造双翼飞行的结果不同一样。


说到这里,我们又回到人的主体性。镭也好,人造双翼也罢,还有大数据,最终决定它们“能”和“不能”、“如何能”又“如何不能”的根本的因素,是人,而不是这些被发现、创造或是积累的外在物自身。在这变化无穷的世界里,人类不可能不迷茫,有时甚至于迷失,但时刻记住人的主体性,认清大数据类工具的属性,我们就不会“迷”得过久、过深。


我想在此再次推荐英国学者维克托·迈尔-舍恩伯格等著的《大数据时代》一书。作者在预言大数据带来巨大冲击的同时,敏锐地提示了过于依赖大数据,将对人的主体性造成伤害。就这一点,称这些作者为大数据时代的“代达罗斯”应不为过。




(本文原载于《书屋》2015年第12期)



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多