人工智能的六大伦理原则

jc_ipec 2019-06-03

展开全文

透明度和问责制是基础，其他四项原则是公平、可靠和安全、隐私和保障、包容 Tim O’Brien | 文 2018年，微软发表了《未来计算》（The Future Computed）一书，其中提出了人工智能开发的六大原则：公平、可靠和安全、隐私和保障、包容、透明、责任。首先是公平性。公平性是指对人而言，不同区域的人、不同等级的所有人在AI面前是平等的，不应该有人被歧视。人工智能数据的设计均始于训练数据的选择，这是可能产生不公的第一个环节。训练数据应该足以代表我们生存的多样化的世界，至少是人工智能将运行的那一部分世界。以面部识别、情绪检测的人工智能系统为例，如果只对成年人脸部图像进行训练，这个系统可能就无法准确识别儿童的特征或表情。确保数据的“代表性”还不够，种族主义和性别歧视也可能悄悄混入社会数据。假设我们设计一个帮助雇主筛选求职者的人工智能系统，如果用公共就业数据进行筛选，系统很可能会“学习”到大多数软件开发人员为男性，在选择软件开发人员职位的人选时，该系统就很可能偏向男性，尽管实施该系统的公司想要通过招聘提高员工的多样性。如果人们假定技术系统比人更少出错、更加精准、更具权威，也可能造成不公。许多情况下，人工智能系统输出的结果是一个概率预测，比如“申请人贷款违约概率约为70％”，这个结果可能非常准确，但如果贷款管理人员将“70％的违约风险”简单解释为“不良信用风险”，拒绝向所有人提供贷款，那么就有三成的人虽然信用状况良好，贷款申请也被拒绝，导致不公。因此，我们需要对人进行培训，使其理解人工智能结果的含义和影响，弥补人工智能决策中的不足。第二是可靠性和安全性。它指的是人工智能使用起来是安全的、可靠的，不作恶的。目前全美热议的一个话题是自动驾驶车辆的问题。之前有新闻报道，一辆行驶中的特斯拉系统出现了问题，车辆仍然以每小时70英里的速度在高速行驶，但是驾驶系统已经死机，司机无法重启自动驾驶系统。想象一下，如果你要发布一个新药，它的监管、测试和临床试验会受到非常严格的监管流程。但是，为什么自动驾驶车辆的系统安全性完全是松监管甚至是无监管的？这就是一种对自动化的偏见，指的是我们过度相信自动化。这是一个很奇怪的矛盾：一方面人类过度地信赖机器，但是另一方面其实这与人类的利益是冲突的。另一个案例发生在旧金山，一个已经喝晕了的特斯拉车主直接进到车里打开了自动驾驶系统，睡在车里，然后这辆车就自动开走了。这个特斯拉的车主觉得，“我喝醉了，我没有能力继续开车，但是我可以相信特斯拉的自动驾驶系统帮我驾驶，那我是不是就不违法了？”但事实上这也属于违法的行为。可靠性、安全性是人工智能非常需要关注的一个领域。自动驾驶车只是其中一个例子，它涉及到的领域也绝不仅限于自动驾驶。第三是隐私和保障，人工智能因为涉及到数据，所以总是会引起个人隐私和数据安全方面的问题。美国一个非常流行的健身的App叫Strava，比如你骑自行车，骑行的数据会上传到平台上，在社交媒体平台上有很多人就可以看到你的健身数据。问题随之而来，有很多美国军事基地的在役军人也在锻炼时用这个应用，他们锻炼的轨迹数据全部上传了，整个军事基地的地图数据在平台上就都有了。美国军事基地的位置是高度保密的信息，但是军方从来没想到一款健身的App就轻松地把数据泄露出去了。第四是人工智能必须考虑到包容性的道德原则，要考虑到世界上各种功能障碍的人群。举个领英的例子，他们有一项服务叫“领英经济图谱搜索”。领英、谷歌和美国一些大学联合做过一个研究，研究通过领英实现职业提升的用户中是否存在性别差异？这个研究主要聚焦了全美排名前20 MBA的一些毕业生，他们在毕业之后会在领英描述自己的职业生涯，他们主要是对比这些数据。研究的结论是，至少在全美排名前20的MBA的毕业生中，存在自我推荐上的性别差异。如果你是一个男性的MBA毕业生，通常你在毛遂自荐的力度上要超过女性。如果你是一个公司负责招聘的人，登录领英的系统，就会有一些关键字域要选，其中有一页是自我总结。在这一页上，男性对自己的总结和评估通常都会高过女性，女性在这方面对于自我的评价是偏低的。所以，作为一个招聘者，在招聘人员的时候其实要获得不同的数据信号，要将这种数据信号的权重降下来，才不会干扰对应聘者的正常评估。但是，这又涉及到一个程度的问题，这个数据信号不能调得过低，也不能调得过高，要有一个正确的度。数据能够为人类提供很多的洞察力，但是数据本身也包含一些偏见。那我们如何从人工智能、伦理的角度来更好地把握这样一个偏见的程度，来实现这种包容性，这就是我们说的人工智能包容性的内涵。在这四项价值观之下还有两项重要的原则：透明度和问责制，它们是所有其他原则的基础。第五是透明度。在过去十年，人工智能领域突飞猛进最重要的一个技术就是深度学习，深度学习是机器学习中的一种模型，我们认为至少在现阶段，深度学习模型的准确度是所有机器学习模型中最高的，但在这里存在一个它是否透明的问题。透明度和准确度无法兼得，你只能在二者权衡取舍，如果你要更高的准确度，你就要牺牲一定的透明度。在李世石和AlphaGo的围棋赛中就有这样的例子，AlphaGo打出的很多手棋事实上是人工智能专家和围棋职业选手根本无法理解的。如果你是一个人类棋手，你绝对不会下出这样一手棋。所以到底人工智能的逻辑是什么，它的思维是什么，人类目前不清楚。所以我们现在面临的问题是，深度学习的模型很准确，但是它存在不透明的问题。如果这些模型、人工智能系统不透明，就有潜在的不安全问题。为什么透明度这么重要？举个例子，20世纪90年代在卡耐基梅隆大学，有一位学者在做有关肺炎方面的研究，其中一个团队做基于规则的分析，帮助决定患者是否需要住院。基于规则的分析准确率不高，但由于基于规则的分析都是人类能够理解的一些规则，因此透明性好。他们“学习”到哮喘患者死于肺炎的概率低于一般人群。然而，这个结果显然违背常识，如果一个人既患有哮喘，也患有肺炎，那么死亡率应该是更高的。这个研究“学习”所得出的结果，其原因在于，一个哮喘病人由于常常会处于危险之中， …