盛葳：从视觉机器到人工智能

WQ_AI_LYS_999 2020-03-13

展开全文

从视觉机器到人工智能

文/盛葳

图/常青藤计划2018年展

2001年，英国艺术家大卫·霍克尼（David Hockney）在《隐秘的知识》一书中提出了一个极具挑战性的观点，他认为15世纪以来，西方艺术史中满是使用光学设备辅助进行的绘画创作。早期的例证就包括荷尔拜因（Hans Holbein，1497-1543）的《大使》。在他看来，“画面上充满了球体和曲面物体，光凭裸眼都很难画，可是他们的缩短透视都极为精确。”前景中有一个扭曲变形的骷髅，“这种变形可以通过倾斜的投射面来获得。我通过电脑处理将这只骷髅挤压回正常的形状，它看起来非常逼真。”［1］因此，他认为荷尔拜因在创作时使用了光学器材。相似的是，2016年，Google公司研发人员阿卡斯（Blaise Aguera Arcas）也在一个讲演上谈到艺术史上有许多利用当时新技术来进行的创作，他同样认为荷尔拜因《大使》中变形的骷髅，如果不利用视觉辅助设备是无法完成的，而且，那可能是当时最先进的视觉成像技术。

纵览艺术史，尤其是现代艺术和当代艺术的发展历史，与技术进步和媒介革新具有极其密切的关联。从印象派到装置艺术，从录像艺术到互联网艺术，这一趋势非常明显。但其中发挥作用的新技术并不仅仅是视觉机器，也包括许多生产艺术作品的必要物质技术条件。如果没有现代光学、化学工业、铁路网络，很难想像印象派的产生；如果没有规模化生产、流水线作业、围绕都市建立的现代生活方式，恐怕就不会有装置艺术；如果没有传媒业的发达、商业电视网络、家用录像机及播放设备，也同样不会出现录像艺术。［2］而且，这一趋势不仅出现在西方，同样也出现在中国。在讨论明清绘画时，不可避免会谈到“程式化”，譬如一棵树，画法可能是在一根表示树干的竖线上加上无数短横线、圆圈、三角形或者椭圆形表示的树叶。许多艺术史家从艺术和艺术史自律的逻辑出发，认为这种现象是艺术发展的必然。但实际上，其背后也不乏技术支持，即大规模复制印刷术的流行。各种画谱的大量面世与流通，使得习画者在无法亲临原作现场的情况下，也可以学习绘画。［3］但技术也限制和重新定义了绘画本身及其发展，因为本质上是“版画”的那些“中国画”画谱只能在更加符号化、抽象化的前提下才可能实现，由此，学习者在中国画的创作中接受了版画的语言和美学，这是拜技术所赐，而非艺术。

技术、媒介的变化与艺术的革新息息相关，不同领域的人们基于各种不同的理由，始终关注其发展。霍克尼不仅痴迷于研究历史上艺术技艺的变迁，并且乐于在自己的创作中尝试采用新兴媒介。2010年，他开始在Ipad上使用Brushes软件创作绘画作品，而且，这些作品未必会被复制为物质形态的画作，常常也通过互联网进行传播和欣赏。在阿卡斯演讲之时，也正值Google公司在旧金山一家画廊举办AI（Artificial Intelligence，人工智能）“画家”Deep Dream的艺术展“深梦：神经网络艺术”（Deep Dream: The Art of Neural Network）。这是新科技在艺术领域应用的一个缩影，它们引发了艺术界在最近几年热火朝天的争论。这些争论包括，AI创造的“作品”是艺术吗？如果是，应该如何重新定义“艺术”？除了模仿艺术史上的既有风格，AI能够创造全新的艺术吗？AI能够创造具有社会价值和精神意义的艺术吗？AI会取代艺术家，让艺术家失业吗？等等。

AI在近年来成为大众话题首先是因为其在包括艺术创作等现实领域的应用，而不仅仅是局限在实验室里的纯科学探索。AI的进化包括三个方面的基本要素，其一是脑神经科学的研究，由于AI是基于人类神经网络的模拟，因此，这一基础是首要的。只有弄清人类神经网络如何运转，才可能进行有效模拟；其二是计算机科学的推进，它是实现AI必要的技术手段，各种算法的实现，都取决于计算机技术的进步；其三是与互联网的接驳，如果没有互联网，就很难获取不同领域的各种大数据，而如果没有这些数据库，自主学习、深度学习都将只是纸上谈兵，AI也难以进入应用环节。大多数人开始了解AI，可能都是从“下棋”的新闻开始。在AI的历史上，似乎总在和棋手们过不去，原因是它只需要单一手段，但思维又足够复杂，方便用于实验。1914年，西班牙工程师莱昂拉多·托利斯·克韦多（Leonardo Torresy Quevedo）创造了第一个简单的自动下棋机。1950年，克劳德·尚农（Claude Shannon）发表了论文《电脑编程下棋》，同样在1950年，针对计算机人工智能的“图灵测试”出现。1952年，阿瑟·萨缪尔（Arthur Samuel）开发出了具有学习能力的电脑程序以及世界上首个电脑下棋程序，他的理想是让电脑通过编程自主学习下棋。在1956年的达特茅斯会议上，人工智能的概念首次被提出。1963年，IBM公司研发的深蓝（Deep Blue）首次挑战人类棋手大卫·布龙斯坦（David Bronstein）。其后，深蓝不断被改进，1996年首次挑战国际象棋世界冠军加里·卡斯帕罗夫（Гарри Каспаров），虽然失败，但仅在一年后，再次改进的深蓝便战胜了人类棋手。而在2016年和2017年，Google公司研发的AlphaGo完胜围棋世界冠军李世石和柯洁。尽管Google公司宣布不再参加围棋比赛，但最新版本的AlphaGo Zero显然只会更聪明。

通过此类在与日常生活紧密关联的科技新闻，大众逐渐了解AI，随着脑神经科学和计算机科学的发展，尤其是与互联网和大数据库的接驳，AI由冷门变得热门，展现出在医学、汽车、电商、游戏、工业、农业、物流、媒体等许多领域的商业前景。无论是在报纸上，电视上，还是电脑和手机上，人们都能看到大量此类报道和评论。在2017年淘宝网的双11购物节上，阿里公司的AI设计师“鲁班”可以通过数据库的学习，实现每秒钟8000张海报设计。相似的是在艺术领域，AI也崭露头角。图像识别技术是很多软件的基础，譬如Google公司研发的Quick Draw。用户有20秒时间可以在软件中画简笔画，Quick Draw会自动识别用户画的图像是什么。图像识别技术在艺术领域也有所运用，泰特美术馆将2016年的IK奖主题定位在AI领域，该颁给了意大利Fabrica团队研发的视觉识别程序，可以在路透社的新闻图片库与泰特美术馆的作品图片库之间按照相似度进行对应匹配识别，对应匹配成功的图片会在泰特美术馆和网络公开展示。另一款由Google公司研发的软件Auto Draw则可以帮助用户完善自己创作的简笔画，让它更完善、更生动。当然，专业人士会将其看作游戏，而不是艺术创作。但“风格转换”（Style Transfer）技术可以提供更多的可能性。

风格转换技术能通过AI软件将源图片的风格合成进目标图片，并保留目标图片的语意内容。换言之，AI软件可以在学习某种既有风格艺术作品的基础上，将普通照片转变为该种艺术风格的作品，并最大程度保留其原来的形象。当前流行的Prisma、Deep Art都是这样的典型例子。它们首先让AI软件学习艺术史上的一些经典艺术风格作品，然后将用户上传的图片处理成这些风格的图像，后者还可以提供用户自定义上传某种风格作品的服务，当然，那是收费的。Face2Face等软件还可以按照相似的方式处理动态视频。就其使用感受而言，对于某些风格，AI可以顺利完成的比例更高，与目标风格贴近的程度更高，譬如利希滕斯坦（Roy Lichtenstein，1923-1997）的POP风格，但另外某些却差强人意。以包容和鼓励的眼光看，对于商用级别的AI软件来说，或许应该感到满足了。但其中有一个关键的问题，并不是所有的风格都适用于所有的内容，在一定程度上也会造成上述结果，这并不仅是一个技术问题，同样也是一个艺术问题。

某些艺术家的风格具有特定的内容对象，或者对内容非常挑剔，兼容程度不高，如果在软件中处理一些艺术家从未画过的内容时，结果多半会是惨不忍睹，譬如用透纳（Joseph Mallord William Turner，1775-1851）的风格处理人像，或用蒙克（Edvard Munch，1863-1944）的风格处理幸福家庭或甜蜜爱情的合影。对于熟悉这些艺术家作品的人而言，简直是噩梦。风格转换技术的原理是拆分图像的“形式”和“内容”，它所学习的对象是形式，即风格，并将这种风格应用到新的图片内容上。在具体的运算过程中，AI软件会按照“卷积”（Convolution）的方式进行，特定风格作品的图片被分割成数个层级，譬如第一层级是轮廓，第二层级是纹理……AI软件如此进行风格学习和风格应用。但对于人类艺术家而言，形式和内容是无法完全分割的，在很多时候，特定形式与特定内容是对应，甚至一体的，唯有达到这种对应和一体，才能充分的传达出情感和观念，而这才是艺术的目的。如果张冠李戴，乱点鸳鸯谱，那终究依然只能是游戏。但对于非专业的普通人而言，则无法分清这一点，就像画家们看AI诗人小冰创作的诗歌是一码事，而在专业的诗歌评论家看来，则可能完全是另一码事。

在风格转换中，艺术作品的生成并不能完全令人满意，尤其是在将诸如康定斯基（Василий Кандинский，1866-1944）这类具有音乐感的抽象艺术风格应用到一张具象人像图片等实践中，更是如此。在商业级的应用中，目前的技术手段更难对高质量需求有所保证。尽管风格转换在静态图片和动态视频中的应用已经很广泛，但对于绘画或者电影而言，仍难以满足需求。2017年，波兰画家兼导演多洛塔·科别拉（Dorota Kobiela）与休·韦尔什曼（Hugh Welchman）共同执导了向梵高致敬的手绘油画电影《至爱梵高》（Loving Vincent）一片。该片追溯了后印象派画家梵高生命中最后的几个星期，电影的每一帧画面都是一张梵高风格的绘画。按照每秒12帧计算，最终公映的95分钟版本电影包含了6万余张绘画，数量相当巨大。但导演并没有采用风格转换的AI技术——虽然那将会更加高效且成本低廉——而是通过在美国众筹网站kickstarter平台上筹资获取投资，并在全球15个国家招募了125位画家，经过三个星期培训后，按照拍摄的内容进行手工绘画创作。相对于影片最终的预期，这种操作的可靠性和稳定性要比当前的AI高的多。

不过，技术总是在进步，今天，AI已经能够在不参考具体形象图片的基础上创作一件完全抽象的作品。譬如，由美国罗各斯大学（Rutgers University）计算机艺术与人工智能实验室、查尔斯顿学院（Collage of Charleston）艺术史系，以及Facebook人工智能研究所共同创造的AI“画家”Can（Creative Adversarial Networks，创造式对抗网络）。它是略早的Gan（Generative Adversarial Networks，生成式对抗网络）的升级版。它们共同的特点是具有两个对抗性的部分，创作网络和判别网络，后者可以对既有艺术作品进行判断，然后对前者进行修正。Can学习了8万余副现代绘画作品，判别网络能够在其基础上判定在艺术史上已经存在的艺术风格，而创作网络可以根据这一点来创造一种区别于既有艺术风格的全新艺术，包括抽象艺术。然后，这个跨学科的小组组织了一场图灵测试（The Turing Test）。人类评委会在不知情的情况下进行评审，53%的AI作品被判定为人类创造，而巴塞尔博览会参展作品只有41%被认为是人类创作的，此外，AI作品的艺术性指标也高于人类作品，尤其是那些抽象艺术作品。

那么，走到这一步，AI会将艺术家取而代之吗？答案是否定的。尽管它已经取得显著的进步，但在今天和可预见的未来，无论是现实意义的技术上还是哲学层面的观念上，这都还不现实。因为艺术毕竟并不仅仅是绘画，艺术的现实、未来也不等于艺术的历史。目前，AI在艺术领域的探索仅仅停留在历史形态的绘画中，尤其是那些为大众所熟知和热爱的艺术明星，相对来说，它们在技术的实现上要简单的多。如果将二维绘画置换为三维雕塑，又够得AI去挑战了，而对于纷繁复杂的当代艺术，今天的AI根本束手无措。这就像纸上谈兵的下棋和荷枪实弹的战争之不同。下棋只是单纯的智力游戏，而战争绝不是简单的军力对比，除了军事实力，影响战争的还有政治、经济、外交、科技等决定性的外在因素，以及士气、天气或其他更为偶然的因素。艺术更是如此，它彻头彻底是人类社会的产物，在不同时代，艺术有着完全不同的哲学内涵、物质形态和视觉样式，不同时代艺术之间的转换有时让人匪夷所思，不可能像托马斯·库恩（Thomas Kuhn，1922-1996）对“科学革命的结构”（The Structure of Scientific Revolutions）［4］描述的那样明晰。不同时代的艺术“范式”（Paradigm）之间甚至充满断裂的鸿沟，缺乏基本的逻辑联系。它们之所以都被称之为“艺术”，完全是人为的结果。而且，在每一个时代，艺术史的范围以及看待过去艺术的方式亦大相径庭，更遑论对未来的预测，就像达芬奇（Leonardo da Vinci，1452-1519）无论如何也难以预测和理解杜尚（Marcel Duchamp，1887-1968），但今天的人们却将他们统统纳入艺术的领地之中，并创造性的在他们之间建立起历史联系。如何理解艺术的历史性变化和预测未来的范式转换，是AI取代艺术家最大的障碍。

如果缺乏这种预测，AI显然无法取代人类进行艺术上的创造，事实上，今天AI的艺术创造力尚取决于人类的定义，对于目前最“聪明”的AI“画家”Can而言，项目组对它的创造要求是与既有风格不同，同时，创造出来的新风格与艺术史上既有风格的差异必须被保持在一定的范围内，否则，创作结果可能会被判定为不是艺术。而现实中艺术范式的转换却并不遵循这样的原则。当然，AI并不可能永远只是人类的客体和镜像，在人类与AI之间，将会存在一种动态的平衡，二者之间的关系不会永远一成不变，而是会相互定义、相互影响、相互塑造，就像时空穿梭回到从前改变历史，同样也会造成现实的转变。历史上的视觉机器，无论是文艺复兴时期的暗箱，还是近代的照相机、摄像机，都未能取代艺术和艺术家。其原因一方面在于，艺术并不仅仅是个视觉问题，它是整个人类社会综合影响的产物，政治、文化、经济的现实以及人们对它们的理解都会影响到艺术范式；另一方面在于，艺术和艺术家本身又因为这些新视觉机器的出现而发生了巨大的改变，视觉机器可以创造出来“以假乱真”的艺术，但人类的解决方案不是试图比机器做得更好，而是改变游戏规则本身——对于现代艺术而言，是人创作的，满足人的精神需要，至关重要。如果霍克尼创作的那些Ipad绘画是由AI来完成的，那么，在艺术批评家眼中，对它们的评价估计不会比看什么都像鸟或狗的Deep Dream好多少——他们的标准并非技术高低，而是基于人文主义的现代社会文化价值观。

在文艺复兴以后的现代社会，人类从精神上需要“人”创造的、以“人”为主体的纯粹艺术，这不仅是对“艺术”的一种哲学表述，也是对其社会功能的表述。AI当然有可能创造一种新的机器艺术，就像照相机和摄影机创造的摄影和电影一样，但很难成为纯粹艺术。不过，显然，它们的出现也在很大程度上改变了艺术史的进程，新艺术范式正是在既规避由这些视觉机器直接创造出来的艺术（及其逻辑）、又在更深层次上与之对话和互动的前提下发生和发展的，比如乔纳森·克拉里（Jonathan Crary）谈到的19世纪末的情况［5］。对于AI来说，这似乎成为了一个悖论，除非人文主义以及建立其上的资本主义、自由主义通通坍塌，人类社会的底层结构发生质的变化，而不是“公共领域”、“景观社会”这一类型性质的变化。这当然有可能发生，因为人文主义并不天生就是人类社会的基础；或者AI进化为超级AI，而不是图像识别、风格转换、有限创造这样的“小儿科”，这意味着超级AI能够对包含AI自身在内的人类社会，以及政治、文化、经济等影响艺术史进程的所有因素作出全面而充分的判断。但如果这真能实现，超级AI就不再是AI，而是上帝。无论如何，这样的运算能力和运算模型在今天依然难以想象、遥不可及，几乎就是科幻小说，但在可预期的未来，AI可能会成为改变艺术既有范式、塑造艺术新范式的重要参数。

注释：

——————

［1］[英]大卫.霍克尼，《隐秘的知识——重新发现西方绘画大师的失传技艺》，杭州：浙江人民美术出版社，2013年版，第56、57页。

［2］盛葳，《创新史：技术、媒介与社会生产方式的转型》，《美术》，2017年第9期，第123-127页。

［3］[德]雷德侯，《万物：中国艺术中的模件化和规模化生产》，张总等译党晟等校，北京：生活读书新知三联出版社，2006年版，第268-269页；[美]周启荣，《明清印刷书籍成本、价格及其商品价值的研究》，《浙江大学学报》（人文社科版）第40卷第1期，2010年1月，第5-17页；[日]大木康（东京大学东洋文化研究所），《明末‘画本’的兴盛与市场》，《浙江大学学报》（人文社科版）第40卷第1期，2010年1月，第45-53页。

［4］[美]托马斯·库恩，《科学革命的结构》，北京：北京大学出版社，2012年版。

［5］[美]乔纳森·克拉里，《观察者的技术》，上海：华东师范大学出版社，2017年版，第7-9页。