分享

凤凰艺术|人工智能是如何改变艺术史的?

 高观点笃者 2022-12-05 发布于上海
图片


 

DALL-E 2



随着越来越多的艺术家使用AI工具进行艺术创作,AI作画的出现让艺术史学家们陷入了困境。

今年秋天,DALL-E 2,一个从文本到图像的人工智能图像生成器进入了公众视野。该模型的最初版本于2021年1月由OpenAI研究实验室发布,取自迪斯尼2008年可爱的机器人WALL-E和超现实主义艺术家萨尔瓦多·达利(Salvador Dalí)的戏谑之名。这项技术的一个版本DALL-E Mini早前在“Hugging Face”平台上发布,在推特上风靡一时,每天有超过150万用户使用DALL-E创建了超过200万张图片。

DALL-E 2同时带来了两个问题:一是这项技术能在多大程度上真正“理解”艺术;二是在机器的“头脑”中量化艺术史是否有用?

尽管有些批评的声音质疑这项新技术的物质现实性及其对艺术创作和艺术史定义的颠覆和挑战,但大部分人仍然赞成AI绘画的艺术性,并对AI艺术的创造力和发展潜力持有乐观态度。

以下是凤凰艺术为您带来的综合编译报道。

图片

点击链接

阅读相关报道



图片
从猿进化为人,人类经历了漫长的数百万年时间。从文明的曙光初露,到真正创造出伟大的现代艺术,又是几千年的时间过去。

对于“AI艺术家”来说,这个过程是以一年和几个月来计算的。

2021年1月,美国著名人工智能实验室OpenAI推出了“DALL-E”算法,这个算法可以“通过自然语言的描述创造逼真的图像和艺术”。

2022年4月,“达利二代”(DALL-E 2)上线了,生成的图像更加真实准确,分辨率提高了4倍,画面的美感和艺术氛围更是与一代不可同日而语。

又过了5个月后,AI生成的画作,便已经可以在人类的艺术比赛上斩获大奖了——这位名叫杰森·艾伦(Jason Allen)的参赛者,凭借他用AI绘画工具Midjourney生成的作品,在美国科罗拉多州博览会的艺术比赛中获得了第一名。

这似乎是一座幽深华美的宫殿,金碧辉煌,却并未被完全照亮,仿佛被永恒的夕阳所笼罩。几位身着长袍的女子站在大厅里,远眺着占据画面中心的一轮“圆窗”,窗外隐隐可见另一个有着建筑痕迹的世界。神秘的氛围弥漫在这间殿堂里,画作本身则既看不出年代,也看不出背景,但熟悉科幻的观众或许都会脱口而出——“太空歌剧”。
图片

获奖作品《太空歌剧院》

尽管AI艺术的画面效果惊人,但当人们得知这并非出自人类艺术家之手,而是出自人工智能机器之后,还是引发了巨大的争议。有网友将此次获奖事件与“人们不会让机器人参加奥运会”相比,并表示“我们不需要与机器人比赛,更何况这些机器设计出来就是为了击败我们。对艺术,大概也是如此吧。”

悲观的预言跟着就来——“我们这一代人即将眼睁睁见证艺术的消亡”“如果连最具创意的艺术工作都无法避免被机器所吞没,那其他高技能的工种也将面临被淘汰的危机。到时候,我们又能剩下什么呢?”“艺术正以尽可能便宜和快速的方式生产出来,然后在社交媒体上被迅速消耗掉……”



每当艺术家的手与最终的艺术品分离时,人们就会站起来。“照片是真正的艺术吗?”他们在19世纪曾喃喃自语。“天啊,我讨厌这个叫波洛克的人,”看到艺术家似乎从未触摸过的泼溅的画布,反对者们喊道。(此指杰克逊·波洛克(Jackson Pollock,1912年1月28日-1956年8月11日),美国抽象表现主义绘画大师,也被公认为是美国现代绘画摆脱欧洲标准,在国际艺坛建立领导地位的第一功臣。他于1947年开始使用“滴画法”,把巨大的画布平铺于地面,用钻有小孔的盒、棒或画笔把颜料滴溅在画布上。其创作不作事先规划,作画没有固定位置,喜欢在画布四周随意走动,以反复的无意识的动作画成复杂难辨、线条错乱的网,人称“行动绘画”。此画法构图设计没有中心,结构无法辨识,具有鲜明的抽象表现主义特征。主要作品有《秋韵:第30号》《薰衣草之雾:第1号》《大教堂》《蓝杆:第11号》等。)因此,随着越来越多的艺术家利用AI工具来为自己的艺术实践提供信息,AI作画让艺术历史学家陷入困境也就不足为奇了。我喜欢深入艺术界让人热血沸腾的事物,今年夏天,AI悄悄地登上了刺激因素排行榜。但原因是什么?关于艺术史和视觉消费,它又能教给我们什么?

今年秋天,一个名为DALL-E 2的从文本到图像的人工智能图像生成器,进入了公众视野。该模型的最初版本于2021年1月由OpenAI研究实验室发布,取自迪斯尼2008年可爱的机器人WALL-E和超现实主义艺术家萨尔瓦多·达利(Salvador Dalí)的戏谑之名。这项技术的一个版本DALL-E Mini早前在“Hugging Face”平台上发布,在推特上风靡一时,并使该项目引起了超越人工智能专业领域之外的全球性兴趣。每天,有超过150万用户使用DALL-E创建了超过200万张图片。

DALL-E一经亮相,便在图像生成和图像处理领域卷起了新的风暴。只需要给到寥寥几句文本提示,DALL-E 2就可以按文本指示生成全新图像,甚至能将毫不相关的物体以看似合理的语义方式组合在一起。

DALL-E 2使用“GPT-3”模型的CLIP(对比语言-图像预训练,由OpenAI去年宣布),一个计算机视觉系统,能根据输入的文本提示词生成1024×1024像素的图像。该工具使用6.5亿对从互联网拍摄的图片和标题来进行训练。在收集了图像——文本对后,研究人员训练CLIP模型生成文本来准确描述图像,从而创建了一个算法可靠的模型。然后,DALL-E逆转了这个过程,基于CLIP的数据生成了文本精确描述的图像。用户还可以使用DALL-E 2来“重新绘制”图像——将已有的图像扩展出更多的相关内容——并使用文本命令编辑已存在的图像。
图片

▲ 人工智能图像生成器DALL-E对提示词“一幅蒙德里安画的番茄爬上海边的梯子”的回应(由DALL-E提供)

当输入你的DALL-E2请求时,你会得到“从详细的描述开始”的指示和“印象派油画画的紫色花瓶中的向日葵”的示例。但是,DALL-E 2对于印象派的风格真正“理解”了什么呢?或者是任何艺术风格或运动?用同样的“番茄爬上海边的梯子”的提示,我测试了DALL-E2的艺术史实力。

对于印象派来说(“一幅印象派画的番茄爬上海边梯子”),DALL-E 2似乎认为这是一种基于松散的笔触和颜色对比表明光线的影响的风格。
图片

▲ DALL-E基于提示词:“一幅印象派画的番茄爬上海边的梯子。”创作的图像

它在明确“18世纪”艺术的含义方面也做得惊人地好。它在侧面添加纹理元素,产生一个极为深沉的18世纪风格图像。同样有趣的是,DALL-E 2表现出了18世纪艺术品在今天的样子,它们的色调随着时间的推移而暗淡。
图片

▲ DALL-E对“18世纪绘画画的番茄爬上海边梯子”的诠释

我个人最喜欢的是DALL-E对罗伯特·梅普尔索普(Robert Mapplethorpe)风格的诠释。这张单色照片给了番茄一种明显的臀部外观,这是一种对梅普尔索普形象的性感致敬。“亨利·摩尔(Henry Moore)雕塑”的提示也让我感到好笑:一个雕塑需要一个基座,这似乎是DALL-E 2的第二天性。

有一些风格是DALL-E不太擅长再现的,比如风格派(De Stijl)或超现实主义。它很好地诠释了提示词里的“蒙德里安”,添加了穿过图像的直线。已经很接近了。沃霍尔的番茄也捕捉到了一些与他的作品相关的平坦性,而立体派的尝试在某些地方都是有棱角分明的。
图片
图片

▲ DALL-E基于提示词罗伯特·梅普索普(Robert Mapplethorpe)和亨利·摩尔(Henry Moore)的创作

玩DALL-E 2带来了两个问题:一是这项技术能在多大程度上真正“理解”艺术;二是在机器的“头脑”中量化艺术史是否有用?

人工智能咨询公司Provectus的通讯负责人Iryna Ryslyayeva告诉Hyperallergic,尽管DALL-E 2没有人类学者的情感能力,但是“该模型比大多数人类专家看到了更多的图像、绘画、风格等,其观点将是一种主观但全面的观点。”

的确,DALL-E 2在训练和学习过程中确实优化了数千亿个参数,但需要知道的是,它所使用的图像并不一定是“中立的”。就像艺术家们将目光投射在画布上一样,DALL-E 2吸收了一组并非没有自身偏见的数据集。算法正义联盟(Algorithmic Justice League)的高级创新和创意顾问José Lizarraga对我谈到关于凝视的问题:“AI艺术引人注目的是,它依赖于系统和语料库的视觉人工制品,这些视觉人工制品仍然带有白人异性恋男性凝视——这取决于谁在技术设计和开发世界中具有代表性,谁在做内容审核……同样,由于人工智能使用的是未经过滤的数据,它也被证明会生成带有冒犯性和种族主义的图像”。
图片

▲ DALL-E的立体派作品“番茄爬上海边的梯子”

南安普顿大学(University of Southampton)的苏尼尔·曼哈尼(Sunil Manghani)教授最近成立了一个艺术与人工智能的特别兴趣小组,他对此表示赞同。他说,数据集中的偏差不仅影响了DALL-E 2的创作所形成的凝视,而且还影响了它在再现某些类型时的准确性。

“会有历史偏见,”曼哈尼在一次采访中告诉Hyperallergic。“早期的作品可能会不那么丰富,而当代的作品也会被扭曲(部分出于版权原因)。这让我们处于中间地位,可能在印象派、超现实主义和表现主义等风格中占据优势。”

那么,这项技术在正在进行的艺术史书写中究竟处于何方?曼哈尼为DALL-E2的图像生成给出了一个恰当的比喻:“如果我掷三次硬币,得到的都是头像面,我可能会认为得到头像面的可能性更高。但如果我掷了100万次硬币,就很清楚这个概率是对半的。因此,图像扩散模型,虽然在方法上非常聪明(它们将图像转换为噪声,然后重新调整为可信或可能的图像),但实际上只是在以前存在过的图像中进行工作。从这个意义上说,我们为什么要把它们加入到艺术史中呢?DALL-E 2正在重塑之前的一切。”
图片

▲ DALL-E创作的安迪·沃霍尔(Andy Warhol)版本的“番茄爬上海边的梯子”

然而,这些图像虽然是基于过去的固定数据集,但却是新的。曼哈尼认为,问题的关键在于我们对“艺术史”的定义:“如果你把艺术史视为一门需要监管的学科,那么你就倾向于拒绝DALL-E 2图像。但如果你把艺术史仅仅看作是图像创造的世俗历史的表达(可以追溯到文明的起源),那么你现在就应该接受DALL-E 2。”

这项技术在Hugging Face上发布后不久,DALL-E模因就席卷了互联网。在DALL-E2发布的两个月内,该技术被用于制作Cosmopolitan杂志的第一张AI生成的封面。亨氏(Heinz)和雀巢(Nestlé)等大品牌也利用了这项技术进行广告宣传——雀巢选择了一个特别的艺术历史角度,比约翰内斯·维米尔(Johannes Vermeer)1657年的画作《倒牛奶的女仆》(the Milkmaid)更出色。这项技术开始深深融入视觉文化。

AI艺术家马里奥·克林格曼(Mario Klingemann)指出,DALL-E对艺术知识的倾向并不一定是其最终目的。他在一次采访中表示:“我认为,复制现有的艺术风格并不是对这些模型的真正诉求”,“它们真正的潜力在于学习在所有形式的图像生成和感知中什么是相关的和重要的,然后有望能让我们发现新的表达模式。”

DALL-E将成为艺术教育的重要工具,并且毫无疑问将被纳入艺术家的实践当中。推特的高级机器学习工程师Rishabh Misra提到了人工智能作为一种独立艺术形式的潜力。“人工智能已经极大地改变了创作过程的本质,并扰乱了艺术行业,”他告诉Hyperallergic,“人工智能本身可以被视为一个创造性实体,能够复制创造性的艺术行为的各个方面,并增强人类的创造力。”

DALL-E项目的首席研究员Aditya Ramesh评价了DALL-E对艺术爱好者的重要性,他告诉Hyperallergic:“AI生成的艺术为个性化的艺术创作创造了机会。DALL-E向我们表明,即使很多人并没有接受过正式的艺术培训,他们也依然可以在创作艺术和与创作者在社区上互动的过程中发现艺术的价值。”

关于通过DALL-E生成的图像作为独立的艺术品是否具有内在价值的问题,可能会引发了另一场完全不同的争论。但OpenAI已经预测了DALL-E作为一个强大的图像生成器的潜力,它可以执行内容管理和抢先的反深度伪造功能,这意味着它无法生成可识别的人脸。想要找到关于DALL-E 2在艺术史上所处地位的明确答案,可能还需要对艺术史有更明确的定义,并对技术的潜力进行简化性的理解。

文章来源:https://

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多