ChatGPT升级图像编辑功能后，PS修图师又快失业了

Lzc20005 2023-03-14 发布于黑龙江

展开全文

ChatGPT在短短两个月内可以说席卷全球，人工智能再一次上了热搜。我的感觉，虽然人工智能已经研发了很多年，但是随着ChatGPT这样的语言模型的推出，仿佛打开了潘多拉魔盒，这是一个窗口期，也是一个分水岭。我们有理由相信，人工智能以后会走上一条高速快车道，因为越来越多的资本都在注资加大研发力度，也许，强人工智能并不会那么久远。

就在上周，一段基于ChatGPT的升级多模算法Demo出现在Git上，在短短几天时间内就收获到15.4K的关注。这个算法改进称之为Visual ChatGPT。他允许用户直接和AI聊天中输入一张图片，或者用语言生成图片。

如上图片，用户用纯文字要求它生成一只猫，很快系统就自动生成了一只猫的图片。这还没完，随后用户又继续让系统将这只猫，换成一只狗。

我们可以看到，猫周围的的环境并没有改变，而是单纯将猫替换成了狗。这其实说明系统知道哪里绘制的是猫，哪里是狗，这是针对像素的改变。随后，人又再一次测试印证了这个想法，他要求将这只狗的颜色进行改变，替换成黄色的小狗。

可以看到，人工智能直接改变了狗的颜色，这说明，他完全听懂了人类的意思，只更换了狗的颜色，而没有更改他的外形。

识别照片的物体

接下来演示再次升级，人直接输入一张图片，可以看到，照片中有一辆摩托车。

如图，人在输入一辆摩托车后，直接开问系统，照片中的摩托车是什么颜色的？

这句话包含两个问题点，第一，什么是摩托车？照片中哪个是摩托车？第二，识别出摩托车的颜色。果然Visual ChatGPT立刻给出了答案：“黑色”的。看来这并没有难为主他，然后人直接提出了一个终极挑战，请帮我把摩托车从图中P掉（PS掉，抠除的意思）

果然，Visual ChatGPT居然真的就抠除掉了图片中的摩托车。这个不禁让人感叹，PS发展到今天，居然抠图的工作完全可以由人工智能完成，而人类只需要动动嘴就可以了。如此发展的话，以后恐怕PS修图师要失业了。

Visual ChatGPT的过人之处

为何Visual ChatGPT能够做到基于图片的提问和修改呢。根据他们官方提供的架构图，大概可以理解到，他是基于一个叫做Prompt Manager的管理工具，整合了ChatGPT的语言模型，并且将VFM（图像生成神经网络）等算法也整合在一起。当用户输入文字要求时候，首先由ChatGPT翻译成程序语言，然后分析是否要生成图片。如果有需要的话，直接由VFM来进行图片的生成以及矫正等工作，最后再呈现给用户。