分享

ChatGPT升级图像编辑功能后,PS修图师又快失业了

 Lzc20005 2023-03-14 发布于黑龙江

ChatGPT在短短两个月内可以说席卷全球,人工智能再一次上了热搜。我的感觉,虽然人工智能已经研发了很多年,但是随着ChatGPT这样的语言模型的推出,仿佛打开了潘多拉魔盒,这是一个窗口期,也是一个分水岭。我们有理由相信,人工智能以后会走上一条高速快车道,因为越来越多的资本都在注资加大研发力度,也许,强人工智能并不会那么久远。

就在上周,一段基于ChatGPT的升级多模算法Demo出现在Git上,在短短几天时间内就收获到15.4K的关注。这个算法改进称之为Visual ChatGPT。他允许用户直接和AI聊天中输入一张图片,或者用语言生成图片。

如上图片,用户用纯文字要求它生成一只猫,很快系统就自动生成了一只猫的图片。这还没完,随后用户又继续让系统将这只猫,换成一只狗。

我们可以看到,猫周围的的环境并没有改变,而是单纯将猫替换成了狗。这其实说明系统知道哪里绘制的是猫,哪里是狗,这是针对像素的改变。随后,人又再一次测试印证了这个想法,他要求将这只狗的颜色进行改变,替换成黄色的小狗。

可以看到,人工智能直接改变了狗的颜色,这说明,他完全听懂了人类的意思,只更换了狗的颜色,而没有更改他的外形。

识别照片的物体

接下来演示再次升级,人直接输入一张图片,可以看到,照片中有一辆摩托车。

如图,人在输入一辆摩托车后,直接开问系统,照片中的摩托车是什么颜色的?

这句话包含两个问题点,第一,什么是摩托车?照片中哪个是摩托车?第二,识别出摩托车的颜色。果然Visual ChatGPT立刻给出了答案:“黑色”的。看来这并没有难为主他,然后人直接提出了一个终极挑战,请帮我把摩托车从图中P掉(PS掉,抠除的意思)

果然,Visual ChatGPT居然真的就抠除掉了图片中的摩托车。这个不禁让人感叹,PS发展到今天,居然抠图的工作完全可以由人工智能完成,而人类只需要动动嘴就可以了。如此发展的话,以后恐怕PS修图师要失业了。

Visual ChatGPT的过人之处

为何Visual ChatGPT能够做到基于图片的提问和修改呢。根据他们官方提供的架构图,大概可以理解到,他是基于一个叫做Prompt Manager的管理工具,整合了ChatGPT的语言模型,并且将VFM(图像生成神经网络)等算法也整合在一起。当用户输入文字要求时候,首先由ChatGPT翻译成程序语言,然后分析是否要生成图片。如果有需要的话,直接由VFM来进行图片的生成以及矫正等工作,最后再呈现给用户。

微软在3月9号的公布在本月16号,也就是百度的“文心一言”发布的同一天,发布ChatGPT4.0语言模型,届时可以对图片、语言、视频进行一键生成和修改的功能。如果真如所述,那无疑是更大的一场风暴,届时,失业的可能不光是PS修图师了,怕是视频编辑也要下岗了。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多