分享

AI最新资讯 | 未来发展的关键

 天承办公室 2023-12-26 发布于北京

图片

正文字数:2870字

图片总数:37张

引言:AI的最新进展在许多行业的产品设计中发挥了重要作用。在制造业中,生成式AI被用于协助工程师在数据库和专利信息中快速获取有效信息,以完成产品设计。它还可以整合设计环节和视觉检测环节,提高视觉检测的效果。在管理环节,AI的应用可以实现制造周期的透明化,并自动优化成本和流程。对于现在的全球的发展趋势来说,人工智能(AI)是全球科技发展的一个重要趋势,各国政府和企业都在加大投资,以抢占技术制高点。美国、中国、欧洲和日本等国家和地区都在积极推动AI技术的发展和应用。

01

Videopoet

Designer:谷歌团队

VideoPoet 既可以文生视频、图像生视频,又能风格迁移,视频转语音。从效果上看,它可以构建多样化且流畅的运动。

图片

AI视频生成,或许就是2024年下一个最前沿(juan)的领域。回看过去几个月,RunWay的Gen-2、Pika Lab的Pika 1.0,国内大厂等大波视频生成模型纷纷涌现,不断迭代升级。当然,谷歌在视频生成上也不甘落后,先是与斯坦福李飞飞团队共同发布了W.A.L.T,用Transformer生成的逼真视频引来大波关注。

图片


最令人惊叹的是,VideoPoet一次能够生成10秒超长,且连贯大动作视频,完全碾压Gen-2仅有小幅动作的视频生成。另外,与领先模型不同的是,VideoPoet并非基于扩散模型,而是多模态大模型,便可拥有T2V、V2A等能力,或将成为未来视频生成的主流。

文本生成视频

图片

提示(从左到右):一条从嘴里射出激光束的鲨鱼;泰迪熊手牵着手走在雨天的第五大道上;举铁的小鸡。

图片

提示(从左到右):黄色蒲公英花瓣制成的狮子在咆哮;地球表面发生大规模爆炸;一匹马在梵高的星夜中驰骋;穿着盔甲的松鼠骑着鹅;熊猫在自拍。

图像生成视频

图片


对于图像到视频,VideoPoet 可以获取输入图像并通过提示将其动画化。
蒙娜丽莎开始打哈欠,只要输入一张图片,外加一句提示:一个女人打哈欠。就会得到下面的效果。

图片

提示(从左到右):一艘船在波涛汹涌的大海上航行,有雷暴和闪电,油画风格;飞过有许多闪烁星星的星云;大风天,一个拄着拐杖站在悬崖上的流浪者,俯视着下面浮动的云海。

将视频风格化

图片

提示(从左到右):泰迪熊在干净的冰湖上滑冰;一只金属色的狮子在熔炉的光芒下咆哮。

扩展视频

图片

用户可以改变提示,从而扩展视频。原始视频是两只浣熊骑着摩托车在松树环绕的山路上行驶,8k。扩展后的视频是两只浣熊骑着摩托车,浣熊身后落下流星,流星撞击地球并爆炸。

交互式视频编辑

图片

对于提供的输入视频(最左边),用户可以改变物体的运动来执行不同的动作。如下所示,中间三个没有文本提示,最后一个文本提示为:烟雾背景下启动。

视频修复

图片图片


VideoPoet 可以在视频被遮住的部分添加细节,也可以选择通过文本引导进行修复。

02
堆友

Design by:阿里设计团队

随着AI时代的来临,设计能力、设计工具、设计素材、设计模板、AI模型等都面临着“被后浪拍在沙滩上”的隐忧,客观上需要一个思想碰撞的平台,新一代的设计师需要新一代的生态社区,「堆友」应运而生。

图片

作为一款面向设计师群体的社区,「堆友」上线以来,就成为超50万AI创作者、设计师“安身立命”的平台,集成6000个以上的设计工具、3D素材、AI设计模型等,设计师们每天在这里生产超10万张AI作品,「堆友」已成为国内领先的设计师平台。

图片

分析起来,「堆友」成为设计师们创作和精神上的“后花园”并不偶然:在AI设计浪潮推动下,「堆友」则充分发挥平台的作用,网聚人的力量,将各路设计师笼在自己的社区,并且在开放式交流和创作氛围下,形成一个可持续的商业生态。

图片图片

图片

图片图片

未来已来,其实不远。面对全球化、数智化浪潮的扑面而来,人、货、场各元素发生了深刻改变,规模更大、用户体验更细分、响应时间更迅速的设计需求已是应有之义,传统的设计生产方式,将无法满足新的商业环境。而新技术不断出现的语境下,数智设计越来越频繁地融入商业化也会是大势所趋。

03

Midjourney V6

Designer:David Holz及其团队

Midjourney V6刚发行,神图就纷纷炸出,光影效果登峰造极,主打一个「你能说我就能画」

图片

在/settings的下拉菜单中选择V6,或者在Prompt后输入 --v 6,就可以用上V6 Beta版模型了!

图片

激动的网友们蜂拥而入,出炉了一大波测评。比起V5,V6真的是疯狂加细节,画面质量史诗级增强。根据MJ官方介绍,V6的主要变化,就是图像质量更好、语义理解更强、能嵌入英文单词、更容纳更多token了。

图片图片

举个例子,下面这两张超人和蝙蝠侠的「剧照」,要不是背景里的「V6 is here」的提示,几乎已经分辨不出来到底是实拍还是出自AI。以前被诟病最多的「一眼AI」,也在V6上达到了几乎「以AI乱真」的地步。

总之一句话就是,「只要你能说得清楚,V6就能给你画明白。」

图片

图片

仔细观看可以发现,同样的女性面部主体,V6在皮肤细节、毛发细节、光影效果上,都远优于V5.2的效果。

如果你是个想象力大师,可以用逻辑结构清晰、充满细节的语言描绘出心中所想,V6定不会让你失望——语言可以控制光影、控制材质、控制色彩、控制构图。

图片图片

图片

图片

在文字生成上,V6较前代也有了巨大的提升。虽然在准确度上略逊于DALL·E 3,但视觉美感方面的表现,Midjourney依旧是遥遥领先。不过需要注意的是,以上这些图像,每一张都进行了3-10次的尝试,才得到比较理想的结果。

04

MiracleVision 4.0事的纸巾盒设计

Design by:美图公司

图片

自2023年6月19日亮相以来,美图自研AI视觉大模型MiracleVision(奇想智能)持续进步。现在又为大家带来了MiracleVision的4.0版本!

AI设计的四大功能,包括矢量图形、文字特效、智能分层和智能排版。可以满足AI设计的基础需求。

矢量图形

图片

只要在画布中选一个区域,输入提示词,就可以快速生成匹配设计风格的矢量图形。还可以无损缩放大小,精准调整每个节点。

文字特效

图片

输入任意想要的字形,如“MV”,同时输入“半透明玻璃,灯泡”就能生成对应的文字特效。还有更多效果,机械、花朵和面包等不同纹理和材质选择。大大简化了设计流程。

智能分层

图片

只需涂抹对象,AI就能够快速识别,自动提取,再转换成独立的图层。可以单独移动和缩放每个元素,自由调整图层顺序,让创作更加随心所欲。

智能排版

图片

MiracleVision4.0的AI视频能力,体现在文生视频、图生视频、视频运镜、视频生视频四大功能当中。

文生视频

图片

输入提示词,就能生成一段视频。花丛中的兔子摇头晃脑,汽车行驶扬起的尘土,恋人在森林中旋转,每个场景的动作、光影、细节都恰到好处。

图生视频

图片

让图片也动起来。从景深变化到细节动作捕捉,MiracleVision可以轻松生成。非常的自然流畅,就像专业摄像机拍出来的。

视频运镜

图片

在图生视频的基础上,MiracleVision支持视频运镜。提供了推、拉、摇、移等八种电影级运镜模式,让用户能够轻松模拟专业的镜头运动,演绎更加丰富的镜头语言。

视频生视频

图片

导入如“男生开车兜风“的视频,再加上不同的提示词,就能获得卡通、科幻、像素风,羊毛毡等不同的艺术风格,非常的酷。

矢量图形,文字特效,智能分层,智能排版满足了AI设计的基础需求,视觉模型商店构建了一个丰富的模型生态,文生视频,图生视频,视频运镜,视频生视频,可以让奇思妙想动起来!

素材来源:

1.https://mp.weixin.qq.com/s/vbRtL_rmzLn1zsXOsz_0uA

2. https://mp.weixin.qq.com/s/nYw3cvOpqqiYGnJIRgc_sA

3.https://mp.weixin.qq.com/s/GsWy3Sngk1DXak6bzwRb4g

4.https://mp.weixin.qq.com/s/2DR455nI6VS-tSSCjRSr7w

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多