AI最新资讯 | 未来发展的关键

天承办公室 2023-12-26 发布于北京

展开全文

正文字数：2870字

图片总数：37张

引言：AI的最新进展在许多行业的产品设计中发挥了重要作用。在制造业中，生成式AI被用于协助工程师在数据库和专利信息中快速获取有效信息，以完成产品设计。它还可以整合设计环节和视觉检测环节，提高视觉检测的效果。在管理环节，AI的应用可以实现制造周期的透明化，并自动优化成本和流程。对于现在的全球的发展趋势来说，人工智能（AI）是全球科技发展的一个重要趋势，各国政府和企业都在加大投资，以抢占技术制高点。美国、中国、欧洲和日本等国家和地区都在积极推动AI技术的发展和应用。

Videopoet

Designer:谷歌团队

VideoPoet 既可以文生视频、图像生视频，又能风格迁移，视频转语音。从效果上看，它可以构建多样化且流畅的运动。

AI视频生成，或许就是2024年下一个最前沿（juan）的领域。回看过去几个月，RunWay的Gen-2、Pika Lab的Pika 1.0，国内大厂等大波视频生成模型纷纷涌现，不断迭代升级。当然，谷歌在视频生成上也不甘落后，先是与斯坦福李飞飞团队共同发布了W.A.L.T，用Transformer生成的逼真视频引来大波关注。

最令人惊叹的是，VideoPoet一次能够生成10秒超长，且连贯大动作视频，完全碾压Gen-2仅有小幅动作的视频生成。另外，与领先模型不同的是，VideoPoet并非基于扩散模型，而是多模态大模型，便可拥有T2V、V2A等能力，或将成为未来视频生成的主流。

文本生成视频

提示（从左到右）：一条从嘴里射出激光束的鲨鱼；泰迪熊手牵着手走在雨天的第五大道上；举铁的小鸡。

提示（从左到右）：黄色蒲公英花瓣制成的狮子在咆哮；地球表面发生大规模爆炸；一匹马在梵高的星夜中驰骋；穿着盔甲的松鼠骑着鹅；熊猫在自拍。

图像生成视频

对于图像到视频，VideoPoet 可以获取输入图像并通过提示将其动画化。

蒙娜丽莎开始打哈欠，只要输入一张图片，外加一句提示：一个女人打哈欠。就会得到下面的效果。

提示（从左到右）：一艘船在波涛汹涌的大海上航行，有雷暴和闪电，油画风格；飞过有许多闪烁星星的星云；大风天，一个拄着拐杖站在悬崖上的流浪者，俯视着下面浮动的云海。

将视频风格化

提示（从左到右）：泰迪熊在干净的冰湖上滑冰；一只金属色的狮子在熔炉的光芒下咆哮。

扩展视频

用户可以改变提示，从而扩展视频。原始视频是两只浣熊骑着摩托车在松树环绕的山路上行驶，8k。扩展后的视频是两只浣熊骑着摩托车，浣熊身后落下流星，流星撞击地球并爆炸。

交互式视频编辑

对于提供的输入视频（最左边），用户可以改变物体的运动来执行不同的动作。如下所示，中间三个没有文本提示，最后一个文本提示为：烟雾背景下启动。

视频修复

VideoPoet 可以在视频被遮住的部分添加细节，也可以选择通过文本引导进行修复。

堆友

Design by:阿里设计团队

随着AI时代的来临，设计能力、设计工具、设计素材、设计模板、AI模型等都面临着“被后浪拍在沙滩上”的隐忧，客观上需要一个思想碰撞的平台，新一代的设计师需要新一代的生态社区，「堆友」应运而生。

作为一款面向设计师群体的社区，「堆友」上线以来，就成为超50万AI创作者、设计师“安身立命”的平台，集成6000个以上的设计工具、3D素材、AI设计模型等，设计师们每天在这里生产超10万张AI作品，「堆友」已成为国内领先的设计师平台。

分析起来，「堆友」成为设计师们创作和精神上的“后花园”并不偶然：在AI设计浪潮推动下，「堆友」则充分发挥平台的作用，网聚人的力量，将各路设计师笼在自己的社区，并且在开放式交流和创作氛围下，形成一个可持续的商业生态。

未来已来，其实不远。面对全球化、数智化浪潮的扑面而来，人、货、场各元素发生了深刻改变，规模更大、用户体验更细分、响应时间更迅速的设计需求已是应有之义，传统的设计生产方式，将无法满足新的商业环境。而新技术不断出现的语境下，数智设计越来越频繁地融入商业化也会是大势所趋。

Midjourney V6

Designer:David Holz及其团队

Midjourney V6刚发行，神图就纷纷炸出，光影效果登峰造极，主打一个「你能说我就能画」

在/settings的下拉菜单中选择V6，或者在Prompt后输入 --v 6，就可以用上V6 Beta版模型了！

激动的网友们蜂拥而入，出炉了一大波测评。比起V5，V6真的是疯狂加细节，画面质量史诗级增强。根据MJ官方介绍，V6的主要变化，就是图像质量更好、语义理解更强、能嵌入英文单词、更容纳更多token了。

举个例子，下面这两张超人和蝙蝠侠的「剧照」，要不是背景里的「V6 is here」的提示，几乎已经分辨不出来到底是实拍还是出自AI。以前被诟病最多的「一眼AI」，也在V6上达到了几乎「以AI乱真」的地步。

总之一句话就是，「只要你能说得清楚，V6就能给你画明白。」

仔细观看可以发现，同样的女性面部主体，V6在皮肤细节、毛发细节、光影效果上，都远优于V5.2的效果。

如果你是个想象力大师，可以用逻辑结构清晰、充满细节的语言描绘出心中所想，V6定不会让你失望——语言可以控制光影、控制材质、控制色彩、控制构图。

在文字生成上，V6较前代也有了巨大的提升。虽然在准确度上略逊于DALL·E 3，但视觉美感方面的表现，Midjourney依旧是遥遥领先。不过需要注意的是，以上这些图像，每一张都进行了3-10次的尝试，才得到比较理想的结果。

MiracleVision 4.0事的纸巾盒设计

Design by:美图公司

自2023年6月19日亮相以来，美图自研AI视觉大模型MiracleVision（奇想智能）持续进步。现在又为大家带来了MiracleVision的4.0版本！

AI设计的四大功能，包括矢量图形、文字特效、智能分层和智能排版。可以满足AI设计的基础需求。

矢量图形

只要在画布中选一个区域，输入提示词，就可以快速生成匹配设计风格的矢量图形。还可以无损缩放大小，精准调整每个节点。

文字特效

输入任意想要的字形，如“MV”，同时输入“半透明玻璃，灯泡”就能生成对应的文字特效。还有更多效果，机械、花朵和面包等不同纹理和材质选择。大大简化了设计流程。

智能分层

只需涂抹对象，AI就能够快速识别，自动提取，再转换成独立的图层。可以单独移动和缩放每个元素，自由调整图层顺序，让创作更加随心所欲。

智能排版

MiracleVision4.0的AI视频能力，体现在文生视频、图生视频、视频运镜、视频生视频四大功能当中。

文生视频

输入提示词，就能生成一段视频。花丛中的兔子摇头晃脑，汽车行驶扬起的尘土，恋人在森林中旋转，每个场景的动作、光影、细节都恰到好处。

图生视频

让图片也动起来。从景深变化到细节动作捕捉，MiracleVision可以轻松生成。非常的自然流畅，就像专业摄像机拍出来的。

视频运镜

在图生视频的基础上，MiracleVision支持视频运镜。提供了推、拉、摇、移等八种电影级运镜模式，让用户能够轻松模拟专业的镜头运动，演绎更加丰富的镜头语言。

视频生视频

导入如“男生开车兜风“的视频，再加上不同的提示词，就能获得卡通、科幻、像素风，羊毛毡等不同的艺术风格，非常的酷。

矢量图形，文字特效，智能分层，智能排版满足了AI设计的基础需求，视觉模型商店构建了一个丰富的模型生态，文生视频，图生视频，视频运镜，视频生视频，可以让奇思妙想动起来！

素材来源：

1.https://mp.weixin.qq.com/s/vbRtL_rmzLn1zsXOsz_0uA

2. https://mp.weixin.qq.com/s/nYw3cvOpqqiYGnJIRgc_sA

3.https://mp.weixin.qq.com/s/GsWy3Sngk1DXak6bzwRb4g

4.https://mp.weixin.qq.com/s/2DR455nI6VS-tSSCjRSr7w

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：天承办公室 > 《021科技新闻》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

天承办公室

关注对话

TA的最新馆藏

看腻了中国的千手观音，来段印度版千手观音解腻下 #千手观音 #印度舞蹈
《特工》电影根据黑金星真实事件改编主打真实颠覆认知
#菩提祖师重伤危在旦夕 #鸿钧老祖真是个老六#菩提祖师的兄弟太强了
[转] 经济学家朱嘉明：AIGC将为元宇宙解决两个技术难题
[转] 朱嘉明：人工智能正在改变经济和经济学
东方财富财经早餐 6月21日周五

喜欢该文的人也喜欢更多

热门阅读换一换