分享

DoNews王乐:AIGC在元宇宙领域的五大应用场景

 AndLib 2022-11-29 发布于北京
图片
如何激发用户创造内容,参与创造内容,是所有互联网社区型产品最重要的课题。有技术导向、产品导向、运营导向、资源导向等等不一而足。在各式各样的手段中,抓住技术进步的机会,提供一种前所未有的产品,来满足用户的表达需求是重大成功必不可少的因素。
Web1.0时代的重要技术是网页技术,主流模式是门户网站,内容主要来自传统媒体,用户以阅读为主,内容的形式主要是文字、图片。这一时代虽然也诞生了包括BBS、个人主页、网页聊天室、IM即时通讯等初代社交范式,但受制于网络带宽、需要掌握网页制作技术等门槛,用户受限较多。
Web2.0时代最显著的特点是,基础设施的提升、技术的进步降低了表达和传播的门槛,大多数情况下,用户不需要接触代码就能够表达自我。强表达(网页实现了图、文、音视频多媒体的支持)、强交互(博客、播客、主播)得以实现;社交网络(SNS)、社交媒体(SM)取代了门户网站成为用户参与世界的入口。近10年以来的移动化则大大的加强了用户的参与。
社交在web2.0时代也暴露出一些重要问题,比如互联网内容的生产已经从UGC转向了PGC,普通用户日益难以参与其中。饶是如此由于其生产依然离不开传统的方式,远远跟不上网络传播的速度,并且由于竞争的加剧,制作和传播的成本越来越高,效能越来越低。元宇宙及其相关技术的出现让以上困扰的解决见到了曙光。
AIGC是继UGC、PGC之后,利用AI技术自动生成内容的生产方式。能够创造更丰富的人与人、人与非人之间的交互体验。其成本和效率将远优于传统的人工建模方式。将广泛运用于数字人、虚拟形象、视觉场景构建、用户交互设计等多个应用领域,成为元宇宙的核心基础技术之一。有非常广泛的应用场景:
1、协助用户设计更丰富的头像、表情包。用户可以输入一组关键字,就能生成符合用户意图的图片。随着Diffusion模型逐渐成熟,AIGC将在元宇宙中协助用户发掘自身的创意潜力与个性,从最基础的个人形象和情绪表达开始,逐步深入到更高级的创作形式。
2、轻松制作个人虚拟形象。在元宇宙中应用的虚拟形象,将不仅止于头像,还应具备较高的交互能力和定制空间,一般以3D人物、动物的虚拟形象为主。同时,还要赋予其丰富的动作模型。通过AIGC的辅助,可迅速实现海量虚拟形象的3D建模、动作库定制,并通过组合,实现亿万用户的个性化需求。
3、自动场景设计。AIGC技术已经参与到游戏的场景、人物设计,下一步将试图让AI自主设计游戏地图、关卡。同时,AIGC也将极大的提高数字孪生项目中三维视觉构建的效率。
4、参与、主导互动游戏的设计。目前的AI技术基于短文本创作已经较为成熟,基于GPT-3等大模型的应用,可以引导AI创造一个虚拟游戏世界观。如此一来,使用AI与人类想象力开展互动,将会创造出不计其数的有趣选择,极大的增加了游戏乐趣的多样性。
当前的AI技术还处于辅助用户创作的阶段,仍然依赖于设计者的主线设计,更多的是反馈。可以预期的是,3-5年后,随着NLP领域模型的持续进步,AI在其中将起到更大的作用。
5、协助动画及视频的制作。伴随短视频浪潮的发展,依靠少量素材直接生成大量视频作品的需求日益增多。同时传统3D内容生产也有大量的需求,比如3D图纸、影视行业模拟运镜、体育赛场现场还原等等。
以上都是AIGC广阔的用武之地,虽然一些问题亟待解决,比如空间感、物理规则缺失;镜面反射、透视等视觉规则扭曲;或者对同一实体刻画缺乏连续性等。
我们从2020年开始,通过神经辐射场(NeRF)模型的应用,可以很好的完成三维重建任务。今年参考谷歌发布的DreamFusion 模型,可以实现根据一段话生成360度三维图片。我们认为以三维模型和场景为基础,推动视频生成的进步是一条可行之路。
AIGC的用途不胜枚举,具体到社区,尤其是社区的内容创作者们,AIGC可以多重方案赋能,提高创作效率和品质。
社区中大多数普通的创作者,以图文为主,独自创作多而协同者少,官方助力有限。AIGC可以使创作者的文字,以图片、视频、互动程序等方式展现,成为创意视频、表情包、游戏创作、玩法创作、3D文创、动作语言、舞蹈、互动才艺等IP的源头。使创作内容多样化成为可能。
对于专业型的创作者,AIGC的能力又可以提升其创作效能。比如智能生成作品,最近基于LaMDA的Wordcraft开始尝试帮助作家们写作:由AI根据作家的设定,自动完成部分章节的写作,根据上下文生成图片,对已经完成的作品进行编辑等。此外,由AI协助修正图片、生产表情包、合成图片,协助进行互动游戏场景、人物、玩法等等。
结合元宇宙的其他技术如区块链,可以使内容生产者的创作方式更加多样化,方便的实施共同创作、分工创作、邀请创作、碎片化创作、创意分享、共享素材库等。同时,便于实施公开、透明、平等的机制来激励创作者,通过分层激励,使得头部、活跃、潜力以及入门者都得到适当的激励,有利于社区治理。
从技术本身的发展、应用的成熟度来看,AIGC固然还有很长的路要走。比如准确性有待提高,训练数据来源尚待优化、用户需求定位尚不明确,来自传统内容生产的质疑也颇为强烈。但是,无论将其看成人类内容生产领域一次工业革命级的变革,还是元宇宙世界一项核心技术,其所展现出的前景是令人向往和追求的,无论是娱乐应用领域还是工业化应用领域的价值已经开始显现,随着技术的不断发展,围绕AIGC的产业生态将会逐渐走向成熟。
AIGC在娱乐领域的商业化前景已经初露端倪。以游戏为例,自然语言处理与图片生成算法相互结合,可以实现AI关卡,自动生成冒险地图,自动生成场景甚至BGM(背景音乐)等,含有多元化感觉效果的内容而非局限于文字。
同时,AIGC的内容产出效率也使得不需要主持人的多人在线游戏(MMO跑团)成为可能。传统跑团及剧本杀、桌游等集中于线下,需要玩家之间高强度沟通,依赖主持人的水平,但也受制于既定的世界观、剧本等因素。我们研发AI作为决定剧情走向的主持人,使得回合制模式的线上多人团本成为可能,同时也避免了传统跑团游戏中固定套路的问题,实现了更加自由与多样化的体验。
高可靠性(结果可预见性)是AIGC工具商业化的前提。在项目前期,需要开发者介入,对AIGC生产的内容进行校准和精加工,此时可以采用让利的方式吸引用户参与,不断提升体验。当可靠性突破临界值后,同时聚拢了一批有长期需求的核心用户圈层后,可以考虑转为会员制,月费制等长期稳定的运营策略。
在工业化应用方面,与技术相关的信息已经很多,值得一提的是,如何运用元宇宙时代的机制建立良性的开源数据集。
一个成熟且强大的AI模型,需要被喂养海量的数据进行自我学习,同时也需要“人工智能训练师”进行外部训练与调教,完全依靠企业雇佣人工智能训练师进行外部训练和调教是有限的。
运用“区块链”的机制创建的开源数据集,可以根据数据贡献来进行分配,这些贡献可以是诸如给大型文本-图像数据集贴标签进行AI训练等。因这些工作获益的产品如果产生收入,将分配合理的收益给数据集贡献者。这样的一个开源社区将转变为一个去中心化的自治社区,共同维护一个编译良好的开源数据集,这对于扩大大型模型的研究可及性和提高模型性能起到至关重要的作用。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多