分享

人工智能[1518]山姆奥特曼——继马斯克之后的标志性科技狂人?!1分钟流畅高清

 赵站长的博客 2024-02-17 发布于北京

随着技术的不断进步,人工智能领域迎来了一个令人瞩目的创新——OpenAI发布的Sora技术。这项技术为创意产业带来了革命性的变革,它能够将文字描述迅速转化为生动、精细的视频内容。Sora的发布标志着人工智能在视觉内容生成方面的又一重要突破。

刚刚,奥特曼发布Op­e­n­AI首个视频生成模型So­ra。完美继承DA­LL·E 3的画质和遵循指令能力,能生成长达1分钟的高清视频。Op­e­n­AI表示,正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。根据文本提示生成视频,仅仅是整个计划其中的一步。

(g 众 h AI科技之窗)

OpenAI发布视频生成模型Sora与增强ChatGPT记忆功能

Sora视频生成模型:

OpenAI发布了名为Sora的视频生成模型,可根据文本描述生成长达1分钟的高清视频。

Sora继承了DALL·E 3的高画质和遵循指令能力,能处理复杂场景和角色动作。

该模型采用扩散模型,从噪声开始生成视频,使用Transformer架构,并统一表示视频和图像数据。

Sora不仅能根据文本生成视频,还能从静态图像中创建动态内容,为创作者提供新工具。

ChatGPT记忆功能:

OpenAI为ChatGPT增加了记忆功能,使其能保留用户提供的特定信息。

ChatGPT将自动判断哪些对话内容应被记住,并在后续交流中利用这些信息,提供个性化服务。

这两项技术的发布标志着内容创作和人工智能交互的新里程碑,有望推动相关行业和技术的快速发展。

目前So­ra已经能生成具有多个角色、包含特定运动的复杂场景,不仅能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。So­ra还可以在单个视频中创建多个镜头,并依靠对语言的深入理解准确地解释提示词,保留角色和视觉风格。对于So­ra当前存在的弱点,Op­e­n­AI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

在技术细节上,Sora采用了扩散模型,从噪声开始生成整个视频。其关键在于能够一次生成多帧的预测,确保画面的连贯性和稳定性。此外,Sora还使用了Transformer架构,并将视频和图像表示为patch,类似于GPT中的token。这种统一的数据表示方式使得模型能够在更广泛的视觉数据上进行训练,提高了模型的通用性和可扩展性。

值得一提的是,Sora不仅能够根据文本指令生成视频,还能够从静态图像中生成动态视频。这一功能使得艺术家、设计师和电影制作人能够以前所未有的方式创作内容。目前,已经有部分创作者获得了Sora的访问权限,并开始创作出令人惊叹的新作品。

除了Sora之外,OpenAI还为ChatGPT增加了记忆功能。这项新功能将使ChatGPT能够在每次交流时保留用户提供的特定信息,从而提供更个性化的服务。ChatGPT将能够自动判断哪些对话内容应该被记住,并在后续交流中加以利用。

这两项技术的发布引起了业界的广泛关注。许多专家认为,这些技术不仅将推动内容创作行业的变革,还将为人工智能在现实世界中的应用开辟新的道路。随着技术的不断进步和优化,我们有理由期待更多令人惊叹的创新成果。

我是一位75岁以上的老人!本站主要是些学习体验与分享(其中会引用一些作品的原话并结合我的一生体会与经验加工整理而成!在此一并感谢!如有不妥之处敬请与我联系,我会妥善处理,谢谢!)我写的主要是中老年人各方面应注意的事儿!退休后我希望通过这个平台广交朋友,互助交流,共筑美好生活!!

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多