在广告图片创作领域,百度商业自研了面向商业营销场景的文生图大模型,实现了 Prompt 驱动的图片生成和背景图生成能力,缓解了特定行业图片素材缺少和场景适配度低的问题。与广告文案生成一样,文生图大模型训练也分三步走: 首先在基于大规模图文对比学习预训练模型来实现图文表征之间的理解对齐,同时引入了近千亿图搜行为反馈数据进行学习增强;接着基于扩散模型和元素级 Prompt 生成进行文生图模型的端到端学习;最后基于客户专有图文数据和用户行为反馈信号进行商业场景化精调。 下面是文生图的典型示例,客户既可以通过 Prompt 生成初始图,也可以通过 Prompt 来更换图的背景。 此外,数字人口播视频也越来越频繁地出现在各大平台的广告投放场景中, 数字人视频不仅可以大幅节省客户视频创作的成本,还能对它们的外貌、声音、交互方式等进行高度自由定制。百度商业打造了数字人口播短视频端到端生成解决方案,将客户短视频生产的时间从天级缩短到了分钟级。其中视频脚本、数字人模特、口播声音和风格以及视频背景都可以自主生成和选择,完全满足不同客户多样化的营销需求。 最后生成式 AI 技术也在改变着数字化客服领域,数字化客服在电商、金融等场景中已经得到一定应用,但是大都以人工定制模板和问答内容的检索交互为主,对话生硬、千篇一律且需求满足度覆盖很差,随着大语言模型能力的赋能,这些问题正逐渐得到改善。百度商业自研了商业营销对话和营销知识增强的百亿对话生成大模型,具备面向不同行业、不同客户、不同业务点的差异化智能对话能力,大大改善人机交互体验和营销效率。 今年 6 月底,百度营销旗下生成式 AI 创意平台「擎舵」正式亮相,在文心大模型赋能下实现了文案、图片和数字人视频自动化制作。据机器之心了解,该平台可以 2 分钟产出 100 条创意文案、3 分钟生成一个数字人建模、5 分钟制作一支数字人口播视频,相较传统制作方式效率惊人,成本自然而然被打下来了。 可以看到,从广告文案、图片到数字人口播、智能客服,生成式 AI 已经在百度商业的运营中无所不在,深刻变革了传统营销内容的生产方式。并且,生成式 AI 在商业领域的成功应用也为重塑千行百业「打了一个好样」。 结语 2023 大半年过去了,大模型推出的已经足够多, 不过很多仍停留在仅供用户体验的初步状态。但如果仅仅是秀肌肉,无法带来价值,它们也就失去了真正的用武之地。商业营销这个连通商户、场景和用户的「大秀场」为大模型和生成式 AI 提供了尽情释放和发挥能力的土壤。 近年来,百度致力于 AI 技术与商业的紧密结合,这是生成式 AI 对企业进一步发展的必然要求。抓住大模型和生成式 AI 这一技术窗口,则有可能在自身商业场景中迎来生产效率的大幅提升,并留住更多客户和用户。因此,让大模型和生成式 AI 渗透更深层次的企业经营是必由之路,最终形成它们赋能下的全方位商业生态。 百度商业则希望以此次 AI 技术创新大赛为契机,吸引更多年轻人探索 AI 技术的创新应用。我们知道,创新人才的培养是推动 AI 技术发展的根本源泉,更多人才以及他们的创新能力会充分挖掘大模型和生成式 AI 在商业领域的更多可能性。 大模型和生成式 AI 的商业化之路任重道远,百度显然已经走上了快车道。