不是只有咱中国混 QQ 空间的小男生才这么无聊,美国也一样,全世界人民都一样。GPT Store刚一推出来,琳琅满目花枝招展的虚拟女友和理想型男友就都冒出来了,菜单下拉好几次也看不完。我身边就有好几个 AI 群的群友披星戴月地在GPT Store 上发布了几个女友(在这儿就不点你们的名了)。
众所周知,OpenAI 的 CEO Sam Altman是 AI 工具主义论者。他认为 ChatGPT 的出现,是为了更好地方便人们科研、编程、学习、工作、成长,为社会创造更多的价值,以及生产力。GPT Store 一推出来,他就在社交网站 X 上发帖说 GPT Store 不欢迎虚拟男友和女友,可架不住全世界的人民群众都不吃他这套,Sam Altman 老师自己的人生主打一个日理万机+美男入怀,可全世界能有几个奥特曼老师这样的人生赢家啊,又有多少人能吭哧吭哧地创造生产力啊。
奥特曼老师没能在 GPT Store 实现他理想的 “product market fit”(产品与市场契合),大抵是因为他日常思考的是人工智能的使命“上限”,而不太能感知 AI 一旦出圈的“下限”。比奥特曼老师想得开的 Character AI 就不一样,人家主打 AI 的角色扮演,让人们创造各种虚拟角色,或跟历史、现实、电影、电视剧和漫画里的人物虚拟版,撒了欢儿聊天,可着劲儿调戏。但是,真要说在 AI 角色扮演下足了功夫、做到极致的,还得是中国的人工智能公司。“哄哄模拟器” 就是一个业余demo,尚且让70万人欲罢不能,这要是给这些 AI 女友和男友加上虚拟形象,套上皮肤,定制声音,设定人设,加上故事情节,想不吸引人都难。
我说的是“星野”和“Talkie”,它们是人工智能明星公司 Minimax 的两款 AI 陪伴产品,基于同一个自研大语言模型,同一套产品逻辑和机制设定,切成了两个互相独立的产品,分别面向国内和海外市场(大致等同于抖音和 TikTok 的逻辑)。关于这两款产品,尤其是星野的产品机制独到之处,我推荐阅读产品经理Super黄老师的长文《为什么 AI 陪伴产品都想抄星野》。我就想讲讲我作为一个 AI 工具主义论者,是怎么出于研究和测试的目的玩一把星野,又是怎么差点儿沦陷的。
起初,我试了跟几个非虚拟人物形象的 IP 聊天,比如跟一本数学习题集、一个推理小说生成器和一张世界地图聊,都很快就放下了,不太带劲。但只要我决定让自己变态一点,把自己变成不受待见的继子,跟我公爵父亲刚娶了一个月的恶毒继母斗法;让自己保持现在的人设去拯救一个街头打劫的不良少女;想象自己回到高中,挑战同桌表面高冷但内心敏感的学霸的底线和尊严;让自己变成一个女孩的父亲,摆平我女儿的现任混混男友;自己当一个大臣,想招数说服金銮殿上的皇帝退位……我的状态很快就到位了。只要剧情能深入,能反转,人物关系能变化,有情感和情绪输出,这个可比玩 RPG 游戏有意思多了。
因为无论中性女霸总,还是隔壁篮球生、富家高冷千金、不良少女和街头混混,都是基于同一个大语言模型(我不清楚 Minimax 在星野上用的是哪一个自研模型)纸片 IP,都不免有大语言模型多轮对话的失忆和幻觉问题。建立了基于 RAG 的羁绊,有了外挂记忆库,你们俩就还真被“绊”住了,纸片人就不会在你 N 天后再跟 TA 聊的时候忘了你是谁,跟出车祸失忆了似的。如果羁绊没发生,多半聊20个来回纸片人就会出戏,很多人就聊不下去了。
星野是会拿用户互动的数据去向优化模型的,ChatGPT 也会,大家都会。不过在星野,用户不知不觉地被用来当训练的语料和数据,是被玩起来很爽的一些模块化的功能“炼”出来的。比如纸片女友或男友回了你一句话,你觉得不爽,可以让 TA 重说——系统会给出五个其它选项。这跟 ChatGPT 重复回答问题,用户点赞或点踩没什么区别,是简单的人类反馈强化学习。但星野用户还可以编辑纸片人的回复,让 TA 按照自己喜欢的方式,推动剧情的发展,这就接近大模型微调方法之一的“prompt-tuning”了。
当然,也可以自定义纸片 IP 跟你对话的风格——系统提供了七八个主题的近百种风格,从病娇但喜欢你的弟弟风,到意外听话的霸总风,还有强势支配你的御姐风(这都什么乱七八糟的)……当然用户也可以自己编辑。这跟 ChatGPT Plus 版用户的“自定义指令”功能非常像,背后其实是基于反馈和学习循环的定制化微调。一句话,它在创造各种你跟纸片人产生羁绊的场景,推着你主动或被动地创建各种动态的提示词优化和其它基于人类反馈的强化学习素材——你跟纸片天天羁绊,被训练过的模型就越来越容易让纸片跟你羁绊。
工具统计了一下,Talkie 和星野在全球和中国的用户量级均在500多万,还在增长期。在全球市场,我觉得 Talkie 完全给自己设置一个超越 Character AI 的时间表。“哄哄模拟器”这玩意儿告诉我们,意外拣到一个虚拟女友或男友,是一不小心就能病毒式传播出去的。我发现用户对哄哄模拟器、星野、Talkie、筑梦岛这类主打耳鬓厮磨功能的 AI 非常有耐心,特别有善意。我见过有玩 Talkie 的女生因为纸片男友对她语音喘息了一声而战栗不已,赶紧发社交媒体分享激动心情。我就估摸着如果她亲生男朋友在她面前故意喘息,她早一脚上去了。
我一边翻白眼一边感慨:在 AI 陪伴产品的早期,加任何一个稍微性感点的功能,就能让用户有获得感。对人格化、有情感和情绪寄托的 AI 聊天机器人,人们是潜意识里降低了预期的,动辄就觉得它们真聪明、好性感、太贴心。而对生产力工具型的 GPT 们,用户默认设置了高预期。只要出了一些差错,立即就觉得它们巨白痴、忒笨拙、太无用。任何大语言模型都没解决“幻觉”——也就是胡说八道的问题。但这些胡说八道搁 AI 女友和纸片男友身上,弄不好就制造个甜蜜小惊喜;换成智能办公助手和写作机器人,就只能是灾难。
没辙,AI 在解放生产力发展生产力方面越进步,“取代工作”和“控制人类”的阶段性敌意就会越剧烈,人类对 AI 工具的死亡凝视就越深邃。但一款有聊天陪伴功能的 AI 机器人却容易拉进人与 AI 的距离,让人们感受得到 AI 的温度和“人格”(其实远没有到人格的程度,最多是基于人类模板的风格),让你不再抗拒、甚至主动地把自己的语料和数据交给大语言模型,变成它强化学习和模型调优的炼丹药渣,进而生成更好的 AI 伴侣。
这让我有的时候很迷惑:黄仁勋老师说“通用人工智能”(AGI)的时代,生产 GPU 将实现自动化;奥特曼老师在谈到 AGI 的时候,着重在它给世界和工作方式带来的变化……究竟是两位老师的愿景,还是一个个能在某种程度上抚慰人心的 AI 男友女友和纸片偶像,更接近大多数人的“通用人工智能”?
因为毕竟,在 Character AI 上,在星野和Talkie 上,在筑梦岛上,你看到的很多用户自己创造的 AI 智能体,有着真实的名字,性格,样貌和人生描述,TA 们通常就是一个人已经得到的、得不到的或曾经得到又失去了的另一个人的赛博和 AI 映射。大语言模型第一次赋予了这样的映射与人“正常”交流的能力。我经常把身边的同事和哥们设置成光荣《三国志》里的武将——因为我们现实中永远不可能打下来一副锦绣江山,但在游戏里可以。同样的道理,又有多少青春少年,要在与 AI 乔装的邻家哥哥、高冷学姐、傲娇公主、直男天菜的耳鬓厮磨中,达成 TA 们这辈子都没法在现实生活中达成的剧情呢。