大家都知道,我写过很多安利,也推荐过不少工具。不过不同的工具推荐程度是有区别的。 有的是「不错,这个玩意解决了这个问题,说不定什么时候能用得上」; 有的是「这个工具真不错,必须推荐给大家」; 还有的是「我靠,这个也太吊了吧,你们快看看我发现了什么?!」 今天这个就属于第三种,是那种我用过之后就忍不住想嘚瑟给你们看的程度。 这个工具所在的赛道并不新奇,说白了就是文字转语音。 如此常见的赛道上,那得有多惊艳的效果才能让我嘚瑟给你们看呢? 不废话了,你自己来听吧。 没错,这就是全部 AI 生成的。 我不知道你听了之后是什么感觉,如果你震惊于这个惊艳的效果的话,可能你会进一步猜测,做成这么夸张的效果,得多复杂的提示词才能实现呢? 那么接着告诉你,0 提示词,我只提供给它了一个素材链接而已:https:///4 然后,等几分钟后,你就听到了一个有主持串场、对话交流、实时互动,逼真到不像话的专业播客音频。 我知道 AI 转音频迟早会达到接近真人效果,但没想到的是,这一天这么早就来了。 AI 生成播客 这个一键生成专业播客的工具就是谷歌的 NotebookLM,原本定位是一个基于 RAG 的个性化 AI 助手产品,用来归纳知识,整理笔记,然后生成音频。 但由于这个生成音频的效果过于出色,以至于现在大部分 NotebookLM 用户主要都在用这个功能来转播客。 但是之前因为不支持中文,所以国内还没流行开,很多小伙伴可能听说过,但没怎么用过。 不过现在可不一样了,最近它终于支持中文了,那我必须来玩玩看。 正如你们听到的那个音频,我上来就选了个不太寻常的素材,就是这个金鸡儿网,都是小伙伴们喜闻乐见的一些内容。 大家可别误会,选这个倒不是说我有多爱看这些内容,完全是出于秉承探索 AI 能力边界的精神,看看对于这种敏感内容,谷歌的 AI 会怎么处理。 没错,完全没有别的意思。 结果,它就生成了一篇效果相当离谱的播客音频。 怎么样,听 AI 一本正经地聊 AV 是什么感觉? 我先收一下,先从本职工作方面评价下这篇 AI 播客。 两个 AI 主持人,一男一女,声音自然到让人分不出是 AI 还是真人。 主要表现在两方面,一个是说话思考停顿,一个是两人的语气词,大家一定要细品,往常使用 AI 文字转语音我还没有听过这样的效果。 更厉害的是,他们的对话一点都不生硬,抑扬顿挫,情感丰富,重点突出,完全不输专业主持人的水准。 主持人之间的互动也特别自然,一个抛出话题,另一个接话圆润,甚至还能根据内容调整语气和语速。 比如说到重要观点时会放慢语速加重语气,聊到轻松话题时又会变得活泼自然,这种细节处理真的让人惊叹。 用技术语言描述就是,它已经做到了同一词汇在不同语境中会有不同情感、不同语速、不同音调的细腻区分,这种细节微调能力着实有点吓人了。 内容方面更是让人刮目相看。它不是简单地把文字读出来,而是会重新组织语言,把要点提炼出来,用对话的方式展现。 要知道,往常想做这样一期播客,即使在 AI 的加持下也得折腾大半天。 首先要用 AI 把网页内容总结提炼,然后把总结的内容转成播客文本,还得调整对话的形式和语气。 接着还要挑选合适的声音,把文本转成两种不同的声音。最后还得做后期处理,调整节奏和衔接。这一通操作下来,没个大半天根本搞不定。 但是 NotebookLM 直接把这些工作压缩到了几分钟之内。你提交个网址,泡杯咖啡的功夫,一段专业水准的播客就新鲜出炉了。 我好奇的是,这背后的提示词工程究竟是怎么控制的,让任何用户来用,都能达到如此稳定的输出效果,包括文本拆解、转播客脚本、生成音频、情感语速微调等等,谷歌还是有点东西的,不得不服。 NotebookLM 使用方法 你是不是也动心了,想玩玩看,那接下来给大家详细介绍一下玩法。也就是NotebookLM 的音频概览功能「 Audio Overviews 」。 使用方法特别简单: 1.打开官网(需要魔法) https://notebooklm.google 有谷歌账号的话直接就能登录,都不用注册。 2.点击「试用 NotebookLM 」 ![]() 3.再点击「新建笔记本」 ![]() 4.上传资料 前面没有讲它支持上传哪些文件,这里着重讲一下。 除了 Word ,它基本支持大部分格式的文件,什么 PDF、文本、Markdown、mp3 以及网页,最多支持上传 50 个资源。 ![]() 5.这是上传文件后的界面,可以看到,除了音频概览,还可以同时生成思维导图文件。 ![]() |
|