![]()
在此期间,我曾经尝试通过手动的方式完成这个过程,包括将内容制作成PPT,然后通过剪映这类视频剪辑工具,制作一个课程讲解视频出来,然而我制作了2个视频之后就基本放弃了,因为太消耗我的精力和时间了,实际尝试下来每制作一个视频在高度专注的情况下依然需要2天左右的时间,这基本无法接受,我不能把时间浪费在内容形式的转换上。 所以我尝试寻找通过AI的方式去解决,但是没有找到特别好的能够将整个流程闭环在一起的产品,而秘塔搜索最近上线的“今天学点啥”的功能,基本很高完成度的解决了我的需求,在体验完之后,我一口气就将自己过去一年多的几篇比较好的文章转换成了视频,视频效果示例效果如下。 ![]() 同时,出于对该功能的认可,作为一个平时很少分享实操攻略的我,也觉得有必要跟大家分享一下应用实操过程,希望能够帮助更多在这个方面有同样需求的朋友,本篇内容全文2700字,阅读预计需要10分钟,我主要会分享如下3点内容:
实操攻略:将一篇公众号文章转换成一个讲解视频1.首先打开“秘塔搜索”(metaso.cn/),点击侧边栏的切换入口,切换到新功能界面; ![]() ![]() 2.上传一个文档,或者输入一个文章链接 比如,我输入之前写的一篇“深度理解Manus AI Agent”的文章链接,然后点击开始后,秘塔搜索支持选择通过什么样的水平讲解,以及选择讲解的风格,比如我比较喜欢的是以专家的水平,通过课堂的风格讲解,点击确认。 ![]() 接着平台会阅读和提取文章的内容,然后将内容做结构化处理,生成Markdown格式的结构化文本; ![]() 3.生成PPT以及带字幕和语音的讲解 这个过程中,大模型首先将生成的结构化文本转换成一个PPT,然后针对每一页PPT生成讲解内容,并合成语音播报出来,同时附带字幕,如此,一个讲解视频就基本完成,体验效果如下。 整个过程很简单,使用也很流畅和舒服,所以值得给秘塔搜索团队点赞,能明显看出来有深度的结合应用场景在做产品。 该功能有什么用?1.提升学习效率价值:对于大众用户而言,大家可以把一些自己没有耐心看的文章、文档直接上传,生成一个讲解视频,用于视频学习,解决的是大部分用户学习知识的需求;通过视频讲解的方式,可能能够更好的帮助大家获取知识; 2.提升生产效率价值:对于内容创作者用户而言,也就是像我这种长期深度输出的用户,最大的作用就是可以帮我把自己压箱底的文档转换成视频课程,然后用于分享,帮助大家更好的获取知识; 秘塔搜索文章转视频讲解的产品点评整体上讲,个人觉得在应用场景的满足度上,已经挺不错了,并且实际生成的讲解内容,虽然还存在部分小问题,但是基本可以达到用于使用的标准,个人觉得在产品能力上,有几点值得肯定: 1.内容讲解的模型效果不错 其中体现在讲解风格确实能够个性化,能生成面向不同受众的内容,并且讲解内容通俗易懂,内容之间是有逻辑关系的,不会像一个机械的播报机器人; 并且在讲解的过程中能够重视还原文档中的细节内容,把细节信息也呈现出来,而不是像现在很多AI问答和阅读的工具,只是生成一些摘要信息,过滤掉了很多细节信息; 2.支持PPT播放的演示动效 比较难得的一点是,在讲解的过程中,它能时不时的生成一些演示动效,通过交互动效,让用户聚焦讲解重点,而不是面对一个静态的PPT页面; ![]() 3.支持生成逻辑图和流程图 对于一些可能比较复杂难懂的知识点,为了让用户更加容易理解,在讲解的过程中,会生成一些逻辑图和流程图,帮助用户更好的理解; ![]() 当然,目前产品也还存在一些不足的地方,个人觉得如果能优化好就更好了,主要表现在如下几点: 1.PPT美感问题 目前生成的PPT的设计质感和样式还比较差,跟WPS AI、Gamma AI、ChatPPT、AI-PPT等产品生成的PPT相比还差的比较多,可以明显看出来的是,秘塔搜索在生成PPT的时候,更加重视逻辑结构,相对弱化美感的实现,这个是个可以优化的地方; 2.不支持下载讲解视频 对于内容创作者而言,我很希望这个讲解视频能直接下载,因为对我来说挺有帮助的,目前我只能通过录屏的方式把内容录制下来,如果秘塔搜索能支持下载就更好了,可以帮我节省更多的时间; 当然以上都是站在内容创作者的角度看待,可能目前秘塔搜索还是聚集在解决普通用户的教育学习方面的需求,因此以上问题可能也不是他们定位下的重点,我们期待它有更多的更新。 一个完整的文章转视频AI产品的能力是什么样的?接下来,我主要站在产品经理的角度上,畅想一下一个更加完整的这类产品,还应该完整具备哪些功能,依赖哪些关键技术;或者说,从我个人的角度看,我想要什么样的一个工具,其中包括功能除了前面已经提到的,还应该包括如下,希望秘塔搜索能越做越好,或者有研发同学有兴趣的可以一起合作把产品做出来。 1.支持自定义音色 比如我很需要它能像豆包一样,支持录入个人的声音,然后语音播报人可以用我的声音播报,这样可以更加个性化一些; 2.支持数字人,且需要能够对口型; 除了克隆音色,最好还能支持个人形象的露出,能够克隆个人数字人,并且播报的过程中能够对口型,如此便可达到教育和知识付费场景的标准课程视频的水准。 3.具备更多交互动效,包括圈选讲解内容 在讲解的过程中,支持更多PPT的播放和交互动效,在讲解的过程中,让PPT的画面能够经常动起来,让听众知道具体在讲哪一块的内容,视线焦点和讲解内容能够结合起来。 OK,以上便是今天的分享内容,呼吁大家看完就实操起来,通过AI获取更多的知识。当然,秘塔搜索目前的功能是将文章转成讲解视频,那么前提是要有高质量的文章内容,生成高质量的文章内容可以使用DeepResearch深度研究产品,详细参考我上一篇文章一文深度理解DeepResearch产品 |
|