大家好,我是 Jack。 今天,给大家介绍一个算法。 AI 算法 5 秒钟,就能克隆你的声音,你信吗? 听听这段音频,猜猜看是 AI 合成音,还是真人录音? 答案是:AI 合成。 这个人的原始声音在这里: 你给这个 AI 克隆声音的算法打几分? 上述两个音频,算法运行起来的效果: MockingBird这个算法是基于比较著名的 Real Time Voice Cloning 实现的。 MockingBird 是最近开源的中文版。 论文的名字是:
简单介绍下: 算法分为三个模块:encoder模块、systhesis模块、vocoder模块。
具体的算法原理,大家可以先看论文:
论文还没详细看,等我研究好后,后面有机会再发吧。 今天主要聊聊,这个算法怎么玩。
有深度学习基础的话,这个应该不难。 就是部署环境,分四步:
具体的配置方法,直接看这里:
环境搭建的方法,可以参考我写过的两篇文章: 都搞定了,就可以运行代码了。 有两种模式可以启动,Web 模式和工具箱模式。 在项目根目录运行: python web.py 即可开启 Web ,打开地址 http://localhost:8080 就能操作了。 这个界面比较简陋,建议使用工具箱模式。
总结Enjoy it! 喜欢的话,来个再看喽~ 如果人多的话,后面我再出个详细的算法原理剖析和训练教程。 我是 Jack,我们下期见~ Jack Cui 一名热爱技术的算法工程师。分享技术,乐享生活:技术、快乐、财富。 171篇原创内容 公众号 |
|
来自: 昵称7Wo2ThHr > 《待分类》