分享

AI语音克隆软件 FastVits v22 支持TXT文本转克隆声音 离线版

 二花虚拟资源 2024-07-14 发布于福建

AI音频克隆语音克隆软件是一款功能强大的本地运行工具,专为克隆和模拟特定的语音声色设计。这款软件能够接受你的语音输入,创建一个相似的语音模型,并能将文本内容转化为与原始语音几乎一致的音频文件。最令人兴奋的是,这款软件无需安装,只需解压就可以开始使用!

  

【无需联网,随时随地转换语音】

AI音频克隆软件完全在本地运行,不需要联网连接,使其成为随时随地进行语音转换的理想工具。无论是将一部小说转换为有声读物,还是执行其他语音合成任务,只要你的设备存储空间充足,一切都变得轻松简单。软件的AI引擎同样本地化,确保了处理速度和数据安全,尽管这意味着软件的压缩包体积高达10GB,但这是高质量语音克隆的坚实保障。

1. 语音克隆:提交的语音样本会被软件训练成一个详细的语音模型。

2. 文字到语音转换:软件可以将输入框或TXT文档中的文字转换成与克隆声音相同的语音文件。如果同时存在输入框文字和TXT文档,系统默认优先处理TXT文档中的内容进行语音合成。若没有上传TXT文本,则默认转换输入框内的文字。

【最新更新】

- V2.2版本(2024-02-08):更新至 Bert-VITS2。

- V2.0版本(2023-11-11):新增了RVC音频克隆项目,支持更加复杂的训练任务,包括人声和歌声克隆。

AI音频克隆软件通过其先进的功能,为用户提供了一种快速、安全且高效的方式来创建和使用自定义语音模型,从而极大地拓宽了个人和专业用户在语音合成领域的可能性。

【使用AI音频克隆软件创建和合成定制语音的方法可以分为两大步骤】

 一、制作语音模板

这个阶段的目的是创建一个根据你的需求定制的语音模板。

1. 选择待训练的音频文件夹:软件将自动处理含有WAV格式音频的文件夹,执行切割、去除背景音乐和噪音等预处理任务。

  

  

  2. 使用预训练模型:通常无需手动操作,软件会默认加载作者提供的模型。如果需要手动选择,可以直接在模型存储的文件夹中选取。

3. 自定义模型的角色名字:为你的模型命名,使用英文名称。

4. 选择语音识别模型:一般使用默认的base模型即可。

5. 设置训练轮数(epoch):建议设置为200,虽然通常几十轮就足够,但300轮能够达到更优效果。

6. 设置批处理大小(batch size):这应根据你的显存容量调整,一般设置得小一些。

7. 设定学习率:使用默认设置即可。完成以上设置后,点击开始训练开始制作语音模板。

  

二、文字转语音合成

在制作好语音模板后,你可以开始将文本转换为语音。

1. 输入或导入文本:直接在软件中输入文本或通过导入TXT文件添加需要转换的文本。(若同时存在,TXT文件中的文本会被优先处理)

2. 选择训练好的音频模型:选择之前步骤中制作的以G开头的音频模型。

  

  

3. 保持默认设置:其他设置如SDP混合比、噪声级别、语速等保持默认即可。

4. 生成语音:完成设置后点击生成语音,软件将根据输入的文本和选择的模型生成语音。

通过这两个步骤,你可以轻松地使用AI音频克隆软件来创建个性化的语音模板,并将任何文本转换成特定的声音。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多