前段时间B站上孙燕姿AI歌曲异常火爆,动辄百万播放量,让孙燕姿从一个“冷门歌手”一举成为“新晋顶流”。
一时间,用AI克隆孙燕姿声音做出来的歌曲铺天盖地。
就连孙燕姿本人都发文感叹AI的强大,说自己是可被定制的。
今天这篇文章就教你如何通过AI来克隆自己或者别人的声音,让你也能轻松做出一首AI歌曲,甚至让自己成为“顶级歌手”。
由于文章内容比较长,加上需要展示最终的效果,音频文件无法直接上传到这里,所以请点击下方链接进行阅读:
硬核教程!手把手教你用AI克隆声音
7月24日创建
前段时间B站上孙燕姿AI歌曲异常火爆,动辄百万播放量,让孙燕姿从一个“冷门歌手”一举成为“新晋顶流”。
一时间,用AI克隆孙燕姿声音做出来的歌曲铺天盖地。
就连孙燕姿本人都发文感叹AI的强大,说自己是可被定制的。
今天这篇文章就教你如何通过AI来克隆自己或者别人的声音,让你也能轻松做出一首AI歌曲,甚至让自己成为“顶级歌手”
第一步,部署AI声音克隆工具:
点击下方链接下载AI声音克隆工具的完整包:
如果打不开上面链接的话,也可以直接点击这个链接进行下载:
下载完成后对压缩包进行解压,注意解压完成后大概需要10G的空间,所以除非C盘容量特别大,否则尽量不要
解压到C盘。
解压完成后打开文件夹,找到go-web文件并双击运行:
加载程序,如果比较慢的话不用担心,第一次打开可能加载的内容比较多
加载完成后会在浏览器中自动打开这个页面,如果没有自动打开的话,可以复制下方链接到浏览器,手动打开:
第二步,选择声音模型:
和Stable Diffusion一样,我们需要有一个声音模型才能克隆声音,打开下方链接,选择声音模型:
在页面左侧找到“voice-models”并点击:
找到一个自己感兴趣的声音模型并点击,然后右侧会有这个模型的详细信息
点击下方声音文件可以试听,觉得可以的话就可以点击上方链接下载
下载完成之后会是一个压缩包,解压之后里面有两个文件,先选择”.ph”后缀的文件并复制:
打开最开始解压的文件夹,把刚刚复制的文件粘贴到weights文件夹里:
然后再找到logs文件夹:
再logs文件夹里新建一个文件夹,并命名为和声音模型一样的名称:
接着找到声音模型文件夹里的另一个文件并复制:
粘贴到刚刚新建好的文件夹里:
回到操作页面,点击刷新音色列表和索引路径,再点击左侧推理音色栏就可以看到刚刚导入的声音模型了:
然后我们就可以开始克隆声音了
第三步,克隆声音
比如我想用这个声音模型去唱廖俊涛的《谁》,先把网上把这首歌下载下来,然后对这首歌进行处理,把伴奏和人声分离。
如果你想处理的声音文件是纯人声,没有伴奏的话,就可以直接跳过这一步:
选择“伴秦人声分离&去混响&去回声”,把下截好的歌曲文件直接拖拽到这里:
然后选择模型对歌曲进行处理,模型的具体作用上面有详细的解释
1、分离伴奏: 选择HP2或者HP3模型
然后点击转换,看到右侧是这个提示就说明分离伴奏成功了:
打开RVC文件夹里的opt文件夹,就会看到分离好的两段音频,选择vocal开头的音频文件进行去除混响操作:
2、去除混响:
把上一步处理好的vocal文件拖拽到这里,选择onnx模型,点击转换,这一步会稍微慢一点,大概需要几分钟。
然后就会得到去除混响后的文件:
3、去除延迟
把上一步处理过的文件拖拽进来,选择VR模型,点击转换:
然后就得到彻底处理好的音频文件了:
在模型推理下选择声音模型,上传刚刚处理好的音频文件,设置声音转换的升key或者降key,也可以设置为0.
不升不降,接着选择算法,各种算法都有清晰的解释,再下拉选择一下index路径,点击转换就可以了。
(如果这一步转换失败,可以在下方批量转换区域按照上述步骤进行同样的操作就可以了)然后我们就得到声音克隆后的《谁》的清唱音频了
第四步,合并音频
接着我们把人声和伴奏进行一个合并,制作出一首完整的歌曲
下载格式工厂:
在音频栏选择混合功能:
点击添加文件,上传人声和伴奏,点击确定:
点击开始,一首完整的《谁》就做好啦:
如何克隆自己声音:
首先需要准备30分钟到50分钟的自己声音的音频,要尽量清晰并避免有任何人声以外的声音,然后复制文件夹路径:
在训练模式下,粘贴刚刚复制的文件夹路径,设置总训练路径和显卡batch_size,显卡最低要求4GB显存。
然后点击一键训练,耐心等待就可以得到自己的声音模型了,剩下的步骤就和上面一样了.
暂无评论内容