10分钟复刻自己的声音-- GPT-SOVITS 小白级教程
大家好,我是肉饼李,目前专注探索声音克隆+数字人业务~
今天分享GPT-SOVITS本地部署+推理教程,跟着步骤操作,小白也高效复刻自己的声音~
文末附上十多款音频相关工具,希望能对各位圈友有所帮助,话不多说,直奔主题!
一、GPT-SOVITS介绍
结论先行:
GPT-SOVITS能低成本高效率,
解决自媒体短视频制作时,快速复刻目标人物声音的痛点!
成本效果展示:
我录了自己1min声音,没用AU处理,直接在GPT-SOVITS花了10分钟训练推理的
: (暂无法在飞书文档外展示)
优势说明:
1.只需2分钟的干净素材音频
2.训练时间很短,十分钟左右
3.对硬件要求低,6G的N卡即可
4.效果可达90相似度左右
软件对比:
主流声音克隆工具很多,我深度使用过其中大部分产品,
1. Sovits(翻唱效果最好--如AI孙燕姿)
2. bert-vists(语气模仿最强--如适合强IP自媒体口播,有声小说)
3. RVC (能实时变声--如游戏直播)
4. 11labs (实现多语种配音--但中文效果差到令人发指)
5. Reecho.AI(Damon教练详细分享过:链接)
剪映 (操作简单,待体验对比)
使用场景:
比如自媒体口播配音,AI虚拟人物声音还原,AI复活人声还原(这次的数字人航海就能用到~~)
软件介绍:
GPT-SOVITS1月份就出来了,B站花儿不哭大佬的开源产品,之前也有圈友简单分享过
受限于音频和图片步骤说明,烦请移步飞书:链接


