OpenBayes教程｜GPT-SoVITS声音复刻术！华妃、甄嬛等声音一键克隆

作者：OpenBayes发布时间：2024-03-27

Sora

由 B 站热门 up 主 Jack-Cui 制作的 AI 声音克隆教程「GPT-SoVITS 音频合成在线 Demo」现已上线至 OpenBayes 公共教程！

公共教程地址：

https://openbayes.com/console/public/tutorials/E1NG5iJERYC

为了让大家更快上手，Jack-Cui 录制了生动有趣的教学视频，现已入选 B 站热门视频榜单～

王炸！AI声音克隆+Sora开源平替一键启动，全网最简单！

本教程将手把手教会你如何一键启动，克隆各种有趣音色，分分钟让你喜欢的经典角色、动漫人物，用他们独特的音色，说出你定制的台词。

小贝已经定制好了华妃版叫早音频，简单易操作，零基础小白也可以快速学会，快来尝试吧！

操作步骤

PART 1 数据准备阶段

目前该教程内已预设多款经典角色音色供大家体验，如想克隆其它音色，则需要准备一段该音色 MP3 格式的音频文件，最好为单独人声（30s 左右即可)，高质量的音频文件可以提升克隆声音的逼真程度。

1. 通过左侧菜单栏中的「数据集」后，点击「创建新数据集」。

2. 按照要求填写好「数据集名称」和「数据集描述后」，点击「创建数据集」。

3. 创建完成后，点击右上角「上传新版本」，将想要克隆的音频文件上传。

PART 2 Demo 运行阶段

1. 数据准备完成后，在左侧菜单栏「公共教程」中，打开「GPT-SoVITS 音频合成在线 Demo」，点击右上角「克隆」，将教程克隆至自己的容器中。

2. 可以看到已经为大家绑定了可莉、华妃、甄嬛、胖橘的音频数据。目前绑定数据的数量已满，可以删除不需要的音频数据后添加自己创建的数据集。

3. 添加完成后，点击「审核并执行」。

4. 跳转页面后，点击「继续执行」。推荐使用 RTX 4090，新用户使用下方邀请链接注册，即可获得 4 小时 RTX 4090 + 5 小时 CPU 免费算力时长哦！

📢 小贝总专属邀请链接（直接复制到浏览器打开）：

https://openbayes.com/console/signup?r=GraceXiii_W8qO

5. 稍等片刻，待状态会变为「运行中」后，点击「打开工作空间」。首次克隆启动该容器约需要 3-5 分钟，如超过 10 分钟仍处于「正在分配资源」状态，可尝试停止并重启容器；如重启仍无法解决，请在官网联系平台客服。

6. 打开工作空间后，点击左侧「run.ipynb」，通过菜单栏中的「运行」按钮，点击「运行所有单元格」。

7. 找到「Running on public URL」，打开该链接。

8. 在「数据集地址」模块内填写本次想要克隆声音的数据集地址，选择音频数据类型后，点击「开始训练」，待输出结果显示为「模型正在开启预测，请稍后」，回到「run.ipynb」，即可看到显示「GPT 训练完成」。

9. 打开右侧「API 地址」，请注意，用户需在实名认证后才能使用 API 地址访问功能。

PART 3 效果展示阶段

1. 在「GPT 模型列表」和「SoVITS 模型列表」选择训练好的模型，然后在「Inference text」中输入文本，点击「Start inference」后，稍等片刻，就可以愉快地玩耍啦！

龙年福利

* 新用户注册：点击下方邀请链接注册，即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费算力时长，永久有效！

📢 小贝总专属邀请链接（直接复制到浏览器打开）：

https://openbayes.com/console/signup?r=GraceXiii_W8qO

相关资讯

GPT-SoVits如何生成日语教程

因为私信太多人问我这个问题了，所以索性写一篇教程出来本解决方案: 下载链接(0217版本有whisper): sha-256: A2496F9EB344059E6F4C54996B16F2A193C5628B784487B7D907858F7DDF7E90-00005AD1 GPT-SoVits官方(icloud) 迅雷网盘百度网盘 [图片] 新版本解决方案: 在GPT-SoVits最新版中，已经内置了OpenAI-Whisper (ASR) 模型。第一次选择该模型进行离线ASR时，可能需要下载模型。

Whisper 百度 OpenAI

Cloxl233 2024-06-12

AI声音克隆教程

大家好，我是 Jack。因 ChatGPT、Stable Diffusion 让 AI 在文本、图像生成领域火出了圈。但 AI 在生成方面的能力，可不仅如此，音频领域也出现了很多优秀的项目。我用我本人的音频数据，训练了一个 AI 模型，生成了几段歌曲，效果已经在我最新一期的视频中展示了，感兴趣的可以看下：https://www.bilibili.com/video/BV1x24y147yq视频、教程制作不易，跪求三连支持，一个免费的赞也行～勿用技术做恶勿用技术做恶，必须放在第一个来说。请勿用该技术从事诈骗

ChatGPT Stable Diffusion

Jack-Cui 2023-03-13

OpenAI推出声音克隆新技术：复刻你的声音仅需15秒

该技术能够在极短的时间内，通过简单的文本输入和15秒的音频样本，复刻出与原始说话者极为相似的语音，其情感表达丰富且自然逼真。“VoiceEngine”技术的研发始于2022年，目前已成功集成到OpenAI的文本转语音API和ReadAloud功能中。

OpenAI

砍柴网 2024-03-31

OpenAI语音克隆新技术，企业可用微软声音克隆

OpenAI在官方博客分享一个名为“Voiceengine语音引擎”模型的预览，该模型仅需使用单个15秒音频样本，然后通过文本输入来生成与原始说话者非常相似的自然语音，即，我们经常提到的“AI语音克隆”技术。…

OpenAI 微软 AI音频

等保测评办理 2024-08-26

TTS模型和声音克隆工具-Lovo.Ai

随着Ai技术的进步，TTS模型和声音克隆工具的应用也越来越广泛。尽管市场上有很多相关的软件，其中最知名的就是Lovo.Ai。该平台支持文本转语音声音克隆，视频剪辑功能。选择第一个名为chloe woods的女性播音员，试听一下声音。和其他TTS模型相比，LOVO生成的人声更加自然。完全没有人工合成痕迹。目前已经有来自全球的70万用户和知名企业正在使用LOVO的语音生成服务。此外，LOVO还支持视频编辑，以及图像生成和Ai写作功能。作为行业的标杆，LOVO使用了自然真实的人声，为各个行业的内容创作者提供高质

AI写作

新的褪色者 2023-11-13

OpenBayes教程｜GPT-SoVITS声音复刻术！华妃、甄嬛等声音一键克隆

推荐体验

相关资讯

GPT-SoVits如何生成日语教程

AI声音克隆教程

OpenAI推出声音克隆新技术：复刻你的声音仅需15秒

OpenAI语音克隆新技术，企业可用微软声音克隆

TTS模型和声音克隆工具-Lovo.Ai

近期资讯

如何顺利安装和使用打印机驱动程序的实用技巧与注意事项

如何轻松打开和安装MSI文件的详细指南与常见问题解决方案

深圳市金沃德科技取得一种具备束线机构的行车记录仪专利，有效地提升了记录仪本体的实用性

云米推出智能门锁 2A Pro 人脸猫眼版：3D结构光+指纹，999 元

摩尔线程MTT X300专业卡上线官网，物理规格与MTT S80一致

重庆冀繁取得车载GPS定位仪专利，提高定位仪装卸效率

如何高效使用笔记本提升学习和工作效率的技巧与建议

天创壹洲取得自动驾驶中控交互设备专利，提高行车安全性

REDMI Turbo 4手机搭载6550mAh最大小米金沙江电池

谷歌升级安卓 15 跨 Pixel 设备通知，支持蜂窝网络同步

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响