文章目录
1.首先到stable diffusion整合的SadTalker
2.安装ffmpeg
3.下载SadTalker
4.然后下载它的checkpoint里面的文件
5.在SadTalker的资料夹新增一个checkpoints资料夹
6.点选webui.bat档案
7.上传照片跟mp3档
SadTalker是一款免费的线上工具,让你可以自己制作AI主播,只要上传一张图片,就可以让它动起来,并且说出你想要的话,只需要简单的安装按钮不用10分钟就能安装好SadTalker,想要创造一个属于自己的AI主播。
SadTalker的优势在于它完全免费,不像D-ID和HeyGen等平台,需要付费才能使用更多的功能和资源。可以像stable diffusion 安装到自己的电脑,自己使用,保障你的个人资料跟隐私权。
话不多说,我们赶快开始吧!首先,因为这个还是很吃显卡效能,如果你显卡不足4G跑起来会非常吃力….
1.首先到stable diffusion整合的SadTalker
如果你的显示卡是6G~12G以上可以直接透过stable diffusion安装扩充模型。如果你跟我一样显卡低的可怜,那我们还是手动安装到本机。
前往网址:https://github.com/OpenTalker/SadTalker
只有提供Windows安装教学。
Windows (中文windows教程):
Ⅰ.安装Python 3.10.6,检查“Add Python to PATH”。
Ⅱ.手动安装git(或者通过scoop安装git)。
Ⅲ.按照下面的说明安装ffmpeg(或者使用scoop通过scoop安装ffmpeg)。
Ⅳ.下载SadTalker存储库,例如运行git clone https://github.com/Winfredy/SadTalker.git。
Ⅴ.下载检查点和gfpgan↓。
Ⅵ.在Windows资源管理器中以普通非管理员用户运行start.bat,将启动梯度web演示。
如果之前有安装过stable diffusion,那么就可以省略步骤1、步骤2。(因为之前安装过了)如果还没有安装过过可以参考这一篇文章《Stable Diffusion详细教程》新手小白如何在Windows系统上快速安装Stable Diffusion详细步骤》
2.安装:ffmpeghttps://tracyting.com/sadtalker/
直接解压缩档案,然后将解压缩的档案直接拷贝到C硬碟里面。
然后我们复制control sysdm.cpl,任意贴到文件路径上面。
可以叫唤出系统内容。
选择进阶→环境变数
→选择Path→编辑
然后复制刚刚安装ffmpeg的路径,在bin文件底下。
→编辑环境变数→新增
→贴上路径→确定→确定
输入cmd后按下enter键打开命令提示字元
输入ffmpeg按下enter
如果出现这样的画面就是ffmpeg安装成功了
3.下载SadTalker
在命令提示元件贴上以下网址。然后等他跑完就下载好了
git clone https://github.com/Winfredy/SadTalker.git
4.然后下载它的checkpoint里面的文件
到以下连结,把这些都下载下来。
https://github.com/OpenTalker/SadTalker/releases
5.在SadTalker的资料夹新增一个checkpoints资料夹
把刚刚下载的档案解压缩后丢checkpoints资料夹
6.点选webui.bat档案
等命令提示元件跑完,出现http://127.0.0.1:7860
就代表安装完成了,可以开始运行了。
每次都要到这里运行webui.bat档案,然后再复制网址贴到浏览器http://127.0.0.1:7860
C:fmpeg-2023-06-26-git-285c7f6f6b-full_buildinSadTalker
7.上传照片跟mp3档
上传照片跟mp3档,按下Generate
crop是裁切
resize是调整尺寸
full是全尺寸不更改的意思
Still Mode (fewer hand motion, works with preprocess full)
这个选项是讲话的时候不要让头部有摇晃的动作,配合选full的效果最好
GFPGAN as Face enhancer
下面的是脸部讲话看起来更真实
如果你跟我依样显卡容量不足…就会出现以下画面
之后会出一期如何免费云端使用SadTalker