造梦师手记：中国小哥研发，Stable Diffusion一张图生成视频数字人

作者：铁华团的黄金船发布时间：2023-07-13

前一段时间，AI孙燕姿热闹非凡。AI合成的声音，和真人已经几乎难以分辨。

不难想象，在洛天依等数字IP持续火热的过程中，随着AI技术的突飞猛进，很可能会出现一个真正超越人类声音的AI歌手。

一边是ChatGPT等超级AI可以代替人类思考生成文字；

一边是Stable Diffusion等AI绘图（视频）可以从文字生成图像（视频的本质是一帧帧的图像，AI绘图突破后，视频只是个累加工作量）；

一边是AI合成声音越来越逼真。

这也意味着，三个环节打通后，真正的数字人，触手可及了。

事实上，相关的技术已经基本实现突破，剩下的就是一步步迭代，更加完美。

今天给大家介绍的插件，是开局一张图，剩下的全靠AI编。

这个插件叫SadTalker，创作者来自西交大。

一、程序安装

程序本身安装比较简单，但程序需要的模型搞起来比较复杂。作者单独打包了模型，需要从网盘下载。

https://github.com/OpenTalker/SadTalker

装完程序后，使用前还要下载模型和依赖包。

二、模型、依赖包下载和安装

模型和依赖包下载地址：

百度云盘： https://pan.baidu.com/s/1nXuVNd0exUl37ISwWqbFGA?pwd=sadt

123云盘：https://www.123pan.com/s/ueDeVv-DM0I.html 提取码:lgyh

在extensions\SadTalker 目录下手工创建一个文件夹：chekpoints

1、将下载的模型文件（百度云盘的需解压，123云盘的下载下来即可）拷贝至xtensions\SadTalker\chekpoints

2、将视频解码文件解压缩，放到C盘根目录下，ffmpeg-2023-07-10-git-1c61c24f5f-full_build.7z

解压缩后，将文件夹改名为ffmpeg（改成别的也可，为了方便），将文件夹拷贝到c:\ffmpeg

然后在环境配置里增加环境变量。

变量为c:\ffmpeg\bin

配置完环境变量后，需重启计算机生效。

三、Stable Diffusion的WebUI界面会新增SadTalk选项卡

略奇怪的是，和作者在主页上放出的界面略有不同。

作者的界面里有一个从文生图读取图片功能，实际安装后并无此按钮。

我以为是版本问题，更新到最新发现也没有，估计作者忘了放上了。耐心等下个版本吧。

稍微繁琐一点点的地方，是需要将生成的图片存到硬盘，再在SadTalk界面上传，多浪费3秒钟。

四、使用界面简介

整个界面大致有四个区域，左上栏上传图片，左下栏上传音频（可以从AI网站由文字生成），右上栏是配置界面，右下栏是生成视频。

只有右上栏略微复杂一些，挨个按钮介绍下。

Pose style是口型和眼睛的风格，我的建议是随缘。

face model resolution是面部识别模型，建议256，对资源占用小一些。

preprocess是截取照片，crop是只取头部，full是全图，建议选full效果好一些，可以提前手工截取比较满意的画面再上传。

GFPGAN是高清模式，占用资源比较大。

需要注意的是，音频不要太长，30秒内为佳，否则对显卡要求过高，容易爆显存，生成失败。

五、我做的视频范例

建议使用真人模型，正脸面对镜头，否则容易识别失败。

原图：

视频：

相关资讯

近期资讯

ogg音频转mp3格式，学会这6个教程，一键轻松转换！

您知道ogg是一种出色的音频格式吗？凭借其高质量的音质，ogg在游戏行业等多个领域得到了广泛的应用。然而，由于兼容性问题，许多设备和音乐播放器无法直接播放ogg文件。解决这个问题的最佳方法就是将ogg音频转换成mp3格式。mp3是最常见的音频格式，不仅与大多数设备和播放器兼容，而且文件体积较小，便于存储和传输。在本文中，我们将为您介绍6种关于ogg音频转mp3格式的简单方法，一起来看看吧。教程一：使用“闪电音频剪辑软件”把ogg转换成mp3格式闪电音频剪辑软件不仅提供强大的音频剪辑功能，还支持音频格式转换

金舟音频大师 2024-12-29

可编程中央控制主机的技术创新与未来趋势

在当今这个快速变化的科技时代，可编程中央控制主机作为自动化与智能化控制系统的核心组件，正经历着前所未有的技术创新与变革。随着物联网、大数据、人工智能等技术的飞速发展，可编程中央控制主机不仅在功能上得到了极大的丰富和扩展，还在性能、可靠性、易用性等方面实现了显著提升。本文将深入探讨可编程中央控制主机的技术创新点、当前的应用现状以及未来的发展趋势。一、技术创新点模块化与可扩展性现代可编程中央控制主机普遍采用模块化设计，使得系统可以根据实际需求进行灵活配置和扩展。这种模

格芬科技 2024-12-29

成功秘诀：掌握关键要素

有时，我们可能会误入歧途，因为未能预见结果，沿途风景又相似，便误以为自己走在正确的道路上。如果我们不尽早调整方向，直到抵达终点才意识到错误，那时无论怎样懊悔都无济于事。因此，一旦我们通过多次实践确认了正确的路径，就应该坚定不移地走下去，并且要走得熟练自如。

天天向上_24 2024-12-29

门窗网站本地企业网站优化策略

门窗网站本地企业网站优化策略至关重要。通过精心设计和优化，可以提升企业在当地市场的曝光度和竞争力。首先，关键词的选择至关重要。在文章和网站内容中，应该使用与门窗行业相关的关键词，以提高搜索引擎排名。其次，网站的页面加载速度也是一个重要因素。确保网站加载迅速，以提供良好的用户体验。此外，响应式设计是必不可少的，使网站在各种设备上都能够良好展示。另外，定期更新网站内容也是关键。保持网站内容新鲜和有吸引力，可以吸引更多访问者并提高转化率。最后，利用社交媒体平台进行推广也是一个有效的策略。通过在社交媒体上分享有关

做网站建设设计小程序 2024-12-29

灾难降临地中海：谁干的？！

一场突如其来的灾难降临在地中海，据参考消息12月26日援引俄新社报道，当地时间12 月 23 日，俄罗斯最大的干货船之一“大熊星座”号遭遇恐怖袭击后沉没。这一事件引起了国际社会的广泛关注，而人们最为关心的问题便是：这起恐怖袭击究竟是谁干的？“大熊星座”号的船东俄罗斯国防物流公司明确表示，该船遭到了有针对性的恐怖袭击。船员的证词显示，莫斯科时间 12 月 23 日 13 时 50 分，右舷船尾区域连续发生三起爆炸。随后的检查中，发现水线上方有一个直径为 50x50 厘米的大洞，洞的边缘被撕裂并向内凹陷，船的

俞洁讲武堂 2024-12-29

高中生物考了全班第一的秘密！

高中生物被誉为——理科中的文科，是文科中的理科，这所以被同学们这么称呼，是因为在高中生物的学习过程之中不但需要需要背书，也需要用理科思维做题。因此高中生物是很多同学的丢分项！但实话实说，高中生物真的超级简单！很多同学丢分是没有掌握正确的学习方法。今天学姐给大家整理了一份高中生物长句子规范表述，带你高效提分，快来一起看看吧 [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片]

小一学姐爱分享 2024-12-29

陶瓷粉末伺服成型机-电子陶瓷、金属化陶瓷、精细陶瓷

在当今科技飞速发展的时代，材料科学的进步不断推动着工业和科技的边界。特别是电子陶瓷、金属化陶瓷以及精细陶瓷领域，它们以其独特的性能在多个行业中扮演着至关重要的角色。而在这些高性能材料的背后，是一系列创新技术的支撑，其中就包括了陶瓷粉末伺服成型机。氧化铝陶瓷电子陶瓷金属化陶瓷氧化锆陶瓷氮化硅、氮化铝、碳化硅、碳化硼、硼化锆等陶瓷粉末---氧化铝、碳化硅、氮化硅、氮化铝、氧化铝、氧化锆、碳化硅、氧化硅电子陶瓷、精密陶瓷、陶瓷结构件、陶瓷粉末：氧化铝、氧化锆、碳化硅、氮化铝、氮化硅、氧化硅等陶瓷粉

伺服粉末成型机 2024-12-29

智慧园区系统提升管理效率与安全性的创新解决方案

本文探讨了“智慧园区系统”在提升管理效率与安全性方面的创新解决方案。通过引入先进的数字化工具和技术，该系统实现了对园区资产、运营及租赁的全面管理，显著提高了工作效率，降低了安全风险，为企业创造了更高的经济价值和运营保障。

快鲸智慧园区 2024-12-29

碧桂园套现20亿！清仓长鑫存储，

碧桂园近日宣布出售长鑫科技约1.56%股权，总价为20亿人民币，交易完成后将不再持有长鑫科技权益。所得款项将用于一般营运资金，主要计划用于保交楼等项目建设，以缓解流动性压力。碧桂园通过香港交易所发布官方公告，披露其间接非全资合伙企业已与合肥建长股权投资合伙企业（有限合伙）及长鑫科技集团股份有限公司签署了股份转让协议。根据协议条款，买方将收购长鑫科技约1.56%的股权，交易总额达到20亿元人民币。此次交易完成后，碧桂园将彻底退出长鑫科技的股东行列。照此计算，长鑫科技估值约1282亿元。碧桂园方面表示，出售长

芯片失效分析 2024-12-29

引领新势耀目登场深圳龙华清湖腾势中心店盛大开业

2024年12 月 28 日，深圳龙华区迎来了汽车行业的又一大盛事——深圳龙华清湖腾势中心盛大开业，标志着腾势品牌在深圳区域布局的进一步拓展，为满足消费者对腾势汽车消费体验的全新期待，从而开拓创新服务模式，为当地消费者带来了更加便捷、高端的汽车消费体验。 [图片] [图片] 开业盛典现场，气氛热烈非凡。腾势方程豹直营事业部南部战区销售总监罗帅峰先生上台为我们发表致辞。他表示，龙华清湖腾势中心将秉承腾势品牌的高端品质与服务理念，为消费者提供一站式服务涵盖销售、售后、充电设施等全方位，致力于打造成为龙华地

深圳有车 2024-12-29

造梦师手记：中国小哥研发，Stable Diffusion一张图生成视频数字人

推荐体验

相关资讯

造梦师手记：Stable Diffusion让世界了解中国马面裙

造梦师手记：Stable Diffusion胶片级画质模型

造梦师手记：Stable Diffusion人造人18号

造梦师手记：Stable Diffusion最美亚洲人模型，更新了

造梦师手记：Stable Diffusion最美梦幻萝莉

近期资讯

ogg音频转mp3格式，学会这6个教程，一键轻松转换！

可编程中央控制主机的技术创新与未来趋势

成功秘诀：掌握关键要素

门窗网站本地企业网站优化策略

灾难降临地中海：谁干的？！

高中生物考了全班第一的秘密！

陶瓷粉末伺服成型机-电子陶瓷、金属化陶瓷、精细陶瓷

智慧园区系统提升管理效率与安全性的创新解决方案

碧桂园套现20亿！清仓长鑫存储，

引领新势耀目登场深圳龙华清湖腾势中心店盛大开业

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响