当前位置:首页|资讯

3种AI黑科技,让照片中的人物开口说话的简易方法,快进来学!

作者:大象AIGC发布时间:2024-11-04

本文背景

用AI工作这么久了,我经常碰到各种关于AI的问题,比如制作让照片中人物开口说话的数字人。

很多小伙伴想知道是怎么弄的,不知从何下手。不过不用担心,今天就给大家带来三种实用的方法,快来一起试试吧。

首先是腾讯智影

步骤如下:

第一步:制作人物照片

第二步:写文案

第三步:合成视频

网址是https://zenvideo.qq.com/。

打开智影后,点击数字人播报模块。


选择照片播报 - 本地上传,将制作好的照片传上去。


这里推荐用即梦(https://jimeng.jianying.com/)生成的照片,效果挺不错。

接着在 灵想AI 中编辑口播文案,复制到右侧栏,选好声音和语速,需要停顿就插入停顿,然后点击合成视频。


不过要注意,智影在小孩子声音选择方面少得可怜,甚至可以说几乎没有,这就导致配音有时会很出戏,而且整体效果比较一般。

但如果对质量要求不高,只是想让人物开口说话,那也算是个可用的选择。

D - ID

步骤为:

一、先制作人物照片

二、写文案

三、然后在剪映中制作台词音频

四、最后合成视频

制作人物照片步骤这里就省略啦

文案可以用之前准备好的。这一步来到剪映专业版(电脑版)

点击文本 - 新建文本,将文本插入进度条


再插入右侧文本中


点击朗读 - 选择小萝莉音,一定要记得点击「开始朗读」,这样才能真正将音色和文本融合。


试听没问题后,点击导出,去掉视频导出的对勾,选择音频导出(默认 mp3 格式)。


之后来到 D - ID 官网(https://studio.d - id.com/,注意需要突破网络限制哦)

打开主页 Create - 视频


在化身处上传制作好的人物图片


传好后点击脚本 - 音频 - 上传音频,将刚才制作的文本音频文件上传


最后点击生成视频,稍等片刻就大功告成啦。


看看效果,是不是比智影好多了呢?

不过免费版有水印,如果觉得效果好,可以考虑充值。

有些朋友可能会抱怨收费问题,但大家要知道,如今所有免费工具都有商业化的趋势。

资本不是慈善机构嘛。而且从目前众多 AI 工具来看,收费的往往效果会更好一些,当然,是否选择付费就看大家自己的情况啦。

Hedra

如果觉得 D - ID 效果不错但收费让你不爽,那就来试试它吧,目前它在免费公测阶段,中文名叫海德拉

网址是https://www.hedra.com/

无需突破网络限制,直接打开就能用。

制作照片和文案的步骤这里就不多说了,进入后直接选择 Create 开始生成。

步骤和 D - ID 差不多,可以提前做好音频或者使用网站生成的音频。

不过要注意,海德拉不接受未成年人的照片,这可能是出于对未成年人的保护。

在导入音频和照片(这里建议使用成年人照片)后


右下角点击生成


但它也有个小问题,我感觉人物的动作幅度和表情像是按照欧美人的状态设计的,所以如果是中国人的脸,看起来会有点出戏,换张脸可能会更和谐。


总结

让照片开口说话,本质上是一种数字人效果。

目前市面上效果相近的数字人大多是收费的,我还没发现效果好又免费的,如果你们知道,可一定要告诉我。

要是想追求更加立体、真实的效果,飞影、万兴播爆、商汤如影、快剪、剪影的数字人等都可以尝试一下。

经常有粉丝问哪种工具最好用,其实在这个快速发展、竞争激烈的时代,没有绝对的最好,变化太快了,我只能把自己用过觉得不错的工具推荐给大家。

好啦,今天的分享就到这里了,还有不懂的再来私我吧。

我是大象,目前在做AI写作,副业从事新媒体运营,并拥有自己的工作室。借助AI技术趋势,我们可以做自媒体任何行业的赋能

我通过发布多篇实用干货视频教学,我每天深入研究AI的应用,大部分文案和视频都由AI协助完成,使我的工作效率大幅提升,节省了近一半的人力成本。AI的趋势远不止于此,其潜力巨大。

本文来自www.daxiangbiji.com



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1