搜索

分享

QQ空间 QQ好友新浪微博微信

AI一键让照片说话，无限且免费！

mbqymbqy 2023-07-03 发布于广西

展开全文

安装SadTalker

这款AI一键让照片说话的模型叫SadTalker，是由西安交通大学的研究人员提出的，它可以让照片里的人物跟随音频的输入动起来，且头部运动、面部表情比较真实，下图是官方展示的效果图，还在等什么呢，即刻拥有它！

①建议先部署SD（stable-diffusion-webui），可以参考以下文章：

AI杀疯了 | 从0开始学AI绘画

因为SD已经支持了SadTalker的插件了，后续从SD生成的图片，都可以直接一键生成说话、唱歌视频。

（当然了，你也可以不部署SD，直接使用SadTalker）

②安装SadTalker插件：

打开并运行SD webui，然后选择“扩展”，在“从网址安装”里，输入以下地址：

https://github.com/OpenTalker/SadTalker

点击安装，需要等待3~5分钟。

安装完成后，重启一下SD webui，即可在功能栏里看到“SadTalker”插件栏了。

安装FFmpeg

FFmpeg是一套可以用来记录、转换数字音频、视频，并能将其转化为流的开源计算机程序，是SadTalker运行的必要支持程序。可以从以下网址下载获得：

https://www.v/ffmpeg/builds/ffmpeg-git-full.7z

解压后，需要将FFmpeg的bin文件夹路径添加到系统环境变量里：

手动添加环境变量：控制面板→系统→高级系统设置→环境变量→Path→编辑→添加

下载模型

运行SadTalker，还需要下载一些模型，可以从以下链接获得：

https://github.com/OpenTalker/SadTalker/releases

需要下载前面的10个文件：

找到之前在SD里添加的SadTalker插件（在SD文件夹\extensions里），然后新建一个文件夹“checkpoints”：

将上面下载的10个模型文件复制进去，其中BFM_Fitting和hub两个压缩文件还需要解压到checkpoints文件根目录中。

至此，你已经拥有了一键让图片说话的能力了。

试试效果

在SD webui的功能栏里，选择“SadTalker”，然后将图片（支持从SD中加载）和音频传入，音频建议在10秒以内，不然显卡压力有点大。点击“生成”按钮，即可一键使照片说话。

相关设置项说明：

corp：图片被裁剪为方形（运算速度快，但如果传入的图片不是方形，最终视频会变形）
resize：重新调整尺寸，可以使脖子和头部衔接自然，但代价是口型可能不太准
full：完整体验（基本就是选它了）

同时记得勾选“面部增强”，使整体面部效果更加自然些。

最终得到了文章开头的会说话、唱歌的小姐姐了，她还会很自然地眨眼睛呢，成就感满满有木有！感兴趣的小伙伴快去试试吧~

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： mbqymbqy > 《媒体》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

mbqymbqy

关注对话

TA的最新馆藏

轻松学歌赋《用药传心赋》第20讲沙参（一）
内容很变态，但能让你开车变很牛！
猪皮冻，切记不要加水熬！大厨教你一招，透亮Q弹无腥味！
轻松学歌赋《用药传心赋》第19讲元参（四）
轻松学歌赋《用药传心赋》第19讲元参（三）
轻松学歌赋《用药传心赋》第19讲元参（二）

喜欢该文的人也喜欢更多

热门阅读换一换