SadTalker

西安交通大学开源了人工智能SadTaker模型，通过从音频中学习生成3D运动系数，使用全新的3D面部渲染器来生成头部运动，可以实现图片+音频就能生成高质量的视频。内含多个踩坑的解决办法，值得玩一玩。

功能

可以根据一张图片、一段音频，合成面部说这段语音的视频。图片需要真人或者接近真人。目前项目已经支持stable diffusion webui,可以SD出图后，结合一段音频合成面部说话的视频（抖音常见的数字人）

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple

本文链接：https://www.xn19.com/thread-9000.htm
友情提示：

1、本网站名称：M992-娱跃网
2、本站下载不收任何会员费用。
3、欢迎有能力的朋友共享稀缺资源。
4、专注于互联网分享精神，专注收藏与分享。下载提示：回复帖子后，刷新页面就看到下载地址。
5、本站资源大多为网盘资源，如发现链接失效，可以点：留言或网站底部留言本进行反馈，我们会第一时间更新。

最新回复 (0)

暂无回复，快来抢沙发吧

昵称： M992.com

所属：

UID:2

创建时间：

最后登录：

主题数
166

帖子数
105

注册ID
2