照片也能说话了？嘴型表情全同步，AI数字人时代要来了-摩杜云开发者社区

照片也能说话了？嘴型表情全同步，AI数字人时代要来了

kRDTkRuFKVZ0 2024年03月09日 34 0

AI综合

SadTalker是一款先进的人工智能模型，它通过从音频中学习生成3D运动系数，并使用全新的三维面部渲染器来生成头部运动，只需传入一张照片和一段音频，就能生成高质量的AI数字人视频

工作原理

1、显式地对音频和不同类型的运动系数之间的联系进行单独建模

2、通过蒸馏系数和3D渲染的脸部，从音频中学习准确的面部表情

3、通过条件VAE设计PoseVAE来合成不同风格的头部运动

4、使用生成的三维运动系数映射到人脸渲染的无监督三维关键点空间，合成最终视频

SadTalker生成后的人物头部运动规律，面部表情自然，口型也和音频的内容保持一致（小姐姐还会眨眼睛！）

最新中文版：

百度网盘：https://pan.baidu.com/s/1AMInL9l_LxfQ0g3j1TrWQA?pwd=8r4f

使用方法

1、上传人物图片和音频（音频可以是英文、中文、歌曲）

2、设置参数（下面会详细介绍）

3、点击“生成”按钮

参数说明

· 姿式风格：调节头部运动风格，默认0

· 表达量表：人物表情丰富程度，默认1

· 生成中的批量大小：生成视频的速度，默认1，显卡好可以适当拉大

· 预处理

crop：从图片中截取头部做视频

resize：拉伸图片，人物被压缩选择此项

full：全身照做视频

extcrop：加强版crop，主要聚焦头部

extfull：加强版全身

· 面部渲染：两种模式可自由尝试

· GFPGAN：让面部高清化

在控制台可以查看当前的处理进度，程序执行完毕会输出信息The generated video is named

生成的视频保存在SadTalker\results路径下，也可以在网页端下载

在操作界面下方的Examples中提供了部分图片和音频，请点击“图片源”选择使用

注意事项

①项目安装路径不要包含中文

②推荐使用GTX1060以上显存运行此项目

③使用过程中若不慎关闭软件后台，请重新打开，并刷新网页

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： ChatGPT 消息发不出去了？我找到解决方案了下一篇：无模型的强化学习方法

分享：

最后一次编辑于 2024年03月09日 0

暂无评论

推荐阅读

[每日AI·0430]首个自主更新的多模态大模型，马斯克访华，文本一键转3D数字人骨骼动画，创新的虚拟试衣模型

CCMY6VB0yzoR 10天前 28 0 0 AI综合

使用LinkAI创建AI智能体，并快速接入到微信/企微/公众号/钉钉/飞书..

8W4LzCsLSnEK 11天前 21 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记16_音乐图灵测试

BD8Mqa3Ktdyv 10天前 22 0 0 AI综合

最好用的AI换脸软件，rope下载介绍（支持cpu）

kRDTkRuFKVZ0 11天前 26 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记15_声响的数学之旅

BD8Mqa3Ktdyv 11天前 19 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记21_语言游戏

BD8Mqa3Ktdyv 5天前 15 0 0 AI综合

Ryght 在 Hugging Face 专家助力下赋能医疗保健和生命科学之旅

QKcLjRV1cZqV 5天前 20 0 0 AI综合

一键接入大模型：One-Api本地安装配置实操

2NpId4nxxBM0 5天前 21 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记20_数学图灵测试

BD8Mqa3Ktdyv 5天前 18 0 0 AI综合

深度学习框架火焰图pprof和CUDA Nsys配置指南

1XHMWPmbm7U6 5天前 11 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记18_心流机

BD8Mqa3Ktdyv 8天前 21 0 0 AI综合

制作语义分割数据集(VOC格式)

BYaHC1OPAeY4 5天前 19 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记19_深度数学

BD8Mqa3Ktdyv 5天前 19 0 0 AI综合

国内免费的AI工具出色地帮我辅导女儿的小学英语作业

CCMY6VB0yzoR 9天前 18 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记17_歌曲的创作公式

BD8Mqa3Ktdyv 9天前 19 0 0 AI综合

在英特尔至强 CPU 上使用 Optimum Intel 实现超快 SetFit 推理

QKcLjRV1cZqV 5天前 19 0 0 AI综合

[每日AI·0506]巴菲特谈 AI，李飞飞创业，苹果或将推出 AI 功能，ChatGPT 版搜索引擎

CCMY6VB0yzoR 5天前 19 0 0 AI综合

视觉语言模型详解

QKcLjRV1cZqV 13天前 20 0 0 AI综合

开源电子邮件营销平台 listmonk 使用教程

166Ve614hKdJ 5天前 18 0 0 AI综合

AI实战 | 手把手带你打造智能待办助手

sSh3rBaiME5f 5天前 19 0 0 AI综合

kRDTkRuFKVZ0

作者其他文章更多

最好用的AI换脸软件，rope下载介绍（支持cpu）

2024-05-02

最强AI直播换脸软件，DeepFaceLive下载介绍

2024-04-27

最简单的AI换脸软件，roop下载介绍（可直播）

2024-04-25

AI极速批量换脸！Roop-unleashed下载介绍，可直播

2024-04-20

最全能的AI换脸软件，FaceFusion下载介绍（可直播）

2024-04-13

P图神器Lama下载介绍，一键移除图片中任何不想要的元素

2024-03-30

动态水印也能去除？ProPainter一键视频抠图整合包下载

2024-03-23

人人都是艺术家！AI工具Doodly让潦草手绘变精美画作

2024-03-16

照片也能说话了？嘴型表情全同步，AI数字人时代要来了

2024-03-09

ChatGPT要慌了？谷歌推出最新AI大模型Gemma（可本地部署）

2024-03-03

最新推荐更多

聊聊大模型的屏蔽词工程

2024-04-16

深度学习基本概念简介

2024-04-16

读天才与算法：人脑与AI的数学思维笔记01_洛夫莱斯测试

2024-04-16

RAG算法优化+新增代码仓库支持，CodeGeeX的@repo功能效果提升

2024-04-16

机器学习基本概念简介

2024-04-15

GPT连问工具随想

2024-04-15

读所罗门的密码笔记20_更好的自己

2024-04-15

Pytorch DistributedDataParallel（DDP）教程一：快速入门理论篇

2024-04-15

Pytorch DistributedDataParallel（DDP）教程二：快速入门实践篇

2024-04-15

向量数据库之Lancedb学习记录

2024-04-15

读所罗门的密码笔记19_治理模式

2024-04-14

解密prompt系列27. LLM对齐经验之如何降低通用能力损失

2024-04-13

读所罗门的密码笔记18_大宪章

2024-04-13

向量数据库Chroma学习记录

2024-04-13

最全能的AI换脸软件，FaceFusion下载介绍（可直播）

2024-04-13

“大模型驱动的软件研发” 华为云助推企业研发智能化升级

2024-04-12

读所罗门的密码笔记17_网络安全

2024-04-12

基于香橙派AIpro将开源框架模型转换为昇腾模型

2024-04-12

元启发式算法库 MEALPY 初体验-遗传算法为例

2024-04-11

读所罗门的密码笔记16_直通心智

2024-04-11