2024 年可以称之为数字人元年,数字人也是 AI 摄影的一个大的应用方向,现在各大 IT 大厂已经全面布局数字人了,数字人绝对是今年最大的大风口!
但是,现在网上的在线版数字人,收费版的一个月要300多,价格非常贵;免费的功能限制非常大,只能让嘴巴动一动,完全不能满足我的要求。
今天我给大家带来了一款叫 SadTalker 的数字人生成软件,该软件可以在本地独立运行,而且已经做成了整合包,可以解压一键运行。
一、系统要求
操作系统:windows 10 及以上
内存:16 G
CPU:I5 以上
显卡:NVIDIA 30 或者 40 系以上,显存8G及以上
硬盘:固态硬盘 20G 以上
软件下载地址:链接:
二、SadTalker 驱动图片数字人
一)双击「SadTalker_WEBUI 运行.bat」,按 ctrl 并点击链接进入网页
二)在网页中上传图片和语音文件,点击“生成”按钮
具体参数可以参考下图:
三)生成你的照片数字人
生成的数字人视频在 results 目录下,我们来看看效果如何。点击设立观看视频
三、SadTalker_Video 驱动视频数字人
一)录制你自己的视频
录制的视频最好是半身的,身体和手可以动,嘴不要动,头可以适当的转动和移动,动作不要太大,面部对着镜头,特别注意嘴不要动。
二)用剪映把视频和语音调整为一样长的时间
这里先用剪映生成一个嘴不动的数字人为例,方法就是让数字人读:嗯嗯嗯嗯……
三)分开保存视频文件和音频文件
特别注意:请使用全数字文件名,否则会有一定概率出错。
四)双击「驱动视频生成数字人.exe」,选择「语音驱动视频数字人」页面
按下图选择参数。
五)生成你的视频数字人
生成的数字人视频在 results_bat 目录下,我们来看看效果如何。点击这里观看视频
四、总结
用离线版的 SadTalker 做数字人,对系统要求比较高,做个几十秒还可以。如果要做几分钟的那种,对显卡要求非常高,我这个 4060 8G 版的最多做到一分钟,太长就会显存溢出。如果你对数字人有非常大的需求,建议购买收费版。
1、本站大部分资源均为网络采集所得,仅供用来学习研究,请于下载后的24h内自行删除,正式商用请购买正版。
2、所有汉化类文件和个别标注了“原创”的产品均为本站原创发布,任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。
3、如若本站内容侵犯了原著者的合法权益,请携带相关版权文件联系我们[微信/QQ:9820910]进行下架或删除。
4、虚拟下载类资源具有可复制性,一经下载后本站有权拒绝退款或更换其他商品!
原文链接:https://xdyl.club/?p=1209,转载请注明出处~~~
评论0