【软件版本】V1.4
【软件介绍】
口播数字人生成助手,是一款可以快速生成口播类视频的工具,在配置好相关功能参数的情况下,用户仅需导入相关数据,即可一键挂机批量生成视频。
口播数字人生成助手,整合了音频文件转写功能、文本合成功能(目前已内置IndexTTS和F5TTS两大模型)、音频驱动数字人合成功能(目前内置heygem数字人模型)
【使用要求】
1、电脑系统必须是win10以上的操作系统,并且安装了Microsoft Visual C++ Redistributable 运行库。
2、必须拥有显存至少达到8G的显卡,比如我本地环境4060的8G显卡;显卡和CPU越好生成速度越快。
3、电脑内存建议32G以上,载入各种模型需要使用相关内存资源,比如我的电脑载入模型后,内存消耗16-20G之间。
PS:我们建议您在使用之前,先找个1分钟的音频进行合成测试,看看您的电脑配置合成1分钟的数字人需要多长时间;若时间太长建议升级电脑配置/租用GPU电脑使用,以提升生成效率!
注:本人4060的8G显卡,综合测试下来,生成1分钟的数字人视频,平均在10分钟。
【更新日志】
2025.6.30口播数字人生成助手V1.4更新日志:
1、修复实际发起音频克隆合成任务成功,但是因为POST超时问题进行二次请求,无法检测到合成状态问题。
2、音频克隆合成新增自定义超时设置,若达到指定的超时时间依然没有生成成功,将会结束生成操作!
1、修复IndexTTS语音克隆合成,在某些情况下音频已经合成成功,软件并没有获取到状态信息问题!
口播数字人生成助手V1.2更新日志:
1、修复AI修稿/二创,指令设置无效问题。
2、优化AI修稿指令模板。
口播数字人生成助手V1.1更新日志:
1、移除F5TTS语音克隆模型。
2、优化升级IndexTTS语音克隆模型,简化参数配置,生成速度更快,支持音量和音速调节。
3、修复文本语音克隆生成时,本地不存在文本文件时,软件按钮点击之后出现不可选问题。
PS:由于本次进行了大模型的精简和优化,必须重下完整包;精简后的完整包从21G降低到17.7G
口播数字人生成助手V1.0更新日志:
1、支持对音视频文件进行一键转写文稿。
2、支持对文稿根据设定的音色进行音频合成。
3、支持根据设定的数字人形象,一键快速合成数字人视频。
在所有参数配置好的情况下,可以导入【对标账号音视频】/【视频文案】/【视频音频】三种方式,快速进行数字人生成!
【软件截图】

