口播AI数字人生成软件

【软件版本】V1.7

【软件介绍】

口播数字人生成助手，是一款可以快速生成口播类视频的工具，在配置好相关功能参数的情况下，用户仅需导入相关数据，即可一键挂机批量生成视频。

口播数字人生成助手，整合了音频文件转写功能、文本合成功能（目前已内置IndexTTS和F5TTS两大模型）、音频驱动数字人合成功能（目前内置heygem数字人模型）

【使用要求】

1、电脑系统必须是win10以上的操作系统，并且安装了Microsoft Visual C++ Redistributable 运行库。

2、必须拥有显存至少达到8G的显卡，比如我本地环境4060的8G显卡；显卡和CPU越好生成速度越快。

3、电脑内存建议32G以上，载入各种模型需要使用相关内存资源，比如我的电脑载入模型后，内存消耗16-20G之间。

PS：我们建议您在使用之前，先找个1分钟的音频进行合成测试，看看您的电脑配置合成1分钟的数字人需要多长时间；若时间太长建议升级电脑配置/租用GPU电脑使用，以提升生成效率！

注：本人4060的8G显卡，综合测试下来，生成1分钟的数字人视频，平均在10分钟。

【更新日志】

2025.12.28口播数字人生成助手V1.7更新日志：
1、由于最新的HeyGem模型在生成身穿白色衣服的数字人时，会出现黑色方框；暂时增加旧版本的HeyGem进行过渡平替！
PS：如果你的数字人形象不是身穿白色衣服的，建议使用最新的模型，也就是模型1，生成速度更快，并且支持参数设置！

口播数字人生成助手V1.6更新日志：
1、彻底重构开发口播数字人生成助手，所有代码重写，新架构更容易上手！
2、全新升级 indextts、heygem AI大模型，生成速度更快，质量更佳！
3、移除音频转文字功能，需要用到音频文字转语音的可以下载另外一款软件。

PS：由于此软件完全重写，并且AI模型文件全面升级，因此要重新下载完整包才可以进行使用！

口播数字人生成助手V1.5更新日志：
1、由于业务发展需要，进行商业转型，上线全新用户体系！

2025.6.30口播数字人生成助手V1.4更新日志：

1、修复实际发起音频克隆合成任务成功，但是因为POST超时问题进行二次请求，无法检测到合成状态问题。

2、音频克隆合成新增自定义超时设置，若达到指定的超时时间依然没有生成成功，将会结束生成操作！

口播数字人生成助手V1.2更新日志：
1、修复AI修稿/二创，指令设置无效问题。
2、优化AI修稿指令模板。

口播数字人生成助手V1.1更新日志：
1、移除F5TTS语音克隆模型。
2、优化升级IndexTTS语音克隆模型，简化参数配置，生成速度更快，支持音量和音速调节。
3、修复文本语音克隆生成时，本地不存在文本文件时，软件按钮点击之后出现不可选问题。

PS：由于本次进行了大模型的精简和优化，必须重下完整包；精简后的完整包从21G降低到17.7G

口播数字人生成助手V1.0更新日志：
1、支持对音视频文件进行一键转写文稿。
2、支持对文稿根据设定的音色进行音频合成。
3、支持根据设定的数字人形象，一键快速合成数字人视频。

在所有参数配置好的情况下，可以导入【对标账号音视频】/【视频文案】/【视频音频】三种方式，快速进行数字人生成！

【软件截图】

下载权限

查看

您当前的等级为

登录后免费下载登录小黑屋反思中，不准下载！评论后刷新页面下载评论支付以后下载请先登录您今天的下载次数（次）用完了，请明天再来支付积分以后下载立即支付支付以后下载立即支付您当前的用户组不允许下载升级会员

您已获得下载权限您可以每天下载资源次，今日剩余次

{{userData.name}}已认证