利用多种AI工具接合进行项目实操

涉及使用工具:

Midjourney(生成个性化人物元素);
GPT200.com (以最低的成本使用Midjourney及ChatGPT4)
ChatGPT(生成适配Midjourney的英文关键词(咒语));
D-ID(使静态图像生成逼真的动态讲解模式);
Pictory (文本导出视频综合使用:包括字幕、人声、背景、视频合成)
腾讯智影:(AI去水印及国产项目解决方案)https://zenvideo.qq.com/
Camtasia(剪辑视频及声音导出)、
剪映(提取字幕及合成)
Elevenlabs (个性化定制声音)。

(综合使用成本9.9+1美元 小于20元)

高级使用(需有较高的IT互联网综合应用能力)

MockingBird- 文字转语音神器!附最新安装使用教程!

MockingBird- 文字转语音神器!附最新安装使用教程!

1.安装Python 选择3.8 或更高版本 【官方链接

2.安装 PyTorch, 直接官网下载 【官方链接】,如果GPU不支持CUDA,请默认选择,没有显卡就选择CPU。

3.安装 ffmpeg 【下载链接】,下载后把bin目录路径path到系统变量里,见视频教程。

4.下载 MockingBird 【开源项目】下载解压后,直接在目录输入CMD 进入终端

5.在本机或服务器终端下安装剩余的必备环境包:

python -m pip install --upgrade pip
pip install -r requirements.txt
pip install webrtcvad-wheels
6.下载语言模型,或使用自己训练好的模型
作者 下载链接 效果预览 信息
作者 https://pan.baidu.com/s/1iONvRxmkI-t1nHqxKytY3g 百度盘链接 4j5d 75k steps 用3个开源数据集混合训练
作者 https://pan.baidu.com/s/1fMh9IlgKJlL2PIiRTYDUvw 百度盘链接 提取码:om7f 25k steps 用3个开源数据集混合训练, 切换到tag v0.0.1使用
@FawenYo https://drive.google.com/file/d/1H-YGOUHpmqKxJ9FRc6vAjPuqQki24UbC/view?usp=sharing 百度盘链接 提取码:1024 input output 200k steps 台湾口音需切换到tag v0.0.1使用
@miven https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021 150k steps 注意:根据issue修复 并切换到tag v0.0.1使用

 

7.下载模型后,确保 xxx.pt 格式的文件放在 synthesizer\saved_models文件夹下,saved_models 如不存在请新建

8.最后执行运行命令,就可以启动程序了!

启动Web程序(v2)

python web.py
运行成功后在浏览器打开地址, 默认为 http://localhost:8080

训练数据集下载【点击

GUI启动命令:

启动工具箱:

python demo_toolbox.py -vc -d <datasets_root>
假如数据集路径为 C:\data\aidatatang_200zh,那么 <datasets_root>就是 C:\data

程序界面功能说明:

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源