harry0703 / MoneyPrinterTurbo

利用AI大模型,一键生成高清短视频 Generate short videos with one click using AI LLM.
MIT License
18.37k stars 2.83k forks source link
ai automation chatgpt moviepy python shortvideo tiktok

MoneyPrinterTurbo 💸

Stargazers Issues Forks License


简体中文 | English

harry0703%2FMoneyPrinterTurbo | Trendshift

只需提供一个视频 主题关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。

Web界面

![](docs/webui.jpg)

API界面

![](docs/api.jpg)

特别感谢 🙏

由于该项目的 部署使用,对于一些小白用户来说,还是 有一定的门槛,在此特别感谢 录咖(AI智能 多媒体服务平台) 网站基于该项目,提供的免费AI视频生成器服务,可以不用部署,直接在线使用,非常方便。

感谢赞助 🙏

感谢佐糖 https://picwish.cn 对该项目的支持和赞助,使得该项目能够持续的更新和维护。

佐糖专注于图像处理领域,提供丰富的图像处理工具,将复杂操作极致简化,真正实现让图像处理更简单。

picwish.jpg

功能特性 🎯

后期计划 📅

交流讨论 💬

视频演示 📺

竖屏 9:16

▶️ 《如何增加生活的乐趣》 ▶️ 《金钱的作用》
更真实的合成声音
▶️ 《生命的意义是什么》

横屏 16:9

▶️《生命的意义是什么》 ▶️《为什么要运动》

配置要求 📦

快速开始 🚀

下载一键启动包,解压直接使用(路径不要有 中文特殊字符空格

Windows

下载后,建议先双击执行 update.bat 更新到最新代码,然后双击 start.bat 启动

启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)

其他系统

还没有制作一键启动包,看下面的 安装部署 部分,建议使用 docker 部署,更加方便。

安装部署 📥

前提条件

① 克隆代码

git clone https://github.com/harry0703/MoneyPrinterTurbo.git

② 修改配置文件

Docker部署 🐳

① 启动Docker

如果未安装 Docker,请先安装 https://www.docker.com/products/docker-desktop/

如果是Windows系统,请参考微软的文档:

  1. https://learn.microsoft.com/zh-cn/windows/wsl/install
  2. https://learn.microsoft.com/zh-cn/windows/wsl/tutorials/wsl-containers
cd MoneyPrinterTurbo
docker-compose up

注意:最新版的docker安装时会自动以插件的形式安装docker compose,启动命令调整为docker compose up

② 访问Web界面

打开浏览器,访问 http://0.0.0.0:8501

③ 访问API文档

打开浏览器,访问 http://0.0.0.0:8080/docs 或者 http://0.0.0.0:8080/redoc

手动部署 📦

视频教程

① 创建虚拟环境

建议使用 conda 创建 python 虚拟环境

git clone https://github.com/harry0703/MoneyPrinterTurbo.git
cd MoneyPrinterTurbo
conda create -n MoneyPrinterTurbo python=3.10
conda activate MoneyPrinterTurbo
pip install -r requirements.txt

② 安装好 ImageMagick

③ 启动Web界面 🌐

注意需要到 MoneyPrinterTurbo 项目 根目录 下执行以下命令

Windows
conda activate MoneyPrinterTurbo
webui.bat
MacOS or Linux
conda activate MoneyPrinterTurbo
sh webui.sh

启动后,会自动打开浏览器(如果打开是空白,建议换成 Chrome 或者 Edge 打开)

④ 启动API服务 🚀

python main.py

启动后,可以查看 API文档 http://127.0.0.1:8080/docs 或者 http://127.0.0.1:8080/redoc 直接在线调试接口,快速体验。

语音合成 🗣

所有支持的声音列表,可以查看:声音列表

2024-04-16 v1.1.2 新增了9种Azure的语音合成声音,需要配置API KEY,该声音合成的更加真实。

字幕生成 📜

当前支持2种字幕生成方式:

可以修改 config.toml 配置文件中的 subtitle_provider 进行切换

建议使用 edge 模式,如果生成的字幕质量不好,再切换到 whisper 模式

注意:

  1. whisper 模式下需要到 HuggingFace 下载一个模型文件,大约 3GB 左右,请确保网络通畅
  2. 如果留空,表示不生成字幕。

由于国内无法访问 HuggingFace,可以使用以下方法下载 whisper-large-v3 的模型文件

下载地址:

模型下载后解压,整个目录放到 .\MoneyPrinterTurbo\models 里面, 最终的文件路径应该是这样: .\MoneyPrinterTurbo\models\whisper-large-v3

MoneyPrinterTurbo  
  ├─models
  │   └─whisper-large-v3
  │          config.json
  │          model.bin
  │          preprocessor_config.json
  │          tokenizer.json
  │          vocabulary.json

背景音乐 🎵

用于视频的背景音乐,位于项目的 resource/songs 目录下。

当前项目里面放了一些默认的音乐,来自于 YouTube 视频,如有侵权,请删除。

字幕字体 🅰

用于视频字幕的渲染,位于项目的 resource/fonts 目录下,你也可以放进去自己的字体。

常见问题 🤔

❓如何使用免费的OpenAI GPT-3.5模型?

OpenAI宣布ChatGPT里面3.5已经免费了,有开发者将其封装成了API,可以直接调用

确保你安装和启动了docker服务,执行以下命令启动docker服务

docker run -p 3040:3040 missuo/freegpt35

启动成功后,修改 config.toml 中的配置

注意:该方式稳定性较差

❓AttributeError: 'str' object has no attribute 'choices'`

这个问题是由于大模型没有返回正确的回复导致的。

大概率是网络原因, 使用 VPN,或者设置 openai_base_url 为你的代理 ,应该就可以解决了。

同时建议使用 MoonshotDeepSeek 作为大模型提供商,这两个服务商在国内访问速度更快,更加稳定。

❓RuntimeError: No ffmpeg exe could be found

通常情况下,ffmpeg 会被自动下载,并且会被自动检测到。 但是如果你的环境有问题,无法自动下载,可能会遇到如下错误:

RuntimeError: No ffmpeg exe could be found.
Install ffmpeg on your system, or set the IMAGEIO_FFMPEG_EXE environment variable.

此时你可以从 https://www.gyan.dev/ffmpeg/builds/ 下载ffmpeg,解压后,设置 ffmpeg_path 为你的实际安装路径即可。

[app]
# 请根据你的实际路径设置,注意 Windows 路径分隔符为 \\
ffmpeg_path = "C:\\Users\\harry\\Downloads\\ffmpeg.exe"

❓ImageMagick的安全策略阻止了与临时文件@/tmp/tmpur5hyyto.txt相关的操作

可以在ImageMagick的配置文件policy.xml中找到这些策略。 这个文件通常位于 /etc/ImageMagick-X/ 或 ImageMagick 安装目录的类似位置。 修改包含pattern="@"的条目,将rights="none"更改为rights="read|write"以允许对文件的读写操作。

❓OSError: [Errno 24] Too many open files

这个问题是由于系统打开文件数限制导致的,可以通过修改系统的文件打开数限制来解决。

查看当前限制

ulimit -n

如果过低,可以调高一些,比如

ulimit -n 10240

❓Whisper 模型下载失败,出现如下错误

LocalEntryNotfoundEror: Cannot find an appropriate cached snapshotfolderfor the specified revision on the local disk and outgoing trafic has been disabled. To enablerepo look-ups and downloads online, pass 'local files only=False' as input.

或者

An error occured while synchronizing the model Systran/faster-whisper-large-v3 from the Hugging Face Hub: An error happened while trying to locate the files on the Hub and we cannot find the appropriate snapshot folder for the specified revision on the local disk. Please check your internet connection and try again. Trying to load the model directly from the local cache, if it exists.

解决方法:点击查看如何从网盘手动下载模型

反馈建议 📢

参考项目 📚

该项目基于 https://github.com/FujiwaraChoki/MoneyPrinter 重构而来,做了大量的优化,增加了更多的功能。 感谢原作者的开源精神。

许可证 📝

点击查看 LICENSE 文件

Star History

Star History Chart