kuangdd2024 / auto-video-generateor

自动视频生成器,给定主题,自动生成解说视频。用户输入主题文字,系统调用大语言模型生成故事或解说的文字,然后进一步调用语音合成接口生成解说的语音,调用文生图接口生成契合文字内容的配图,最后融合语音和配图生成解说视频。
MIT License
417 stars 71 forks source link

auto-video-generateor

自动视频生成器,给定主题,自动生成解说视频。用户输入主题文字,系统调用大语言模型生成故事或解说的文字,然后进一步调用语音合成接口生成解说的语音,调用文生图接口生成契合文字内容的配图,最后融合语音和配图生成解说视频。

🌈️⭐️

❤️️🌈喜欢的话,不妨“点石成金”点 Star ⭐️,你的点⭐️是我的动力,感谢🎉🌟!

视频样例先睹为快

免费并校对:人的本性是天生的吗 免费并校对:归去来兮辞
免费并校对:空白效应 免费并校对:棘轮效应

体验Demo

v4. 免费+校对生成

先自动批量合成视频所需素材,然后校对用以合成视频的文本、语音、图像资源,可以修改或重新生成,直到满意。

free_checking.jpg

使用简要指引

avg_generating.png

avg_loading.png

avg_checking.png

免费的自动视频生成

全部用免费的资源实现,体现完整流程和初步效果。

相关文档

千帆ModelBuilder 部分ERNIE系列模型免费开放公告 - 千帆大模型平台 | 百度智能云文档 (baidu.com)

ERNIE-Speed-128K - 千帆大模型平台 | 百度智能云文档 (baidu.com)

如何用GPT直接生成AI绘画? - 知乎 (zhihu.com)

2.8k star! 用开源免费的edge-tts平替科大讯飞的语音合成服务 - 知乎 (zhihu.com)

基于千帆的自动视频生成

基于百度的千帆大模型生成故事和图像,然后进一步生成视频。

相关文档

API列表 - 千帆大模型平台 | 百度智能云文档 (baidu.com)

Python SDK快速入门 - 千帆大模型平台 | 百度智能云文档 (baidu.com)

Stable-Diffusion-XL - 千帆大模型平台 | 百度智能云文档 (baidu.com)

ERNIE-4.0-8K - 千帆大模型平台 | 百度智能云文档 (baidu.com)

极简的自动视频生成

实现这个系统需要多个步骤,包括生成故事文本、分句、语音合成、文生图、生成视频、以及使用Gradio进行交互。

资源校对交互页面

校对用以合成视频的文本、语音、图像资源,可以修改或重新生成,直到满意。

使用方法

执行代码

# 参数可选:1 2 3 4
python main.py 4

打开浏览器

http://127.0.0.1:8000/

交互操作

用户在gradio界面输入主题文字,生成并编辑故事文本,然后生成语音、图片资源,最终合成视频。

注意事项

  1. 生成视频后会把生成的文本、语音、图片的多媒体材料保存到目录中(默认:mnt/materials/username/code_name)。

  2. 保存多媒体材料的目录结构样例如下:

code_name
│  metadata.json
│  story.txt
│  video.mp4
│
├─audio
│      audio_100.mp3
│      audio_101.mp3
│      audio_102.mp3
│      audio_103.mp3
│      audio_104.mp3
│      audio_105.mp3
│      audio_106.mp3
│      audio_107.mp3
│
├─image
│      image_100.png
│      image_101.png
│      image_102.png
│      image_103.png
│      image_104.png
│      image_105.png
│      image_106.png
│      image_107.png
│
├─resource
│      resource_100.json
│      resource_101.json
│      resource_102.json
│      resource_103.json
│      resource_104.json
│      resource_105.json
│      resource_106.json
│      resource_107.json
│
└─text
        text_100.txt
        text_101.txt
        text_102.txt
        text_103.txt
        text_104.txt
        text_105.txt
        text_106.txt
        text_107.txt

todo list