作者：已经重构的代码正式发布了！

Kamino666 / Video-Captioning-Transformer

这是一个基于Pytorch平台、Transformer框架实现的视频描述生成 (Video Captioning) 深度学习模型。视频描述生成任务指的是：输入一个视频，输出一句描述整个视频内容的文字（前提是视频较短且可以用一句话来描述）。本repo主要目的是帮助视力障碍者欣赏网络视频、感知周围环境，促进“无障碍视频”的发展。

Apache License 2.0

79 stars 18 forks source link

作者：已经重构的代码正式发布了！ #11

Open Kamino666 opened 2 years ago

Kamino666 commented 2 years ago

希望大家能够更顺利的复现了QWQ 最近空闲时间比较多，也能更好维护这个repo啦