Kamino666 / Video-Captioning-Transformer

这是一个基于Pytorch平台、Transformer框架实现的视频描述生成 (Video Captioning) 深度学习模型。 视频描述生成任务指的是:输入一个视频,输出一句描述整个视频内容的文字(前提是视频较短且可以用一句话来描述)。本repo主要目的是帮助视力障碍者欣赏网络视频、感知周围环境,促进“无障碍视频”的发展。
Apache License 2.0
79 stars 18 forks source link

作者:已经重构的代码正式发布了! #11

Open Kamino666 opened 2 years ago

Kamino666 commented 2 years ago

希望大家能够更顺利的复现了QWQ 最近空闲时间比较多,也能更好维护这个repo啦