Open csh589 opened 4 years ago
作者大大好~首先感谢下这个优秀的项目。但是读文档的时候我有一个疑问,分类现在的做法是把视频用cutter分成不同阶段,再用不同阶段作为一个类别去训练分类器。同时,cutter的切分方法我也很粗略地读了一下,感觉像是提取图像特征然后用无监督的方法来先聚类。 有一个不成熟的想法是,如果是把视频帧分为stable和unstable两类去训练分类器的话,足量的训练是不是能让用户不需要重新训练自己的模型,而是一个模型到处通用。举例来讲,假设这个分类器足够精确,我们能够把任意一个视频分成stable和unstable的部分,然后用户根据自己的需求去组合不同的阶段。这样会避免cutter里需要指定block数的部分,同时,用户也不需要重新训练模型,可以避免用户的欠拟合等问题。 不知道之前进行项目的时候有没有思考过相关问题呢?希望多多指正
你好,谢谢肯定:
我对这种方式是比较感兴趣的,但没有找到合适的方法。我之前想过的方法是将前后几帧作为一个整体来训练分类器,不过一个是没有时间去验证,另一个是客观来说我对模型的理解有限,不确定这是否是一个合适的方向。
如果有兴趣欢迎共建 :)
作者大大好~首先感谢下这个优秀的项目。但是读文档的时候我有一个疑问,分类现在的做法是把视频用cutter分成不同阶段,再用不同阶段作为一个类别去训练分类器。同时,cutter的切分方法我也很粗略地读了一下,感觉像是提取图像特征然后用无监督的方法来先聚类。 有一个不成熟的想法是,如果是把视频帧分为stable和unstable两类去训练分类器的话,足量的训练是不是能让用户不需要重新训练自己的模型,而是一个模型到处通用。举例来讲,假设这个分类器足够精确,我们能够把任意一个视频分成stable和unstable的部分,然后用户根据自己的需求去组合不同的阶段。这样会避免cutter里需要指定block数的部分,同时,用户也不需要重新训练模型,可以避免用户的欠拟合等问题。 不知道之前进行项目的时候有没有思考过相关问题呢?希望多多指正