zhiqwang / sightseq

Computer vision tools for fairseq, containing PyTorch implementation of text recognition and object detection
MIT License
125 stars 34 forks source link

能提供新的依赖版本么? #22

Open liuzhuang1024 opened 3 years ago

zhiqwang commented 3 years ago

我近期会更新一下,最近时间有些紧,希望下周能开始做这个。

zhiqwang commented 3 years ago

你好 @lzmisscc ,

我看到 fairseq 目前改用了 https://github.com/facebookresearch/hydra 作为训练框架。在我之前的经验里,fairseq 原来的配置使用起来确实比较繁琐,我现在也认为作为训练,如果配置如此繁琐用起来确实麻烦。

我最近一直在做的一个项目是 yolov5-rt-stack , 这是一个通用目标检测的任务,里面一个设计原则是

object detection should not be more difficult than classification, and should not require complex libraries for training and inference.

sightseq 现在的配置我也一直想修改,接下来很可能的变动就也是按着这个原则来设计。如果按着这个原则,最可能的就是将其与 fairseq 解耦。

所以这里先向你征求一下如果你用 sightseq 这个仓库的话,你的出发点更主要在于哪一点?(或者说,如果我做这个修动,对你的影响大不大)

liuzhuang1024 commented 3 years ago

感谢作者百忙之中的答复!🤡 ''' 1.参考mmdetection提供配置文件,将不必要得参数设置默认值。设置不同部件。 2.提供小型数据库,方便新人快速上手。 3.针对部署提供一些建议。 4.提供不同的数据加载方式,虽然现在的已经很方便了。 6.对一些参数提供必要的解释或者将对模型产生的影响。 7.fairseq在不停地迭代,提供稳定版的仓库,避免参数发生变化需要大范围改动。或者与fairseq解耦。 '''

zhiqwang commented 3 years ago

也谢谢你的反馈呀!

  1. 参考mmdetection提供配置文件,将不必要得参数设置默认值。设置不同部件。

mmdetection 的设计思路我现在感觉也有点复杂哎,按照上面的思想的话,要把目标检测做到和一个分类任务一样的规模也许是可能的,这个我主要是被 https://gitHub.com/facebookresearch/detr 的实现震撼住了,而且 detr 的结构天生就适合做 OCR 任务,所以我大概率要往这个方向改,yolov5-rt-stack 那个 repo 已经体现了其中的思想。

后面的 6 点我是同意的,我往这 6 点更新一下。

zhiqwang commented 3 years ago

@lzmisscc 哈喽哈喽,感觉要放鸽子了 :( 进度比想象的慢一些