Open hitlxm opened 1 month ago
Thanks for your attention! We will update the paper on arXiv before Nov. 2024 —and possibly the same for the tutorial code.
Thanks for your attention! We will update the paper on arXiv before Nov. 2024 —and possibly the same for the tutorial code.
另外,现在并不支持c+s -> p,你们有any plan吗?
我们目前的settings是与CGL和posterlayout对齐,但我们的方法本质上兼容c->s+p, c+s->p甚至none->c+s+p,这只需要针对你的需求对输入数据做不同的mask,我们默认是mask掉输入中的size和position(作为输出),保留category(作为输入)。按需求修改data/qbposter/get_prompt.py中的procss_json函数即可。
我们目前的settings是与CGL和posterlayout对齐,但我们的方法本质上兼容c->s+p, c+s->p甚至none->c+s+p,这只需要针对你的需求对输入数据做不同的mask,我们默认是mask掉输入中的size和position(作为输出),保留category(作为输入)。按需求修改data/qbposter/get_prompt.py中的procss_json函数即可。
所以prompt是这样吗?
"value": "
模版里面是[left, top, right, bottom], 换成[left, top, width, height],之后,输出结果就看着比较奇怪,貌似输出结果还是[left, top, right, bottom]这种模式? [left, top, right, bottom] + c -> s +p 模式
[left, top, width, height] + c + s-> p 模式
prompt:
"value": "
如上