Sleepychord / CogLTX

The source code of NeurIPS 2020 paper "CogLTX: Applying BERT to Long Texts"
MIT License
268 stars 54 forks source link

muti-label classification #15

Open rucieryi369 opened 2 years ago

rucieryi369 commented 2 years ago

在多标签分类的任务中,数据的输入格式是[[CLS] label [SEP] doc],这样不会造成标签的泄露吗?此外新的数据输入的时候,是没有标签的。期待您的回复,谢谢!

Sleepychord commented 2 years ago

不会啊,这个是n个binary classifier,判断一个每个标签有没有。

zjb2016 commented 2 years ago

您好,这个label是multi-hot形式的吗?[[CLS][0 1 0 0 1 0 0 ...] [SEP]] ?