原始数据如何处理

taishan1994 / BERT-BILSTM-CRF

使用BERT-BILSTM-CRF进行中文命名实体识别。

312 stars 38 forks source link

Open zsc482429124 opened 10 months ago

zsc482429124 commented 10 months ago

原始数据如何处理成这样"spo_list": [{"h": {"name": "空调", "pos": [5, 7]}, "t": {"name": "制冷效果差", "pos": [7, 12]}, "relation": "部件故障"}]}

taishan1994 commented 10 months ago

应该不需要这种数据格式，看最终格式就行。

wongshg commented 10 months ago

我也同问，我只有标注好的每行一个字的BIO格式数据。不使用提供的process.py，用自己写的脚本转换成ner_data里要求的格式，但是运行main.py还是报错。

taishan1994 commented 9 months ago

我也同问，我只有标注好的每行一个字的BIO格式数据。不使用提供的process.py，用自己写的脚本转换成ner_data里要求的格式，但是运行main.py还是报错。

报什么错

lzy1107 commented 9 months ago

我也同问，我只有标注好的每行一个字的BIO格式数据。不使用提供的process.py，用自己写的脚本转换成ner_data里要求的格式，但是运行main.py还是报错。

请问现在报错解决了嘛我也是同样的BIO数据格式5555

Tangerineyy commented 2 months ago

我也同问，我只有标注好的每行一个字的BIO格式数据。不使用提供的process.py，用自己写的脚本转换成ner_data里要求的格式，但是运行main.py还是报错。

报什么错

屏幕截图 2024-08-06 142837

就是还是需要json文件

taishan1994 commented 2 months ago

确保每一行都是一个可以被json.loads的对象；文件末尾不要有一个空的换行。