taishan1994 / BERT_MRC_NER_chinese

基于bert_mrc的中文命名实体识别
43 stars 4 forks source link

span的问题 #2

Open duguiming111 opened 2 years ago

duguiming111 commented 2 years ago

你好,这里span的值都为1 span_pred_lst = [[[1] len(start_pred_lst[0])] len(start_pred_lst[0])] len(start_pred_lst) span_gold_lst = [[[1] len(start_gold_lst[0])] len(start_gold_lst[0])] len(start_gold_lst)

后续在判断的时候 if span_labels[tmp_start][tmp_end] >= threshold: 这里不是都为True 这个就是成了找最小的end,没啥意义了

taishan1994 commented 2 years ago

你好,这里span的值都为1 span_pred_lst = [[[1] len(start_pred_lst[0])] len(start_pred_lst[0])] len(start_pred_lst) span_gold_lst = [[[1] len(start_gold_lst[0])] len(start_gold_lst[0])] len(start_gold_lst)

后续在判断的时候 if span_labels[tmp_start][tmp_end] >= threshold: 这里不是都为True 这个就是成了找最小的end,没啥意义了

https://github.com/JavaStudenttwo/BERT_MRC 它里面就是这样的。我感觉吧,因为我们预先已经知道了当前需要抽取的实体类型,所以就不存在多种实体之间的嵌套,所以只需要找最小的end就可以了。