CWSPipe在处理全角数字的时候有bug

Describe the bug 原数据是这样的：截流进入最后冲刺（附图片１张）天然气产量达到２０１亿立方米。处理后的id转换为汉字是这样的： ['截', '流', '进', '入', '最', '后', '冲', '刺', '（', '附', '图', '片', '<NUM>', '>', '张', '）'] ['天', '然', '气', '产', '量', '达', '到', '<NUM>', '>', '亿', '立', '方', '米', '。'] To Reproduce

dataset_name = 'msra'
loader = CWSLoader(dataset_name=dataset_name)
data_bundle = loader.load()

data_bundle = CWSPipe().process(data_bundle)
print(data_bundle)
vocab = data_bundle.get_vocab('chars')
target_vocab = data_bundle.get_vocab('target')
data_bundle.rename_field('chars', 'words')
for i, data in enumerate(data_bundle.get_dataset('test')):
    print(data.fields.get('raw_words'))
    print(list(vocab.idx2word.get(i) for i in data.fields.get('words')))
    if i > 500:
        break

这是msra数据集的，其他数据集应该也会有这个问题

fastnlp / fastNLP

CWSPipe在处理全角数字的时候有bug #324