troublemaker-r / Chinese_Coreference_Resolution

基于SpanBert的中文指代消解,pytorch实现
95 stars 20 forks source link
chinese-coreference-resolution natural-language-processing python pytorch spanbert

SpanBERT for Chinese Coreference Resolution (Pytorch)

:ledger: 1. 代码架构:

│ conll.py
│ coreference.py
│ demo.py
│ metrics.py
│ utils.py
│ experiments.conf
│ requirements.txt
│
├─bert
│ │ modeling.py
│ │ optimization.py
│ │ tokenization.py
│ 
├─conll-2012
│ └─scorer
│ ├─reference-coreference-scorers
│ └─v8.01
├─data
│ ├─dev 
│ ├─test 
│ └─train
│ 
└─pretrain_model
 │ bert_config.json
 │ pytorch_model.bin 
 │ vocab.txt

其中

conll.py:验证集验证所需脚本

coreference.py:指代消解模型脚本

demo.py:指代消解工程测试脚本

metrics.py:验证集计算指标脚本

utils.py:数据转换,文件读写脚本

experiments.conf:代码运行所需参数配置文件

requirements.txt:代码运行必要环境文件

bert:用于存放bert模型相关脚本文件

conll-2012:官方提供的验证文件

data:用于存放训练验证预测文件以及最后预测的结果文件

pretrain_model:用于存放预训练模型(包含模型、参数配置文件、字典)

:orange_book: 2. 运行环境

:green_book: ​3. 运行方式

:green_book: ​4. 结果(有点忘了是否是这个loss对应这个结果)

loss image