myx666 / LeCaRD

A Chinese legal case retrieval dataset.
MIT License
120 stars 15 forks source link

请问你们使用的BM25使用的是什么分词工具 #9

Open prometheusXN opened 2 years ago

prometheusXN commented 2 years ago

请问你们使用的BM25使用的是什么分词工具?

prometheusXN commented 2 years ago

image 请问你这里使用的Language Modeling是否能提供一下源码用于进行数据集的构建

myx666 commented 2 years ago

就是代码中的lmir

myx666 commented 2 years ago

jieba

prometheusXN commented 2 years ago

但是你这里写的是使用的Thulac工具进行分词的呀

ZiqingTIAN commented 6 months ago

image 请问你这里使用的Language Modeling是否能提供一下源码用于进行数据集的构建

请问这篇论文您是在哪里找到的呀