hupochuan / Bom_analysis

1 stars 0 forks source link

一些问题 #2

Open hupochuan opened 6 years ago

hupochuan commented 6 years ago

最近把之前做的工作集成起来做了测试,出现了以下几个问题:

  1. JVM相关问题,为了使用Java调用CRF++,之前在64位系统中安装了32位的JDK,测试期间出现了各种各样的虚拟机报错,主要是内存方面的问题;
  2. Stanford Ner识别时会把输入句中的特殊符号、数字拆开识别,例如“--”,“32.1”这种,由于不能准确把握哪些符号会分开,哪些不会,导致出现一系列问题;
  3. Stanford Segmenter分词效果一般,我觉得没有Ltp用起来好,毕竟不是专门做中文分词的。
zhangtaochn commented 6 years ago

你好,能和你交流下么,我现在在弄职务犯罪判决书犯罪事实部分的信息抽取和实体识别之类的内容,有些无从下手,可以交流下么,我的邮箱11749178@mail.sustc.edu.cn