li-aolong / li-aolong.github.io

李傲龍的博客
https://aolong.me
82 stars 16 forks source link

7.16——NLP相关了解 #5

Open li-aolong opened 5 years ago

li-aolong commented 5 years ago

处理流程

jieba

分词算法

  1. 基于统计词典,构造有向无环图(DAG)
  2. 基于DAG图,采用动态规划计算最大概率路径来进行分词
  3. 对于新词,采用HMM模型进行切分

相关函数