houbb / sensitive-word

👮‍♂️The sensitive word tool for java.(敏感词/违禁词/违法词/脏词。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能。)
https://houbb.github.io/opensource/sensitive-word
Apache License 2.0
4.1k stars 545 forks source link

refactor:优化数据存储结构 #33

Closed xiaochangbai closed 1 year ago

xiaochangbai commented 1 year ago

使用自定义的数据结构来存储数据,优化存储空间

  1. 子节点不为空才初始化,避免占用额外的空间。 2.优化结束标识:利用bool来存储,并且不是结束节点时不占用空间

在默认数据源(6w)的情况,节省了近6M的存储空间

houbb commented 1 year ago

感谢 PR,我后续会做一层抽象。map/double array 等作为具体的实现。

houbb commented 1 year ago

V0.7.0 已添加抽象接口,并且已添加实现。你的作者信息加上了。