houbb / sensitive-word

👮‍♂️The sensitive word tool for java.(敏感词/违禁词/违法词/脏词。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能。)
https://houbb.github.io/opensource/sensitive-word
Apache License 2.0
4.1k stars 545 forks source link

没在库里的乱打的数字也会触发敏感词 #67

Closed manongqiyin closed 2 weeks ago

manongqiyin commented 2 months ago

在测试的时候发现 CensoredWordConfig.getSensitiveWordBs().findAll(article.getText()) 其中article.getText()中包含类似于1221211212、1223222111这样乱打的数字也会触发

且该类数字并不在库里面

houbb commented 2 months ago

数字是否检测可以关闭

发自我的iPhone

------------------ 原始邮件 ------------------ 发件人: manongqiyin @.> 发送时间: 2024年7月12日 17:30 收件人: houbb/sensitive-word @.> 抄送: Subscribed @.***> 主题: Re: [houbb/sensitive-word] 没在库里的乱打的数字也会触发敏感词 (Issue #67)

在测试的时候发现 CensoredWordConfig.getSensitiveWordBs().findAll(article.getText()) 其中article.getText()中包含类似于1221211212、1223222111这样乱打的数字也会触发

且该类数字并不在库里面

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>