houbb / sensitive-word

👮‍♂️The sensitive word tool for java.(敏感词/违禁词/违法词/脏词。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能。)
https://houbb.github.io/opensource/sensitive-word
Apache License 2.0
4.1k stars 545 forks source link

[Bug]一长串代码会被检测到含有敏感词 #56

Closed eddsi closed 3 months ago

eddsi commented 4 months ago

if !hit { CollectQuota(conn.GetCtx(), user, buffer, plan, err) }

if buffer.IsEmpty() { conn.Send(globals.ChatSegmentResponse{ Message: defaultMessage, End: true, }) return defaultMessage }

conn.Send(globals.ChatSegmentResponse{ End: true, Quota: buffer.GetQuota(), Plan: plan, })

return buffer.ReadWithDefault(defaultMessage) 上述go代码会被检测出敏感词,但是我仔细检查了一下,并不包含dict_en中的英文。

houbb commented 3 months ago

默认被识别为 url 了。

v0.16.2 默认关闭了 url 检测,以前的版本可以配置指定。