houbb / sensitive-word

👮‍♂️The sensitive word tool for java.(敏感词/违禁词/违法词/脏词。基于 DFA 算法实现的高性能 java 敏感词过滤工具框架。请勿发布涉及政治、广告、营销、翻墙、违反国家法律法规等内容。高性能敏感词检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能。)
https://houbb.github.io/opensource/sensitive-word
Apache License 2.0
4.36k stars 589 forks source link

忽略字符问题 #48

Closed liutao-lx closed 6 months ago

liutao-lx commented 7 months ago

我在找到[傻@帽,狗+东西]这个集合后,我没有找到如何处理这个集合的思路,多谢

houbb commented 7 months ago

你把中间的特殊符号,当作忽略字符就行

发自我的iPhone

------------------ 原始邮件 ------------------ 发件人: liutao-lx @.> 发送时间: 2024年3月5日 16:48 收件人: houbb/sensitive-word @.> 抄送: Subscribed @.***> 主题: Re: [houbb/sensitive-word] 忽略字符问题 (Issue #48)

我在找到[傻@帽,狗+东西]这个集合后,我没有找到如何处理这个集合的思路,多谢

— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you are subscribed to this thread.Message ID: @.***>

chuntungho commented 7 months ago

标签获取存在问题,如:傻@帽,应该是获取“傻帽”对应的标签

houbb commented 6 months ago
  1. 设置特殊符号为忽略字符。
  2. 其他正常按原逻辑处理。