thunlp / THULAC-Python

An Efficient Lexical Analyzer for Chinese
MIT License
2.02k stars 336 forks source link

请问对英文和数字是如何处理的? #91

Open ryangawei opened 5 years ago

ryangawei commented 5 years ago

是直接通过空格分割吗?filt=True时有的英文和数字也会被过滤,想问下具体的机制是怎样的,工作中遇到了中英数字夹杂的文本。