Open SeekPoint opened 3 years ago
ahocorasick有python版本,底层是用的C实现的,python环境可以一键安装。 但python ahocorasick 在字典数量很大(>1 * 10^9)的情况下,会极大的占用内存。并且由于GIL的存在,Python无法原生的实现多线程共享单个模型。只能修改成多进程+共享变量的方式,但会带来较大的性能损失。
ahocorasick有python版本,底层是用的C实现的,python环境可以一键安装。 但python ahocorasick 在字典数量很大(>1 * 10^9)的情况下,会极大的占用内存。并且由于GIL的存在,Python无法原生的实现多线程共享单个模型。只能修改成多进程+共享变量的方式,但会带来较大的性能损失。