hankcs / AhoCorasickDoubleArrayTrie

An extremely fast implementation of Aho Corasick algorithm based on Double Array Trie.
http://www.hankcs.com/program/algorithm/aho-corasick-double-array-trie.html
950 stars 290 forks source link

有python封装吗 #46

Open SeekPoint opened 3 years ago

NintendoLink commented 8 months ago

ahocorasick有python版本,底层是用的C实现的,python环境可以一键安装。 但python ahocorasick 在字典数量很大(>1 * 10^9)的情况下,会极大的占用内存。并且由于GIL的存在,Python无法原生的实现多线程共享单个模型。只能修改成多进程+共享变量的方式,但会带来较大的性能损失。