Open ji90po opened 1 year ago
安装问题比较多 (https://dumps.wikimedia.org/zhwiki/latest/ 语料库)
1) 如果遇到err 就像下面 ’”aise source.error('global flags not at the start ' re.error: global flags not at the start of the expression at position 4 “
请务必将python 退到py3.10 的版本 (我用的anaconda 是3.11的 一直报错)
example : Conda create --name py310 python=3.10 conda activate py310 pip install wikiextractor
2) 如果开始运行 python -m wikiextractor.WikiExtractor jawiki-latest-pages-articles.xml.bz2 了 很长一段时间 ,如 '...xxx pages ... ...xxx pages ... ...xxx pages ...' 突然报 带’fork‘的错误
一个解决方案 pip install git+https://github.com/prokotg/wikiextractor
wikiextractor 会从3.0.6 回退到 3.0.4 从而 ok
再 python -m wikiextractor.WikiExtractor jawiki-latest-pages-articles.xml.bz2
从而ok
安装问题比较多 (https://dumps.wikimedia.org/zhwiki/latest/ 语料库)
1) 如果遇到err 就像下面 ’”aise source.error('global flags not at the start ' re.error: global flags not at the start of the expression at position 4 “
请务必将python 退到py3.10 的版本 (我用的anaconda 是3.11的 一直报错)
example : Conda create --name py310 python=3.10 conda activate py310 pip install wikiextractor
2) 如果开始运行 python -m wikiextractor.WikiExtractor jawiki-latest-pages-articles.xml.bz2 了 很长一段时间 ,如 '...xxx pages ... ...xxx pages ... ...xxx pages ...' 突然报 带’fork‘的错误
一个解决方案 pip install git+https://github.com/prokotg/wikiextractor
wikiextractor 会从3.0.6 回退到 3.0.4 从而 ok
再 python -m wikiextractor.WikiExtractor jawiki-latest-pages-articles.xml.bz2
从而ok