opendatalab / MinerU

A high-quality tool for convert PDF to Markdown and JSON.一站式开源高质量数据提取工具,将PDF转换成Markdown和JSON格式。
https://opendatalab.com/OpenSourceTools?tool=extract
GNU Affero General Public License v3.0
17.96k stars 1.29k forks source link

由于新版本albumentations依赖simsimd导致不支持Centos7的说明 #1004

Open myhloli opened 3 days ago

myhloli commented 3 days ago

近日收到多起反馈编译安装simsimd库失败的情况,经过验证,simsimd的新版本预编译包在x86-64平台linux上要求glibc版本在2.28及以上,根据收集到的数据,一些符合要求的系统版本为:

  1. CentOS/RHEL CentOS 8 和 RHEL 8 及其后续版本
  2. Ubuntu Ubuntu 20.04 LTS (Focal Fossa) 及其后续版本
  3. Debian Debian 10 (Buster) 及其后续版本
  4. Fedora Fedora 30 及其后续版本

如果系统版本较老,可先安装

pip install albumentations==1.4.20

再安装

pip install -U magic-pdf[full] --extra-index-url https://wheels.myhloli.com