PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
Apache License 2.0
39.34k stars 7.35k forks source link

update ancient greek dict and fonts #12041

Open fangquinlan opened 1 month ago

paddle-bot[bot] commented 1 month ago

Thanks for your contribution!

CLAassistant commented 1 month ago

CLA assistant check
All committers have signed the CLA.

jzhang533 commented 3 weeks ago

有人知道, doc/fonts 下的这些字体文件是怎么被使用到的吗?

GreatV commented 3 weeks ago

有人知道, doc/fonts 下的这些字体文件是怎么被使用到的吗?

据我所知,好像就画图(可视化)的时候用到。

fangquinlan commented 3 weeks ago

有人知道, doc/fonts 下的这些字体文件是怎么被使用到的吗?

据我所知,好像就画图(可视化)的时候用到。

可以用这些字体来生成训练用的文字图片素材

jzhang533 commented 3 weeks ago

因为历史原因,在仓库里放了不少的字体文件,我觉得需要重新 review 这么做是否合适。 另外,关于这些字体的版权和来源,有一些说明吗?

fangquinlan commented 3 weeks ago

因为历史原因,在仓库里放了不少的字体文件,我觉得需要重新 review 这么做是否合适。 另外,关于这些字体的版权和来源,有一些说明吗?

https://fonts.google.com/specimen/Open+Sans https://www.greekfontsociety-gfs.gr/typefaces/19th_century

都遵循Open Font License

如果你觉得有问题,可以不通过字体,通过dict就行

jzhang533 commented 3 weeks ago

如果是这样的话。因为现在已经有不少字体已经 vendor in 在仓库里了, PaddleOCR 的部分功能还依赖于这样的做法。所以我觉得新增的字体,现在 vendor in 也没问题。

为了更加合规,你需要在 doc/fonts 目录下,新增一个 README 文件,来说明一下(用英文),你新增的字体的来源和版权,就可以合入了。