apicrafter / metacrafter

Metadata and data identification tool and Python library. Identifies PII, common identifiers, language specific identifiers. Fully customizable and flexible rules
Apache License 2.0
44 stars 5 forks source link

Правило для URL #2

Closed tonal closed 2 years ago

tonal commented 2 years ago

Можно ли добавить правило для нахождения URL-ов? Вроде в pyparsing есть удобное правило pyparsing.pyparsing_common.url, но неясно как его добавить.

ivbeg commented 2 years ago

@tonal конечно можно, фишка в том что можно создавать свои правила, а путь к правилам настраивать. Конкретно url'ы валидирует validators.url функция из пакета validators. Я добавил референсную версию правил вот тут https://github.com/apicrafter/metacrafter/blob/main/rules/common/commonurl.yaml , но вообще Вы можете создать любое/любые свои правила, главное чтобы функция была вызываема и библиотека её доступна через import