scieloorg / packtools

Python library and command-line utilities to handle SciELO PS XML files.
http://packtools.readthedocs.org
BSD 2-Clause "Simplified" License
11 stars 23 forks source link

Nas validações em que existem valores que deveriam ser URL #678

Open robertatakenaka opened 2 months ago

robertatakenaka commented 2 months ago

Descrição da tarefa

Nas validações em que existem valores que deveriam ser URL, adicione se o conteúdo é uma URL. Note exemplos como: https://articlemeta.scielo.org/api/v1/article/?collection=cub&code=S1024-94352003000500002&format=xmlwos

Observe que, apesar de não ser o XML SciELO, todos os supostos links, não estão corretos, isso pode causar problemas nos conteúdos a serem exportados. Use estes exemplos como fora do padrão de URL.

# código gerado por IA, verificar se funciona
import urllib.parse

def is_url_like(text):
  """Checks if a given text string resembles a URL pattern using urllib.parse."""
  try:
    parsed_url = urllib.parse.urlparse(text)
    return bool(parsed_url.scheme) and bool(parsed_url.netloc)
  except ValueError:
    return False

# Examples
text1 = "https://www.example.com"
text2 = "This is not a URL"

print(is_url_like(text1))  # Output: True
print(is_url_like(text2))  # Output: False
robertatakenaka commented 2 months ago

@gitnnolabs @samuelveigarangel PSI