google-code-export / turpial

Automatically exported from code.google.com/p/turpial
0 stars 0 forks source link

Expresión Regular para reconocer URL #236

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
Saludos, la expresión regular para el reconocimiento de URL o sitios web, se 
podría mejorar, ya que sitios web como: http://twitter.com/#!/encels no lo 
reconoce por la presencia del signo de exclamación (!) y cosas como: 
http://es+onoe?sv@lido#.com las marca como un enlace.

Como sugerencia, se podría mejorar y cambiar por la siguiente expresión 
regular que evalua los caso expuestos anteriormente

URL_PATTERN = 
re.compile('((http|ftp|https)://[-\w.]*(\s|/[-\w+&@#/%!?=~_:\[\]()]*))')  

Original issue reported on code.google.com by encels on 16 Oct 2010 at 3:52

GoogleCodeExporter commented 9 years ago
Había omitido el punto   (.) en la parte luego del slash /  la expresión 
quedaría:

URL_PATTERN = 
re.compile('((http|ftp|https)://[-\w.]*(\s|/[-\w+&@#/%!?=~_:.\[\]()]*))') 

Original comment by encels on 16 Oct 2010 at 4:53

GoogleCodeExporter commented 9 years ago
Implementada la nueva expresión regular mi pana, probemos a ver qué tal anda.

Saludos

Original comment by wil.alej...@gmail.com on 2 Nov 2010 at 2:35

GoogleCodeExporter commented 9 years ago
Creo que ahora la expresión regular presenta un problema y no reconoce: las 
url del tipo http://algo.com sin / al final! no hice mayores prueba, así que 
si se animan a probar!

Original comment by encels on 2 Nov 2010 at 3:33