Open tomasHolaHello opened 2 years ago
@Sotrosca como va? Estuve indagando un poco para sortear el error y me encontré con eso:
get_estates_quantity()
que intenta levantar el valor de la cantidad de coincidencias de la búsquedaestates_quantity = re.findall(r'\d+.?\d+', soup.find_all('h1')[0].text)[0]
Entiendo que este error surge cuando r'\d+.?\d+'
intenta encontrar un numero separado por punto en el string soup.find_all('h1')[0].text
(corregíme si estoy equivocado) Esta búsqueda es nula, por lo tanto el indicador de índice final [0]
se encuentra fuera del array.<h1>
es:
Por lo tanto al intentar encontrar un valor numérico separado por punto, fracasa ya que el string es www.zonaprop.com.ar
Algunas sugerencia: Al desconocer si existe algún método propio de cloudscraper par verificar el resultado del scrap, se me ocurrió lo siguiente
www.zonaprop.com.ar
en <h1>
antes de proseguirr'\d+.?\d+'
, yo utilicé split()
. Utilizado así pro defecto, devuelve un array con las palabras separadas por espacios en blanco. una vez hecho esto, el indice [0] será la cantidad de coincidencias de la búsquedaPara cerrar, solo mencionar que no se si se podrá zafar de ese mensaje que te indicaba en el punto 3, me temo que no, y que tiene que ver con insistir tanto en las consultas. Vi que vos tenés un archivo/test/mock/html_page.html
que me imagino que lo has usado de base. Yo intente usarlo para no mostrarle mi cara al server de zonaprop con el riesgo de que bloqueen mi IP o algo así, pero no supe como hacer para que levante esa pagina y no la online. Te agradecería si me tiras una mano con eso.
Saludos!
@Sotrosca como va? bueno, te cuento que estuve trabajando y aprendiendo bastante del código que compartiste. Hay un error que me encuentro frecuentemente pero no he podido solucionarlo. Al realizar una búsqueda suele tirarme este error:
Esto lo hace intermitentemente. Es decir, talvez al primer intento me tira este error, pero si insisto con la consulta ya no lo tira. Al mismo tiempo, hay consultas particulares que siempre arrojan este resultado sin importar cuanto pueda uno insistir en conseguirlo.
Por lo que entiendo hay un problema con un array vacío:
aunque no me doy cuenta si el problema es el segundo parámetro que se le pasa a la funcion re.findall():
o el mismo re.findall():