transparentegt / portal

Scrapper del portal de Guatecompras
GNU General Public License v3.0
14 stars 5 forks source link

Paginador con nombre con barra | rompe la lectura #59

Closed str closed 9 years ago

str commented 9 years ago

La página #62 del paginado de proveedores http://guatecompras.gt/proveedores/consultaProveeAdjLst.aspx muestra el proveedor MAPFRE | SEGUROS GUATEMALA, SOCIEDAD ANONIMA. La barra rompe el algoritmo de lectura

str commented 9 years ago

Los datos retornados se ven parecidos a esto

1|#||4|14691|updatePanel|MasterGC_ContentBlockHolder_UpdatePanel1|$$$$|0|hiddenField|__EVENTTARGET||0|hiddenField|__EVENTARGUMENT||744|hiddenField|__VIEWSTATE|$viewState|332|hiddenField|__EVENTVALIDATION|$eventValidation|0|asyncPostBackControlIDs|||0|postBackControlIDs|||42|updatePanelIDs||tMasterGC$ContentBlockHolder$UpdatePanel1,|0|childUpdatePanelIDs|||41|panelsToRefreshIDs||MasterGC$ContentBlockHolder$UpdatePanel1,|2|asyncPostBackTimeout||90|25|formAction||consultaProveeAdjLst.aspx|47|pageTitle||Guatecompras - Resumen Adjudicaciones Proveedor|

Parece que son filas de 4 columnas donde la primera columna define el tamaño del string de la columna final

$tamaño|$col2|$col3|$valor|

Si $col3 está vacío, $col2 es el nombre del campo. Si no, $col3 es el nombre del campo. Tengo que hacer un algorimto que use el $tamaño para leer el 4to campo.