ondata / albo-pop

Un piccolo e semplice esperimento, che ha come obiettivo quello di rendere più "popolari" gli Albi Pretori
http://albopop.it/
MIT License
16 stars 9 forks source link

Aggiungere San Cipirello #12

Open giuragu opened 8 years ago

giuragu commented 8 years ago

URL Albo: http://www.gazzettaamministrativa.it/opencms/opencms/_gazzetta_amministrativa/albo_pretorio/_sicilia/_comuni/_san_cipirello/

aborruso commented 8 years ago

@giuragu84 per favore indica l'URL dell'albo, grazie

giuragu commented 8 years ago

@aborruso sbadato...messo sopra

giuragu commented 8 years ago

Mi sono cimentato su questo simpatico Albo dove le pagine si differenziano non per numeri ma per tipologia di atto.

Ora mi trovo ad un punto "quasi morto" nel tentativo di definire su gdrive la data pubblicazione. In data miner scrivendo così data pubblicazione

mi restituisce "Data Pubblicazione: 03-12-2015"

ma in gdrive non me lo prende... Chiedo umilmente AIUTO

giuragu commented 8 years ago

Questo sarebbe il drive su cui sto lavorando con permesso di edit a chiunque abbia il foglio: https://docs.google.com/spreadsheets/d/1_nroXRYhkKpw0bAcvoYjFHwdQ5eL85ITucR7FRrRFLE/edit?usp=sharing

aborruso commented 8 years ago

Caro @giuragu84 ho applicato

//div[@id="searchList"]/div/div[contains(.,'Data')]/text()

Per ora senza spiegazioni :)

Il risultato è da pulire, ma esce!

giuragu commented 8 years ago

@aborruso benissimo! ho visto che mi uscivano tutte le date ed ho appena modificato il 'Data' in 'Data pubblicazione' e mi esce così solo quella di pubblicazione :)

giuragu commented 8 years ago

@aborruso per il campo Descrizione (per noi title) ho scritto //div[@id="searchList"]/div[contains(.,'Descrizione')]/text()

Mi restituisce correttamente il campo in drive ma con tanto di due righe vuote successive ad ogni riga compilata :(

aborruso commented 8 years ago

Per oggi mi fermo, anche questo è da pulire e da commentare:

//div[@id="searchList"]/div/b/following-sibling::text()[1]

Tutto questo perché l'html originale non è un granché

giuragu commented 8 years ago

@aborruso grazie! following-sibling...ma chi lo doveva dire:)

aborruso commented 8 years ago

C'era il tag <b>.

"following-sibling" sarebbe ciò che viene dopo. Ma tanta roba può venire dopo, e bisogna prendere soltanto il primo elemento, che è proprio la descrizione e quindi following-sibling::text()[1]

La funziona text() estrae solo il testo

giuragu commented 8 years ago

@aborruso yeah! Our function to delete :(space) is REPLACE Ho pulito i risultati di "Descrizione" e "Data pubblicazione"

giuragu commented 8 years ago

@aborruso questo gdrive continua a comportarsi in maniera davvero strana. Hai compreso quale potrebbe essere la motivazione? il foglio di output non sembra restituire tutti i link e non sembrano esserci gli ultimi.

giuragu commented 8 years ago

@aborruso ho notato due cose:

  1. gdrive in output non prende gli atti di gennaio 2016 perché il formato mese è senza lo 0 iniziale quindi la data diventa tipo "2016101" che sta per 1 gennaio 2016. Ci sarebbe da agire qui presumo: =QUERY(Foglio1!A2:H1000;"select C,D,E,G where E matches '^[0-9]{8}$' order by E desc"). Praticamente se sostituisco 8 con 7 mi prende i link di gennaio 2016 correttamente ma esclude gli altri naturalmente. ci vorrebbe mica un "or"? Ho provato ma ancora non trovo soluzione...riesci a soccorrere la mia momentanea ignoranza?
  2. La formula della colonna Link del foglio 1 non era presente in tutte le celle e pertanto non venivano restituiti tutti i link. Ora ho copiato la formula e dovrebbe funzionare correttamente.
aborruso commented 8 years ago

@giuragu84 dovrei avere risolto con la formula inserita nel campo order del primo foglio.

Fammi sapere

giuragu commented 8 years ago

@aborruso perfetto. pensi che quel NA in alto possa creare problemi? ho appena pubblicato sul web ma mi restituisce solo la riga NA

giuragu commented 8 years ago

@aborruso forse ho risolto in parte. ho superato il problema NA creando ulteriore foglio output con query che mi permetta di eliminare sostanzialmente la prima riga con tutte le NA. Ora pubblico su web e mi si visualizzano tutte le celle.....ma sono vuote! per ora mi fermo....riproverò..sempre che non ci arrivi prima tu :)

giuragu commented 8 years ago

Creato feed rss da @aborruso : http://feeds.feedburner.com/AlboPretorioComuneSanCipirrello Creato canale Telegram e relativa ricetta: https://telegram.me/albopretoriosancipirello

Inizia fase test prima del lancio. Previsto entro la settimana