Open giuragu opened 8 years ago
@giuragu84 per favore indica l'URL dell'albo, grazie
@aborruso sbadato...messo sopra
Mi sono cimentato su questo simpatico Albo dove le pagine si differenziano non per numeri ma per tipologia di atto.
Ora mi trovo ad un punto "quasi morto" nel tentativo di definire su gdrive la data pubblicazione. In data miner scrivendo così
mi restituisce "Data Pubblicazione: 03-12-2015"
ma in gdrive non me lo prende... Chiedo umilmente AIUTO
Questo sarebbe il drive su cui sto lavorando con permesso di edit a chiunque abbia il foglio: https://docs.google.com/spreadsheets/d/1_nroXRYhkKpw0bAcvoYjFHwdQ5eL85ITucR7FRrRFLE/edit?usp=sharing
Caro @giuragu84 ho applicato
//div[@id="searchList"]/div/div[contains(.,'Data')]/text()
Per ora senza spiegazioni :)
Il risultato è da pulire, ma esce!
@aborruso benissimo! ho visto che mi uscivano tutte le date ed ho appena modificato il 'Data' in 'Data pubblicazione' e mi esce così solo quella di pubblicazione :)
@aborruso per il campo Descrizione (per noi title) ho scritto //div[@id="searchList"]/div[contains(.,'Descrizione')]/text()
Mi restituisce correttamente il campo in drive ma con tanto di due righe vuote successive ad ogni riga compilata :(
Per oggi mi fermo, anche questo è da pulire e da commentare:
//div[@id="searchList"]/div/b/following-sibling::text()[1]
Tutto questo perché l'html originale non è un granché
@aborruso grazie! following-sibling...ma chi lo doveva dire:)
C'era il tag <b>
.
"following-sibling" sarebbe ciò che viene dopo. Ma tanta roba può venire dopo, e bisogna prendere soltanto il primo elemento, che è proprio la descrizione e quindi following-sibling::text()[1]
La funziona text()
estrae solo il testo
@aborruso yeah! Our function to delete :(space) is REPLACE Ho pulito i risultati di "Descrizione" e "Data pubblicazione"
@aborruso questo gdrive continua a comportarsi in maniera davvero strana. Hai compreso quale potrebbe essere la motivazione? il foglio di output non sembra restituire tutti i link e non sembrano esserci gli ultimi.
@aborruso ho notato due cose:
@giuragu84 dovrei avere risolto con la formula inserita nel campo order del primo foglio.
Fammi sapere
@aborruso perfetto. pensi che quel NA in alto possa creare problemi? ho appena pubblicato sul web ma mi restituisce solo la riga NA
@aborruso forse ho risolto in parte. ho superato il problema NA creando ulteriore foglio output con query che mi permetta di eliminare sostanzialmente la prima riga con tutte le NA. Ora pubblico su web e mi si visualizzano tutte le celle.....ma sono vuote! per ora mi fermo....riproverò..sempre che non ci arrivi prima tu :)
Creato feed rss da @aborruso : http://feeds.feedburner.com/AlboPretorioComuneSanCipirrello Creato canale Telegram e relativa ricetta: https://telegram.me/albopretoriosancipirello
Inizia fase test prima del lancio. Previsto entro la settimana
URL Albo: http://www.gazzettaamministrativa.it/opencms/opencms/_gazzetta_amministrativa/albo_pretorio/_sicilia/_comuni/_san_cipirello/