opendatasicilia / tansignari

"T'ansignari e t'appeddiri"
http://tansignari.opendatasicilia.it
Creative Commons Attribution 4.0 International
18 stars 10 forks source link

[miller] e formato jsonl con errore #252

Closed pigreco closed 1 year ago

pigreco commented 1 year ago

ho questo file jsonl [1]

cerco di convertirlo in csv usando:

mlr --j2c clean-whitespace toto2.jsonl >totoFeatureALL.csv

ma ricevo questo errore:

mlr: invalid character 'r' after object key:value pair.

[1] toto2.zip

pigreco commented 1 year ago

forse ho beccato l'errore, alla riga 44:

image

e altre righe:

image

sembrano errori legati ai link ipertestuali, li ho tolti e funziona tutto.

Occorrerebbe capire come evitare a monte questo problema

pigreco commented 1 year ago

Gli errori li ho scoperti usando fx e NotePad++ assegnado il linguaggio JSON (HA esidenziato gli errori di parsing)

aborruso commented 1 year ago

Ciao totò, l'errore è perché nel JSONL ci sono virgolette senza l'escape.

Sono presenti coppie chiave valore come

"funded":"viva "totò" fiandaca"

che dovrebbe essere

"funded":"viva \"totò\" fiandaca"