Open antitoxic opened 9 years ago
Не е от encoding-a . Туко що пробвах с https://github.com/obshtestvo/opendata/blob/master/tests/postcodesutf8.csv . Отново има грешка. Може би трябва да rebuild-нем цялата Datastore база данни
btw file -i <file>
ми върна грешен encoding
потенциална причина защо CSV-то е реално разделено с точка и запетая: ref: http://stackoverflow.com/questions/10140999/csv-with-comma-or-semicolon
GitHub също се оплаква, че не е разделено със запетая, но си мисля, че datapusher-ът би трябвало да се оправя и с ;
. От друга страна, много лесно може да се тества.
Направих още малко тестови файлове. Ако искаш/можеш, пробвай и с тях.
С тестовете до момента смятам че проблема идва от това че в CKAN datastore има таблица за тоя файл но е създадена с по-малко на брой колони, отколкото в момента засича. Още тествам
omg... изцяло и само зарарди non-ascii-то е.
Тествах:
iconv
: iconv -f WINDOWS-1251 -t UTF-8 ./Downloads/Post-Codes-2015.csv > postcodesutf8.csv
- не беше товаПолзвах файла, който @mitio даде със съдържание на латиница - сработи.
Разочарован съм.
Трябва да го дебъгнем по-добре това и да видим дали ще можем да го оправим. Голям проблем е.
Ето проблема като issue в главното репо на CKAN: https://github.com/ckan/datapusher/issues/69
@peperon това изглежда достса relevant, ако случайно не си го видял.
Да, видях го. Като цяло май ще е най-добре да ъпдейтнем до последната версия на ckan
за по-добри съобщения от DataStore
.
Оригинална грешка:
Job "push_to_datastore" raised an exception
Опитах се да force-на parse-ването (иначе казано да "кача в DataStore") на 1 CSV в таблицата на postgre чрез уеб интерфейса на портала и получих:
Това е същата грешка, която получаваме по мейл като: