mholt / PapaParse

Fast and powerful CSV (delimited text) parser that gracefully handles large files and malformed input
http://PapaParse.com
MIT License
12.44k stars 1.14k forks source link

Not all fields are in the result #259

Closed caspahouzer closed 9 years ago

caspahouzer commented 9 years ago

Hopefully you can help.

This my line to import:

Ean;Title;Description;Image;Asin;Category;Library;Anzahl Seiten;Autor;Collections;Dauer;Dauer;Dauert;Dimensions;Edition;EISBN;Erschienen am;Format;Gelesen am;Gelesen am;Gelesen am;Googleid;Herausgeber;Hersteller;Infourl;ISBN;Isbn-10;Isbn-13;Label;Laufzeit;Noofpages;Preis;Produktgruppe;Publizierung;Rating;Releasedate;Seiten;Seiten;Serien;Sprecher;Sprecher;Studio;Subjects;Sutor;Typ;Urheber;Veröff.-Datum;Veröffentlicht;Veröffentlicht;Volume;Rated;Seen;Favourite
5044963200809;Shadows of Love 06 - Verbotener Tanz;Bluebell Girls' heißt das legendäre Damenballett des Pariser Lido. Die junge Tänzerin Élaine Verdonne nimmt am Casting für einen der fünf begehrten Plätze im Ensemble teil. Der künstlerische Leiter Maximilien de Saint Verrier lehrt Élaine nicht nur, wie sie tänzerische Hingabe zum Ausdruck bringt - abseits der Bühne verführt er die aufstrebende Balletttänzerin. Beide können nicht voneinander lassen. Doch Max verhält sich immer wieder abweisend. Warum nur versucht er die Liaison vor aller Welt zu verbergen? Élaine stellt Nachforschungen zu seiner Vergangenheit an - und wird schon bald fündig... Lust auf Liebe - 'Shadows of Love', in sich abgeschlossene erotische Liebesgeschichten.;http://ecx.images-amazon.com/images/I/51Y209El1dL.jpg;B014J3BP2A;Books, Erotik, Hörbuch, Liebesromane, Will ich lesen;Main library;;July Cullen;;03:07;;;;;;;;2015-09;;;;Lübbe Audio;;;;;;;;;;;;;;;;;Karen Kasche;;;;;;;;2015-09-10;;;1;1;1

This is my config:

header: true,
delimiter: '',
skipEmptyLines: true,
dynamicTyping: true

This is my result:

{
    "Ean": 5044963200809,
    "Title": "Shadows of Love 06 - Verbotener Tanz",
    "Description": "Bluebell Girls' heißt das legendäre Damenballett des Pariser Lido. ",
    "Image": "http://webserver/images/I/51Y209El1dL.jpg",
    "Asin": "B014J3BP2A",
    "Category": "Books, Erotik, Hörbuch, Liebesromane, Will ich lesen",
    "Library": "Main library",
    "Anzahl Seiten": "",
    "Autor": "July Cullen",
    "Collections": "",
    "Dauer": "",
    "Dauert": "",
    "Dimensions": "",
    "Edition": "",
    "EISBN": "",
    "Erschienen am": "",
    "Format": "",
    "Gelesen am": "",
    "Googleid": "",
    "Herausgeber": "Lübbe Audio",
    "Hersteller": "",
    "Infourl": "",
    "ISBN": "",
    "Isbn-10": "",
    "Isbn-13": "",
    "Label": "",
    "Laufzeit": "",
    "Noofpages": "",
    "Preis": "",
    "Produktgruppe": "",
    "Publizierung": "",
    "Rating": "",
    "Releasedate": "",
    "Seiten": "",
    "Serien": "",
    "Sprecher": "",
    "Studio": "",
    "Subjects": "",
    "Sutor": "",
    "Typ": "",
    "Urheber": "",
    "Veröff.-Datum": "",
    "Veröffentlicht": "",
    "Volume": "",
    "Rated": 1,
    "Seen": 1,
    "Favourite": 1
}

As you see, I'm missing some object values.

Do you have a solution for that?

vurral commented 9 years ago

Hi @caspahouzer

As it seems you have a few duplicate headers. PapaParse will create only one key for a duplicate header and will use the last found value for it.

You have following duplicates: 2x"Dauer", 3x"Gelesen am", 3x"Seiten", 2x"Sprecher", 2x"Veröffentlicht"

mholt commented 9 years ago

^ Bingo. The header feature is just a convenience but doesn't mess with the data so it expects that field names are not duplicated:

Warning: Duplicate field names will overwrite values in previous fields having the same name.

caspahouzer commented 9 years ago

uh.. missed that. thank you!