Closed ChrizZz110 closed 8 years ago
done
Anmerkung aus dem Gespräch mit Herrn Nentwig:
@Lunev1 TODO für dich: Ich denke ein guter Weg wäre für deine Klasse "DataCleaner" einen Konstruktor anzulegen, den man ein boolean Wert übergeben kann: 0 = Klammern und Komma drin 1 = Klammern und Komma raus. Den Wert speicherst du in einer privaten Klassenvariable. In der Map Funktion selbst fragst du diese dann ab und entscheidest, was du machst.
Ich hab deinen DataCleaner in den createCompareCsv Prozess integriert. Das Ergebnis sieht sehr gut aus!
Spontan ist mir noch das Zeichen ‘ ins Auge gefallen, welches sich bspw. in der concept_attributes.csv Zeile 45588 befindet: 7350;label;Al ‘Amārah;string
Vielleicht kannst du das auch noch mit raus werfen.
Der DataCleaner hat nun zwei Modi die mit dem Konstruktor übergeben werden können: true - Klammern und Kommas mit Innhalt bzw. folgendem Inhalt entfernen false - Klammern und Komma mit Inhalt behalten (default)
Zu beachten: auch im false-Mode werden standardmäßig Kommas entfernt.
@Lunev1 : Bitte im Unit-Test den Modus mit false noch integrieren.
Nach dem Label Filter müssen die gefilterten Tupel bereinigt werden: