UUDigitalHumanitieslab / Reader-responses-to-translated-literature

Scripts for the DIOPTRA-L project (Digital Opinions on Translated Literature)
MIT License
0 stars 0 forks source link

Newlines in review text #5

Closed alexhebing closed 4 years ago

alexhebing commented 4 years ago

Ha Robert, Ik heb gisteren geprobeerd te tellen hoeveel reviews via de api methode te pakken zijn te krijgen, maar het is nog niet gelukt (script liep na een uur vast). Ben nu weer bezig. Eén ding viel me op in jouw csv: als er een newline karakter voorkomt in de tekst (i.e. \r\n of \n) dan behoudt jouw script die nu voor het text veld. Daarvan breekt de csv: daar komen regels in terecht met een deel van de text.

Fixen kan door die karakters te replacen:

text = mystring.replace('\r').replace('\n')