martinmacko47 / chcemvediet

FOIA requests for the lazy
4 stars 4 forks source link

zle rozparsovane meno prilohy #151

Open mmmaly opened 8 years ago

mmmaly commented 8 years ago

uzivatelovi prisla odpoved na ziadost, priloha v maili ma nazov typu Človek - odpoveď.pdf Miesto toho sa rozparsovalo meno "attachment", bez pripony.

Ked si uzivatel subor attachment stiahne a premenuje napr. na attachment.pdf, tak obsah je ok, dobre pdf.

Anonymizovana hlavicka pre subor vyzera takto:

Content-Type: application/pdf;\n name*=UTF-8''Priezvisko%20-%20odpove%C4%8F.pdf\nContent-Disposition: attachment;\n filename*=UTF-8''Priezvisko%20-%20odpove%C4%8F.pdf;\n size=200300\n

screen shot 2016-01-08 at 15 05 59

viac info, ak treba, mailom.

martinmacko47 commented 8 years ago

Kopiu eventu z mandrillu ulozenu nemame nikde, ale vyzera, ze mandrill nam poslal taky nazov attachmentu. Nazov attachmentu sa do DB zapisuje tu: https://github.com/martinmacko47/chcemvediet/blob/master/poleno/mail/transports/mandrill/signals.py#L72 Nic sa s tym nazvom nerobi, takze string attachment nemal ako vzniknut. Ak by aj nazov chybal, alebo by bol chybne encodovany, tak by sa bud zapisal prazdny string, nejaky balast, alebo by to cele spadlo.

Mandrill API je popisane tu https://mandrill.zendesk.com/hc/en-us/articles/205583207-What-is-the-format-of-inbound-email-webhooks- Ak sa Ti chce, pozri kod a to API, ci som nieco zle nepochopil.

Ked som rucne (standardnou python kniznicou) rozparsoval raw doruceneho mailu (z mandrill logov), tak nazov prilohy sa rozparsoval spravne. Chyba je asi na strane mandrillu. Nebolo by odveci to reportovat. Najlepsie co najskor, kym maju mail v logoch.

Alternativne by sme mohli uplne ignorovat, co nam posle mandrill a zobrat iba raw email a rozparsovat si ho sami. Naivne som predpokladal, ze mandrill bude mat vymakanejsi parser, nez sme schopni spravit my.