maybe we need to check for differently encoded strings with the same decoded value like in this example from the RKI feed:
<item>
<title>Kontakt­personen­nach­ver­folgung bei respira­to­rischen Erkran­kungen durch das Corona­virus SARS-CoV-2</title>
<link>https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Kontaktperson/Management_Download.html</link>
<pubDate>Thu, 16 Apr 2020 15:30:00 +0200</pubDate>
<description>Die Hinweise in diesem Dokument können der Situation vor Ort im Rahmen einer Risikobewertung durch das zuständige Gesundheitsamt unter Berücksichtigung der angestrebten Schutzziele angepasst werden.</description>
</item>
<item>
<title>Kontaktpersonen­nachverfolgung bei respiratorischen Erkrankungen durch das Coronavirus SARS-CoV-2</title>
<link>https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Kontaktperson/Management.html</link>
<pubDate>Thu, 16 Apr 2020 15:30:00 +0200</pubDate>
<description>Die folgenden Hinweise können der Situation vor Ort im Rahmen einer Risikobewertung durch das zuständige Gesundheitsamt unter Berücksichtigung der angestrebten Schutzziele angepasst werden.</description>
</item>
maybe we need to check for differently encoded strings with the same decoded value like in this example from the RKI feed: