Hi, I think the language filtering that takes place before the n-grams are checked works too aggressively. I've made the observation that one non-German character is sufficient for Lingua to dismiss German as a possible language. Here are a few examples:
Vandalismus in Rotenburg: Bürger unterstützen Cafébesitzer
Barça-Fans feiern fünften Saisonsieg
Führung der César-Akademie zieht sich zurück
Ein gut gekühlter Roséwein
Flüchtlingsreferendum in Ungarn: Eigentor für Orbán
Charité-Beschäftigte streikten schon mehrfach
DFB: Fünf Clásico-Erkenntnisse für Bundestrainer Joachim Löw
Der Eröffnungstag des Sónar-Festivals für elektronische Musik gehörte den Instrumentalkünstlern
Hi, I think the language filtering that takes place before the n-grams are checked works too aggressively. I've made the observation that one non-German character is sufficient for Lingua to dismiss German as a possible language. Here are a few examples:
Vandalismus in Rotenburg: Bürger unterstützen Cafébesitzer Barça-Fans feiern fünften Saisonsieg Führung der César-Akademie zieht sich zurück Ein gut gekühlter Roséwein Flüchtlingsreferendum in Ungarn: Eigentor für Orbán Charité-Beschäftigte streikten schon mehrfach DFB: Fünf Clásico-Erkenntnisse für Bundestrainer Joachim Löw Der Eröffnungstag des Sónar-Festivals für elektronische Musik gehörte den Instrumentalkünstlern