Es soll festgestell werden, inwiefern die Zusammenfassungen in den Trainingsdaten mit den Texten übereinstimmen (sind ganze Sätze entnommen und zur Zusammenfassung verwendet worden?)
Zusammenfassungen der Texte enthalten nur sehr wenige Sätze aus dem Texten.
Die Ähnlichkeit der erzeugten Zusammenfassungen werden über die Frequenzen der Inhaltswörter mit der Euklidischen Distanz ermittelt
Es soll festgestell werden, inwiefern die Zusammenfassungen in den Trainingsdaten mit den Texten übereinstimmen (sind ganze Sätze entnommen und zur Zusammenfassung verwendet worden?)