issues
search
kenoboss
/
TextSummarization
0
stars
2
forks
source link
PreProcessing
#4
Closed
siwer
closed
6 years ago
siwer
commented
6 years ago
Umwandeln der Sätze in Feature Vectors:
Ein Satz wird ein Vektor, bestehend aus:
[x] Erster Satz in Text (0|1)
[x] Satzposition in Dokument (1|..|Anzahl Sätze)
[x] Satzlänge in Wörtern (1|..|Satz.length)
[x] Anzahl an thematischen Wörtern (Wie viele der 10 häufigsten Wörter (pro Text) kommen in Satz vor?)
[x] Anzahl an Inhaltswörtern, welche auch im Titel vorhanden sind