(1) Process methods which transfer the text like e.g. "Apple" --> "apple";
(2) Exchange e.g. "He" and "Her" with the last character in reference.
(3) Deal with "die Jünger Jesu" = Andreas (er, wie sein Bruder Simon Petrus waren Jünger des Johannes),
Simon (Kefas, Petrus), Jakobus (Sohn des Zebedäus), Johannes (Bruder des Jakobus - "Boanerges"), Philippus
Bartolomäus (vielleicht der Jünger, der im Johannesevangelium Nathanael heißt)
Simon (Kananäus), Matthäus (bei Markus auch "Levi" genannt), Thomas
Jakobus (Sohn des Alphäus), Thaddäus - auch Judas, Sohn des Jakobs genannt), Judas (der Jesus verraten hatte)
(4) Map between multiple character names, that are referencing the same character
For (2), we need to do a co-reference resolution and for (3) and (4), we may do a synonym detection. We can probably use existing implementations for both
(1) Process methods which transfer the text like e.g. "Apple" --> "apple"; (2) Exchange e.g. "He" and "Her" with the last character in reference. (3) Deal with "die Jünger Jesu" = Andreas (er, wie sein Bruder Simon Petrus waren Jünger des Johannes), Simon (Kefas, Petrus), Jakobus (Sohn des Zebedäus), Johannes (Bruder des Jakobus - "Boanerges"), Philippus Bartolomäus (vielleicht der Jünger, der im Johannesevangelium Nathanael heißt) Simon (Kananäus), Matthäus (bei Markus auch "Levi" genannt), Thomas Jakobus (Sohn des Alphäus), Thaddäus - auch Judas, Sohn des Jakobs genannt), Judas (der Jesus verraten hatte) (4) Map between multiple character names, that are referencing the same character