freme-project / freme-ner

Apache License 2.0
6 stars 1 forks source link

Entities in Dutch text are found, but not linked to resources (DBpedia) #141

Closed pheyvaer closed 8 years ago

pheyvaer commented 8 years ago

Using a Dutch text using NER finds the entities. However, it doesn't retrieve the URIs in DBpedia. For the English version this works.

curl -X POST --header 'Content-Type: text/html' --header 'Accept: text/turtle' -d '<p>Voordat Harry Potter aan zijn derde jaar op Zweinstein kan beginnen, moet hij de zomervakantie doorbrengen bij zijn gemene oom en tante en vervelende neefje Dirk. Door een magisch ongelukje komt hij \u0027s avonds laat opeens op straat te staan. Dan blijkt dat Sirius Zwarts, een beruchte volgeling van Voldemort, uit de gevangenis van Azkaban is ontsnapt. Hij is op de vlucht en heeft het wellicht op Harry gemunt.
Er volgt een enerverend schooljaar met nieuwe vakken als Dreuzelkunde en zorg voor Fabeldieren, spannende Zwerkbalwedstrijden en griezelige voorspellingen. De school wordt bewaakt door Dementors, de gevreesde bewakers van Azkaban, en Harry zal zijn lessen Verweer tegen de Zwarte kunsten hard nodig hebben.
\u0027Harry Potter en de Gevangene van Azkaban leest als een trein, is geestig en hartverwarmend. \u0027 (Algemeen Dagblad) \u0027Niemand kan meer om Harry Potter heen. Harry betovert de wereld. Harry verovert de wereld.\u0027 (De Gelderlander) \u0027De Nederlandse vertaling van Wiebe Buddingh\u0027 is uitmuntend.\u0027 (Het Parool)</p>' 'https://api-dev.freme-project.eu/current/e-entity/freme-ner/documents?language=en&dataset=dbpedia&mode=all'
sandroacoelho commented 8 years ago

Hi @pheyvaer , @m1ci : could you please try again?

jnehring commented 8 years ago

@sandroacoelho did you change something in the implementation?

m1ci commented 8 years ago

I think it was only issue with the indexing. The entities were indexed only for EN, thus linking would work only for English texts. For this reason, we indexed without language specified, so that we can link the entities in "any" language.

sandroacoelho commented 8 years ago

Hi @jnehring: It is related to the data as @m1ci told

Best,