Open bramiozo opened 3 months ago
@vmenger, ik ben bezig met dit issue. Ik zag overigens dat clinlp -> src/clinlp is verplaatst :)
p.s. of is het deze issue, naja he
Cool, goed om te weten! De hele roadmap staat nu hier: https://github.com/orgs/umcu/projects/3 -- is gelijk wat uitnodigender naar externen die mee willen werken. Vul gerust aan (door issues aan te maken
thinking out loud/notitie: Exclusie van interpunctie in fuzzy/proximity matching kan gedaan worden door interpunctie tijdelijk te vervangen door een tokenreeks van voldoende lengte e.g. "SEP SEP SEP SEP SEP" :D. Beetje een belachelijke optie maar het werkt wel...
Het niet accepteren van case switching voor de fuzzy matching vereist een nieuw gecompileerde Levenshstein.
Als alles goed werkt dan kijkt de fuzzy matching alleen binnen een token, was het niet de proximity matching die hier de interpunctie matchte? In dat geval is het wel makkelijker te fixen, door {"OP": "?"}
te vervangen door iets wat geen punct (of wellicht ook sentence boundaries?) matcht..
First this span
is tagged as positive, then this span
is tagged as negative.
The relevant phrases in the concept dictionary are: positive:
Longembolieën beiderzijds
negative:Geen longembolieën
with the following clinlp settings:
Expected behavior
Longembolieën beiderzijds
is respectedDirection of solution:
IS_PUNCT
option as a pattern attribute.