Open Phaqui opened 1 year ago
Et forslag for å jobbe rundt feilen som oppstår, i alle fall mildertidig, som jeg fant, var å endre regexen som splittes på, til:
(linje 834) r"(_∞_\w+\s?|_∞_@\s?|_∞_\?\s?|_∞_\<ehead>\s?|_∞_#|_∞_\<mv>\s?\|_∞_\<aux>\s?)"
(fra r"(_∞_\w+\s?|_∞_\?\s?|_∞_\<ehead>\s?|_∞_#|_∞_\<mv>\s?\|_∞_\<aux>\s?)"
)
Altså, jeg la til _∞_@\s?
- fordi mitt input til .split()
var "1024x_∞_@HNOUN #2->0"
...Men det blir nok ikke korrekt. I tillegg vet jeg ikke om dette egentlig kommer av en feil tidligere i pipelinen et eller annet sted (og at det blir mer riktig å legge inn fiksen der), - eller kanskje jeg har noe feil med selve språkmodellen min?
Du blir vel nødt til å se hva som lager linjene med _∞_
, og følge med hva som skjer fra input som er fra analyse
til der du er nå, for å se om det gir mening.
Det kan virke som at noe går galt et sted. I den fila jeg prøver å konvertere med
korp_mono.py
, ligger det analyser av typenSom da gjør at scriptet krasjer med følgende melding (de første tre linjene har jeg skrevet ut slik at jeg skulle finne ut hvordan inputtet så ut.