jerbarnes / nordial

NorDial is a project that aims to create resources and collect knowledge about the state of written Norwegian dialects on the web, specifically in social media.
Creative Commons Zero v1.0 Universal
8 stars 0 forks source link

Ordnivå: sammenlikning med norm #19

Open marieef opened 2 years ago

marieef commented 2 years ago

Har nok spurt om noe liknende før, men spør igjen for sikkerhets skyld :) Har skjønt at i de tilfellene hvor tweeten inneholder en blanding av ord som er normert i bokmål og ord som er normert i nynorsk, så tar man utgangspunkt i den normen som er likest, og behandler de ordene som ikke stemmer overens med denne som dialektord.

Blir det det samme i tweets som den under? Her er det masse dialektord å ta av. Utenom det vil jeg kanskje si at den likner mest på nynorsk. Betyr det at ord som "selvfølgelig" og "putter", som ikke er normert i nynorsk, skal markeres?

"Selvfølgelig ser ej forskjellen og dei to e jo dei verste gutta i klassa , men synest det e for enkelt å gi skylda på legen og at Therese ikkje hadde noko ansvar for kva man putter i kroppen . Ej he stor respekt for idrettsutøveren Therese og alt ho he gjort , men å gi legen skylda"

marieef commented 2 years ago

Relatert spørsmål:

Her er et eksempel på en nynorskaktig tweet med noen innslag av bokmålsord.

"Følelsen av magi gav seg då eg såg den var svart . Så no lurer eg på om eg skal male saken , gi den bort eller bruke helga på å pusse den ned for hånd."

Synes det er vanskelig, men har tenkt følgende:

Tyriflis commented 2 years ago

Marie og jeg snakket litt om det nå. Jeg synes dette er vanskelig selv. Jeg synes forslagene dine i det andre spørsmålet er gode for "følelsen" og "den". Hånd har litt samme problemet som tweeten over tenker jeg. Vi kan

1) Markere dem som marked (men da utvider vi bruken av denne merkelappen, kanskje litt uheldig) 2) Ignorere ord av denne typen. Det er interessant, men antageligvis vil det uansett være vanskelig å ta høyde for forskjellig bruk av "vanlig" bokmål og nynorsk. Her er det mer snakk om blanding, og det er ikke noe ellers unormert ved disse ordene.

Jeg lurer på om jeg heller mest mot 2. "marked" er fint for ord som "følelsen", som du skrev over, men ikke når orda aldri er tillatte.

Hva tenker @SamiaTouileb @jerbarnes ?

marieef commented 2 years ago

Et lite oppfølgingsspørsmål: hvis vi går for alternativ 2 som Petter foreslår, vil det da også si at vi ignorerer "putter" i det øverste eksempelet, hvor det er bøyningsendelsen som er hentet fra bokmål?

EDIT: Må presisere litt hva jeg egentlig mente. Da vi snakket om hvor stor grad av bokmål vi tillater i nynorsk (på setningsnivå), sa vi vel bl.a. at vi ikke tillater bøyningsendelser fra bokmål i nynorsk. Så da regner jeg med at et verb som "putter" skal markeres med conjugation i en ellers nynorsk tekst.

Mitt opprinnelige spørsmål var egentlig hva man gjør når teksten er dialektpreget, men kanskje likner litt mer på nynorsk enn bokmål (eller motsatt). For meg virker det litt komplisert å skulle ta stilling til om en tekst som inneholder tydelige dialektord er "mest bokmål" eller "mest nynorsk" når den kanskje ikke likner veldig på noen av delene.

I den tidligere runden (runde 3) har jeg nok bare fokusert på å annotere ordene som ikke er normert i hverken bokmål eller nynorsk i slike tweets, men hvis dere mener det bør gjøres på en annen måte, skal jeg selvfølgelig prøve å gjøre det konsekvent fra nå.