Loknar / loka-ord

Libre database for icelandic words.
GNU Lesser General Public License v3.0
15 stars 7 forks source link

BÍN #47

Open sveinbjornt opened 1 year ago

sveinbjornt commented 1 year ago

Þú veist að BÍN er aðgengilegt undir CC BY-SA 4.0?

Og öflugur Python pakki utan um gagnagrunninn hér: https://github.com/mideind/BinPackage

Loknar commented 1 year ago

BÍN er aðgengilegt undir CC BY-SA 4.0

já, góður vinur minn benti mér á það í fyrra, CC BY-SA 4.0 er skilst mér compatible við GPLv3, og ætli það sé þá ekki líka compatible við LGPLv3? hef samt í raun ekki pælt mikið í því ... ég gæti skoðað að importa orðum úr bín í grunninn? þyrfti væntanlega að bæta við tilgreiningu á því og vísun í uppruna bín gagnanna líkt og gert er hér ? og kannski vísa líka í commit id þar sem bín grunninum væri skeytt við? ýmsar spurningar þó sem þyrfti að skoða varðandi að fara í einhverja svoleiðis vegferð ..

en þú ert ef til viłl að benda á þetta með það að ljósi að það að halda í svona vegferð við smíði nýs orðagrunns frá grunni sé meiriháttar vitleysa og/eða allt of stórt og óviðráðanlegt dæmi? :sweat_smile: mátt endilega ljá mér skoðanir þínar nánar um það sértu með slíkar og til í að deila þeim

það er ekki beint hlaupið að því að fá að gera breytingar eða viðbætur á orðagrunnum Árnastofnunar, það er alveg eitthvað sem mætti bæta

þetta loka-ord verkefni mitt er vissulega bara lítið hobbíverkefni, og forritunin bara svona lala, ekkert til að hrópa húrra fyrir, en grunnurinn er með sql gagnasnið, að vísu útfært með ORM pakkanum SQLAlchemy, en engu að síður, svo eru stöku nýjungar sem mér datt í hug þegar ég var að reyna að niðurnjörva gagnasniðið, kennistrengir fyrir orð (fyrirgefðu mér Snorri), innleiðing á pólska Ł, "samsett" skilgreiningar fyrir samsett orð, beygingar samsettra orða í raun ekki geymd í SQL grunni en leidd út útfrá samsett lýsingu og prentuð í JSON skrár, hash strengir til að eyrnamerkja orðabreytingar, sér sérnafnaflokkar, örnefnaorðflokkur, listun skammstafana og ýmislegt annað

meginverðmætið í þessi verkefni mínu sem mér finnst ég sjá er þó það að auðvelt er fyrir hvern sem hefur áhuga á því, að afrita grunninn/verkefnið, gera breytingar á gagnastrúktúr, eða orðum sem viðkomandi er ekki sammála með beygingar á eða bæta við orðum sem viðkomandi þykir vanta, smíða síðan grunninn og nota í það sem viðkomandi hugnast, fork it, make your own custom version, publish under LGPL, something something everyone profits

Og öflugur Python pakki utan um gagnagrunninn hér

já, þessi islenska python modúłl hjá miðeind er mjög kúl, hef því miður fiktað voða lítið með hann enn sem komið er, mjög áhugaverð þessi "word compounding algorithm" virkni, væri gaman að skoða nánar við tækifæri

fiktaði talsvert með reynir pakkann fyrir nokkrum árum, og hann var með bín grunninn einmitt pakkaðan inn þar, sem var áhugavert í ljósi hversu grimm árnastofnun var varðandi notkunarskilmála á grunnunum sínum á þeim tíma

annars þakka ég starrið í sumar og þetta innlegg frá þér :)

skál og góða helgi