Open sveinbjornt opened 1 year ago
BÍN er aðgengilegt undir CC BY-SA 4.0
já, góður vinur minn benti mér á það í fyrra, CC BY-SA 4.0 er skilst mér compatible við GPLv3, og ætli það sé þá ekki líka compatible við LGPLv3? hef samt í raun ekki pælt mikið í því ... ég gæti skoðað að importa orðum úr bín í grunninn? þyrfti væntanlega að bæta við tilgreiningu á því og vísun í uppruna bín gagnanna líkt og gert er hér ? og kannski vísa líka í commit id þar sem bín grunninum væri skeytt við? ýmsar spurningar þó sem þyrfti að skoða varðandi að fara í einhverja svoleiðis vegferð ..
en þú ert ef til viłl að benda á þetta með það að ljósi að það að halda í svona vegferð við smíði nýs orðagrunns frá grunni sé meiriháttar vitleysa og/eða allt of stórt og óviðráðanlegt dæmi? :sweat_smile: mátt endilega ljá mér skoðanir þínar nánar um það sértu með slíkar og til í að deila þeim
það er ekki beint hlaupið að því að fá að gera breytingar eða viðbætur á orðagrunnum Árnastofnunar, það er alveg eitthvað sem mætti bæta
þetta loka-ord verkefni mitt er vissulega bara lítið hobbíverkefni, og forritunin bara svona lala, ekkert til að hrópa húrra fyrir, en grunnurinn er með sql gagnasnið, að vísu útfært með ORM pakkanum SQLAlchemy, en engu að síður, svo eru stöku nýjungar sem mér datt í hug þegar ég var að reyna að niðurnjörva gagnasniðið, kennistrengir fyrir orð (fyrirgefðu mér Snorri), innleiðing á pólska Ł, "samsett" skilgreiningar fyrir samsett orð, beygingar samsettra orða í raun ekki geymd í SQL grunni en leidd út útfrá samsett lýsingu og prentuð í JSON skrár, hash strengir til að eyrnamerkja orðabreytingar, sér sérnafnaflokkar, örnefnaorðflokkur, listun skammstafana og ýmislegt annað
meginverðmætið í þessi verkefni mínu sem mér finnst ég sjá er þó það að auðvelt er fyrir hvern sem hefur áhuga á því, að afrita grunninn/verkefnið, gera breytingar á gagnastrúktúr, eða orðum sem viðkomandi er ekki sammála með beygingar á eða bæta við orðum sem viðkomandi þykir vanta, smíða síðan grunninn og nota í það sem viðkomandi hugnast, fork it, make your own custom version, publish under LGPL, something something everyone profits
Og öflugur Python pakki utan um gagnagrunninn hér
já, þessi islenska python modúłl hjá miðeind er mjög kúl, hef því miður fiktað voða lítið með hann enn sem komið er, mjög áhugaverð þessi "word compounding algorithm" virkni, væri gaman að skoða nánar við tækifæri
fiktaði talsvert með reynir pakkann fyrir nokkrum árum, og hann var með bín grunninn einmitt pakkaðan inn þar, sem var áhugavert í ljósi hversu grimm árnastofnun var varðandi notkunarskilmála á grunnunum sínum á þeim tíma
annars þakka ég starrið í sumar og þetta innlegg frá þér :)
skál og góða helgi
Þú veist að BÍN er aðgengilegt undir CC BY-SA 4.0?
Og öflugur Python pakki utan um gagnagrunninn hér: https://github.com/mideind/BinPackage