Taapeli / stk-upload

Base for stk server with data upload and browsing
GNU General Public License v2.0
3 stars 1 forks source link

Referenssipaikkojen ID-sääntöjen määrittely #63

Open PeterJPower opened 3 years ago

PeterJPower commented 3 years ago

Aikaisemmin on päädytty siihen, että referenssipaikoille tulee erottava ID (alkaa esim. PR.. kun paikka normaalisti saa Grampsissa P-alkuisen ID:n. Lisäksi on todettu, että ref.paikan ID:n pitää olla pysyvä.

Paikkakantojen keräämisen yhteydessä sekä Sibeliuksen ja tarjokasaineistojen kokemuksella on ilmeistä, että tarvitaan pidemmälle menevä ID-säännöstö, jolla varmistetaan ref-paikkojen UUID-tyyppinen pysyvyys. Siltä pohjalta, että suurimmassa seurakuntakohtaisessa paikkakannassa on 800 referenssipaikkaa ja seurakuntia on laajimmassa Kirkollisten organisaatioiden kannassani 829 kpl, ehdotan seuraavaa säännöstöä:

Pohjalla on Seurakuntien aukoton ja pysyvä numerointi, 1000 numeron välein. Siis 1. seurakunta on "PR0001..", 2. seurakunta on "PR0002.." jne. Kun seurakunnasta valmistuu esim. 680 paikan paikkakanta, sen paikat (srk:n alla) numeroidaan ao. seurakunnan alaiseen sarjaan. Siis 2. seurakunnassa ref.paikat saavat ID:t "PR00010001, ...PR00010680. Jos srk:n alle tulee tämän jälkeen uusia paikkoja, ne numeroidaan viimeisen käytetyn jälkeen.

Jos srk:sta ei ole valmista paikkakantaa (kuten on tilanne vielä pitkään), Suomi-tietokantaan viedyt srk:n alaiset paikat voitaisiin ehkä numeroida ao srk:n alle juoksevasti. Kun srk:lle valmistuisi paikkakanta, sen paikat viedään srk:n alle lähtien seuraavasta vapaasta ref. ID:stä. Jos paikkakannassa tulee tupla srk:ssa jo olevaan paikkaan, paikkakannan paikka sulautetaan ref.kannassa jo olevaan. Tämä varmistaa, että kerran ref.kantaan lisätyn paikan ID ei muutu.

Edellä olevan lisäksi pitäisi määritellä säännöt muiden kuin srk:n alaisten paikkojen numeroinnille. Riittäisikö, että tärkeimmillä mailla (Pohjoismaat , Venäjä, ..) olisi yhteinen sarja tai erilliset sarjansa? Militääriorganisaatioille ja muille organisaatioille omat sarjansa?

kkujansuu commented 3 years ago

Minulle ei oikein auennut se mitä hyötyä tästä olisi. Ilmeisesti se että eri referenssipaikkakokoelmien kesken ei tulisi samoja id-numeroita. Varmistaako tämä id-arvojen pysyvyyden sen paremmin kuin muukaan numerointi?

Tämmöisiä ajatuksia tuli mieleen:

Seurakunnillahan on jo numerointi, jota esim. Hiski noudattaa. joten varmaan on syytä käyttää ko. numerointia sikäli kuin seurakunta on SSS:n seurakuntakannassa. Nämä numerot kai vastaavat kuntanumeroita sikäli kun se soveltuu. Muille vastaan tuleville seurakunnille pitää keksiä oma numero (jostain omasta sarjastaan, jottei mene päällekkäin). SSHY:hän on tehnyt näin joidenkin ulkomaisten seurakuntien osalta (esim.7004=Övertorneå), niitä voisi myös katsoa.

Tässä varmaan tulee vastaan se että jokin paikka (esim. kylä/talo) on siirtynyt seurakunnasta toiseen. Kumman seurakuntanumeron alle se sitten pannaan? Ja tietysti seurakunnatkin ovat yhdistyneet ja eronneet.

Ei tunnu hyvältä se että koodeille on varattu vain neljä merkkiä tilaa. Vaikka se varmaan riittääkin ainakin toistaiseksi, tuntuu tuollainen koodi vaikeasti hahmotettavalta. Tuntuisi paremmalta että osat erotettaisiin vaikka väliviivalla jolloin voi jättää etunollat pois eikä koodeilla ole ylärajaa: PR12-345.

Koskisiko tämä numerointi siis kaikkia paikkoja kunkin seurakunnan sisällä? Siis niin että kylä, talot ja torpat ovat samalla "tasolla". Voisi kai myös ajatella että id olisi hierarkkinen: seurakunnnat: PRsss kylät: PRsss-kkk talot: PRsss-kkk-ttt torpat: PRsss-kkk-ttt-xxx Mutta en tiedä olisiko tämä vaivan arvoista. Eikös muuten kylille olekin olemassa numerointi (maarekisterikylä).

Eikö numerointi oikeastaan pitäisi alkaa maatasolta, jolloin ensimmäiset merkit voisivat olla vaikka maakoodi: FI-1-123, SV-22-333 tms?

Koskisiko tämä vain seurakuntia (jotka eivät oikeastaan ole oikeita paikkoja). Entä kunnat, kaupungit, maakunnat, osavaltiot ym? Miten erotettaisiin toisistaan paikkakunta Espoo ja seurakunta Espoo?

elandal commented 3 years ago

Hiskin seurakuntanumerot ovat aakkosellisen järjestyksen mukaisia, eivät kuntanumeroita. Olen käyttänyt kuntanumeroita itse lähteiden id:ssä grampsissa. Erotinmerkkiä hyvä käyttää vaikka käyttäisi 0-padded numerosarjoja.

Paikkojen koodaaminen hierarkiatasojen mukaan maa/kunta/kylä/talo tms on ongelmallinen sen takia, että kaikki rajat ovat muuttuneet aikain saatossa. Ajatus on periaatteessa hyvä, mutta toteutus vaatii pohdintaa sen suhteen, miten käsitellään paikat jotka ovat kuuluneet eri kohtiin paikkahierarkiaa eri aikoina. Jos paikalle voisi antaa useita koodeja aikarajatusti, tätä ongelmaa ei olisi, mutta silloin kyse ei välttämättä ole paikka-id:stä vaan siitä, että tietoa paikasta on koodattu alfanumeeriseksi sarjaksi.

Palautuu lopulta siis id:n tarkoitukseen. Mitä saavutetaan sillä, että se sisältää jotain tietoa (joka on Isotammessa erillisenä paikkaan liittyvänä tietona, esim. paikkahierarkia). Eli: pitäisikö referenssipaikkoja isotammeen tuotaessa luoda näille uudet referenssipaikka-id:t, vai pitäisikö nämä luoda jo Grampsissa? Jos jo Grampsissa, onko tarvetta ID-muodostukselle joka on helppo human readable mielessä? Jos näin, palataan luultavasti geopoliittiseen paikkahierarkiaan joka alkaa maasta, ja joudutaan määrittämään minkä ajankohdan mukaan maa tai pääalue valitaan, kuten myös kuntien jne osalta.