NLCR / registrdigitalizace

Národní knihovna - Registr Digitalizace
4 stars 2 forks source link

nesprávný údaj SIGLA1 v importu z Alephu (xml) #38

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
Prosím prověřit, odkud se bere SIGLA1 při importech xml z NK. Všechny 
takto importované záznamy musejí mít SIGLA1 ABA000. Vyskytují se záznamy 
s čísly zakázek (novými, používanými výhradně NK), které mají siglu 
jinou. Příklad: číslo zakázky 49279. Jestli se sigla bere z 040a, je to 
špatně! Buď musí být sigla pro takto importované záznamy natvrdo, nebo 
se musí brát z 910(konkrétně z 910 s indikátorem 1 - ale pole s jinými 
indikátory by se exportovat z alephu nemělo). hedv

Original issue reported on code.google.com by helena....@gmail.com on 4 Mar 2011 at 8:53

GoogleCodeExporter commented 9 years ago

Original comment by martin.n...@incad.cz on 6 Mar 2011 at 10:43

GoogleCodeExporter commented 9 years ago
Sigla při importech z marc-xml se bere z pole 040a.
A ještě je tam hack který z hodnoty ABA001 dělá hodnotu ABA000.

Zasílám ukázku jednoho záznamu který nám z NK přišel k importu v 
marc-xml.
Jak je vidět hodnoty polí 040a a pole 910 s indikátorm 1 jsou identické 
"ABA001".
A tak je to myslím u všech záznamů.
Importní program je napsán obecně, ale je možné do něj vložit 
specifické podmínky například pro národní knihovnu, viz hack s ABA001 -> 
ABA000. Ovšem vložení hodnoty na tvrdo je nežádoucí, už kvůli ostatním 
knihovnám, které mají zcela jiné SIGLY.
Někdo zodpovědný, kdo tomu rozumí by tedy měl řící z jakého pole se 
maá při importech brát hodnota SIGLA.

   <record>
      <leader>     nam a22      a 4500</leader>
      <controlfield tag="FMT">BK</controlfield>
      <controlfield tag="001">np9439979</controlfield>
      <controlfield tag="003">CZ PrNK</controlfield>
      <controlfield tag="005">20080711100106.0</controlfield>
      <controlfield tag="007">ta</controlfield>
      <controlfield tag="008">950410s1873    xr     e l    001   cze</controlfield>
      <datafield tag="020" ind1=" " ind2=" ">
         <subfield code="a">(Váz.)</subfield>
      </datafield>
      <datafield tag="035" ind1=" " ind2=" ">
         <subfield code="a">(OCoLC)85659239</subfield>
      </datafield>
      <datafield tag="040" ind1=" " ind2=" ">
         <subfield code="a">ABA001</subfield>
         <subfield code="b">cze</subfield>
      </datafield>
      <datafield tag="043" ind1=" " ind2=" ">
         <subfield code="a">e-xr---</subfield>
         <subfield code="a">e-au---</subfield>
      </datafield>
      <datafield tag="045" ind1=" " ind2=" ">
         <subfield code="a">w5w5</subfield>
      </datafield>
      <datafield tag="072" ind1=" " ind2="7">
         <subfield code="a">343</subfield>
         <subfield code="x">Trestní právo</subfield>
         <subfield code="2">Konspekt</subfield>
         <subfield code="9">16</subfield>
      </datafield>
      <datafield tag="080" ind1=" " ind2=" ">
         <subfield code="a">343</subfield>
         <subfield code="2">MRF</subfield>
      </datafield>
      <datafield tag="080" ind1=" " ind2=" ">
         <subfield code="a">(437.3)</subfield>
         <subfield code="2">MRF</subfield>
      </datafield>
      <datafield tag="080" ind1=" " ind2=" ">
         <subfield code="a">(436)</subfield>
         <subfield code="2">MRF</subfield>
      </datafield>
      <datafield tag="080" ind1=" " ind2=" ">
         <subfield code="a">(094.5)</subfield>
         <subfield code="2">MRF</subfield>
      </datafield>
      <datafield tag="110" ind1="1" ind2=" ">
         <subfield code="a">ÄŚesko</subfield>
      </datafield>
      <datafield tag="240" ind1="1" ind2="0">
         <subfield code="a">Trestní zákon (1852)</subfield>
      </datafield>
      <datafield tag="245" ind1="1" ind2="0">
         <subfield code="a">Zákon trestní o zločinech, přečinech a přestupcích pro císařství Rakouské vydaný dne 27. května 1852, č. 117 říš. zák. :</subfield>
         <subfield code="b">se zákonem o tisku, s jinými zákony, nařízeními a rozhodnutími nejv. soudu v příčině práva trestního vydanými, jakož i s abecedním rejstříkem</subfield>
      </datafield>
      <datafield tag="260" ind1=" " ind2=" ">
         <subfield code="a">V Praze :</subfield>
         <subfield code="b">Tiskem a nákladem dra. Edvarda Grégra</subfield>
         <subfield code="c">1873</subfield>
      </datafield>
      <datafield tag="300" ind1=" " ind2=" ">
         <subfield code="a">505 s. ;</subfield>
         <subfield code="c">18 cm</subfield>
      </datafield>
      <datafield tag="500" ind1=" " ind2=" ">
         <subfield code="a">Obsahuje rejstřík</subfield>
      </datafield>
      <datafield tag="648" ind1=" " ind2="7">
         <subfield code="a">19. stol.</subfield>
         <subfield code="2">czenas</subfield>
      </datafield>
      <datafield tag="650" ind1="0" ind2="7">
         <subfield code="a">trestní právo</subfield>
         <subfield code="z">ÄŚesko</subfield>
         <subfield code="y">19. stol.</subfield>
         <subfield code="2">czenas</subfield>
      </datafield>
      <datafield tag="650" ind1="0" ind2="7">
         <subfield code="a">trestní právo</subfield>
         <subfield code="z">Rakousko</subfield>
         <subfield code="y">19. stol.</subfield>
         <subfield code="2">czenas</subfield>
      </datafield>
      <datafield tag="655" ind1=" " ind2="7">
         <subfield code="a">zákony</subfield>
         <subfield code="2">czenas</subfield>
      </datafield>
      <datafield tag="710" ind1="1" ind2="2">
         <subfield code="a">ÄŚesko.</subfield>
         <subfield code="t">Tiskový zákon (1862)</subfield>
      </datafield>
      <datafield tag="910" ind1="1" ind2=" ">
         <subfield code="a">ABA001</subfield>
      </datafield>
      <datafield tag="928" ind1="9" ind2=" ">
         <subfield code="a">Edvard Grégr</subfield>
      </datafield>
      <datafield tag="ITM" ind1=" " ind2=" ">
         <subfield code="b">1000356422</subfield>
         <subfield code="c">63 C 000828/D.1-2.</subfield>
         <subfield code="d">D.1-2.</subfield>
         <subfield code="v"/>
         <subfield code="i"/>
         <subfield code="y"/>
      </datafield>
      <controlfield tag="SYS">000104743</controlfield>
   </record>

Original comment by martin.n...@incad.cz on 7 Mar 2011 at 7:08

GoogleCodeExporter commented 9 years ago
Nevim, kdo psal zadani na zpracovani xml, ale pocitalo se urcite s tim, ze z NK 
jdou do digitalizace jen stare veci a tam skutecne 040a=9101a. Ted se tam 
zacaly zrejme posilat veci nove a tam tomu tak byt nemusi (do baze se dostavaji 
i zaznamy zpracovane jinymi knihovnami). Taky neni dobre, ze se prevadi ABA001 
na ABA000. To bylo urcite nepochopeni v ramci NK. Pocitam s tim, ze probereme 
vse, co souvisi s importy a transformacemi co nejdrive - budou muset byt 
zmeny.hedv

Original comment by helena....@gmail.com on 7 Mar 2011 at 8:04

GoogleCodeExporter commented 9 years ago
Oprava bude zahrnuta v nové verzi importního programu.

Original comment by martin.n...@incad.cz on 6 Apr 2011 at 2:01

GoogleCodeExporter commented 9 years ago
Očekávala jsem, že novou verzi importního programu budeme tvořit s MNo ve 
spolupráci. Mělo by se vyjít z mapovací tabulky - který údaj z xml / z 
importního xls(csv) do jakého pole v bázi, jak řešit opakovatelnost apod. 
Nepsala jsem do ISSUES zvlášť požadavky NK či návrhy NK zahrnuté v 
rozesílaných přílohách, protože jsem předpokládala, že to probereme na 
technických schůzkách: zmiňovala jsem např. nutnost více výskytů pole 
ISSN/ISBN a zahrnutí neplatných ččnb (další výskyty), přidání pole 
pro variantní název, který je pro některá periodika naprosto nezbytný ap. 
Takhle je možné, že bude posléze nutno dost věcí předělat. hedv  

Original comment by helena....@gmail.com on 7 Apr 2011 at 6:41

GoogleCodeExporter commented 9 years ago
NK by měla sepsat pořadavky na funkčnost nového importního systému. Mělo 
by to stačit krátce v bodech co všechno by nový systém měl umět. 

Poté pravděpodobně proběhne ještě finanční kalkulace, která bude muset 
být schválena :/

Já bych se zapojil až do řešení konkrétního technického provedení.

Požadavků bude spousta, protože se ukázalo že k některým polím se bude 
muset přistupovat jiným způsobem než se přistupovalo do teď. viz to co 
psala paní HEDV o ISSN, ISBN atd.

Počet druhů importních dat, jde o rozdělění stávající jedné excel 
tabulky na více různých tabulek.

Proběhla informace o požadavku na to že by systém měl generovat nějaký 
web kde by se každý přispivatel mohl proklikat k informacím o importování 
svých dat. atp.

Pak je tu přesné definování všech požadavků na registr, protože po 
poslední technické schůzce to vypadalo že bude potřeba upravit i trochu 
strukturu, vyvstal požadavek možnosti hlásit do registru plánovanou 
digitalizaci na dvou úrovních, na úrovni předlohy a titulu.

A myslim že jsem nevyčerpal všechny zamýšlené požadavky NK.

Original comment by martin.n...@incad.cz on 7 Apr 2011 at 9:05

GoogleCodeExporter commented 9 years ago
Při zkoumání dat jsem narazil na jednu věc, kterou nechápu.
Je to význam taxů v XML.

Zatím co národní knihovna posílá záznamy s ind1="1"
      <datafield tag="910" ind1="1" ind2=" ">
         <subfield code="a">ABA001</subfield>
      </datafield>

ale z MZK mi přišlo ind1=" "
      <datafield tag="910" ind1=" " ind2=" ">
         <subfield code="a">BOA001</subfield>
      </datafield>

A vzhledem k tomu co bylo napsáno 
citace: "nebo se musí brát z 910(konkrétně z 910 s indikátorem 1 - ale 
pole s jinými indikátory by se exportovat z alephu nemělo"

Tak nerozumim tomu kdy je tag "ind1" platný a kdy ne? ... nebo stačí aby tam 
ten tag byl a je jedno jakou má hodnotu?

Original comment by martin.n...@incad.cz on 19 Apr 2011 at 9:05

GoogleCodeExporter commented 9 years ago
Vsechny knihovny krome NK by mely posilat 910 bez indikatoru. Indikator se 
pouziva jen v NK kvuli sdilene katalogizaci pro odliseni vlastnictvi zaznamu a 
do RD se posila vyhradne pole 910 s indikatorem 1. Mozna by slo dohodnout s 
kolegou Zahorikem, aby pri xml exportu indikator potlacil, pokud to dela 
problemy. Nebo to nastavit - "bud indikator zadny, nebo 1".

Original comment by helena....@gmail.com on 19 Apr 2011 at 9:18

GoogleCodeExporter commented 9 years ago
Upraven Importní program.
Bere SIGLA z pole 910a ind1

Přítomnost/nepřítomnost indikátoru jsem vyřešil není třeba dalších 
úprav v XML.

Byl odstraněn i HACK který z ABA001 dělal ABA000.

Original comment by martin.n...@incad.cz on 20 Apr 2011 at 8:41