edeposit / edeposit.amqp.aleph

E-Deposit AMQP module for communication with Aleph
MIT License
2 stars 1 forks source link

Implement SemanticInfo structure #26

Closed Bystroushaak closed 9 years ago

Bystroushaak commented 10 years ago

Implement SemanticInfo structure: http://codeuml.com/?635392901213992620, which will be used to track progress of exported document.

jstavel commented 9 years ago

\ schvaleni zaznamu akvizici Těžko se odpovídá, protože já v podstatě zatím nic neschvaluji ani nezamítám. Když mi přijde e-kniha, buď vytvořím v Alephu úplně nový záznam, nebo najdu již existující. V něm pak zkontroluji (a případně opravím či doplním) již zadané základní údaje (název, autor, nakladatel, ISBN atd.). To, že záznam prošel akvizicí poznáš podle akvizičních polí, která tam přidávám (jak u nového, tak u ohlášeného záznamu). A ta jsou POV, HLD a STZ. Právě pole STZ, kde je datum a podpis zpracovatele (mazi), by mohlo sloužit k identifikaci nejlépe. Ovšem to už značí, že e-publikace prošla akvizicí, nikoliv schválení či zamítnutí. To zatím neexistuje, protože když e-publikace není v pořádku, do Alephu vůbec nejdu a vracím ji nakladateli.

Takže stručně: 
1) schválení = zpracování, pole POV, HLD, STZ
2) zamítnutí = nezpracování, tedy nedoplním nic, do záznamu
   nesahám, vracím e-knihu
jstavel commented 9 years ago

978-80-85979-70-1 - prosel akvizici i isbn agenturou. Je v testovaci bazi.

Bystroushaak commented 9 years ago

978-80-85979-70-1 jsem v testovací ani normální bázi nenašel.

jstavel commented 9 years ago

co tyhle? 000002682 -- 978-80-904739-3-5 000002683 -- 978-80-86520-47-6 000002684 -- 978-80-85979-68-8 000002685 -- 978-80-01-05473-4 000002762 -- 978-80-85979-67-1 000002764 -- 978-80-85979-61-9 000002765 -- 978-80-85979-64-0 000002763 -- 978-80-904617-7-2 000002891 -- 978-80-248-2242-6 (online : ePub) 000002892 -- 978-80-248-2242-6 (online : pdf) 000002893 -- 978-80-260-7000-9 (online) 000002894 -- 978-80-260-7000-9 (online) 000002890 -- 978-80-260-7001-6 000002895 -- 978-80-260-7050-4

jstavel commented 9 years ago

to prvni cislo ma byt sysnumber

Bystroushaak commented 9 years ago

Jo, to první (978-80-904739-3-5) tam je.

Bystroushaak commented 9 years ago

Tak jsem přidal detekci ISBN, ale co tak koukám na ty záznamy, tak asi žádný neprošel kompletně akvizicí. Tohle už by měly být zpracované?

Jinak v ani jednom z nich není POV, HLD či STZ.

jstavel commented 9 years ago

Co tyto, cituji Martina: sysna 2762 - 2765

Co se týče testování, všechny 4 e-publikace (sysna 2762 až 2765)
jsem zpracoval a prošly tedy akvizicí. Panu Jeřábkovi jsem poslal
žádost o jejich zpracování včetně návodu, jak se přihlásit na
akvizitora a dostat se k náhledu. Tak snad vše zvládne bez
problémů a úspěšně je zpracuje. 
jstavel commented 9 years ago

Snad dve by tato policka mela mit.

Bystroushaak commented 9 years ago

Já když se na ně kouknu, tak tam vidím

<fixfield id="LDR">-----nam-a22------a-4500</fixfield>
<fixfield id="FMT">BK</fixfield>
<fixfield id="001">nkc20140002765</fixfield>
<fixfield id="003">CZ-PrNK</fixfield>
<fixfield id="005">20140630110029.0</fixfield>
<varfield id="020" i1=" " i2=" ">
<subfield label="a">978-80-85979-64-0 (online : pdf)</subfield>
</varfield>
<varfield id="245" i1="0" i2="0">
<subfield label="a">Dračí doupě plus</subfield>
<subfield label="h">[elektronický zdroj] :</subfield>
<subfield label="b">fantasy hra na hrdiny : příručka povolání čaroděj /</subfield>
<subfield label="c">Petr Machata, Stanislav Nowak</subfield>
</varfield>
<varfield id="260" i1=" " i2=" ">
<subfield label="a">[Ostrava] :</subfield>
<subfield label="b">Altar,</subfield>
<subfield label="c">2012</subfield>
</varfield>
<varfield id="856" i1="4" i2="0">
<subfield label="u">http://edeposit-test.nkp.cz/producents/zizala/epublications/draci-doupe-plus-2/drdplus-carodej.pdf</subfield>
<subfield label="4">N</subfield>
</varfield>
<varfield id="856" i1="4" i2="2">
<subfield label="u">http://edeposit.nkp.cz/</subfield>
<subfield label="4">N</subfield>
</varfield>
<varfield id="910" i1=" " i2=" ">
<subfield label="a">ABA001</subfield>
</varfield>
<varfield id="998" i1=" " i2=" ">
<subfield label="a">http://aleph.nkp.cz/F/?func=direct&amp;doc_number=000002765&amp;local_base=CZE01</subfield>
</varfield>
</oai_marc>
</metadata>
</record>

Tedy žádné POV, HLD či STZ.

jstavel commented 9 years ago

hm.

jstavel commented 9 years ago

Mohl bys docasne tem dotycnym ISBN policka POV,HDL,... doplnit. Tj. staci kdyz v pripade zminenych isbn vratis semanticinfo naplnene? Jde o nasimulovani dalsiho kroku.

Bystroushaak commented 9 years ago

hasISBNAgencyFields beru z polí pro ISBN, takže to už funguje. Ty ostatní tam jsou implementované tak jak píšeš, tedy že to kontroluje HLD a STZ, ale momentálně tam nejsou.

Ten kód teď vypadá takhle:

def toSemanticInfo(xml):
    """
    Pick informations from :class:`.MARCXMLRecord` object and use it to build
    :class:`.SemanticInfo` structure.

    Args:
        xml (str/MARCXMLRecord): MarcXML which will be converted to
            SemanticInfo. In case of str, ``<record>`` tag is required.

    Returns:
        structure: :class:`.SemanticInfo`.

    """
    hasAcquisitionFields = False
    hasISBNAgencyFields = False
    hasCatalogizationFields = False

    parsed = xml
    if not isinstance(xml, MARCXMLRecord):
        parsed = MARCXMLRecord(str(xml))

    if "HLD" in parsed.datafields or "HLD" in parsed.controlfields:
        hasAcquisitionFields = True

    if parsed.getISBNs():
        hasISBNAgencyFields = True

    if "STZ" in parsed.datafields or "STZ" in parsed.controlfields:
        hasCatalogizationFields = True

    return SemanticInfo(
        hasAcquisitionFields,
        hasISBNAgencyFields,
        hasCatalogizationFields
    )
jstavel commented 9 years ago

To je bezva. Ten fake kod si doplnim do zpracovani zaznamu. Nemusis tam zadny fake vkladat. Diky.

Bystroushaak commented 9 years ago

Takže můžeme uzavřít?

jstavel commented 9 years ago

ano.