edeposit / edeposit.amqp.aleph

E-Deposit AMQP module for communication with Aleph
MIT License
2 stars 1 forks source link

Implement SemanticInfo structure #26

Closed Bystroushaak closed 10 years ago

Bystroushaak commented 10 years ago

Implement SemanticInfo structure: http://codeuml.com/?635392901213992620, which will be used to track progress of exported document.

jstavel commented 10 years ago

\ schvaleni zaznamu akvizici Těžko se odpovídá, protože já v podstatě zatím nic neschvaluji ani nezamítám. Když mi přijde e-kniha, buď vytvořím v Alephu úplně nový záznam, nebo najdu již existující. V něm pak zkontroluji (a případně opravím či doplním) již zadané základní údaje (název, autor, nakladatel, ISBN atd.). To, že záznam prošel akvizicí poznáš podle akvizičních polí, která tam přidávám (jak u nového, tak u ohlášeného záznamu). A ta jsou POV, HLD a STZ. Právě pole STZ, kde je datum a podpis zpracovatele (mazi), by mohlo sloužit k identifikaci nejlépe. Ovšem to už značí, že e-publikace prošla akvizicí, nikoliv schválení či zamítnutí. To zatím neexistuje, protože když e-publikace není v pořádku, do Alephu vůbec nejdu a vracím ji nakladateli.

Takže stručně: 
1) schválení = zpracování, pole POV, HLD, STZ
2) zamítnutí = nezpracování, tedy nedoplním nic, do záznamu
   nesahám, vracím e-knihu
jstavel commented 10 years ago

978-80-85979-70-1 - prosel akvizici i isbn agenturou. Je v testovaci bazi.

Bystroushaak commented 10 years ago

978-80-85979-70-1 jsem v testovací ani normální bázi nenašel.

jstavel commented 10 years ago

co tyhle? 000002682 -- 978-80-904739-3-5 000002683 -- 978-80-86520-47-6 000002684 -- 978-80-85979-68-8 000002685 -- 978-80-01-05473-4 000002762 -- 978-80-85979-67-1 000002764 -- 978-80-85979-61-9 000002765 -- 978-80-85979-64-0 000002763 -- 978-80-904617-7-2 000002891 -- 978-80-248-2242-6 (online : ePub) 000002892 -- 978-80-248-2242-6 (online : pdf) 000002893 -- 978-80-260-7000-9 (online) 000002894 -- 978-80-260-7000-9 (online) 000002890 -- 978-80-260-7001-6 000002895 -- 978-80-260-7050-4

jstavel commented 10 years ago

to prvni cislo ma byt sysnumber

Bystroushaak commented 10 years ago

Jo, to první (978-80-904739-3-5) tam je.

Bystroushaak commented 10 years ago

Tak jsem přidal detekci ISBN, ale co tak koukám na ty záznamy, tak asi žádný neprošel kompletně akvizicí. Tohle už by měly být zpracované?

Jinak v ani jednom z nich není POV, HLD či STZ.

jstavel commented 10 years ago

Co tyto, cituji Martina: sysna 2762 - 2765

Co se týče testování, všechny 4 e-publikace (sysna 2762 až 2765)
jsem zpracoval a prošly tedy akvizicí. Panu Jeřábkovi jsem poslal
žádost o jejich zpracování včetně návodu, jak se přihlásit na
akvizitora a dostat se k náhledu. Tak snad vše zvládne bez
problémů a úspěšně je zpracuje. 
jstavel commented 10 years ago

Snad dve by tato policka mela mit.

Bystroushaak commented 10 years ago

Já když se na ně kouknu, tak tam vidím

<fixfield id="LDR">-----nam-a22------a-4500</fixfield>
<fixfield id="FMT">BK</fixfield>
<fixfield id="001">nkc20140002765</fixfield>
<fixfield id="003">CZ-PrNK</fixfield>
<fixfield id="005">20140630110029.0</fixfield>
<varfield id="020" i1=" " i2=" ">
<subfield label="a">978-80-85979-64-0 (online : pdf)</subfield>
</varfield>
<varfield id="245" i1="0" i2="0">
<subfield label="a">Dračí doupě plus</subfield>
<subfield label="h">[elektronický zdroj] :</subfield>
<subfield label="b">fantasy hra na hrdiny : příručka povolání čaroděj /</subfield>
<subfield label="c">Petr Machata, Stanislav Nowak</subfield>
</varfield>
<varfield id="260" i1=" " i2=" ">
<subfield label="a">[Ostrava] :</subfield>
<subfield label="b">Altar,</subfield>
<subfield label="c">2012</subfield>
</varfield>
<varfield id="856" i1="4" i2="0">
<subfield label="u">http://edeposit-test.nkp.cz/producents/zizala/epublications/draci-doupe-plus-2/drdplus-carodej.pdf</subfield>
<subfield label="4">N</subfield>
</varfield>
<varfield id="856" i1="4" i2="2">
<subfield label="u">http://edeposit.nkp.cz/</subfield>
<subfield label="4">N</subfield>
</varfield>
<varfield id="910" i1=" " i2=" ">
<subfield label="a">ABA001</subfield>
</varfield>
<varfield id="998" i1=" " i2=" ">
<subfield label="a">http://aleph.nkp.cz/F/?func=direct&amp;doc_number=000002765&amp;local_base=CZE01</subfield>
</varfield>
</oai_marc>
</metadata>
</record>

Tedy žádné POV, HLD či STZ.

jstavel commented 10 years ago

hm.

jstavel commented 10 years ago

Mohl bys docasne tem dotycnym ISBN policka POV,HDL,... doplnit. Tj. staci kdyz v pripade zminenych isbn vratis semanticinfo naplnene? Jde o nasimulovani dalsiho kroku.

Bystroushaak commented 10 years ago

hasISBNAgencyFields beru z polí pro ISBN, takže to už funguje. Ty ostatní tam jsou implementované tak jak píšeš, tedy že to kontroluje HLD a STZ, ale momentálně tam nejsou.

Ten kód teď vypadá takhle:

def toSemanticInfo(xml):
    """
    Pick informations from :class:`.MARCXMLRecord` object and use it to build
    :class:`.SemanticInfo` structure.

    Args:
        xml (str/MARCXMLRecord): MarcXML which will be converted to
            SemanticInfo. In case of str, ``<record>`` tag is required.

    Returns:
        structure: :class:`.SemanticInfo`.

    """
    hasAcquisitionFields = False
    hasISBNAgencyFields = False
    hasCatalogizationFields = False

    parsed = xml
    if not isinstance(xml, MARCXMLRecord):
        parsed = MARCXMLRecord(str(xml))

    if "HLD" in parsed.datafields or "HLD" in parsed.controlfields:
        hasAcquisitionFields = True

    if parsed.getISBNs():
        hasISBNAgencyFields = True

    if "STZ" in parsed.datafields or "STZ" in parsed.controlfields:
        hasCatalogizationFields = True

    return SemanticInfo(
        hasAcquisitionFields,
        hasISBNAgencyFields,
        hasCatalogizationFields
    )
jstavel commented 10 years ago

To je bezva. Ten fake kod si doplnim do zpracovani zaznamu. Nemusis tam zadny fake vkladat. Diky.

Bystroushaak commented 10 years ago

Takže můžeme uzavřít?

jstavel commented 10 years ago

ano.