ubtue / DatenProbleme

0 stars 0 forks source link

ISSN 1743-1301 | Palestine Exploration Quarterly | Artikel als Rezensionen getagt #1040

Closed kdr154 closed 4 years ago

kdr154 commented 4 years ago

Bei diesem Heft https://www.tandfonline.com/toc/ypeq20/152/2?nav=tocList werden alle Artikel ausnahmslos als Rezensionen getagt. Nur die letzten beiden sind Rezenionen.

socheres commented 4 years ago

@mtrojan-ub https://github.com/ubtue/zotero-enhancement-maps/blob/bcbc0b2716f6a7633839c666200e5c6a02ca9bdc/zotero_harvester.conf#L121 Kannst du als match pattern für review das Abstract rausnehmen? Dadurch vermeiden wir viele ungewollte Matches wie es z.B. hier der Fall ist: https://doi.org/10.1080/00310328.2020.1738145

ABSTRACT In this article, I review three recent articles. In the first, Asscher and Boaretto (2018. ‘Absolute time ranges in the plateau...

mtrojan-ub commented 4 years ago

Die Änderung wurde auf nu eingespielt, allerdings sieht es nicht so aus als ob das im Issue beschriebene Problem jetzt vollständig gelöst ist. Vermutlich gibt es noch ein Translator-seitiges Problem:

MetadataRecord {
    url: https://doi.org/10.1080/00310328.2020.1769343,
    item_type: review,
    title: Epidemics,
    publication_title: Palestine Exploration Quarterly,
    volume: 152,
    issue: 2,
    pages: 79,
    date: 2020-04-02,
    doi: 10.1080/00310328.2020.1769343,
    language: eng,
    issn: 1743-1301,
    superior_ppn: 382930320,
    superior_type: 2,
    ssg: 2,
    creators: [
        {
            first_name: J. Bjørnar,
            last_name: Storfjell,
            type: author,
        },
    ],
    keywords: [ Book Reviews ],
}
socheres commented 4 years ago

Mit Scaffold wird "Book Reviews" nicht erzeugt. Nur im Harvester. Habe auch Seitenquelltext untersucht und dort finde ich auch kein match-pattern für

let sectionheading = ZU.xpathText(doc, '//div[@class="toc-heading"]');
    if (sectionheading) {
        sectionheading = sectionheading.trim();
        if (sectionheading.match(/^(Book )?(Reviews|Symposium)?$/i))
            item.tags.push("Book Reviews");
    }

view-source:https://www.tandfonline.com/doi/full/10.1080/00310328.2020.1769343

12:17:25 Returned item:
           {
             "itemType": "journalArticle"
             "creators": [
               {
                 "firstName": "J. Bjørnar"
                 "lastName": "Storfjell"
                 "creatorType": "author"
               }
             ]
             "notes": []
             "tags": []
             "seeAlso": []
             "attachments": [
               {
                 "title": "Full Text PDF"
                 "mimeType": "application/pdf"
               }
               {
                 "title": "Snapshot"
               }
             ]
             "itemID": "doi:10.1080/00310328.2020.1769343"
             "title": "Epidemics"
             "publicationTitle": "Palestine Exploration Quarterly"
             "volume": "152"
             "issue": "2"
             "pages": "79-79"
             "date": "April 2, 2020"
         -   "publisher": "Routledge"
             "DOI": "10.1080/00310328.2020.1769343"
             "url": "https://doi.org/10.1080/00310328.2020.1769343"
         -   "_eprint": "https://doi.org/10.1080/00310328.2020.1769343"
         -   "bookTitle": "Palestine Exploration Quarterly"
             "ISSN": "0031-0328"
             "libraryCatalog": "Taylor and Francis+NEJM"
         -   "accessDate": "2020-07-06T10:17:25Z"
           }
12:17:25 Translation successful
mtrojan-ub commented 4 years ago

Ich nehme an dass es sich um ein Priority-Problem handelt und der Server den falschen Translator einsetzt. Das lässt sich aber aufgrund mangelnder Log-Einträge nicht so einfach nachvollziehen. siehe zotero/translation-server#115

socheres commented 4 years ago

weder mit Atypton noch mit Embedded Metadata/DOI Translators kommt der Tag "Book Reviews" mit, daher denke ich nicht, dass es ein Priority-Problem ist. image

mtrojan-ub commented 4 years ago

OK, anderer Ansatz.

Wenn ich diese URL hier Teste: https://www.tandfonline.com/doi/full/10.1080/00310328.2020.1725283

Liefert mir Scaffold dieses Ergebnis ("Taylor and Francis+NEJM"):

16:19:50 Returned item:
           {
             "itemType": "journalArticle"
             "creators": [
               {
                 "firstName": "David M."
                 "lastName": "Jacobson"
                 "creatorType": "author"
               }
             ]
             "notes": []
             "tags": [
               {
         -       "tag": "Palestine Exploration Fund"
         +       "tag": "Book Reviews"
               }
               {
         -       "tag": "Levantine archaeology"
         +       "tag": "British learned societies"
               }
               {
         -       "tag": "nineteenth-century exploration"
         +       "tag": "Elizabeth Finn"
               }
               {
         -       "tag": "Holy Land studies"
         +       "tag": "George Grove"
               }
               {
         -       "tag": "British learned societies"
         +       "tag": "Holy Land studies"
               }
               {
         -       "tag": "George Grove"
         +       "tag": "Levantine archaeology"
               }
               {
         -       "tag": "Walter Besant"
         +       "tag": "Palestine Exploration Fund"
               }
               {
         -       "tag": "Elizabeth Finn"
         +       "tag": "Walter Besant"
               }
               {
         -       "tag": "Book Reviews"
         +       "tag": "nineteenth-century exploration"
               }
             ]
             "seeAlso": []
             "attachments": [
               {
                 "title": "Full Text PDF"
                 "mimeType": "application/pdf"
               }
               {
                 "title": "Snapshot"
               }
             ]
             "itemID": "doi:10.1080/00310328.2020.1725283"
             "title": "The funding of the PEF in its early years, associated issues and responses"
             "publicationTitle": "Palestine Exploration Quarterly"
             "volume": "152"
             "issue": "2"
             "pages": "147-169"
             "date": "April 2, 2020"
         -   "publisher": "Routledge"
             "DOI": "10.1080/00310328.2020.1725283"
             "url": "https://doi.org/10.1080/00310328.2020.1725283"
         -   "_eprint": "https://doi.org/10.1080/00310328.2020.1725283"
             "abstractNote": "The PEF was founded as a charity, relying almost entirely on public generosity for its funding. Its insecure financial basis was at odds with its ambitious programme of surveys and excavations, which required sizeable and stable funding for periods of years. This dichotomy precipitated financial crises which occasionally brought the organisation almost to its knees. Yet, despite all the odds, it managed to chalk up impressive achievements. The financial shortcomings and the ways in which they were addressed, as well as the special factors responsible for the ultimate success of early PEF endeavours, are examined and discussed."
         -   "bookTitle": "Palestine Exploration Quarterly"
             "ISSN": "0031-0328"
             "libraryCatalog": "Taylor and Francis+NEJM"
         -   "accessDate": "2020-07-06T14:19:50Z"
           }
16:19:50 Translation successful

Und da ist "tag": "Book Reviews" enthalten.

Ich nehme an dass der Regex falsch ist:

if (sectionheading.match(/^(Book )?(Reviews|Symposium)?/i))
     item.tags.push("Book Reviews");

Da auf beide Klammern ein Fragezeichen folgt ist in beiden Fällen der Inhalt optional, somit matcht der Regex auch auf einen Leerstring.

socheres commented 4 years ago

Ja, das stimmt. Ich habe ihn übersehen, da ich nicht selbst am Werk war:) Dann ändere ich den Regex und teste, ob es dann stimmt.

socheres commented 4 years ago

Moment mal bei mir lokal ist der Regex so: /^(Book )?(Reviews|Symposium)?$/i (siehe auch https://github.com/ubtue/DatenProbleme/issues/1040#issuecomment-654148066) Also mit Endmatches "$". So macht der Regex NICHT auf einen Leerstring. Ich habe ihn nun geändert.

socheres commented 4 years ago

@mtrojan-ub bitte nach commit "ready for testing" hinzufügen.

mtrojan-ub commented 4 years ago

Doch, das matcht auf Leerstring, siehe auch: https://regex101.com/r/sc7sHm/1

grafik

Ich bin nicht sicher worauf Du genau matchen willst und worauf nicht... kannst Du mir ein paar positiv + negativ Beispiele nennen? Dann kann ich Dir evtl auch einen Regex schreiben der dafür geeignet ist.

socheres commented 4 years ago

Ob "Book Symposium"-Artikel als Rezension zu behandeln sind, muss noch entscheiden werden. https://github.com/ubtue/DatenProbleme/issues/721

mtrojan-ub commented 4 years ago

translators auf nu wurden aktualisiert => ready for testing

kdr154 commented 4 years ago

Korrekt jetzt