Closed kdr154 closed 4 years ago
@mtrojan-ub https://github.com/ubtue/zotero-enhancement-maps/blob/bcbc0b2716f6a7633839c666200e5c6a02ca9bdc/zotero_harvester.conf#L121 Kannst du als match pattern für review das Abstract rausnehmen? Dadurch vermeiden wir viele ungewollte Matches wie es z.B. hier der Fall ist: https://doi.org/10.1080/00310328.2020.1738145
ABSTRACT In this article, I review three recent articles. In the first, Asscher and Boaretto (2018. ‘Absolute time ranges in the plateau...
Die Änderung wurde auf nu eingespielt, allerdings sieht es nicht so aus als ob das im Issue beschriebene Problem jetzt vollständig gelöst ist. Vermutlich gibt es noch ein Translator-seitiges Problem:
MetadataRecord {
url: https://doi.org/10.1080/00310328.2020.1769343,
item_type: review,
title: Epidemics,
publication_title: Palestine Exploration Quarterly,
volume: 152,
issue: 2,
pages: 79,
date: 2020-04-02,
doi: 10.1080/00310328.2020.1769343,
language: eng,
issn: 1743-1301,
superior_ppn: 382930320,
superior_type: 2,
ssg: 2,
creators: [
{
first_name: J. Bjørnar,
last_name: Storfjell,
type: author,
},
],
keywords: [ Book Reviews ],
}
Mit Scaffold wird "Book Reviews" nicht erzeugt. Nur im Harvester. Habe auch Seitenquelltext untersucht und dort finde ich auch kein match-pattern für
let sectionheading = ZU.xpathText(doc, '//div[@class="toc-heading"]');
if (sectionheading) {
sectionheading = sectionheading.trim();
if (sectionheading.match(/^(Book )?(Reviews|Symposium)?$/i))
item.tags.push("Book Reviews");
}
view-source:https://www.tandfonline.com/doi/full/10.1080/00310328.2020.1769343
12:17:25 Returned item:
{
"itemType": "journalArticle"
"creators": [
{
"firstName": "J. Bjørnar"
"lastName": "Storfjell"
"creatorType": "author"
}
]
"notes": []
"tags": []
"seeAlso": []
"attachments": [
{
"title": "Full Text PDF"
"mimeType": "application/pdf"
}
{
"title": "Snapshot"
}
]
"itemID": "doi:10.1080/00310328.2020.1769343"
"title": "Epidemics"
"publicationTitle": "Palestine Exploration Quarterly"
"volume": "152"
"issue": "2"
"pages": "79-79"
"date": "April 2, 2020"
- "publisher": "Routledge"
"DOI": "10.1080/00310328.2020.1769343"
"url": "https://doi.org/10.1080/00310328.2020.1769343"
- "_eprint": "https://doi.org/10.1080/00310328.2020.1769343"
- "bookTitle": "Palestine Exploration Quarterly"
"ISSN": "0031-0328"
"libraryCatalog": "Taylor and Francis+NEJM"
- "accessDate": "2020-07-06T10:17:25Z"
}
12:17:25 Translation successful
Ich nehme an dass es sich um ein Priority-Problem handelt und der Server den falschen Translator einsetzt. Das lässt sich aber aufgrund mangelnder Log-Einträge nicht so einfach nachvollziehen. siehe zotero/translation-server#115
weder mit Atypton noch mit Embedded Metadata/DOI Translators kommt der Tag "Book Reviews" mit, daher denke ich nicht, dass es ein Priority-Problem ist.
OK, anderer Ansatz.
Wenn ich diese URL hier Teste: https://www.tandfonline.com/doi/full/10.1080/00310328.2020.1725283
Liefert mir Scaffold dieses Ergebnis ("Taylor and Francis+NEJM"):
16:19:50 Returned item:
{
"itemType": "journalArticle"
"creators": [
{
"firstName": "David M."
"lastName": "Jacobson"
"creatorType": "author"
}
]
"notes": []
"tags": [
{
- "tag": "Palestine Exploration Fund"
+ "tag": "Book Reviews"
}
{
- "tag": "Levantine archaeology"
+ "tag": "British learned societies"
}
{
- "tag": "nineteenth-century exploration"
+ "tag": "Elizabeth Finn"
}
{
- "tag": "Holy Land studies"
+ "tag": "George Grove"
}
{
- "tag": "British learned societies"
+ "tag": "Holy Land studies"
}
{
- "tag": "George Grove"
+ "tag": "Levantine archaeology"
}
{
- "tag": "Walter Besant"
+ "tag": "Palestine Exploration Fund"
}
{
- "tag": "Elizabeth Finn"
+ "tag": "Walter Besant"
}
{
- "tag": "Book Reviews"
+ "tag": "nineteenth-century exploration"
}
]
"seeAlso": []
"attachments": [
{
"title": "Full Text PDF"
"mimeType": "application/pdf"
}
{
"title": "Snapshot"
}
]
"itemID": "doi:10.1080/00310328.2020.1725283"
"title": "The funding of the PEF in its early years, associated issues and responses"
"publicationTitle": "Palestine Exploration Quarterly"
"volume": "152"
"issue": "2"
"pages": "147-169"
"date": "April 2, 2020"
- "publisher": "Routledge"
"DOI": "10.1080/00310328.2020.1725283"
"url": "https://doi.org/10.1080/00310328.2020.1725283"
- "_eprint": "https://doi.org/10.1080/00310328.2020.1725283"
"abstractNote": "The PEF was founded as a charity, relying almost entirely on public generosity for its funding. Its insecure financial basis was at odds with its ambitious programme of surveys and excavations, which required sizeable and stable funding for periods of years. This dichotomy precipitated financial crises which occasionally brought the organisation almost to its knees. Yet, despite all the odds, it managed to chalk up impressive achievements. The financial shortcomings and the ways in which they were addressed, as well as the special factors responsible for the ultimate success of early PEF endeavours, are examined and discussed."
- "bookTitle": "Palestine Exploration Quarterly"
"ISSN": "0031-0328"
"libraryCatalog": "Taylor and Francis+NEJM"
- "accessDate": "2020-07-06T14:19:50Z"
}
16:19:50 Translation successful
Und da ist "tag": "Book Reviews" enthalten.
Ich nehme an dass der Regex falsch ist:
if (sectionheading.match(/^(Book )?(Reviews|Symposium)?/i))
item.tags.push("Book Reviews");
Da auf beide Klammern ein Fragezeichen folgt ist in beiden Fällen der Inhalt optional, somit matcht der Regex auch auf einen Leerstring.
Ja, das stimmt. Ich habe ihn übersehen, da ich nicht selbst am Werk war:) Dann ändere ich den Regex und teste, ob es dann stimmt.
Moment mal bei mir lokal ist der Regex so: /^(Book )?(Reviews|Symposium)?$/i
(siehe auch https://github.com/ubtue/DatenProbleme/issues/1040#issuecomment-654148066) Also mit Endmatches "$". So macht der Regex NICHT auf einen Leerstring. Ich habe ihn nun geändert.
@mtrojan-ub bitte nach commit "ready for testing" hinzufügen.
Doch, das matcht auf Leerstring, siehe auch: https://regex101.com/r/sc7sHm/1
Ich bin nicht sicher worauf Du genau matchen willst und worauf nicht... kannst Du mir ein paar positiv + negativ Beispiele nennen? Dann kann ich Dir evtl auch einen Regex schreiben der dafür geeignet ist.
Ob "Book Symposium"-Artikel als Rezension zu behandeln sind, muss noch entscheiden werden. https://github.com/ubtue/DatenProbleme/issues/721
translators auf nu wurden aktualisiert => ready for testing
Korrekt jetzt
Bei diesem Heft https://www.tandfonline.com/toc/ypeq20/152/2?nav=tocList werden alle Artikel ausnahmslos als Rezensionen getagt. Nur die letzten beiden sind Rezenionen.