avh-bern-berlin / avh-texts

AvH texts
https://www.humboldt.unibe.ch
2 stars 0 forks source link

Spanish "calderón" symbols, other typographical issues #8

Closed rexclark2 closed 3 years ago

rexclark2 commented 3 years ago

Related to #2, I'm reviewing the challenges/nightmare we had editing and getting this Spanish text through the print process and would like best recommendations for updating the xml file to match original and print versions. Screen Shot 2021-05-21 at 09 16 39

  1. There are 2 symbols for 1000s abbreviation, research reference is here: Cajori, 1928, pp. 61-62. For printing we used the GREEK LETTER SAMPI U+03E0 for this, but in the xml now there is use of <!ENTITY abbr1000 "000">. Seems like would be nice to use the sampi and have abbr label to show what the sampi means, how best to code this?
  2. The other symbol which we also have a few cases of in other texts is inverted "lf" calderón. Screen Shot 2021-05-21 at 08 50 52 There is a unicode inverted "f" U+025F but the inverted "lf"combination doesn't look like much, so use a graphic png instead? use a large "U"?
  3. Also in this file are some fractions printed horizontally, as above example. In print edition, these were normalized, in xml is now formula notation="TeX". Do we even bother trying to represent these as in original or stay with normalized fractions?
haoess commented 3 years ago

ad 1: Was genau ist die 1000, das nach der 71 in der 1. Zeile (also das zwischen 71 und de, wie würde das im Dezimalsystem aussehen?) oder das in der 4. Zeile nach 10.062?

ad 2: Ja, wahrscheinlich wäre ein entsprechendes PNG hier die beste Wahl: ... text <figure facs="if.png"/> ... text.

ad 3:

as above example

Wo genau (sorry, ich kenn mich da nicht so gut aus)?

rexclark2 commented 3 years ago

ad 1: 4. Zeile = 10.062.000 Can we still mark both "calderón" symbols with <!ENTITY abbr1000 "000">or some other explanatory tag? ad 3: 1. Zeile, this is 71.375 = 3/8 (numbers horizontal)

haoess commented 3 years ago

ad 1.: Ich würde gerne auf DTD-Angaben wie Entity-Referenzen verzichten (das macht nämlich anderweitig eine Kanne Würmer auf ...). Würde das hier reichen?

<choice>
  <abbr>10.062&#x03e0;</abbr>
  <expan>10.062.000</expan>
</choice>

ad 3.: Ah, jetzt sehe ich es. Folgende Möglichkeit:

<formula notation="TeX" style="transform:rotate(-90deg)">\frac{3}{8}</formula>

Das @style-Attribut (evtl. nicht DTABf-kompatibel) bekommt beliebiges CSS als Inhalt, und wird von <formula> unterstützt.

Für 1. und 3. habe ich unser Testdokument entsprechend erweitert.

rexclark2 commented 3 years ago

Looks good to me, very nice solution for both, thanks!

haoess commented 3 years ago

@rexclark2

Wäre es okay für Dich, wenn ich in folgenden Dateien:

global alle Vorkommen von &abbr1000; durch

<choice><abbr>&#x03e0;</abbr><expan>.000</expan></choice>

ersetze (betrifft nur diese 4 Files)?

Alternative (um die ganze Zahl in abbr/expan zu packen) wäre: Ersetze (\d+(\.\d+)*)&abbr1000; durch

<choice><abbr>$1&#x03e0;</abbr><expan>$1.000</expan></choice>

Hintergrund: Ich möchte gerne für alle Files die XML-Deklaration (= das, was vor <TEI ...> kommt) vereinheitlichen, damit würde auch die Doctype-Deklaration <!DOCTYPE author [<!ENTITY abbr1000 "000"> entfallen.

rexclark2 commented 3 years ago

Sure, go for it, let's get it cleaned up. There are a couple that use the other inverted "lf" thing, but will fix per hand.

I guess I would go with option 2. Alternative-die ganze Zahl, but maybe without the leading period, since most have this in the text, so "000" instead of ".000", will also have to check these manually.

rexclark2 commented 3 years ago

@haoess Not the best image, but for now, can we put this in the right directory for when we need it? abbr1000-sp-calderon-lf.png Thanks. Also, I'm pretty sure these are the only 4 files, might be other editors have this, but would not have marked it.

abbr1000-sp-calderon-lf

haoess commented 3 years ago

Besten Dank, ich hab das Bild zum Text-Repo hinzugefügt: https://github.com/avh-bern-berlin/avh-texts/tree/main/xml/img

Die Einbindung dieses (und evtl. weiterer, zukünftiger) Bildes läuft dann via @facs="calderon-1000.png" (also ohne die Angabe von img/ als Pfadangabe), für die Darstellung im Web wird das automatisch richtig gemacht.

Für diese Art von Abbildungen, die inline im Textfluss stehen, bitte @type="inline", also <figure type="inline" facs="..."/> benutzen, im konkreten Fall dann: <figure type="inline" facs="calderon-1000.png"/>

Testdarstellung gibt's hier.

Gibt es eine Projektdokumentation zum Tagging, wo ich das eintragen kann?

Ansonsten hab ich die XML-Dateien noch nicht angepasst, weil ich mich nochmal vergewissern möchte:

but maybe without the leading period, since most have this in the text

Nee, ich finde kein einziges Vorkommen von &abbr1000; mit . davor.

rexclark2 commented 3 years ago

Ansonsten hab ich die XML-Dateien noch nicht angepasst, weil ich mich nochmal vergewissern möchte:

but maybe without the leading period, since most have this in the text

Nee, ich finde kein einziges Vorkommen von &abbr1000; mit . davor.

OK, I guess not a problem then, so blast away at the files whenever you want. Thanks!

haoess commented 3 years ago

Done via 5eccd237d7fa4d

rexclark2 commented 3 years ago

Awesome, very nice, looks like this is done, I'll close it now and take care of the image cases myself.