nie-ine / npm-package

npm package for the NIE-INE component collection
MIT License
2 stars 0 forks source link

Add configuration option for highlight - service #9

Open janCstoffregen opened 6 years ago

janCstoffregen commented 6 years ago

so that some content is ignored, like described here:

https://github.com/dhlab-basel/Salsah/pull/234#issuecomment-381061783

tobiasschweizer commented 6 years ago

Consider the following sample text (letter "L176-O" from http://beol.dasch.swiss):

<div>
   <div id="transcription">

      <p>Hochwohlgebohrner Herr</p>

      <p>Hochgeehrtester Herr <em>Etats</em> Rath
      </p>

      <p>Bey dem Antritt dieses neuen Jahrs lege ich zuvorderst meinen herzlichsten Wunsch
         für das beständige Wohlseyn Eur. Hochwohlgeb. ab, und empfehle mich dabey gehorsamst
         sammt den meinigen zu Dero fortdaurenden Wohlgewogenheit<span class="math">\(\,.\,\)</span> Zugleich statte ich auch Eur. Hochwohlgeb. meine verpflichtetste Danksagung ab für
         den gütigen Antheil welchen Dieselben an unserem Zustand zu nehmen belieben und habe
         das Vergnügen Eur. Hochwohlgeb. zu berichten, daß&nbsp;S[ein]<span class="math">\(\,{}^{\text{e}}\,\)</span> Königl[iche] <em>Majestät<a class="salsah-link" href="http://rdfh.ch/biblio/DhgjcrRhRfunaSt77-bUxg"></a></em> bey dem Anfang dieses Jahrs Dero Pathen unsern ältesten Sohn mit einer jährlichen
         Besoldung von <a class="salsah-link" href="http://rdfh.ch/biblio/bP1CO3j3TCOUHYdQqKw9pA"></a><span class="math">\(\,200\,\)</span> Rthl. begnadiget.<a class="salsah-link" href="http://rdfh.ch/0801/beol/spy5H95GTV2RElphXFPbbw"><sup>1</sup></a></p>

      <p>Ich habe nun schon eine geraume Zeit so viel andere Geschäfte gehabt daß&nbsp;ich an <em>numeri</em>sche <em>Theoremata</em>, dergleichen ich Eur. Hochwohlgeb. das letste mal vorzulegen die Ehre gehabt, nicht
         habe denken können. Die <em>Partes Matheseos applicatae</em> nehmen mir die meiste Zeit weg, wo es immer mehr zu untersuchen gibt, je mehr man
         damit umgeht.<a class="salsah-link" href="http://rdfh.ch/0801/beol/KvfXRPkXTziMYMVYSz9tBg"><sup>2</sup></a></p>

      <p>Weil nun mein Kopf mit so viel anderen Sachen angefüllet ist, so mag das wohl die
         Ursache seyn, daß&nbsp;ich mich in das von Eur. Hochwohlgeb. <em>communicir</em>te und nach der Hand verbesserte <em>Theorema</em> nicht finden kan. Vielleicht haben Eur. Hochwohlgeb. vergessen noch eine wesentliche
         <em>Condition</em> hinzuzusetzen.<a class="salsah-link" href="http://rdfh.ch/0801/beol/FJCOlKBdRtW8caqnN4A3Vw"><sup>3</sup></a></p>

      <p>Das <em>Theorema</em> war: <em>Si sit</em><span class="math">\(\,aa+bb=P^{2}+eQ^{2}\,\)</span><em>erit etiam</em></p>

      <p>
         <span class="math">\(\,a^{2}+\left(\left(2e+1\right)b-eP-eQ\right)^{2}=M^{2}+eN^{2}\text{;}\,\)</span>

      </p>

      <p>weil ich den Grund desselben nicht einsehen konnte, so habe ich die Richtigkeit desselben
         durch <em>Exempel</em> erforschen wollen.
      </p>

      <p>I. Da <span class="math">\(\,1^{2}+4^{2}=17=3^{2}+2\cdot 2^{2}\,\)</span>, so ist <span class="math">\(\,a=1\,\)</span>, <span class="math">\(\,b=4\,\)</span>, <span class="math">\(\,P=3\,\)</span>, <span class="math">\(\,Q=2\,\)</span> und <span class="math">\(\,e=2\,\)</span>, allso müste seyn
      </p>

      <p>
         <span class="math">\(\,1^{2}+\left(5\cdot 4-2\cdot 3-2\cdot 2\right)^{2}=1^{2}+10^{2}=101=M^{2}+2N^{2}\,\)</span>

      </p>

      <p>welches unmöglich ist.</p>

      <p>II. Da <span class="math">\(\,9^{2}+4^{2}=97=7^{2}+3\cdot 4^{2}\,\)</span>, so ist <span class="math">\(\,a=9\,\)</span>; <span class="math">\(\,b=4\,\)</span>; <span class="math">\(\,P=7\,\)</span>; <span class="math">\(\,Q=4\,\)</span> und <span class="math">\(\,e=3\,\)</span>, allso müsste seyn
      </p>

      <p>
         <span class="math">\(\,9^{2}+\left(7\cdot 4-3\cdot 7-3\cdot 4\right)^{2}=9^{2}+5^{2}=106=M^{2}+3N^{2}\,\)</span>

      </p>

      <p>welches ebenfalls unmöglich ist.</p>

      <p>Da ich nun nicht einmal ein <em>Exempel</em> finden kan, welches einträfe, so schliesse ich daraus, daß&nbsp;eine gewisse Bedingung
         in den Zahlen <span class="math">\(\,a\,\)</span>, <span class="math">\(\,b\,\)</span>, <span class="math">\(\,P\,\)</span> und <span class="math">\(\,Q\,\)</span> müsse weggelassen seyn, welche ich aber nicht ausfündig machen kan.<a class="salsah-link" href="http://rdfh.ch/0801/beol/kZeMXLrQTQONISqizXtf5g"><sup>4</sup></a></p>

      <p>Ich habe dem H. <em>Spener<a class="salsah-link" href="http://rdfh.ch/biblio/Z_-TT-8_QNSRv-O7dKCW0w"></a></em> zu wissen gethan, daß&nbsp;Eur. Hochwohlgeb. die Rechnung für die überschickten Bücher
         verlangen; bekomme ich dieselbe vor Schliessung dieses Briefs, wie ich ihm habe sagen
         lassen, so werde ich sie beylegen.<a class="salsah-link" href="http://rdfh.ch/0801/beol/08Y_rCK5QM-gvchjtixomw"><sup>5</sup></a></p>

      <p>Sonsten da er nicht alle verlangte Bücher gehabt, so werde ich inskünftige dergleichen
         <em>Commission</em>en dem <em>M.<span class="math">\(\,{}^{\text{r}}\,\)</span>Neaulme<a class="salsah-link" href="http://rdfh.ch/biblio/FsJNrctNTMuwJPCX-7OTVg"></a></em>, welcher weit <em>activer</em> ist und alles schaffen kan, auftragen. Wegen des Werks: <em>La Clef du Cabinet des Princes<a class="salsah-link" href="http://rdfh.ch/biblio/up0Q0ZzPSLaULC2tlTs1sA"></a><a class="salsah-link" href="http://rdfh.ch/biblio/sAImr-uGRBGpsdBdoI6XCw"></a></em> füge hier die Antwort des <em>M.<span class="math">\(\,{}^{\text{r}}\,\)</span>de Bourdeaux<a class="salsah-link" href="http://rdfh.ch/biblio/vR3fWAXxRqShBZvWKVA9tA"></a></em> bey.<a class="salsah-link" href="http://rdfh.ch/0801/beol/nRO3f9ENSsqTH8S0Z1uO9w"><sup>6</sup></a></p>

      <p>Sollte dasselbe vor der Ankunft einer <em>Resolution</em> von Eur. Hochwohlgeb. schon verkauft worden seyn, so hat sich <em>M.<span class="math">\(\,{}^{\text{r}}\,\)</span></em><em>Neaulme<a class="salsah-link" href="http://rdfh.ch/biblio/FsJNrctNTMuwJPCX-7OTVg"></a></em> anheischig gemacht, dasselbe auch zu liefern.
      </p>

      <p>Ich habe die Ehre mit der schuldigsten Hochachtung zu verharren</p>

      <p>Eur. Hochwohlgebohrnen</p>

      <p>gehorsamster Diener</p>

      <p>
         <em>L. Euler</em>

      </p>

      <p><em>Berlin</em> den 3<span class="math">\(\,{}^{\text{ten}}\,\)</span><em>Januarii</em></p>

      <p>1756.</p>

      <p>
         <sub>Berlin, January 3rd, 1756</sub>

      </p>

      <p>
         <sub>Original, 1 fol. – RGADA, f. 181, n. 1413, č. V, fol. 123rv</sub>

      </p>

      <p>
         <sub>Published: <em>Correspondance</em> (1843), t. I, p. 636–637; <em>Euler-Goldbach</em> (1965), p. 385–386</sub>

      </p>

   </div>
   <div id="references">
      <ol></ol>
   </div>
</div>

Everything in between <span class="math">...</span should be excluded from highlighting since this would break the LaTeX. The problem is that LaTeX is stored as plain text (it is not represented in standoff).

So if someone searches for "text" also the \text{...} macros are found and would be highlighted. And then MathJax cannot render the math correctly.

We might think about excluding LaTeX from fulltext search, but we won't do it anytime soon (this would involve quite some work I think).

janCstoffregen commented 6 years ago

Hi, I'll do this as my next task, starting on Tuesday. Thank you for your patience!!

tobiasschweizer commented 6 years ago

Ok :-)

Thanks!

tobiasschweizer commented 6 years ago

It would also be great if the amount of text could be reduced to the context surrounding the search terms (so the user only sees the highlighted search terms and some context).

This cold be tricky because of the markup submitted wit the text.