t-tk / upmendex-package

Source/Document distribution of upmendex --- multilingual index processor
Other
5 stars 1 forks source link

upmendex のスタイルファイルの説明, 新オプション kana_head #3

Closed aminophen closed 3 years ago

aminophen commented 3 years ago

upmendex.ja.txt には

   hanzi_head  <文字列>
      ""
      漢字見出し文字列。見出し文字列を";"で区切って指定することにより
      デフォルト設定の文字列を上書きする。(upmendex専用)

と載っていますが,使い方がよくわかっていません。

(1) デフォルト値は空ではなく "漢字" が入っているような気がします。例えば TeX ソースに

漢字だけで,日本語\index{日本語}も入れてみる。

のように読仮名なしのエントリがあると,styfile で lethead_flag 1 を指定したときに索引の見出しには「漢字」が出ます。なお hanzi_head "かんじ" と書けば「かんじ」が出るのは期待通りです。

(2) 見出し文字列を";"で区切って指定,というのが分かりませんでした。たとえば "漢;字" とすると「漢」は出ますが,2個目以降のエントリが有効な状態はどのような場合でしょうか。

t-tk commented 3 years ago

upmendex では漢字は部首順、画数順、ピンイン順、注音符号順のどれかでソートして見出しを立てることができます。 使用例はここの master ブランチの doc/samples に入れてあります。 CTAN版(=TeX Live版)はCTAN投稿時のレビューでファイルが多すぎるとの指摘を受け削ってしまったのでこの例は含まれていないような気がします。 部首順、画数順、ピンイン順、注音符号順の選択は icu_locale の指定で行います。

↓ 部首順で hanzi_head を指定した例。 https://github.com/t-tk/upmendex-package/blob/master/doc/samples/alphabet/mdxsty_zh12.ist

↓ 画数順で hanzi_head を指定した例。 https://github.com/t-tk/upmendex-package/blob/master/doc/samples/alphabet/mdxsty_zh22.ist ‘ Makefileや入出力ファイルを追っていただければご理解いただけると思います。 hanzi_head が空のときのデフォルト値(見出しの文字列の組)は、部首順、画数順、ピンイン順、注音符号順のどれかを選択するとそれぞれの場合の初期値になるようにしていたと思います。

(2021/06/05)追記: 部首順、画数順、ピンイン順、注音符号順のいずれでもない場合、漢字は「漢字」という見出しのところにまとめられます。 その場合は最初にご指摘があったように、hanzi_head に記載した文字列は一つしか現れず、; 以降は無視されます。 これは私の想定通りの動作です。

(2021/06/06)追記: 上記の例 mdxsty_zh12.ist, mdxsty_zh22.ist はCTAN版にも含めてありました。

aminophen commented 3 years ago

ご説明ありがとうございます。なるほど,例を見てかなりわかってきました。

upmendex というより mendex も共通なのですが,スタイルファイル (.ist) の例をサンプルとして提供するほかに,代表的な物を TEXMFDIST/makeindex に置けると参照しやすいのではという気がしました。pBibTeX については幾つかの .bst がインストールされますし,Makeindex 用 .ist も多数収録されていますので,(up)mendex も幾つか標準的なものを作ってはどうかと思いました。

見出しのスタイルなど細かい組み合わせを考えると無数にあるため,何をもって標準とするかは難しいところですが…,少なくとも「これを元にカスタマイズして下さい」的なものが doc/sample/ ではなく runtime にあるだけで助かる人がいそうです。

また,組み合わせが無数にあるケースへも「(up)mendex 起動時に複数の -s styfile オプションを読めるようにする(同じ変数が競合する場合は後が勝つ)」という拡張機能があれば良さそうだと今思いつきましたがどうでしょうか。

t-tk commented 3 years ago

-s styfile オプションを複数読めるようにする、という案は良いと思います。 mendex と共通なので tex-jp-build の方で実装を検討するつもりです。

標準的な .ist とは調べたことも考えたこともなくて何がいいのかよく分かりません。 調べてみます。

t-tk commented 3 years ago

訂正

upmendex では漢字は部首順、画数順、ピンイン順のどれかでソートして見出しを立てることができます。 → upmendex では漢字は部首順、画数順、ピンイン順、注音符号順のどれかでソートして見出しを立てることができます。

t-tk commented 3 years ago

こちらは閉じます。

t-tk commented 3 years ago

https://github.com/t-tk/upmendex-package/releases/tag/v0.58 でマニュアル upmendex.ja.txt, upmendex.1, upmendex.man1.{ps,pdf} に反映完了。