w3c / jlreq-d

Requirements for Japanese Digital Text Layout
17 stars 3 forks source link

Space between Japanese and Western characters: Treatment of combined characters (㌀㎏) #42

Open kidayasuo opened 10 months ago

kidayasuo commented 10 months ago

和欧間スーペースの定義をUnicode全体に広げようとしています。jlreq-d’s spacing property に提案がありますが、何点か議論のある文字についてJLReq TFで議論したく。

組文字について

JLReq においてはこれらは cl-12/13 前置・後置省略記号であり、漢字、欧文両方にベタとして取り扱われています。 その扱いでOK?

ちなみに、両方にベタなものは: cl-01/02 始め終わり括弧(全角と考えて) cl-05/06/07 中点と句読点(全角と考えて) cl-03 ハイフン cl-08 分離禁止文字(EM DASH や三点リーダなど) cl-14 和字間隔 cl-26 欧文間隔 cl-12 前置省略(全角通貨記号$¥) cl-13 後置省略(%、℃、全角単位、SQUARED KANA 含む) (使い方 cl-20 合印中の文字(数字などどの文字でも))

KobayashiToshi commented 10 months ago

%,℃と同じで,アラビア数字との間はベタでよい.

なお,“%”と,その前に配置するアラビア数字との間を空ける方式もあるが,それは少数派だと思います.

そもそも組文字の“㌔”や“㍉”などは,通常のテキストの中では使うのは避けた方がよく,スペースがないなど,特別の場合に使用するもので,一般の組版ルールとは別扱いと考えた方がよい.

KobayashiToshi commented 10 months ago

組文字,特に単位はSI単位を使えばよいのであって,いってみれば簡易な表記,手抜きの表記ともいえるもので,主に縦組で使うものでしょう.しかも,他の単位以外の組文字を含めてスペースの節約が目的の1つでしょうから,ラテン文字とのアキやアラビア数字とのアキは取らなくてよいでしょう.

himorin commented 9 months ago

くくりだすとしたらBlock=CJK_Compatibilityでしょうか? と思ったんですが、令和とかいくつかの単位記号がなぜかEnclosed_CJK_Letters_And_Monthsにいますね。。何だろうか、、Unicodeの間違い?歴史的事情?

xfq commented 9 months ago

Regarding ㋿, since the CJK Compatibility block was fully allocated, it was encoded at the very end of the previous block, i.e., Enclosed CJK Letters and Months, as U+32FF.

himorin commented 9 months ago

ahh,, I misread (in my head) between GC and block...