dzcpy / transliteration

UTF-8 to ASCII transliteration / slugify module for node.js, browser, Web Worker, React Native, Electron and CLI.
http://dzcpy.github.io/transliteration
MIT License
578 stars 52 forks source link

不支援 𠮷𠬠𡬶𫗭𣛙𢎐 ...這類字 #101

Open bluelovers opened 5 years ago

bluelovers commented 5 years ago

不支援 𠮷𠬠𡬶𫗭𣛙𢎐 ...這類字

(我是用 網頁版去測試的 http://dzcpy.github.io/transliteration/

dzcpy commented 5 years ago

測試了下的確不支援這幾個字,這些是屬於 Unicode CJK Extended B 區域中的字,暫時還沒有獲取到相關數據,等我有時間的時候更新下

bluelovers commented 5 years ago

https://data.gov.tw/dataset/5961

dzcpy commented 4 years ago

想問下您主要在哪裡用到這些字符?是在處理古文的時候嗎?哪裡能獲取到這些字符的讀音數據?

bluelovers commented 4 years ago

上面給的連結裡面有這些相關資料

至於用途嘛 例如 可以對漢字 以 讀音 做排序 https://github.com/bluelovers/node-segment/blob/master/script/sort-stringify-cache.ts#L347

另外 有一些也不是古文 而是 追加的新字

dzcpy commented 4 years ago

明白了,我盡量找下讀音,有些字讀音可能已無法考究

bluelovers commented 4 years ago

@dzcpy https://github.com/bluelovers/ws-regexp/tree/master/packages/@lazy-cjk/cns-11643#readme

bluelovers commented 4 years ago

有了這個你可以用來查詢那些缺少的讀音了