wakhub / monodict

Faster PDIC dictionary for Android
https://play.google.com/store/apps/details?id=com.github.wakhub.monodict
Apache License 2.0
9 stars 10 forks source link

create new dic #2

Open rexi1r opened 8 years ago

rexi1r commented 8 years ago

@k-kagurazaka . @wakhub how can i create new dic for my local language?

wakhub commented 8 years ago

I have no experience to create a new dic. But the below process might work. Unfortunately, all explanation are Japanese.

  1. Create csv dictionary by following http://189info.sitemix.jp/PDICnewdic.pdf
  2. Convert the file to one-line format by PDIC app http://homepage3.nifty.com/TaN/unicode/

About one-line format

http://homepage3.nifty.com/TaN/unicode/help/OneLineFormat.html

見出語、訳語、用例が一行で表される形式です。 例:見出語 /// 訳語 / 用例 見出語部と訳語部の区切りは” /// “(半角スペース+スラッシュ3つ+半角スペース)です。訳語部と用例部の区切りはPDICテキスト形式と同じ、” / “(半角スペース+スラッシュ1つ+半角スペース)です。 訳語部、用例部には改行コードを含めることが出来ます。改行コードは” \ “(半角スペース+円マーク+半角スペース)です。見出語部には改行コードは使えません。 PDICテキスト形式と比べ以下の特徴があります。 ・改行コードを扱える ・見出語部と訳語部の順番が逆になることがない。従って、テキストエディターによる編集が楽。 注意! 旧PDICとの互換性のために用意されています。編集で便利であるから、など特別な理由が無い限り、より汎用的なCSV形式を使用されることをお薦めします。

http://ebstudio.info/manual/EBStudio/5_0_1_3.html

PDIC1行テキスト形式は、PDICで使用されるデータ交換用のテキストファイルです。拡張子は*.TXTです。 次のように英単語、日本語訳、用例が一行で表される形式です。 【例】 英単語 /// 日本語訳 / 用例 英単語と日本語訳の区切りは /// (半角スペース+スラッシュ3つ+半角スペース)です。 日本語訳と用例の区切りは / (半角スペース+スラッシュ1つ+半角スペース)です。 日本語訳、用例には改行コードを含めることが出来ます。 改行コードは \ (半角スペース+円マーク+半角スペース)です。 なお、英単語には改行コードは使えません。 /// の左側の文字列から、前方一致・後方一致・クロス検索インデックスを生成します。ただし、かな検索インデックスは作成できません。複合検索はPDICテキスト形式に準じます。