gunyarakun / kantan-ej-dictionary

English-Japanese dictionary
MIT License
61 stars 6 forks source link

簡短英日辞典

英日辞典です。JSON形式で提供されます。

英語の見出し語ごとに、複数の日本語訳が列挙されています。また、見出し語ごとに、出現頻度情報やレベル情報を持っています。

元となった辞典は、Jam Systems Inc.による、ANC(American National Corpus)準拠 英和頻度辞典(28,000語)です。その辞典の見出し語は、American National Corpus Frequency Dataで公開されている、出現頻度別見出し語リストから選ばれています。

英語による字幕の単語ごとに、日本語の意味をルビとして振る目的で編集を始めました。

方針

規則

ANC準拠 英和頻度辞典との差分

元となった辞典をHTMLからTSVファイルに変換したものは、sources/ancdic.tsvに格納してあります。 また、ANCの頻度順辞書もsources/ANC-all-count.txt, sources/ANC-spoken-count.txt, sources/ANC-written-count.txtに格納してあります。

ライセンス

MITライセンスです。ただし、sourcesディレクトリに入るファイルは含まれません。

今後の方針

やること

やらないこと

悩み