program-in-chinese / vscode_english_chinese_dictionary

vscode插件, 实现离线英汉词典功能
https://marketplace.visualstudio.com/items?itemName=CodeInChinese.EnglishChineseDictionary
101 stars 16 forks source link

希望添加音标显示 #39

Open hmilin opened 3 years ago

hmilin commented 3 years ago

单词注释详情中能显示单词音标就完美了

nobodxbodon commented 3 years ago

词典源数据 的确有音标,有兴趣搞个 pr 吗?

jrc96 commented 11 months ago

音标非常有用,希望有

nobodxbodon commented 7 months ago

欢迎pr,在json添加音标数据请参考这里

IOLOII commented 3 months ago

词典源数据 的确有音标,有兴趣搞个 pr 吗?

@nobodxbodon 看了下音标词库体量太大,如何存放音标词库需要先定好,比如托管在服务器开放一个查询音标的接口

image

image

nobodxbodon commented 3 months ago

@IOLOII 如果像之前的 词形变化表 这样将音标数据按照 词:音标 的格式提取出来的话,应该和这个表的体量(3M多)差不多吧?

IOLOII commented 3 months ago

那会也看了下,插件中也是分包的很多个词型文件,组合起来也有42MB 你看的2MB,3MB的是拆包的,如果音标也这样去实现,会不会插件整体太大了

image

nobodxbodon commented 3 months ago

词典1-15包含了所有词汇的释义。词形变化.ts 一个文件就包含所有词汇的词形变化。当时应该是为了避免重新生成一遍词典并拆分,因此选择单独将词形变化放在一个文件。音标也可试试类似处理。 释义部分拆分为这样大小印象里是因为当时ms插件商店的限制。 为了做到离线词典,自带数据似乎是唯一选项。 所有数据每个会话仅载入一次,个人感觉基本不影响使用。

nobodxbodon commented 3 months ago

哦词形变化仅包含了十万词(因为很多词无变化),那音标数据的确应该大不少,但还是比释义小一些吧。 也可以考虑选取常用的几万词提供音标。

IOLOII commented 3 months ago

21万音标.zip

@nobodxbodon 你看下这份文件中的涵盖范围怎样。这是我在词典源数据 中通过其中的ecdict.csv文件生成后查询的数据剔除了无音标和释意后的文件

nobodxbodon commented 3 months ago

过滤得挺好。请问第二和四列为何需要呢?

"wireless fidelity","wirelessfidelity","ˈwaɪəlɪs fiˈdeliti","760129"
IOLOII commented 3 months ago

一,二列的没有仔细对比,第四列sql count没关系的,删了就可以