Open hmilin opened 3 years ago
词典源数据 的确有音标,有兴趣搞个 pr 吗?
音标非常有用,希望有
欢迎pr,在json添加音标数据请参考这里。
词典源数据 的确有音标,有兴趣搞个 pr 吗?
@nobodxbodon 看了下音标词库体量太大,如何存放音标词库需要先定好,比如托管在服务器开放一个查询音标的接口
@IOLOII 如果像之前的 词形变化表 这样将音标数据按照 词:音标
的格式提取出来的话,应该和这个表的体量(3M多)差不多吧?
那会也看了下,插件中也是分包的很多个词型文件,组合起来也有42MB 你看的2MB,3MB的是拆包的,如果音标也这样去实现,会不会插件整体太大了
词典1-15包含了所有词汇的释义。词形变化.ts
一个文件就包含所有词汇的词形变化。当时应该是为了避免重新生成一遍词典并拆分,因此选择单独将词形变化放在一个文件。音标也可试试类似处理。
释义部分拆分为这样大小印象里是因为当时ms插件商店的限制。
为了做到离线词典,自带数据似乎是唯一选项。
所有数据每个会话仅载入一次,个人感觉基本不影响使用。
哦词形变化仅包含了十万词(因为很多词无变化),那音标数据的确应该大不少,但还是比释义小一些吧。 也可以考虑选取常用的几万词提供音标。
过滤得挺好。请问第二和四列为何需要呢?
"wireless fidelity","wirelessfidelity","ˈwaɪəlɪs fiˈdeliti","760129"
一,二列的没有仔细对比,第四列sql count没关系的,删了就可以
单词注释详情中能显示单词音标就完美了