Closed GoogleCodeExporter closed 9 years ago
1.cPickle处理了索引数据,但没有处理data数据,因为这会导致�
��序很大,加载很慢。所以放弃。
2.已经完成
3.目标行解析已经完成,但没有整理接口
4.打印显示行,应该是有的。
数据文件api,暂时不会有统一的写与更改的接口。因为我的��
�据来源很杂,每组来源不一样,都
经过几道工序才得到最后合成的字典文件。
但我希望提供读的接口。query是一定要提供的。
数据格式,目前一行一个字的数据。用\t分组,组内再用k/v形
式的list。至于您提到的\v代替
\t,恐怕并非最好的解决办法。至少现在还可以直接浏览。而
字段顺序,程序读取后都放到了类
成员中,所以只是习惯,不是关键。unicode放在开头可以更容�
��肉眼浏览定位。
没有使用数据库还是为了方便下载安装,不想缺的东西太多��
�打个包非常臃肿。
Original comment by abloz...@gmail.com
on 17 Feb 2010 at 12:23
完成了接口定义。
modules/data.py
提供查询汉字接口,返回指定汉字的文件行接口。
Original comment by abloz...@gmail.com
on 17 Feb 2010 at 4:50
Original issue reported on code.google.com by
shuge....@gmail.com
on 17 Feb 2010 at 4:31