est / hzdq

Automatically exported from code.google.com/p/hzdq
0 stars 0 forks source link

重新设计和实现API,提供数据查询接口 #3

Closed GoogleCodeExporter closed 9 years ago

GoogleCodeExporter commented 9 years ago
1. 使用cPickle加载数据和索引到内存
2. 从索引得到目标字的pos, 通过pos在数据文件得到目标行
3. 把目标行解析
4. 打印/显示行 

1~3的实现要改一下,提供简单、明了、干净的API 

数据文件API
 方法
  - 添加 add
  - 删除 delete
  - 查询 read/query/locate
  - 更新 update
  - 清空 clear
  - 合并 merge
  - 备份 backup
  - 恢复 restore
 接口
  - CLI (py, c ...)
  - GUI (wxpy, pygtk, gtk+ ...)
  - Web UI (django ...) 

Original issue reported on code.google.com by shuge....@gmail.com on 17 Feb 2010 at 4:31

GoogleCodeExporter commented 9 years ago
1.cPickle处理了索引数据,但没有处理data数据,因为这会导致�
��序很大,加载很慢。所以放弃。
2.已经完成
3.目标行解析已经完成,但没有整理接口
4.打印显示行,应该是有的。

数据文件api,暂时不会有统一的写与更改的接口。因为我的��
�据来源很杂,每组来源不一样,都
经过几道工序才得到最后合成的字典文件。
但我希望提供读的接口。query是一定要提供的。

数据格式,目前一行一个字的数据。用\t分组,组内再用k/v形
式的list。至于您提到的\v代替
\t,恐怕并非最好的解决办法。至少现在还可以直接浏览。而
字段顺序,程序读取后都放到了类
成员中,所以只是习惯,不是关键。unicode放在开头可以更容�
��肉眼浏览定位。

没有使用数据库还是为了方便下载安装,不想缺的东西太多��
�打个包非常臃肿。

Original comment by abloz...@gmail.com on 17 Feb 2010 at 12:23

GoogleCodeExporter commented 9 years ago
完成了接口定义。
modules/data.py 
提供查询汉字接口,返回指定汉字的文件行接口。

Original comment by abloz...@gmail.com on 17 Feb 2010 at 4:50