tkinter
sqlite3
pdfplumber
re
requests
os
json
mainpage.py
(本来是多个文件分开的,但是为了打包成可执行文件所以合并到一起)
DataForUse
目录下的两个单词数据库。(本项目不需要联网)
exported_list
目录下。exported_list
目录下。pdfplumber
的 API 读取 PDF 文件,然后利用正则匹配单一大写字母且剩下小写字母或者全部小写字母的单词。为了筛选出常用词汇,利用10多本书的单词,按照词频排序,生成一个高词频的词单。这些词单中大多数将不会被匹配,比如冠词、不定式等等。sqlite3
数据库默认的二叉搜索和 threading
的多线程,分别在高频词汇库(大约13000个词,内含词频)和中频词汇库(34万个词)进行查找。查找完成后在数据库内生成表格,存储收集的信息,以便背诵使用。test_memery.py
DataForUse
目录下的自动生成的 test_memery.db
。(本项目需要联网)
WORD: xxxx
形式),生成关于一个英文单词的至少有 35 个英文例句及更多词意的 txt 文档供学习。在主程序控制台以英文词义检测掌握程度,设置正确次数大于错误次数 2 值后不再复习(后期准备通过遗忘曲线控制熟练度)。requests
库的 session
进行多次连续爬取:先按照词汇查询网页网址规律找到目标单词的网页,在网页源代码中有时直接导成 json
拼接或者利用正则匹配特定的 tag 如 <audio>.*?</audio>
。