yankj12 / blog

技术研究、管理实践、其他的一些文章
MIT License
1 stars 2 forks source link

python读取文件 #67

Open yankj12 opened 4 years ago

yankj12 commented 4 years ago

Python的文本文件的内容读取中,有三类方法:read()、readline()、readlines(),这三种方法各有利弊。

read():

read()是最简单的一种方法,一次性读取文件的所有内容放在一个大字符串中,即存在内存中

        file_object = open('test.txt') //不要把open放在try中,以防止打开失败,那么就不用关闭了
        try:
            file_context = file_object.read() //file_context是一个string,读取完后,就失去了对test.txt的文件引用
            #  file_context = open(file).read().splitlines() 
            // file_context是一个list,每行文本内容是list中的一个元素
        finally:
            file_object.close()
        //除了以上方法,也可用with、contextlib都可以打开文件,且自动关闭文件,
        //以防止打开的文件对象未关闭而占用内存

方便、简单

一次性独读出文件放在一个大字符串中,速度最快

文件过大的时候,占用内存会过大

readline():

readline()逐行读取文本,结果是一个list

        with open(file) as f:
            line = f.readline()
            while line:
                print line
                line = f.readline()

占用内存小,逐行读取

由于是逐行读取,速度比较慢

readlines():

readlines()一次性读取文本的所有内容,结果是一个list

        with open(file) as f:
          for line in f.readlines():
             print line

这种方法读取的文本内容,每行文本末尾都会带一个'\n'换行符 (可以使用L.rstrip('\n')去掉换行符)

一次性读取文本内容,速度比较快

随着文本的增大,占用内存会越来越多

最简单、最快速的逐行处理文本的方法:直接for循环文件对象

    file_object = open('test.txt','rU')
    try: 
        for line in file_object:
             do_somthing_with(line)//line带"\n"
    finally:
         file_object.close()

参考 Python 读取txt文本文件