hive读取lzo文件问题

DeprecatedLzoTextInputFormat和LzoTextInputFormat中会使用到lzo.text.input.format.ignore.nonlzo，如果设置为true（默认值），会使得所有不是".lzo"的文件名结尾的文件都会被remove掉，如果设置为false, 则会用TextInputFormat来处理这些文件(非以.lzo结尾文件名的文件)同时会过滤掉.lzo.index结尾的文件，这样就可以同时处理lzo和非lzo文件。

参考: https://github.com/twitter/hadoop-lzo/blob/master/src/java/com/hadoop/mapred/DeprecatedLzoTextInputFormat.java https://github.com/twitter/hadoop-lzo/blob/master/src/java/com/hadoop/compression/lzo/LzoInputFormatCommon.java

dianping / cosmos-hive

hive读取lzo文件问题 #9