prestodb / presto

The official home of the Presto distributed SQL query engine for big data
http://prestodb.io
Apache License 2.0
16.07k stars 5.38k forks source link

prestodb + parquet bug #18691

Open yushide opened 2 years ago

yushide commented 2 years ago

我使用的presto版本为:0.260.1 建表语句为: CREATE TABLE ads.erp_delivery_summary( sku string, lines_name string, shop_name string, branch_name string, number bigint) PARTITIONED BY ( delivery_time string) ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe' STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat' LOCATION 'hdfs://master:9000/data/hive/warehouse/ads.db/erp_delivery_summary'

现在遇到的问题:

1668568444(1)

当我根据lines_name字段过滤 值为:C-E邮宝,却查询不到记录: image 而使用 like '%C-E邮宝' 可以过滤出来 image

runan520 commented 2 years ago

是不是字符尾部有空格

yushide commented 2 years ago

是不是字符尾部有空格

尾部和开头都没有特殊字符,我在hive 命令行窗口执行可以正常返回数据

runan520 commented 2 years ago

中文字符是不是不支持用引号 换个esc下面的符号

yushide commented 2 years ago

中文字符是不是不支持用引号 换个esc下面的符号

并不是像是特殊字符的问题,我创建了一个新的表,使用orc格式,然后把原表数据导过去后,presto可以正常过滤,说明数据本身没问题。

rohanpednekar commented 1 year ago

Hi @shangxinli Do you think you can help here?