Closed Andyfan322 closed 1 year ago
@Andyfan322 感谢你的详尽的测试报告。 有几个问题想了解一下你的测试环境的具体setup:
另外一个可能可以考察的点是HDFS是否存在作业或者namenode过载。如果在这种情形下, 部署Alluxio也可能带来性能的提升。
你好,测试过程需要修改HIVE每张表的LOCATION配置吗?(从hdfs://修改为alluxio://) 可以分享下alluxio的config配置吗.
This issue has been automatically marked as stale because it has not had recent activity. It will be closed in two weeks if no further activity occurs. Thank you for your contributions.
Will close it for now, feel free to reopen it and contact us if this is a strong request.
1、总述
presto + alluxio
查询 VSpresto
查询对比性能基本没提升!2、集群信息
集群:CDH 5.15.2,hadoop 2.6.x ,presto(0.228) , alluxio(1.8.1)
机器配置如下
3、测试
测试:基于
hive-testbench
的TPC-DS的分析查询测试 ,hive-testbench的github地址 ,导入数据约30G,格式为orc。方法:使用Java代码连接presto,查询3次分别记录时间,再取平均值。也就是说每个查询会有4个时间记录,然后导出excel,基于excel数据做图表,单次查询的伪代码如下:
4、表信息
5、查询分析(单位:毫秒,“-alluxio” 说明是有alluxio的查询)
6、单表查询(st)的sql
7、多表查询(mt)的sql