Open 954031894 opened 7 months ago
你可以更换掉你们spark环境内的hive-jar的版本
直接更换spark得hive相关jar包吗?这个的话已经尝试过了,还是报错,调用的一些函数找不到。修改spark2.4.8源码的hive版本也不行,同样是一些函数。
我这边这个修改了hive-jdbc-1.2.1.spark2的HiveStatement中这个方法,没有让他抛出异常,而是声明了一个变量,并在该方法中进行赋值。目前不会抛出这个异常。 但是油抛出sql分析异常。我这边正在尝试解决。 我这边这些问题都发生在Hive表中,在doris中没有发现这些问题
Search before asking
What happened
在使用hive作为数据源,使用spark作为计算引擎时,发生报错,报错原因是不支持statement.setQueryTimeOut方法。 根据报错提示找到报错问题,法相与spark使用的hive-jdbc的jar包版本有关 我使用的是spark-2.4.8-bin-hadoop2.7,其中的hive-jdbc版本是1.2.1.spark2。该jar源码不支持该方法。 我看了其他spark2.4.x的版本,发现使用的都是1.2.1.spark2版本。 我尝试了修改hive得版本为2.1.0对spark2.4.8进行编译,但是由于hive版本跨度比较大,无法直接通过这种简单的方法修改hive版本。 我查看了一下spark3的hive版本,发现是2.3.7的,但是datavines不支持spark3,这种方法也无法成功使用spark引擎。 不知道测试使用的是什么spark版本,与我的spark2.4.8有什么不同
DataVines Version
1.0.0-SNAPSHOT
DataVines Config
Running Command
Error Exception
Engine Type
spark-2.4.8-bin-hadoop2.7
Java Version
1.8
Screenshots
datavines报错提示
根据报错信息找到报错位置spark2.4.8的jars的hive-jdbc版本是1.2.1.spark2(该版本没有setQueryTimeOut方法)
Are you willing to submit PR?