alibaba / mdrill

for千亿数据即席分析
https://github.com/alibaba/mdrill
Apache License 2.0
1.54k stars 764 forks source link

数据不准确,怎么搞呀? #81

Open clarke0922 opened 10 years ago

clarke0922 commented 10 years ago

我有个txt文本数据,列分割是tab,数据量是1627254条 thedate数据列的值是固定值20130101 通过hadoop fs -copyFromLocal msn.txt /mdrill/tablelist/msn/dt=20130101 拷贝到目录 然后通过./bluewhale mdrill index建立索引 通过sql.jsp页面查询数据量和带条件的语句查询出来的结果,跟我数据库的查询的结果有差异。

请问这个问题会是什么造成的呢? 难道是端口有问题吗?请解!~

muyannian commented 10 years ago

检查你的调度配置,如果出现了 69xx端口 说明你调度配置错误