Open wittyResry opened 6 years ago
二. 查询技巧
多并发读写提升吞吐量
批量处理请求
全表扫描时关闭块缓存功能
扫描时使用扫描缓存
严格限制查找范围
三. 其它
定期触发major_compact 太频繁地major_compact会给集群带来I/O压力,不过当表中有太多的已删除数据影响了查找速度的话,执行major_compact彻底删除这些数据无疑是最佳选择。目前,我们在使用的是hbase-1.0.0-cdh5.4.5版本,默认的major_compact周期是7天,用户也可以通过命令行或者客户端API手动触发compact操作。
尽量使用简短的列名 HBase的数据存储是key-value的形式,也就是<行键-列族-列-时间戳,值>。换句话说,为每一个单元格,HBase都存储了列名,因此使用较简短的列名也是一个好习惯。
参考:
合理设计列族
使用块缓存
在内存中
布隆过滤器
生存期TTL
使用压缩
预拆分Region