tannal / ohmywork

0 stars 0 forks source link

Multi-Core, Main-Memory Joins: Sort vs. Hash Revisited #52

Open tannal opened 7 months ago

tannal commented 7 months ago

https://dl.acm.org/doi/10.14778/2732219.2732227

tannal commented 3 months ago

这篇论文对比了在多核主存环境下排序-合并连接(sort-merge join)和基数哈希连接(radix-hash join)的性能

tannal commented 3 months ago

基数哈希连接在大多数情况下仍然优于排序-合并连接。 只有在处理非常大量数据时,排序-合并连接的性能才接近基数哈希连接。 SIMD指令对两种算法都有帮助,但并不足以改变它们的相对性能。 在NUMA架构上,经过优化的基数哈希连接仍然优于排序-合并连接。

tannal commented 3 months ago

基数哈希连接仍然是主存数据库系统中最高效的连接算法。 硬件感知的算法优化对于充分利用现代多核架构至关重要。 在评估数据库算法时,需要考虑各种硬件因素和数据特征。 理论分析和实际实现同样重要,需要结合两者来得出可靠的结论。