[cudamapper] Small improvements to IndexGPU

NVIDIA-Genomics-Research / GenomeWorks

SDK for GPU accelerated genome assembly and analysis

Apache License 2.0

286 stars 76 forks source link

While reviewing a PR I noticed a) cudaStreamSynchronize() is missing a GW_CU_CHECK_ERR in https://github.com/clara-parabricks/GenomeWorks/blob/d715ab18b9a704726350613b6bb248a741b0d9f3/cudamapper/src/index_gpu.cuh#L781

b) I think the block around the mentioned cudaStreamSynchronize():

    cudautils::device_copy_n(merged_basepairs_h.data(), ...,  cuda_stream_); // H2D

    cudaStreamSynchronize(cuda_stream_);
    merged_basepairs_h.clear();
    merged_basepairs_h.shrink_to_fit();

    // sketch elements get generated here
    auto sketch_elements = SketchElementImpl::generate_sketch_elements(..., cuda_stream_);

could be changed to

    cudautils::device_copy_n(merged_basepairs_h.data(), ...,  cuda_stream_); // H2D

    // sketch elements get generated here
    auto sketch_elements = SketchElementImpl::generate_sketch_elements(..., cuda_stream_);

    cudaStreamSynchronize(cuda_stream_);
    merged_basepairs_h.clear();
    merged_basepairs_h.shrink_to_fit();

which could potentially allow for a bit more overlapping. @mimaric ?

NVIDIA-Genomics-Research / GenomeWorks

[cudamapper] Small improvements to IndexGPU #543