nservant / HiC-Pro

HiC-Pro: An optimized and flexible pipeline for Hi-C data processing
Other
382 stars 183 forks source link

Low alignment rate on Micro-c data #571

Open liviu- opened 1 year ago

liviu- commented 1 year ago

Hi,

I ran HiC-Pro v3.1.0 on Micro-C data, but I get about 30% alignment using default settings for bowtie2. Do you know what could be the issue? The index was generated using bowtie2-build on a fasta file from UCSC, and it's mouse data. Should I change the default bowtie2 settings or is there something else I'm doing wrong? I attached the config below.

Edit: I got 50% mapping for less stringent bowtie2 params and 65% mapping for trimmed reads (150bp -> 80bp), so perhaps there's another issue elsewhere as the alignment rate is still rather low.

Example bowtie2 log:

##HiC-Pro mapping                           
288998915 reads; of these:                  
  288998915 (100.00%) were unpaired; of     
these:                                      
    199988605 (69.20%) aligned 0 times      
    78875334 (27.29%) aligned exactly 1 time
    10134976 (3.51%) aligned >1 times       
30.80% overall alignment rate               

Config file:

# Please change the variable settings below if necessary

#########################################################################
## Paths and Settings  - Do not edit !
#########################################################################

TMP_DIR = tmp
LOGS_DIR = logs
BOWTIE2_OUTPUT_DIR = bowtie_results
MAPC_OUTPUT = hic_results
RAW_DIR = rawdata

#######################################################################
## SYSTEM AND SCHEDULER - Start Editing Here !!
#######################################################################
N_CPU = 40
SORT_RAM = 50000M
LOGFILE = hicpro.log

JOB_NAME = 
JOB_MEM = 
JOB_WALLTIME = 
JOB_QUEUE = 
JOB_MAIL = 

#########################################################################
## Data
#########################################################################

PAIR1_EXT = _R1
PAIR2_EXT = _R2

#######################################################################
## Alignment options
#######################################################################

MIN_MAPQ = 10

BOWTIE2_IDX_PATH = /home/user/misc/ref/mm39/bt2
BOWTIE2_GLOBAL_OPTIONS = --very-sensitive -L 30 --score-min L,-0.6,-0.2 --end-to-end --reorder
BOWTIE2_LOCAL_OPTIONS =  --very-sensitive -L 20 --score-min L,-0.6,-0.2 --end-to-end --reorder

#######################################################################
## Annotation files
#######################################################################

REFERENCE_GENOME = mm39
GENOME_SIZE = /home/user/misc/ref/mm39/mm39.chrom.sizes

#######################################################################
## Allele specific analysis
#######################################################################

ALLELE_SPECIFIC_SNP = 

#######################################################################
## Capture Hi-C analysis
#######################################################################

CAPTURE_TARGET =
REPORT_CAPTURE_REPORTER = 1

#######################################################################
## Digestion Hi-C
#######################################################################

GENOME_FRAGMENT = 
LIGATION_SITE = 
MIN_FRAG_SIZE = 
MAX_FRAG_SIZE =
MIN_INSERT_SIZE =
MAX_INSERT_SIZE =

#######################################################################
## Hi-C processing
#######################################################################

MIN_CIS_DIST = 1000
GET_ALL_INTERACTION_CLASSES = 1
GET_PROCESS_SAM = 0
RM_SINGLETON = 1
RM_MULTI = 1
RM_DUP = 1

#######################################################################
## Contact Maps
#######################################################################

BIN_SIZE = 500 1000 5000 20000 500000 
MATRIX_FORMAT = upper

#######################################################################
## Normalization
#######################################################################
MAX_ITER = 100
FILTER_LOW_COUNT_PERC = 0.02
FILTER_HIGH_COUNT_PERC = 0
EPS = 0.1
dsaeedeh commented 2 months ago

Hi @liviu-

Could you please share your new config file related to your edit message: "Edit: I got 50% mapping for less stringent bowtie2 params and 65% mapping for trimmed reads (150bp -> 80bp), so perhaps there's another issue elsewhere as the alignment rate is still rather low."

Thanks