Sileadim / virome-analysis

0 stars 0 forks source link

Human reference genome? #2

Open Sileadim opened 9 years ago

Sileadim commented 9 years ago

Wir sollten uns auf ein einheitliches Genom einigen, durchprobieren können wir evtl mehr. Wie Lydia meinte, Ensembl GRCh37 ist ~30 GB, NCBI build37.1 ~15 GB, ist also nicht ganz so einfach. -Christopher

JeyKJey commented 9 years ago

Ich hab dies genommen ftp://hgdownload.cse.ucsc.edu/goldenPath/currentGenomes/Homo_sapiens/chromosomes/README.txt und hatte drei runs:

  1. chrrandom and chrUn were not considered
  2. chr*_random and other placed sequences were considered
  3. everything was considered Und irgendwie hatte ich ca. 4 GB
Sileadim commented 9 years ago

Dann weinigen wir uns mal auf das. Ok, welchen read mapper hast du dann verwendet?

JeyKJey commented 9 years ago

BWA

icklerly commented 9 years ago

Und konntest du die Fasta Datei indexieren? Bei mir lief das bwa Index fast 24std und hat nicht geklappt bei einer Fa von 3.1GB

JeyKJey commented 9 years ago

Ja, human konnte ich, aber taurus nicht mehr

Sileadim commented 9 years ago

Also ich konnte das indizieren mit bwa, hab "bwa index -a bwtsw chr1.fa" benutzt. Bin grade dabei meine reads zu mappen.

JeyKJey commented 9 years ago

willst du separat mit jeder chromosome indexieren und mappen? Ich hab alle Chromosomen für ein run benutzt. Ich glaub man kann es nicht separat machen bzw. man kann komische Ergebnisse bekommen bezüglich repeats etc