zmactep / ig-pipeline

2 stars 0 forks source link

Переразобрать данные kabat #24

Open zmactep opened 10 years ago

zmactep commented 10 years ago

Составить kabat файлы для:

  1. VH, JH (DH - всегда CDR3)
  2. VK, JK
  3. VL, JL

для каждого файла иметь соответствующий .kabat в обычном формате

seq   fr1_s   fr1_e   cdr1_s   cdr1_e   fr2_s   fr2_e   cdr2_s   cdr2_e   fr3_s   fr3_e   cdr3_s   cdr3_e   fr4_s   fr4_e

Так, для некоторого V-гена это будет выглядеть как

IGHV2-70*09        1        90        91        111        112        153        154        201        202        297        0        0        0        0

Для некоторого J-гена:

JH2        0        0        0        0        0        0        0        0        0        0        1        18        19        53

Аналогичную операцию проделать с аминокислотными последовательностями.

Это позволит сильно сократить объем хранимой информации при сохранении удобства использования. Вся необходимая для разметки информация может быть взята здесь: http://www2.mrc-lmb.cam.ac.uk/vbase/alignments2.php

zmactep commented 10 years ago

Таким же образом нам будет наплевать на количество рамок считывания и т.д. в нуклеотидных последовательностях.

Feodorov commented 10 years ago

Это для кого и куда?