Open zmactep opened 10 years ago
GOR - первый относительно адекватный алгоритм по предсказанию вторичных структур. Первый использовал идею окна аминокислот.
@incollection{Garnier1996540,
title = "[32] \{GOR\} method for predicting protein secondary structure from amino acid sequence ",
editor = "Russell F. Doolittle",
booktitle = "Computer Methods for Macromolecular Sequence Analysis",
publisher = "Academic Press",
year = "1996",
volume = "266",
pages = "540 - 553",
series = "Methods in Enzymology ",
issn = "0076-6879",
doi = "http://dx.doi.org/10.1016/S0076-6879(96)66034-0",
url = "http://www.sciencedirect.com/science/article/pii/S0076687996660340",
author = "Jean Garnier and Jean-François Gibrat and Barry Robson"
}
PHD - предсказатель вторичных структур на базе нейросети. Использовал группу гомологов с известной структурой в качестве профиля. Тоже бьет на окна, ищет ближайшего среди гомологов для данного окна и дает предсказание по средней аминокислоте.
@article{Rost1993584,
title = "Prediction of Protein Secondary Structure at Better than 70% Accuracy ",
journal = "Journal of Molecular Biology ",
volume = "232",
number = "2",
pages = "584 - 599",
year = "1993",
note = "",
issn = "0022-2836",
doi = "http://dx.doi.org/10.1006/jmbi.1993.1413",
url = "http://www.sciencedirect.com/science/article/pii/S0022283683714130",
author = "Burkhard Rost and Chris Sander",
keywords = "protein secondary structure prediction",
keywords = "multiple sequence alignments",
keywords = "secondary structure content",
keywords = "neural network "
}
IMGT/V-QUEST - продвинутый тул для работы с иммуноглобулинами. Имеет собственные базы данных гермлайнов и собственную номенклатуру аннотирования, слегка отличающуюся от Kabat (смещение на 1-3 аминокислоты). Позволяет найти ближайших гомологов (локальными выравниваниями) среди всех трех генов, дает разметку до FR3. Выдает результаты в удобном для человека представлении, но в связи с подобным форматом вывода весьма ограничивается объем входных данных - просто ничего не воспринимается, когда их много. Работает только с нуклеотидами.
@article{Brochet01072008,
author = {Brochet, Xavier and Lefranc, Marie-Paule and Giudicelli, Véronique},
title = {IMGT/V-QUEST: the highly customized and integrated system for IG and TR standardized V-J and V-D-J sequence analysis},
volume = {36},
number = {suppl 2},
pages = {W503-W508},
year = {2008},
doi = {10.1093/nar/gkn316},
URL = {http://nar.oxfordjournals.org/content/36/suppl_2/W503.abstract},
eprint = {http://nar.oxfordjournals.org/content/36/suppl_2/W503.full.pdf+html},
journal = {Nucleic Acids Research}
}
IMGT/HighV-QUEST - утилита для обработки результатов NGS. Тот же IMGT, но с нормальным выводом статистик для огромных данных. Проприетарная технология, хз как работает. Бесплатна только для academic research, требует регистрации.
@article{Alamyar2012,
author = {Alamyar, Eltaf and Giudicelli, V\'{e}ronique and Li, Shuo and Duroux, Patrice and Lefranc, Marie-Paule},
journal = {Immunome Research},
number = {26},
pmid = {22647994},
title = {IMGT/HighV-QUEST: the IMGT® web portal for immunoglobulin (IG) or antibody and T cell receptor (TR) analysis from NGS high throughput and deep sequencing},
volume = {8},
year = {2012}
}
IgBLAST - версия BLAST для иммуноглобулинов. Поддерживает как нуклеотидные, так и аминокислотные сиквенсы. Может работать с внутренними базами гермлайнов, а также внешними базами. Работает как в номенклатуре Kabat, так и в номенклатуре IMGT. Рассматривает только до FR3.
@article{Ye01072013,
author = {Ye, Jian and Ma, Ning and Madden, Thomas L. and Ostell, James M.},
title = {IgBLAST: an immunoglobulin variable domain sequence analysis tool},
volume = {41},
number = {W1},
pages = {W34-W40},
year = {2013},
doi = {10.1093/nar/gkt382},
URL = {http://nar.oxfordjournals.org/content/41/W1/W34.abstract},
eprint = {http://nar.oxfordjournals.org/content/41/W1/W34.full.pdf+html},
journal = {Nucleic Acids Research}
}
JPred - предсказатель вторичных структур. Работает с использованием предсказателя PHD, но с дополнительной предобработкой данных. Использует PSI-BLAST для поиска гомологов.
@article{Cole01072008,
author = {Cole, Christian and Barber, Jonathan D. and Barton, Geoffrey J.},
title = {The Jpred 3 secondary structure prediction server},
volume = {36},
number = {suppl 2},
pages = {W197-W201},
year = {2008},
doi = {10.1093/nar/gkn238},
URL = {http://nar.oxfordjournals.org/content/36/suppl_2/W197.abstract},
eprint = {http://nar.oxfordjournals.org/content/36/suppl_2/W197.full.pdf+html},
journal = {Nucleic Acids Research}
}
proABC - предсказание H и L областей - участков контакта антитела с антигеном с помощью random forest. Используют предварительное выравнивание для поиска гермлайнов и регионов, а далее случайные деревья для поиска нужных участков. Требуется полный сиквенс тяжелой и легкой цепи в аминокислотах. Принимает по 1 запросу, не может быть использован для массовой обработки.
@article{Olimpieri15092013,
author = {Olimpieri, Pier Paolo and Chailyan, Anna and Tramontano, Anna and Marcatili, Paolo},
title = {Prediction of site-specific interactions in antibody-antigen complexes: the proABC method and server},
volume = {29},
number = {18},
pages = {2285-2291},
year = {2013},
doi = {10.1093/bioinformatics/btt369},
URL = {http://bioinformatics.oxfordjournals.org/content/29/18/2285.abstract},
eprint = {http://bioinformatics.oxfordjournals.org/content/29/18/2285.full.pdf+html},
journal = {Bioinformatics}
}
WEKA - набор алгоритмов для Data Mining и Machine Learning. Является одной из самых популярных в своем классе. Мы используем из нее Random Forest.
@article{Hall:2009:WDM:1656274.1656278,
author = {Hall, Mark and Frank, Eibe and Holmes, Geoffrey and Pfahringer, Bernhard and Reutemann, Peter and Witten, Ian H.},
title = {The WEKA Data Mining Software: An Update},
journal = {SIGKDD Explor. Newsl.},
issue_date = {June 2009},
volume = {11},
number = {1},
month = nov,
year = {2009},
issn = {1931-0145},
pages = {10--18},
numpages = {9},
url = {http://doi.acm.org/10.1145/1656274.1656278},
doi = {10.1145/1656274.1656278},
acmid = {1656278},
publisher = {ACM},
address = {New York, NY, USA},
}
Сюда складываем список статей, которые точно будем цитировать.
Выкладывать сразу в BibTeX формате со ссылкой, что это и зачем.