Under development, not ready for a general use, seem to perform well on gold-standard datasets English description and license will be uploaded with the first release
The main idea of this pipeline is to take best-practice scRNA-seq data preprocessind tools and integrate them in a fully unsupervised pipeline "from GSE id to cluster's markers"
GSE_id->read counts
step will be based on the mixture of https://github.com/hms-dbmi/dropEst and https://github.com/CGATOxford/UMI-tools
Инструкция:
1) Установить пакеты через installer.Rmd
2) Загрузить все необходимые функции из Counts2Exprs.Pmd
3) Загрузить данные ориентируясь на примеры из Load_data.Rmd
4) Запустить основной анализ по примерам из Simple_Analyse.md
5) Если функция seur_find_multiplication выдаёт NULL, значит разбить кластер на суб-кластеры не удалось
Аннотация исходной матрицы клеток должна иметь формат: <тип_клетки>.<номер_клетки>
( "d7.122" "d0.484" "d2.39" "d2.213")
Для расстановки номеров можно воспользоваться функцией types2names,
пример использования которой можно найти в модуле Load_data.Rds в функции load_sce
Исходная аннотация клеток не используется при кластеризации но может быть полезна
для оценки качества итогового разбиения
Переменная окружения "R_MAX_NUM_DLLS 255" может понадобиться при запуске в Windows, если возникает ошибка
"превышение максимального числа загруженных библиотек"