minskpython / talks

Issues этого проекта используются как заявки докладов на митап. Если вы хотите сделать какое-то общее предложение (не заявку на доклад), то добавляйте его пожалуйста в отдельный репозиторий — https://github.com/minskpython/ideas-and-proposals/issues
1 stars 1 forks source link

Питон для анализа генетических данных #44

Closed alexaibio closed 2 years ago

alexaibio commented 4 years ago

примерный план (будет меняться)

получается очень много - и моя задача как-то втистуть это в 20 минут )))

karelin commented 4 years ago

Немного смотрел эту тему - биоинформ это довольно сложная штука сама по себе, а для нашего брата программера еще и весьма чуждая. Может немного сократить био часть для более четкого введения и обзора Python-решений.

alexaibio commented 4 years ago

да - у меня тоже появились сомнения, что это вообще правильное место для такого доклада... С биоинформатикой и компьютерной биологией скорее в DS комьюнити...

А без понимания био части смысл будет недоступен и это точно не тема 20 минут. А если био часть убрать - дальше достаточно простое програмирование )))

И собственно питон решений то и нет... ну или во всяком случае общеизвестных. В основном то, что я знаю - или это Data Science на биологических NGS данных с использованием обычных тулов (pandas, scikitlearn, keras etc) или BioPython который используют в основоном биологи для манипулирования последовательностями, аннотацией итд или создание пайплайнов на докерах, nextflow etc для обработки сырых данных от Illumina (Variant Calling, Expression Data)

Еще особняком стоит создание новых алгоритмов - но это уже C++ )))

В общем, я думаю, ты прав - я не совсем по теме тут

karelin commented 4 years ago

Я не говорю, что это совсем не место, я скорее о том, что надо сделать так, чтобы стало интересно даже тем. кто биологию знает на уровне - "животные - это мясо и шкура, растения - салат" :)

Ну и как-то в тусовке хорошо зходят материалы с хорошей технической частью. Кстати, для многих, кто сколько-нибудь понимает в DS, биологическая специфика будет интересна, как и пайплайны или BioPython.

Короче, вот это прямо супер план доклада:

Data Science на биологических NGS данных с использованием обычных тулов (pandas, scikitlearn, keras etc) или BioPython который используют в основоном биологи для манипулирования последовательностями, аннотацией итд или создание пайплайнов на докерах, nextflow etc для обработки сырых данных от Illumina (Variant Calling, Expression Data)

Можно конечно и рассмотреть вариант ODS митапа (давненько кстати их не было), хотя сообщество процентов на 30-40 пересекается ;) Либо рассматривать митап как репетицию для DataFest или BulbaCon :D

alexaibio commented 4 years ago

да - конечно я учитываю что никто особо не знает биологии и картинки предполагаются простые ))) по моим подсчетам это будет 5-10 минут - ну надо хотя бы знать что такое NGS дата чтобы им манипулировать ))) можно сделать так - когда я таки соблаговолю сделать слайды - я могу проговорить этот доклад перед 2-3 тайными магистрами которых вы сами выберете ))) ну и тогда можно предметно обсудить - что оставить, а что выкинуть

Остается сделать )) тк работы там нормально )))))

shurph commented 2 years ago

Выступление состоялось 26.05.2021. Видео: https://www.youtube.com/watch?v=BF1rI_r-0BY&list=PLjiAaL1HtGPZryLkhGv-oxwWQwvs50t26&index=5