Closed alexaibio closed 2 years ago
Немного смотрел эту тему - биоинформ это довольно сложная штука сама по себе, а для нашего брата программера еще и весьма чуждая. Может немного сократить био часть для более четкого введения и обзора Python-решений.
да - у меня тоже появились сомнения, что это вообще правильное место для такого доклада... С биоинформатикой и компьютерной биологией скорее в DS комьюнити...
А без понимания био части смысл будет недоступен и это точно не тема 20 минут. А если био часть убрать - дальше достаточно простое програмирование )))
И собственно питон решений то и нет... ну или во всяком случае общеизвестных. В основном то, что я знаю - или это Data Science на биологических NGS данных с использованием обычных тулов (pandas, scikitlearn, keras etc) или BioPython который используют в основоном биологи для манипулирования последовательностями, аннотацией итд или создание пайплайнов на докерах, nextflow etc для обработки сырых данных от Illumina (Variant Calling, Expression Data)
Еще особняком стоит создание новых алгоритмов - но это уже C++ )))
В общем, я думаю, ты прав - я не совсем по теме тут
Я не говорю, что это совсем не место, я скорее о том, что надо сделать так, чтобы стало интересно даже тем. кто биологию знает на уровне - "животные - это мясо и шкура, растения - салат" :)
Ну и как-то в тусовке хорошо зходят материалы с хорошей технической частью. Кстати, для многих, кто сколько-нибудь понимает в DS, биологическая специфика будет интересна, как и пайплайны или BioPython.
Короче, вот это прямо супер план доклада:
Data Science на биологических NGS данных с использованием обычных тулов (pandas, scikitlearn, keras etc) или BioPython который используют в основоном биологи для манипулирования последовательностями, аннотацией итд или создание пайплайнов на докерах, nextflow etc для обработки сырых данных от Illumina (Variant Calling, Expression Data)
Можно конечно и рассмотреть вариант ODS митапа (давненько кстати их не было), хотя сообщество процентов на 30-40 пересекается ;) Либо рассматривать митап как репетицию для DataFest или BulbaCon :D
да - конечно я учитываю что никто особо не знает биологии и картинки предполагаются простые ))) по моим подсчетам это будет 5-10 минут - ну надо хотя бы знать что такое NGS дата чтобы им манипулировать ))) можно сделать так - когда я таки соблаговолю сделать слайды - я могу проговорить этот доклад перед 2-3 тайными магистрами которых вы сами выберете ))) ну и тогда можно предметно обсудить - что оставить, а что выкинуть
Остается сделать )) тк работы там нормально )))))
Выступление состоялось 26.05.2021. Видео: https://www.youtube.com/watch?v=BF1rI_r-0BY&list=PLjiAaL1HtGPZryLkhGv-oxwWQwvs50t26&index=5
примерный план (будет меняться)
получается очень много - и моя задача как-то втистуть это в 20 минут )))