openbiox / weekly

生信爱好者周刊(每周日发布)
https://openbiox.github.io/weekly/
363 stars 27 forks source link

【周刊】第 35 期 #813

Closed ShixiangWang closed 2 years ago

ShixiangWang commented 2 years ago

生信爱好者周刊(第 35 期):

这里记录每周值得分享的生信相关内容,周日发布。

本杂志开源(GitHub: ShixiangWang/weekly),欢迎提交 issue,投稿或推荐生信相关内容。

「生信周刊讨论区(语雀)」 | 「生信讨论区(Gitter)」

封面图

本周话题:

生信研究

博文资讯

工具

资源

贡献者(GitHub ID)

「Openbiox 生信周刊」运维小队:

订阅

这个周刊每周日发布,同步更新在微信公众号「优雅R」(elegant-r)上。

微信搜索“优雅R”或者扫描二维码,即可订阅。

(完)

kkjtmac commented 2 years ago

申领5、9、10

He-Kai-fly commented 2 years ago

申领8、11、13

NiEntropy commented 2 years ago

申领7、14

NiEntropy commented 2 years ago

申领7、14 7,14 第一期 _2022-7-8.docx

NiEntropy commented 2 years ago

一切单细胞数据处理都可以seurat为中心

单细胞数据处理的其他分析工具,比如拟时序,细胞通讯和转录因子分析,还有RNA速率等。其结果都可以结合到Seurat的降维聚类分群中做可视化。 比如: 生信技能树的笔记——[pyscenic的转录因子分析结果展示之5种可视化](https://mp.weixin.qq.com/s?__biz=MzAxMDkxODM1Ng==&mid=2247511888&idx=1&sn=15bad0f377832710a08451eb3d6d2f76&scene=21#wechat_redirect) Seurat团队开发整理好的包——[SeuratWrappers包](https://github.com/satijalab/seurat-wrappers) image.png

GENIE | 大型肿瘤基因组测序数据集

image.png GENIE 汇总了19 个机构的肿瘤患者测序数据,主要是基因组测序数据,如基因突变,拷贝数。 image.png 当前的版本 GENIE 11.0-public 于 2022 年 1 月发布。收集了来自 121,000 多名患者的 136,000 多个测序样本,使 AACR Project GENIE数据集成为迄今为止发布的数据量最大的完全公开癌症基因组数据集。

Tomcxf commented 2 years ago

申领 1,6,12

JnanZhang commented 2 years ago

申领2,3

kkjtmac commented 2 years ago

博文资讯-5

最新安卓开发者版本支持虚拟运行Windows 11和桌面版Linux

Android-13-Release-Date-Beta-New-Feature-Leaks-and-More-2 在2月份,谷歌发布了Android 13 的第一个开发者预览版,而一位名叫kdrag0n的开发者发现了安装该版本的 Google Pixel 6可以虚拟化运行Windows 11和多个版本Linux。随着手机硬件性能的不断提升,加上各平台系统的互通,以后在手机上跑个轻量级生信运算也不是不可能。

工具-9

scPred:accurate supervised method for cell-type classification from single-cell RNA-seq data

截屏2022-07-08 10 54 51

单细胞分类的新方法

工具-10

scRepertoire:A toolkit for single-cell immune profiling

截屏2022-07-08 11 03 48

基于R来进行单细胞免疫受体表达谱的分析工具

Tomcxf commented 2 years ago

生信研究 1 来自麻省理工学院和英属哥伦比亚大学等机构的研究人员构建了一个深度学习神经网络模型“神谕” 在利用数亿次实验观测结果进行训练之后,「神谕」可以预测酵母中的非编码DNA序列的突变会如何影响基因表达。 这个无偏模型能够基于任何可能的DNA序列,来预测生物体的适应性和基因表达。 微信图片_20220709092816

博文资讯 6 机器学习中数据不平衡的分类问题很常见,极端的数据不平衡通常会影响模型预测的准确性和泛化性能。 本文介绍几种处理不平衡数据的计算方法:

  1. Oversample and downsample
  2. Generating synthetic data
  3. GAN 87f8d86b01f688e37f329c3cc568afe

工具 13 Lapce是一种基于pure Rust的代码编辑器,更加智能化,更加快速。 logo

He-Kai-fly commented 2 years ago

Linux中的软件安装进度条怎么搞? (qq.com)

image-20220708235449995

平时我们在服务器运维工作中,安装软件时候会出现进度条来提示我们下载的进度,本文通过C语言来简单实现这个功能。

注意:

  1. 换行是换到下一行当前位置,用\n表示,回车是回到当前行的开始用\r开始,而在C语言中,\n代表换行+回到开始。
  2. 代码printf执行后,要打印的内容放入缓冲区,但不一定会立即刷新到屏幕上,需注意无缓冲、行缓冲及全缓冲的3种策略
  3. 每次打印完都回车,就相当于在第一个位置打印一个数字后,又回到该位置,继续打印下一个数字。这样就可以实现倒计时的效果。

Minitorch

Github地址: https://github.com/minitorch/

image-20220709001146013

MiniTorch 是一个为那些希望了解机器学习底层系统内部概念工程师打造的DIY教学库。 它是利用纯Python代码重构的Torch API,其设计简单、易于阅读、测试和增量,最终的库可以运行Torch代码。 该项目是为康奈尔理工大学的机器学习工程课程开发的。

jupyterbook

image-20220709002139819

Jupyter book主要是使用计算机语言来创建发表级别的书籍或文档。

该教程主要分为以下几个主要部分:

  1. TUTORIALS部分是Jupyter Book的逐步入门指南。

  2. Topic Guides部分涵盖了更深入的特定区域,并将其组织为离散的“操作方法”部分。

  3. Reference详细地描述了Jupyter书的API/语法/等。

JnanZhang commented 2 years ago

Nat. Genet. | 哺乳动物胚胎发生细胞轨迹的系统重建 2610516ce6d887b5850304753b82372 在本研究中,研究者着手整合几个与小鼠原肠胚形成和器官形成相关的单细胞RNA序列数据集。此外,作者定义了跨越E3.5到E13的19个连续阶段中每个阶段的细胞状态,试探性地将它们与其伪祖先和伪后代联系起来。尽管是通过自动化程序构建的,但由此产生的哺乳动物胚胎发生轨迹(TOME)在很大程度上与我们当代对哺乳动物发育的理解一致。作者还利用TOME指定转录因子(TF)和TF基序作为新细胞类型出现的每个分支点的关键调节因子。最后,为了便于脊椎动物之间的比较,作者对斑马鱼和青蛙胚胎发育相关的单细胞数据集应用相同的程序,并根据共享的调节器和转录状态指定“细胞类型同源物”。 https://mp.weixin.qq.com/s/_ID7PQmQQHE2Fb-fLxA-GQ

bioRxiv:949种人类细胞蛋白质组学检测与多组学分析 378591ef4896713ff6818085c41600c 报道在949种人类细胞中进行的蛋白质组学的分析,并与之前的一些大规模组学数据整合,形成了Cell Model Passports数据库:https://cellmodelpassports.sanger.ac.uk/ 。主要研究成果包括:(1)蛋白质组数据与细胞类型分析;(2)MOFA多组学分析;(3)DeeProM深度学习分析肿瘤潜在脆弱性(vulnerabilities)靶点。 https://mp.weixin.qq.com/s/ZGaGgH5SDwEkioJGHfnpww

ShixiangWang commented 2 years ago

谢谢大家贡献