ixxmu / mp_duty

抓取网络文章到github issues保存
https://archives.duty-machine.now.sh/
115 stars 30 forks source link

分享24个单细胞数据分析数据库 #4342

Closed ixxmu closed 9 months ago

ixxmu commented 9 months ago

https://mp.weixin.qq.com/s/eVFd3lSOO5fHnyL6c_p-Ew

ixxmu commented 9 months ago

分享24个单细胞数据分析数据库 by SCIPainter

1. CDCP


CDCP (Cell-omics Data Coordinate Platform) 共享和集成复杂的单细胞数据集,并提供单细胞数据分析工具和可视化服务,以方便研究人员访问和探索已公布的单细胞数据集,主页如下。


数据库链接:

https://db.cngb.org/cdcp/


通过Submission选项页面,我们也可以将自己的单细胞测序数据上传到CDCP数据库,具体的方法可参考页面的操作指引。


详细教程链接:

《数据留在祖国大地上!分享一个国产单细胞数据库》


2. Single Cell Portal


Single Cell Portal是一个单细胞研究项目数据库,可以用于查询研究项目和基因在不同细胞类型中的表达情况,目前包含624个研究项目和超过3800万个细胞的数据信息,下面就一起了解下Single Cell Portal吧。


数据库链接:

https://singlecell.broadinstitute.org/single_cell


对于Single Cell Porta数据库的使用,可通过分类标签查找研究项目,也可以通过感兴趣基因查找研究项目。在查询结果的单细胞图谱页面,在搜索框中输入基因名称,如这里的“Aqp1”,可查看当前基因在不同细胞亚群的表达情况。此外,Summary选项为研究项目的简介,登录数据库后可通过Download选项下载相应的研究项目数据。


详细教程链接:

《分享一个单细胞研究项目数据库》


3. DISCO


DISCO是一个深度整合的单细胞组学数据库,整合了来自13921个样本的超过6000万个细胞,涵盖461种细胞类型。DISCO主要面向单细胞研究相关的临床与科研工作者,对研究健康和患病组织的异质性有很大的帮助。


数据库链接:

https://www.immunesinglecell.org/


DISCO的用法很简单,在首页点击不同组织器官对应的图标,可以直接查看相应组织的细胞图谱,如这里选择查看Brain的数据。


详细教程链接:

《如何利用已发表的单细胞数据进行分析?》


4. CellMarker 2.0


CellMarker数据库收集了人工整理且实验支持的人类和小鼠各种类型细胞的标记。当前版本收录了656个组织、2578种细胞类型和26915个细胞标记,还开发了6个在线小工具,功能包括细胞注释、细胞聚类、细胞分化和细胞通讯等。


我们可以使用CellMarker查找特定组织或细胞类型对应的marker,反过来,我们也可以通过搜索细胞亚群的top genes确定细胞类型。


数据库链接:

http://bio-bigdata.hrbmu.edu.cn/CellMarker/

http://117.50.127.228/CellMarker/


教程链接:

《一个快速完成细胞分群的免费网站》


5. PCMDB


PCMDB(Plant Cell Marker Data Base),是一个植物细胞marker数据库。PCMDB收录了六种常见模式植物(拟南芥、水稻、玉米、大豆、番茄和烟草)的三种不同类型的细胞标记,包括实验验证的标记基因(3119个),基于Bulk RNA-seq数据的差异表达标记基因(40625个),以及通过scRNA-seq鉴定的特定细胞间的差异表达基因(46915个)。


PCMDB的界面非常简洁漂亮,如下图,搜索下载不同物种的各种细胞标记时非常方便。


数据库链接:

https://www.tobaccodb.org/pcmdb/homePage


PCMDB的界面非常简洁漂亮,搜索下载不同物种的各种细胞Marker时非常方便。只需在界面上点击感兴趣植物的组织部位,就可以直接查看和下载相应细胞类型的Marker基因,如下图。



6. PlantscRNAdb


PlantscRNAdb是一个植物单细胞RNA分析数据库,新版的PlantscRNAdb 3.0收录了15种植物 (如拟南芥、水稻、番茄、玉米、草莓、杨树、烟草、白菜、木薯、大豆、苜蓿等),包含114770个Marker基因。


数据库链接:

http://ibi.zju.edu.cn/plantscrnadb/index.php


7.Plant Single Cell Hub


Plant Single Cell Hub(PsctH)是由华中农业大学棉花遗传改良团队开发的植物单细胞综合数据库,旨在提供全面准确的不同植物不同组织各种细胞类型的细胞标记资源和分析流程。



Plant Single Cell Hub除了分享植物单细胞研究相关的方法和文献,还提供了一个植物标记基因数据库,其中所有的Marker基因都通过RNA原位杂交或GFP报告基因得到了证实。


数据库链接:

http://jinlab.hzau.edu.cn/PsctH/


8. ColorCells


大多数单细胞研究都集中在mRNAs上却忽略了lncRNA,而lncRNA被证明丰度更高并且具有显著的细胞特异性。这里分享一个单细胞数据库,可用于分析比较单细胞RNA-Seq数据中lncRNA和mRNA的表达和功能。


数据库链接:

https://rna.sysu.edu.cn/colorcells/index.php


ColorCells目前提供包括人类、小鼠、斑马鱼、果蝇和酵母在内的5个物种的单细胞转录组分析数据,单击顶部菜单栏中的Gallery,可以查看详细的数据集信息。


详细教程链接:

《分享一个lncRNA单细胞数据库》


9. HCL


单细胞数据库HCL(Human Cell Landscape),在单细胞水平上确定了人体主要器官的细胞类型组成,并构建了人类细胞景观图谱。


该数据库主要分为Home、Landscape、Gallery、Search、Run-scHCL、FAQ和Contact七个版块,在首页中描述了HCL网站的功能和更新,点击Human tissue info,可查看人体组织信息,点击Microwell-seq Protocol可查看Microwell-seq实验方案。


数据库链接:

https://bis.zju.edu.cn/HCL/


详细教程链接:

《分享一个好用的单细胞景观图谱数据库》


10. MCA


MCA(Mouse Cell Atlas)是基于Microwell-seq高通量单细胞测序的小鼠单细胞数据库。MCA数据库的主要功能分为三类:浏览、搜索和注释。当前版本的MCA 3.0数据库收录了小鼠40多种器官组织,超过260万个单细胞的数据集。


数据库链接:

https://bis.zju.edu.cn/MCA/index.html


详细教程链接:

《MCA数据库——轻松解决小鼠细胞图谱研究中的种种问题》

《分享一个好用的单细胞图谱数据库》


11. CELL×GENE


CELL×GENE是目前较大的且包含多种单细胞技术的数据资源中心,其特色是细胞亚群都进行了细致清楚的注释,并以分类树进行展示。它内嵌了几个功能强大的工具,可用于单细胞数据的处理分析,如数据集的查找、下载、分析、注释等。


数据库链接:

https://cellxgene.cziscience.com/


详细教程链接:

《分享一个细胞分类注释非常细致的单细胞资源库》


12. Cell BLAST


Cell Blast是一个自带高质量参考数据库的scRNA-seq数据检索\注释工具,可用于细胞鉴定和发现新细胞类型。


数据库链接:

https://cblast.gao-lab.org/


13. SC2diseases


SC2disease数据库旨在为不同疾病或不同细胞类型提供全面的基因表达信息和marker基因信息,使用SC2disease可以查看感兴趣基因的表达信息或查找不同类型细胞或疾病的marker。


数据库链接:

http://easybioai.com/sc2disease/home


14. HCA


HCA(Human Cell Atlas)即人类细胞图谱(Human Cell Atlas)计划,是一项与“人类基因组计划”媲美的大型国际合作项目。通过HCA我们可以查找和下载单细胞测序项目数据。


数据库链接:

https://www.humancellatlas.org/


15. PanglaoDB


PanglaoDB是一个收集整合小鼠和人类多种单细胞转录组数据的综合数据库。目前共计收录了1368例样本、258种组织、约550万细胞数据。对于单细胞测序分析中的细胞注释工具,这个数据库也是不错的选择。


数据库链接:

https://panglaodb.se/index.html


教程链接:

《PanglaoDB——另一个快速完成细胞注释的免费网站》


16. PlantPhoneDB


PlantPhoneDB是一个手工整理的关于细胞通讯的植物配受体数据库,收录了拟南芥、水稻、番茄、玉米和杨树五个物种的大量高可信度配受体对数据。此外,研究团队也开发了相应的R包(PlantPhoneDB),可用于细胞通讯分析和可视化。


在PlantPhoneDB的web页面上,我们可以搜索指定配体或受体的详细信息,浏览数据库已有的scRNA-seq数据集对应的分析结果,也可以下载全部的配体对信息。


数据库链接:

https://jasonxu.shinyapps.io/PlantPhoneDB/


17. CITEdb


CITEdb (Cell-cell InTEraction database) 是一个手工筛选整理的细胞间相互作用数据库,该数据库收录了728对人类细胞间的相互作用信息。每个相互作用都附带有结构化的注释,包括生理环境、相互作用的配体-受体对等。


数据库链接:

https://www.citedb.cn/#/


在CITEdb页面,我们可以通过选择感兴趣的生理环境或特定的细胞类型来搜索细胞间相互作用,也可以下载不同生理环境(如疾病或器官)下所有的细胞相互作用数据。



18. CellPhoneDB


CellPhoneDB是一个收录人类配体、受体及其相互作用的数据库,用于细胞通讯网络分析。CellPhoneDB v2收录了总共978种蛋白质,其中501种是分泌蛋白,585种是膜蛋白,这些蛋白质参与了1,396个相互作用。


Nature protocols, 2020)


CellPhoneDB目前已更新到v4.1.0,收录了超过2900个受配体对,引用次数达2000以上。不过,基于python的CellPhoneDB本地软件生成的图比较简单,需要我们根据分析结果文件使用其他工具进行作图和美化。


数据库链接:

https://www.cellphonedb.org/

https://pypi.org/project/CellphoneDB/


19. CellChatDB


CellChatDB是CellChat自建的一个包含人和小鼠配体-受体信息的数据库。而CellChat,是一个能够通过scRNA-seq数据定量推断和分析细胞间互作网络的R包。CellChatDB包含2021个经过验证的互作关系,包括60%的分泌蛋白互作关系。此外,48%的互作关系涉及异质分子复合物。


数据库链接:

http://www.cellchat.org/


与CellPhoneDB工具相比,CellChat最明显的优势就是包含丰富的分析结果,而且结果图都很漂亮,几乎可直接用于文章发表。


20. GEO


GEO(Gene Expression Omnibus)是NCBI的一个子数据库,主要存放基因芯片和二代测序产生的基因表达谱数据。大家可以将自己的单细胞数据上传到GEO数据库也可以直接查看或下载他人已公开的单细胞数据。


GEO数据库链接:

https://www.ncbi.nlm.nih.gov/geo/


通过“研究方向+Single cell” 关键词的方式在GEO数据库中直接进行搜索相关的数据集。当然,在查找结果页面中,我们也可以在左侧版块中进一步设置查询条件,也可以在右侧Filters版块中修改检索式,进一步过滤数据。


详细教程链接:

《如何下载已发表单细胞数据为己所用?》


21. RCAR


RCAR(Root Cell Atlas in Rice)数据库由中国农业科学院生物技术研究所谷晓峰课题组等开发,绘制了两个水稻栽培品种(粳稻NIP和籼稻9311)根尖组织单细胞转录组(scRNA-seq)全景图谱。


数据库链接:

https://www.elabcaas.cn/rcar/index.html


在Cluster search选项下,点击UMAP图上的细胞亚群或图例,可查看相应的基因信息,反之在Locus search选项页面可以查看基因在不同亚群的表达情况。



22. scPlantDB


关于scPlantDB,它是一个植物细胞图谱和标记的综合数据库。scPlantDB收录了17个植物物种的67个高质量数据集的单细胞转录组数据。


数据库链接:

https://biobigdata.nju.edu.cn/scplantdb/home


同时,它还提供了相应工具基于标记识别细胞类型,并进行系统比较和功能注释。



23. scRNA-tools


scRNA-tools是一个收录单细胞RNA测序分析工具的数据库。scRNA-tools数据库几乎记录了用于分析scRNA-seq数据所有软件工具(当前包含1598个)的详细信息,每个工具都根据其可用于的分析任务进行分类。


数据库链接:

https://www.scrna-tools.org/


点击Table选项菜单,我们可以进入到工具信息列表,这里我们可以搜索查看所有单细胞转录组分析工具的详细信息。



24. SCEA


SCEA (Single Cell Expression Atlas),即欧洲EMBL-EBI数据库的子数据库,当前包21个物种,含355个scRNA-seq实验(experiments),总计10,505,726个细胞的单细胞转录组数据。我们可以根据物种、实验设计等下载相应的数据集。


数据库链接:

https://www.ebi.ac.uk/gxa/sc/home


好啦,本次单细胞测序相关的数据库就分享到这里啦!


基迪奥的单细胞测序服务能力行业领先,目前已经积累了丰富的项目经验,产出的农医学单细胞文章案例丰富。如果您有单细胞测序项目咨询,欢迎扫描二维码填写信息,基迪奥为您定制单细胞解决方案。


识别下方二维码填写相关信息:


咨询当地销售或拨打咨询电话:

医学项目:020-84889324

农学项目:020-84889314




参考文献


Efremova M, Vento-Tormo M, Teichmann S A, et al. CellPhoneDB: inferring cell–cell communication from combined expression of multi-subunit ligand–receptor complexes[J]. Nature protocols, 2020, 15(4): 1484-1506.


*未经许可,不得以任何方式复制或抄袭本篇文章之部分或全部内容。版权所有,侵权必究。


基迪奥生物|专业定制测序服务
联系方式:020-39341079;service@genedenovo.com