Closed ixxmu closed 6 months ago
miRNA(microRNA)是一类非编码的小RNA分子,通过与靶基因的mRNA结合,参与调控基因表达。miRNA的靶基因的mRNA通常在其3'非翻译区(3' untranslated region,3'UTR)包含与miRNA的序列互补的区域,这种互补性可以导致miRNA完全或部分与靶基因的mRNA的3'UTR区结合影响其稳定性或翻译,最终导致mRNA的降解或翻译抑制。
miRNA的靶基因是多种多样的,一个miRNA可能会同时调控多个靶基因,而一个基因也可能受到多个miRNA的调控。在生物信息学分析中,通常通过分析miRNA序列和靶基因转录本的互补配对位点来识别可能的miRNA-靶基因关系。
本篇简介几种常用于检索和预测miRNA的靶基因以及二者结合位点的数据库,包括TargetScan、miRDB、miRNet、miRWalk。
使用TargetScan预测miRNA的靶基因
TargetScan(https://www.targetscan.org/vert_80/)是一款常用于预测miRNA-靶基因结合位点的工具,它将RNA间相互作用的热力学模型与序列比对分析相结合,引入了信号信噪比来评估预测结果的准确性。
TargetScan主界面默认显示的是针对哺乳动物miRNA靶基因的预测模型。如果需要用到其他更专业的针对特定生物的预测模型(例如小鼠、线虫、果蝇、鱼等),可在主界面点击跳转。
输入miRNA预测其结合的靶基因
如果想关注一个特定miRNA可能与哪些靶基因结合,在“Select a species”中选择研究的物种信息并在“Enter a microRNA name”中输入感兴趣的miRNA后,点击“Submit”即可在数据库中寻找该miRNA的靶基因。
很快得到结果,展示了数据库中收录的该miRNA的靶基因的名称、转录本名称(点击页面中的基因或转绿本名称可跳转数据库链接查看该基因或转录本的更详细介绍)、在3' UTR区的结合位点、得分等信息。
从中找到感兴趣的miRNA-靶基因关系,点击“Sites in UTR ”,即可查看二者在3' UTR区的结合位点图谱。
输入靶基因预测与其结合的miRNA
另一种常用方法是提供靶基因名称,来反向查找可能与其结合的miRNA。在“Select a species”中选择研究的物种信息并在“Enter a gene”中输入感兴趣的基因名称后,点击“Submit”即可在数据库中寻找该基因的靶miRNA。
很快得到结果,展示了数据库中收录的该基因的多种转录本信息,点击感兴趣的转录本即可查看哪些miRNA与该转录本的3' UTR区结合,以及它们的结合位点。
使用miRDB预测miRNA的靶基因
miRDB(https://mirdb.org/index.html)是一个在线数据库,可用于预测人类、小鼠、大鼠、狗和鸡五种生物的miRNA靶基因。miRDB中的所有靶基因均来自MirTarget预测,通过分析高通量测序实验中的数千个miRNA-靶基因相互作用,确定与miRNA结合且表达下调相关的特征,并使用机器学习方法预测miRNA靶基因。此外,miRDB还允许上传自定义RNA序列进行互补分析,来识别可能的miRNA-靶基因相互作用位点。
使用miRDB在数据库中检索已知的miRNA-靶基因关系
如果想关注一个特定miRNA可能与哪些靶基因存在互作关系,或者想知道一个特定基因可能是哪些miRNA的潜在靶标,可以在miRDB主界面在左侧菜单栏点击“Target Search”用于在数据库中检索已知的miRNA-靶基因关系。
指定物种名称并输入特定miRNA名称(或靶基因名称)后,点击“GO”。
检索得到的miRNA-靶基因关系。如果对特定的靶基因或miRNA感兴趣,点击“Details”即可查看二者的详细信息以及结合位点序列组成。
上传RNA序列至miRDB进行miRNA-靶基因的结合位点分析
上述方法是提供已知的miRNA或靶基因名称来检索数据库中已知的miRNA-靶基因关系。但如果miRNA或基因名称未知,或者只有一段RNA序列,就不能通过上述方法来检索了。
此时可以在miRDB主界面的左侧菜单栏点击“Custom Prediction”,指定物种名称并上传特定miRNA序列(或靶基因的mRNA序列)后,点击“GO”来通过匹配上传的序列与数据库中RNA序列的互补关系,进行miRNA靶基因分析。
等待一会儿后获得结果,展示了数据库中序列与上传序列可能存在的互补关系,即为潜在的miRNA-靶基因互作关系。如果对特定的靶基因或miRNA感兴趣,点击“Details”即可查看二者的详细信息以及结合位点。
下载miRDB库文件
此外,还可以通过在左侧菜单栏点击“Data Download”,将miRDB数据库中收录的所有miRNA-靶基因关系对下载下来,用于在本地批量匹配检索miRNA靶基因,不再多说了。
使用miRNet预测miRNA的靶基因
miRNet(https://www.mirnet.ca/)是一个一站式生物信息学在线网站,用于miRNA调控网络分析。miRNet集成了来自14个不同miRNA数据库的数据(TarBase、mirRTarBase、miRecords、miRanda、miR2Disease、HMDD、PhenomiR、SM2miR、PharmacomiR、EpimiR、starBase、TransmiR、ADMRE、TAM),支持人类、小鼠、大鼠、斑马鱼、果蝇、线虫等多种生物的miRNA潜在靶基因预测,并提供了交互界面允许用户创建以miRNA为中心的网络以直观地探索miRNA-靶基因关系,以及对靶基因的基因集富集分析来帮助了解miRNA功能。
对于如何利用miRNet预测miRNA的靶基因以及构建二者相互作用网络,首先在miRNet主页点击“miRNA”模块,进入miRNA靶基因预测界面。
在新界面中,选择目标物种、miRNA数据库、组织类型等,以便获得更精确的匹配结果。miRNA名称以列表形式粘贴在界面中后,点击Submit上传,随后再点击Proceed开始在数据库中检索目标miRNA的靶基因。
很快获得结果,检索得到的miRNA-靶基因关系。可进一步在该界面中查看下载miRNA靶基因预测结果,以及查看二者的互作关系网络图。
miRNA靶基因预测结果中,列出了数据库中检索到的与所上传的miRNA具有互作关系的基因。若对其中某些miRNA-靶基因关系更感兴趣,可以从中点击跳转数据库链接查看有关这些miRNA、基因的详细介绍,以及参考来源等。
网络图能够直观地探索miRNA、靶点和功能的关系,可以在该界面编辑网络图或下载数据文件。此外,miRNet还提供了基因集富集分析的功能,便于我们了解这些miRNA可能通过调控哪些基因的表达并对哪些重要功能产生影响。
使用miRWalk预测miRNA的靶基因
miRWalk(http://mirwalk.umm.uni-heidelberg.de/)是一个开源的在线数据库,可用于人类、小鼠、大鼠、狗和牛等生物的miRNA、基因的检索以及miRNA靶基因的预测。miRWalk集成了多个miRNA靶基因预测数据库(Targetscan、miRDB等)和1个实验验证的miRNA靶基因数据库(mirTarBase)来获取可能的miRNA靶基因。
miRWalk提供了两种方式的miRNA靶基因预测模式。一种是直接在“Search for a single gene or miRNA”中输入单个miRNA或基因名称查询其靶标,另一种是在“Target Mining”中进行多个miRNA或基因的的预测分析以及涉及的通路分析。下文我们主要介绍“Target Mining”模式的使用。
输入miRNA预测其结合的靶基因
如果想关注哪些特定的miRNA可能与哪些靶基因结合,在miRWalk主界面点击“Target Mining > miRNAs”模块,选择来源的物种、miRNA的命名方式并在界面中输入感兴趣的miRNA后,点击提交至数据库中寻找该miRNA的靶基因。
检索得到的miRNA-靶基因关系如下所示,可以设定阈值或根据Targetscan、Mirdb、Mirtarbase等不同来源的算法进一步筛选获得更可信的结果。如果对其中特定的靶基因或miRNA感兴趣,点击“detail”即可查看二者的结合位点,点击对应的miRNA、基因名称可跳转相关数据库查看有关它们名称、功能的详细描述。
另外,在miRNA-靶基因检索界面中还可以点击“link”跳转查看来自Targetscan、Mirdb、Mirtarbase等不同算法的原始预测。
在miRNA-靶基因检索界面的最后可以下载预测结果表格,并可以点击“Graph”来创建以miRNA为中心的网络以直观地探索miRNA-靶基因关系,以及点击“GSEA”执行靶基因的基因集富集分析,以便于我们了解这些miRNA可能通过调控哪些基因的表达并对哪些重要功能产生影响。
输入靶基因预测与其结合的miRNA
另一种常用方法是提供靶基因名称,来反向查找可能与其结合的miRNA。在miRWalk主界面点击“Target Mining > Genes”模块,选择来源的物种、基因名称类型并在界面中输入感兴趣的基因名称后,点击提交至数据库中寻找这些基因的靶miRNA。
检索得到的miRNA-靶基因关系,结果界面同上所述,可以设定阈值或根据Targetscan、Mirdb、Mirtarbase等不同来源的算法进一步筛选结果,查看感兴趣的miRNA-靶基因的的结合位点,进行基因集富集分析,查看有关miRNA、基因或功能的的详细描述,以及下载结果表格等,不再多说了。
参考文献
基因表达分析
差异表达基因分析:
参数检验:t-test limma edgeR DESeq2 EBSeq DEGseq
非参数检验:wilcox-test samr NOISeq
ChIP-seq
peaks的基因组注释:ChIPseeker
peaks的一致性分析:BEDTools ChIPseeker IDR
基因-功能分析
基因-功能/通路查询:
基因集富集分析(ORA或NTA算法):DAVID KOBAS clusterProfiler GOseq BiNGO Enrichr WebGestalt Metascape g:Profiler
基因集富集分析(GSEA算法):GSEA KOBAS-i clusterProfiler WebGestalt 1D/2D annotation enrichment
蛋白相互作用(PPI)网络:STRING
转录因子-靶基因调控 / 转录因子结合位点(TFBS):BETA JASPAR LASAGNA PROMO TRAP GTRD
https://mp.weixin.qq.com/s/7aqkCJxR26B8sG8b-A0flw