Closed ixxmu closed 1 month ago
1
说在前头
2
一、按物种查询
3
二、按照基因家族查询
4
重点来了
我们先按照物种来看吧,举一反三,以拟南芥为例,进去看下。展示了本物种所有转录因子家族情况。
点击BES1 这个基因家族进去看下,有该基因家族的介绍、列出了其家族成员14个转录因子,也是可以下载这14个转录因子的蛋白序列,等等。
再点击其中1个转录因子AT1G19350.3进去看下,页面要往下划拉半天,可以看到非常非常非常之多的信息了。这里我们大概讲下,基本的一些信息就略过。详细的解释可以查看如下页面。
https://planttfdb.gao-lab.org/help_info.php
Basic Information
Gene Model ID:从基因组或者数据库里获取的基因id。
Gene Model Type,有3种。
1.genome:注释好的基因组。
2.PU_ref:来自PlantGDB数据库和UniGene数据库的,从一组PUTs和Unigene被挑选出来具代表性的转录本/基因。
3.PU_unref:来自PlantGDB数据库和UniGene数据库的,但并不是一组PUTs和Unigene中选出的具代表性的转录本/基因。
补充
PUTs
PUTs指的是编码蛋白质的独特转录本。在基因表达研究中,转录本(transcripts)是基因表达的直接产物,包括mRNA和非编码RNA。PUTs通常是指那些编码特定蛋白质的mRNA转录本,并且每个转录本是独一无二的,即对应于基因组中的一个特定位置。
在一些数据库中,PUTs用于表示那些已经通过实验验证或预测为编码蛋白质的转录本序列。
UniGene
UniGene集是根据序列相似性将来自同一基因的ESTs(Expressed Sequence Tags)分组,形成一个代表该基因的非冗余的转录本集合。每个UniGene集代表一个基因或基因家族,UniGene集中的转录本序列可以包括来自不同转录起始位点或剪接形式的变体,而PUTs通常是指那些已经确定为编码蛋白质的特定转录本。
Signature Domain
特征结构域,用于识别和分类转录因子的特定蛋白质区域。含有特定的氨基酸序列和/或结构模式,它们负责转录因子的DNA结合能力、转录激活或其他功能。通常是转录因子家族成员的共有特征,有助于区分不同的转录因子家族。
该蛋白的注释信息,比如Pfam、InterPro数据库
Entry ID: 是数据库中特定蛋白质家族或域的条目标识符。这里的 "PF05687" 表示Pfam数据库中识别的特定域的ID。
Gene Ontology
植物本体论,各种本体论,比如上述的Gene Ontology,再比如之前在不讲寻常话,CellMarker2.0真干货!里就提到过2个UBER Anatomy Ontology和Cell Ontology。
都有哪些本体论?
5
文献Figure,用R画
点击公众号进入,底部菜单栏【挖到干货】里的【期刊同款图】查看!持续更新,代码大放送!推文中脚本现成的,直接copy!
6
生信这些,得了解
今天是诗
七月坐凉宵,金波满丽谯
https://mp.weixin.qq.com/s/nNDL95uikH-8rEXAf6hphw