在线工具
为了方便广大科研工作者对各类编码和非编码RNA做结构或序列分析、注释、预测基因靶标、功能查询等生物信息学内容,我们在此汇集了许多常用的在线工具。
RiboBio Galaxy 生信分析平台致力于解决生物信息分析中常见的文本处理、格式转换、以及数据可视化等问题,详情点击:galaxy.ribobio.com:8088/
RiboBio Primer Design Tools为用户提供简单、方便、快捷的引物设计平台,提供基础、标准和高级版,详情点击:https://www.ribobio.com/service-and-support/ribobio-primer-design-tools/
NCBI (National Center for Biotechnology Information)是指美国国立生物技术信息中心,NCBI研究小组包括计算机科学家,分子生物学家,数学家,生物化学家,实验物理学家,和结构生物学家,集中于计算分子生物学的基本的和应用的研究。这些问题包括基因的组织,序列的分析,和结构的预测。目前研究计划的一些代表是:检测和分析基因组织,重复序列形式,蛋白domain和结构单元,建立人类基因组的基因图谱,HIV感染的动力学数学模型,数据库搜索中的序列错误影响的分析,开发新的数据库搜索和多重序列对齐算法,建立非冗余序列数据库,序列相似性的统计显著性评估的数学模型和文本检索的矢量模型。另外,NCBI研究者还坚持推动与NIH内部其他研究所及许多科学院和政府的研究实验室的合作。
miRBase序列数据库是一个提供包括 miRNA 序列数据、注释、预测基因靶标等信息的全方位数据库,是 miRNA 研究权威数据依据之一。microRNA 21.0版是最新版本,新版数据库的可靠性进一步提升,总计,新增了4196条发夹前体序列和5441条成熟miRNA,并清除了一些不明确的和错误注释的序列。
EXORBASE是由人血液外体的RNA SEQ数据分析衍生的环状RNA(circRNA)、长链非编码RNA(lncRNA)和信使RNA(mRNA)的储存库,还包括来自已发表文献的实验验证。EXORBASE基于正常人和不同疾病患者的标准化RNA SEQ数据,整合和可视化RNA表达谱。EXOBASE的目的是收集和表征人类血液外体中的所有长RNA物种。提供了注释、表达水平和可能的原始组织。EXORBASE将帮助研究人员识别血液外体中的分子标记,并将触发新的循环生物标志物发现和人类疾病的功能含义。
CSCD(癌症特异性circRNA数据库)是为癌症特异性环蛋白开发的数据库。CSCD收集了来自87个癌细胞样品的可用RNA测序(总RNA与rRNA去除或polyA富集)数据集。我们使用了4种流行的算法:CIRI, find_circ, circRNA_finder和circexplorer进行了综合分析。然后我们收集仅在癌症样本中鉴定的circRNA,而不是任何正常样品。目前在CSCD有272152种癌症特异性circRNA。
CIRCpedia (v2)
CIRCpedia (v2)是一个更新的综合数据库,包含来自六个不同物种的超过150个RNA SEQ数据集的circRNA注释,允许用户搜索、浏览和下载具有各种细胞类型/组织(包括疾病样本)的表达特征/特征的circRNA。此外,更新的数据库结合了人与小鼠之间的CrCRNs的保守性分析。最后,Web界面还包含用于比较样本之间的CyrRNA表达的计算工具。
PlantRNA:http://plantrna.ibmp.cnrs.fr/
Ensembl
piRNApredictor
RNAfold web server
NRED
提供人和小鼠的长链非编码RNA在芯片数据的表达信息。这也是John mattick实验室构建的网站。
LncRNADisease database
circRNADb数据库
UniProt蛋白序列与功能
UniProt为科学界提供一个全面、高质量、可自由获取的蛋白质序列和功能信息资源。
https://www.uniprot.org/
LNCipedia
对人类的长链非编码RNA的序列和结构全面的注释。
ExoCarta外泌体数据库
外泌体是由大多数细胞类型分泌的内吞细胞来源的30~150 nm的膜囊泡,ExcOctA是一个外泌体数据库,提供了在多个生物体中的外来体中识别的内容。
http://www.exocarta.org/
Vesiclepedia胞外囊泡数据库
Vesiclepedia是一个专门收录胞外囊泡研究的数据库,涉及到的物种有33个,来源研究538个,包含了凋亡体,微泡,外泌体等在内的囊泡中发现的miRNA/mRNA/蛋白 /脂类。
EVpedia
The Functional lncRNA Database
一个哺乳动物长链非蛋白编码转录本数据库。如果要搜索特定的lncRNA,请在搜索框中输入其名称,然后选择特定的物种。还可以一次浏览所有lncRNAs。当前,该数据库包含了来自人类、小鼠和大鼠的lncRNAs。
lncRNAdb
提供有生物学功能的长链非编码RNA的全面注释。这是长链非编码RNA研究领域的大牛John mattick实验室构建的网站。
NONCODE
提供对长链非编码RNA的全面注释,包括表达和该团队开发的ncFANs计算机软件预测的lncRNA功能,这是非编码RNA研究的知名数据库。
GeneCards v3
GeneCards是一个可搜索的集成的人类基因数据库,提供了简洁的基因组相关的信息,对所有已知和预测的人类基因。
NCBI/ BLAST
序列分析常用工具。BLAST发现生物序列之间的相似区域,该程序将核苷酸或蛋白质序列与序列数据库进行比较,并计算统计学意义。
Linc2GO数据库
该数据库旨在提供人类lncRNA的全面功能注释,整合了microRNA-mRNA以及microRNA-lncRNA相互作用数据以基于“ceRNA假说”产生lncRNA功能注释。
lncLocator: long non-coding RNA
由上海交大模式识别与生物信息学研究组开发,用于预测lncRNA在亚细胞中的定位。
UCSC Genome Browser
TCGA
circNet
整合circRNA-miRNA-mRNA的互作网络。
circRNA检索数据库
用于检索circRNA信息。
http://www.circbase.org/
CircPro
CircPro是自动化高通量数据分析流程,它能够检测circRNAs,预测其蛋白质编码潜力,并发现Ribo测序数据的连接读取。
cystoscape网络图
Cytoscape是一个专注于开源网络可视化和分析的软件,它可以建构分子交互作用网络,以可视化的方法将分子间的互作关系展现出来。
catRAPID
大规模预测RNA与蛋白质相互作用的算法。