您当前的位置:首页 > 科研服务> 高通量测序结果分析 > 基因组重测序数据分析
基因组重测序数据分析
重测序
    全基因组重测序是对已知参考基因组序列的物种进行不同个体间的基因组测序,并在此基础上对个体或群体进行差异性分析。通过全基因组重测序,研究人员可以找到大量的单核苷酸多态性位点(SNP)、拷贝数变异(Copy Number Variation,CNV)、插入缺失(InDel,Insertion/Deletion)、结构变异(Structure Variation,SV)等变异信息,应用范围涉及临床医药研究、群体遗传学研究、关联分析、进化分析等众多领域。
    随着测序成本的大幅度降低以及测序效率的数量级提升,全基因组重测序已经成为研究人类疾病及动植物分子育种最为快速有效的方法之一。以人类疾病为例,目前人类已知的疾病中,有4000多种疾病与人类的基因有关。利用全基因组重测序的方法,可以在全基因组水平上检测与疾病相关的突变位点、结构变异等信息,进而寻找攻克这些疾病的治疗手段,研发有效地治疗药物。

***数据分析***
基本数据分析
  • SR2009-01 数据产出统计
  • SR2009-02 参考序列比对
高级数据分析
  • SR2009-03 SNP检测与统计
  • SR2009-04 InDel检测与统计
  • SR2009-05 融合基因识别
  • SR2009-06 结构变异(SV)分析
  • SR2009-07 拷贝数变异(CNV)分析
  • SR2009-08 变异属性分析
  • SR2009-09 SNP、SNV功能研究
  • SR2009-10 变异图谱绘制

***详细分析内容***
SR2009-01 数据产出统计
    对测序的原始数据进行初步质量分析,对低质量数据进行过滤,并给出测序质量评估报告。

SR2009-02 参考序列比对
    与参考基因组序列(Reference genome sequence)的比对分析,得到比对结果序列,从而对测序序列进行精确定位。

SR2009-03 SNP检测与统计
    采用整合多种SNP探测算法的结果,综合准确地识别出SNP。通过对多种算法各自识别的SNP进行一致性分析,保留具有高度一致性的SNP作为最终SNP结果。这些具有高度一致性的SNP同时具有非常高的可信度。在分析中使用到的SNP识别算法包括基于贝叶斯和基因型似然值计算的方法,以及使用连锁不平衡LD或推断技术用于优化SNP识别检出的准确性。

SR2009-04 InDel检测与统计
    计算全基因组的indel变异和基因型检出值的过程主要包含3步:(1)潜在的indel的探测;(2)通过局部重匹配计算基因型的似然值;(3)基于LD连锁不平衡的基因型推断和检出识别。

SR2009-05 融合基因(Fusion)
    选择注释的基因信息来自于当前最新版本的Ensemble Gene数据库,RefSeq数据库。图9-2例给出的是融合基因的形成,即来自不同染色体的各自外显子经过重组形成融合基因的模式图。

SR2009-06 结构变异(SV)分析
    结构变异(Structure Variation-SV)是基因组变异的一类主要来源,主要由大片段序列(一般大于1kb)的拷贝数变异(copy number variation, CNV)以及非平衡倒位(unbalance inversion)事件构成。目前主要一些基因组研究探测识别的SV大约有20,000个(DGV数据库)。在某些区域上,甚至SV形成的速率要大于SNP的速率,并与疾病临床表型具有很大关联。因此可以通过测序方式识别公共的SV,也可以识别全新的SV。

SR2009-07 拷贝数变异(CNV)分析
    拷贝数变异分析就是指根据基因组框内覆盖度深度与期望覆盖度深度进行关联,并识别出CNV,并得到拷贝数的绝对值和相对水平。我们也将采用不同算法识别原始测序数据中的缺失片段(deletion)和重复片段(duplication) 。如下图,反映了在该染色体上,大部分片段都发生了不同程度的拷贝数增加(也就是纵轴大于2的散点所处位置)。


SR2009-08 变异属性分析
    本分析项目包括计算低频度变异的分布,全新变异体(novel variant)的等位基因频率和数量分布,变异体的大小、分布,结构变异SV的断点联结点(BreakPoint Junction)分析。

SR2009-09 SNP、SNV功能研究
    分析GWAS研究中得到的易感基因在基因组上不同坐标上的OR值分布情况; 将当前已知的GWAS研究成果与SNP进行比较;根据LD连锁不平衡将SNP与易感基因的关系进行深入讨论;直接与间接关联方法可以分别识别与表型相关的SNP,对于不易获得(missing)和定位的SNP,可通过LD连锁不平衡推断疾病易感基因突变座位。


SR2009-10 变异图谱绘制
    CIRCOS图是癌症文章中大都会用到的变异检测结果展示方法。A comprehensive catalogue of somatic mutations from a human cancer genome文章中用到图9-6的circos图。
锐博生物可根据客户所做的变异检测,把变异检测的结果和染色体条带、测序结果联系起来,做出信息完整的circos图。

图 9-1 结构变异circos图
    对于这个变异图谱,外圈代表癌症基因组染色体,依次到内圈,浅绿色方块是碱基插入,墨绿色方块是碱基缺失;浅橙色表示杂合子,暗橙色是纯合子;下一层颜色方块是氨基酸突变:灰色是沉默突变,紫色是错义突变,红色是无义突变,黑色是剪切位点;蓝色折线状线条是碱基拷贝数;绿色曲线条是染色体内序列重排,紫色曲线条是染色体间序列重排。
 





版权所有:广州市锐博生物科技有限公司 Copyright©2013 Guangzhou RiboBio Co., Ltd.
地址:广州开发区科学城科学大道182号创新大厦C3区13-14层   邮编:510663   粤ICP备05022931号   浏览器建议:IE8.0 1024X768分辨率
主营产品及服务:piRNA  寡核酸  siRNA  miRNA  microRNA   RNAi  shRNA  lncRNA  ncRNA  细胞增殖  生物芯片  高通量测序