当前位置:首页 >> 医学 >>

第二篇第十二章 生物信息学在分子诊断中的应用


第二篇 技术篇 第十二章 生物信息学在分子诊断中的应用 第一节 生物信息学概论 一、生物信息学的定义 生物信息学是结合了生物学和信息技术, 利用计算机和互联网技术, 分析海量的并且还在快 速积累的生物数据,从中获取生物科学新知识的一门新的交叉科学。 人类基因组计划的意义 人类基因研究的意义在于它可以支持和推动生命科学中一系列重要的基础性研究。 如基因组 遗传语言的破译,基因的结构与功能关系,生命的起源和进化,细胞发育、生产、分化的分 子机理,疾病发生的机理等。为推动医学长足进步带来前所未有的机遇,基因诊断、基因疗 法和基因药物的开发, 有可能成为未来医学发展的重要分支。 人类基因组计划的进一步成功 将促进生命科学与信息科学、材料科学的融合,从而带动一批高技术产业的发展 二、生物信息学研究的范畴 第一、各种生物数据库的建立和管理; 第二、研究高效率的统计工具,分析算法, 发展方便、快捷的分析程序; 第三、从海量的原始生物数据中发掘新知识。 第二节 计算机和互联网 一、计算机常识:硬件和软件 计算机的主要硬件由中央处理器(CPU) 、存储器、输入设备和输出设备组成。 常用的操作系统:windows 、UNIX 、Linux 二、互联网和常用搜索引擎 WWW 是 World Wide Web 的缩写,即通常我们所说的国际互联网,它的每个节点在逻 辑上都与任何其他节点保持联系,可以相互交换信息。 三、文件的压缩和解压 传输或保存较大的数据时,常对文件进行压缩,以减少数据量。特别是对于图形文件, 压缩尤其重要。在 UNIX 或 Linux 系统中,压缩命令是 compress myfile,压缩后的文件自动加 上后缀.Z。 解压缩命令是 uncompress myfile.Z。 PC 机上的 Windows 操作系统没有标准的压缩 和解压软件,但网上有许多针对 Windows 的免费或代免费试用期的压缩软件,如 FreeZip、 WinZip 等 四、文件和数据的传送 用户需要递交一条或多条核酸或蛋白质序列去做数据库查询或比对。 这时常用的方法有: 使用视窗系统的剪切、复制和粘贴的功能.对于不太长的序列,这种方法比较方便;网 页的输入窗口旁常有一个“浏览目录”按钮,点击该按钮,会弹 出一个对话框,找到需要 上传的序列文件,再按“提交”钮完成递交。用这种方法可以一次递交较长的序列;有些大 型信息中心和研究单位还有远程文件传送服务,即遵从文件传输协议 (file transfer protocol, ftp)的服务器地址,用户可以无记名的方式访问公用的目录,读取文件,下载软件或数据。 五、编程和语言 在众多的计算机语言中, C 语言无疑是最常用的, 它具有代码精炼, 执行效率高的特点, 网上还有大量的现成模块供免费使用。 对于非计算机专业人员, 还可以选择 Visual BASIC (VB)
1/5

语言。VB 语言具备了高级语言的特点,语句结构类似自然语言,对于生物背景的专业人员 可能较容易掌握。 如果在研究中大量使用网络资源, 则需要掌握一定的网络编程语言, 例如: Perl 语言、PHP 语言和 JAVA 语言等。 第三节 数据的获得 DNA、RNA、蛋白质的测序 蛋白质结构的分析 基因和蛋白质的表达数据 蛋白质相互作用 一、DNA、RNA 和蛋白质的测序 基因组 DNA 直接来源于细胞核基因组,它的组成包括基因和基因间区域,基因序列中 还包括内含子和外显子。cDNA 是由 mRNA 逆转录而来,全长 cDNA 应该包括 5’端非编码 区, 3 ’ 端的多聚腺苷酸序列和编码序列。 重组 DNA 序列是基因重组到质粒、 病毒和 cosmid 等载体 后经测序得到的 DNA 序列。 RNA 的序列可以从基因组序列或 cDNA 序列推导出来; 直接的 RNA 测序涉及修饰核苷酸 的识别,可通过质谱分析获得。蛋白质的序列可以通过 DNA 序列推导而来,但从 DNA 序列 推导的蛋白质序列不能反应真实的蛋白质序列情况,蛋白质测序主要依靠质谱分析 (mass spectrometry, MS)技术, 基本原 理是通过准确测定真空中的离子质量或电荷量来测算出分子 组成。 二、蛋白结构的分析 X 射线晶体学技术: 通过研究 X 射线对蛋白质晶体的扫描后产生的衍射模式来测定蛋白质的 结构; 核磁共振谱法(NMR) spectroscopy):该方法常用于较小(<25kDa)的,可溶性蛋白 质结构的测定; 有些蛋白质很难结晶,不能用 X 射线晶体学技术测定,又太大而不能用核 磁共振谱技术测定,其它技术方法:X 射线纤维衍射技术;电子显微镜(electron microscopy); 环形双色色谱技术(circular dichroism (CD) spectroscopy) 三、基因和蛋白质表达数据 表达文库的测序 基因表达连续分析技术(serial analysis of gene expression, SAGE) DNA 芯片 双向电泳分析技术(2D gel electrophoresis) 四、蛋白质相互作用 1、遗传学方法: 2、亲和性方法: 亲和色谱法(Affinity chromatography) 免疫共沉淀法(coimmunoprecipitation) 免疫共沉淀基本原理: 细胞裂解液中加入抗体,与抗原形成特异免疫复合物, 经过洗脱,收集免疫复合物,然后进行 SDS-PAGE 及 Western blotting 分析。 3、分子和原子法:X 射线晶体法和核磁共振法 4、基于文库法:酵母双杂交系统(yeast two-hybrid (Y2H)system)
2/5

第四节 生物信息数据库 一、重要生物信息中心 美国国家信息中心 (National Center of Biotechnology Information, NCBI)的 GenBank (http:/ / www.nchi.nlm.nih.gov/web/GenBank/index.html); 欧 洲 分 子 生 物 学 室 验 室 (European Molecular BiologyLaboratory-European Bioinformatics Institute, EMBL-EBI)的 EMBL (http:// www.ebi.ac.uk/databases/index.html); 日本 DNA 数据库 (DNA Data Bank of Japan, DDBJ) (http:/ / www.ddbj.nig.ac.jp/ ) 最重要的蛋白质氨基酸序列数据库是瑞士的 SWISS- PROT (http://au.expasy.org/sprot/); 蛋白质数据库 PIR(Protein Information Resource),包含所有序列已知的自然界中野生型蛋白质 的信息 (http://pir.georgetown.edu); PDB 蛋白质结构数据库:收集由 X 射线衍射和核磁共振技术测定的蛋白质大分子三维结构 (http://www.rcsb.org/pdb) 二、数据库检索工具 Entrez 检索工具: Entrez 是美国国家生物技术信息中心( NCBI )提供的集成检索工具 http://www.ncbi.nlm.nih.gov/Entrez/ SRS(Sequence Retrieval System)检索工具:是欧洲分子生物学网 EMBnet 的主要数据库检索 工具,可以从 EMBnet 的主页进入。 DBGET/LinkDB 检索工具:是日本京都工具大学建立的 GenomeNet 数据库,该数据库主要针 对代谢途径。 http://www.genome.ad.jp/dbget/dbget_manual.html。 二、数据库检索工具 第五节 核酸序列分析 一、核酸序列的基本分析 核酸序列的分子量、碱基组成、碱基分布等基本分析: BioEdit (http://www.mbio.ncsu.edu/BioEdit/bioedit.html) ★DNAMAN (http://www.lynnon.com/) 限 制 性 酶 切 分 析 : 限 制 性 酶 数 据 库 (Restriction Enzyme DataBase,REBASE) (http://rebase.neb.com ;★ http://www.neb.com/rebase) 测序峰图的查看、核实与修改 :Chromas,BioEdit,DNAMAN 测序结果需要识别与去除测序时使用的载体序列 : VecScreen ( http://www.ncbi.nlm.nih.gov/VecScreen.html) EST 序列进行电子延伸 : 将待分析的核酸序列(称为种子序列)采用 Blast 软件搜索 GenBank 的 EST 数据库,获得与 种子序列有较高同源性的 EST 序列, 一般要求在重叠 40 个碱基范围内有 95%以上的同源性, 称匹配序列;将匹配序列与种子序列装配成新序列,即片段重叠 群分析(contig analysis);再 以新产生的序列为种子序列,重复上述过程,直至没有新的匹配序列为止。 对核酸序列进行电子基因定位 : 利用序列标签位点(Sequence Tagged Site, STS); 利用 UniGene 数据库进行基因电子定位; 直 接利用基因组序列进行基因电子定位。 二、核酸序列的比对分析和功能预测 BLAST (Basic Local Alignment Search Tool)是基本局域联配搜索工具;Blast 功能有: FASTA:根据用户提交的单个序列进行数据库搜索比对的程序。
3/5

网上服务器和电子邮件服务: http://www.ebi.ac.uk/ mailto: fasta@ebi.ac.uk http://www.fasta.genome.ad.jp mailto: fasta@nig.ac.jp 进行多序列联配 : ClustalW:http://www.ebi.ac.uk/clustalw/index.html , http://iubio.bio.indiana.edu/soft/molbio/align/clustal/ , ftp://ftp.ebi.ac.uk/pub/software/dos/clustalw。 ClustalX: CluastalW 程序的 UNIX 版本,它使用 X 窗口图形界面, ftp://ftp.ebi.ac.uk/pub/software ftp://ftp-igbmc.u-strassbg.fr/pub/clustalX。 对联配结果进一步编辑,形成适于发表的形式,可用的软件有: SeaView: ftp://biom3.univ-lyon1.fr BOXSHADE: http://www.ch.embnet.org/software/box_form.html) CINEMA: http://www.bioinf.man.ac.uk/dbbrowser/cinema2.1/cinema2hdr.html 三、开读框的分析 GT-AG 法则:外显子与内含子之间的连接区序列高度保守,如大部分内含子 5’端起始的两 个碱基是 GT,3’端最后两个碱基是 AG。 基因识别软件,常用的有: ★ORF Finder (http://ncbi.nlm.nih.gov/gorf/gorf.html ) GRAIL (http://avalon.epm.ornl.gov/grainbin/ ) GeneFinder (http://genomic.sanger.ac.uk ) Glimmer (http://www.cs.jhu.edu/labs/compbio/glimmer.html/ ) GenScan (http://genes.mit.edu/genscan.html ) GeneLang (http://www.cbil.upenn.edu/genlang/) 四、引物设计 Primer Premier 软件: http://www.premierbiosoft.com Primer3 软件: http://www.genome.wi.mit.edu/cgi-bin/primer/primer3 Oligo、Vector NT、Omiga 等 五、向数据库提交核酸序列 向 EMBL 提交数据的网络表格可参见:http://www.ebi.ac.uk/subs/emblsubs.tml 向 GenBank 数据库提交核酸序列可联网进 http://www.ncbi.nlm.nih.gov/GenBank/index.html 也可用 Sequin 软件制作好序列提交文件, 向 NCBI 发送 E-mail(gb-sub@ncbi.nlm.nih.gov)提交 第六节 蛋白质序列分析 一、蛋白质基本性质分析 蛋白质的氨基酸组成、分子量、等电点等方面的分析 : OMIGA、DNAMAN、BioEdit、MacVector 等
4/5

蛋白质疏水性分析 :ProtScale, http://www.expasy.org/cgi-bin/protscale.pl 预测跨膜区 : http://genome.cbs.dtu.dk/services/TMHMM-2.0/ http://www.ch.embnet.org/software/TMPRED_form.html http://www.emblheidelberg.de/services/sander/predictprotein ftp://ftp.biochem.ucl.ac.uk。 预测信号肽:http://genome.cbs.dtu.dk/services/SignalP/ 蛋白质亚细胞定位 :http://predict.sanger.ac.uk/nnpsl/ 二、蛋白质功能预测 磷酸化位点、糖基化位点,特殊的结构区(motif)的分析: PROSITE: http://www.expasy.org/prosite/ BLOCKS: http://www.blocks.fhcrc.org/blocks/ PFAM: http://www.sanger.ac.uk/software/pfam/ PESCAN: http://www.isrec.isb-sib.ch/software/pfscan InterProScan: http://www.ebi.ac.uk/interpro/scan.html SMART: http://smart.embl-heidberg.de/ 三、蛋白质结构预测 蛋白质的立体结构数据库 PDB(Protein Data Bank): (http://www.umass.edu/microbio/rasmol) PDBFinder (http://www.sander.embl-heideberg.de/pdbfinder) 蛋白质分子模型数据库(Molecular Modeling Database); 三维结构显示程序 Cn3D (http://www.ncbi.nlm.nih.gov/structure) 同源建模(Homology modeling)分析服务 (http://www.expasy.ch/swissmod/sm_toppage.html) 常用的有以下几个工具: TOPITS: http://www.embl-heidelberg.de/predictprotein frsvr: http://www.mbi.ucla.edu/people/frsvr/frsvr.html THREADER: http://globin.warwick.ac.uk/~jones/ 四、蛋白质分子进化分析 DNAMAN ClustalW PHYLIP(http://evolution.genetics.washington.edu/) PAUP MrBayes(http://morphbank.ebc.uu.se/mrbayes/ ) 亲缘树显示程序: TreeView (http://taxonomy.zoology.gla.ac.uk/rod/treeview) Phylodraw(http://iubio.bio.indiana.edu/treeapp/)

5/5


相关文章:
第二篇第十二章 生物信息学在分子诊断中的应用.pdf
第二篇 技术篇 第十二章 生物信息学在分子诊断中的应用 第一节 生物信息学概论
生物信息学的进展及其在分子微生物学研究中的应用.pdf
生物信息学的进展及其在分子微生物学研究中的应用_生物学_自然科学_专业资料。分子诊断与治疗杂志 2011 年 5 月 第3卷 第 3 期 J Mol Diagn Ther, May ...
生物信息学在基因诊断与基因治疗中的应用.doc
生物信息学在基因诊断与基因治疗中的应用_理学_高等...主要是由 于分子生物学的理论及技术方法,特别是重组...第二十一章 基因诊断与... 暂无评价 15页 免费 ...
新型诊断技术和应用.ppt
生物信息学在分子诊断中的... 74页 免费 创造性评价...PCR测序演示版 1 2 PCR技术在分子诊断中的应用 ...二、单基因疾病的诊断单基因遗传病是由于某一基因结...
生物信息学的进展及其在分子微生物学研究中的应用 (1).pdf
生物信息学的进展及其在分子微生物学研究中的应用 (1) - 分子诊断与治疗杂志
生物信息学的进展及其在分子微生物学研究中的应用_陈文聪.pdf
生物信息学的进展及其在分子微生物学研究中的应用_陈文聪_生物学_自然科学_专业资料。分子诊断与治疗杂志 2011 年 5 月 第3卷 第 3 期 J Mol Diagn Ther, ...
生物信息学在医学领域的应用前沿.doc
二、生物信息学在医学领域的应用 一、主要数据库 ...有 13 个外显子和 12 个内含子组成,主要定位于人...基因诊断又称 DNA 诊断或分子诊断,通过分 子生物学...
生物信息学在临床医学上的应用.doc
各种疾病发生的分子机制,进而发展 适宜的诊断和治疗...从某种 意义上说,生物信息学在靶点确定中的应用已...[ K].上海:上海科学技术出版社 , 2000: 12-22 ...
生物信息学在微生物研究领域中的应用.doc
生物信息学及其在微生物研究领域中的应用摘要: 生物...分子诊断与治疗杂志, 2011. 03(3): 第207-211页...[12]. 郑斯平等, 特色农业微生物基因组研究系统的...
生物信息学在生物方面的应用.doc
生物信息学在生物方面的应用 生物信息学(bioinformaLics)是以核酸和蛋白质等生物大分子数据 库及其相关的图书、文献、资料为主要对象,以数学、信息学、计算 机科学...
生物信息学在发现新基因中的应用_图文.ppt
生物信息学在发现新基因中的应用_生物学_自然科学_...了解各种疾病发生的分子机制,进而发展适宜的诊断和...
浅谈生物信息学在生物学研究中的应用.doc
浅谈生物信息学在生物学研究中的应用_生物学_自然...生命科学的研究进入了分子生物学时代, 而遗传信息...探讨重大疾病机制,疾病诊断 和防治、新药的开发提供...
生物信息学应用_图文.ppt
模拟与药物设计 生物信息学在分子生物技术中的应用 ...测序以及分型数 据,如基因组关联分析、分子诊断 ?...
生物信息学在医学领域的应用研究现状.doc
生物信息学在医学领域中主要应用于医学基础研究、临床...发现及确认 ; 二是具有生物活性的生物小分子的设计...这一技术的成熟和应用将给遗传研究、疾 病诊断和...
高通量测序在临床分子诊断中的应用与展望_论文.pdf
高通量测序在临床分子诊断中的应用与展望_电子/电路...(哈尔滨医科大学附属第四医院检验科,黑龙江 哈尔滨 ...生物信息学 Application and prospect of high-...
分子诊断与临床 PPT_图文.ppt
分子诊断在应用中的问题及对策 5. 分子诊断的发展...生物芯片技术 7. 蛋白质组学技术 8. 生物信息学 ...
生物信息学简介、应用与展望.doc
生物信息学简介、应用与展望_生物学_自然科学_专业...生物信息学在基因的功能发现、疾病基因诊断、蛋白质...在从事分子生物学研究的几乎所有实验室中, 对所获得...
生物信息学在药物研究和开发中的应用_王可鉴.pdf
中国药理学与毒理学杂志 2014 年 2 月第 28 卷第 1 期 Chin J Pharmacol Toxicol,Vol 28 ,No 1 ,Feb 2014 生物信息学在药物研究和开发中的应用 1 1...
生物信息学的进展及其在分子微生物学研究中的应用.pdf
生物信息学的进展及其在分子微生物学研究中的应用_生物学_自然科学_专业资料。分子诊断与治疗杂志 2011 年 5 月 第3卷 第 3 期 J Mol Diagn Ther, May ...
生物信息学的发展及其应用.pdf
技术及生物信息学在医药 、 农业等方面的应用 ; ...的大分子中 , 这个观点开辟了遗传学的信息主义学派...3. 1 基因疾病的诊断 人类的很多疾病与基因有着...
更多相关文章: