什么是「生物信息学」?
生物信息学是一门包括以信息科学的原理和方法对生物信息进行获取、处理、存储、传播、分析和解释等方面知识和方法的学科。它综合运用数学、计算机科学和生物学等知识来阐明各类数据的生物学意义,并利用基因组中编码区的信息进行蛋白质空间结构的模拟和蛋白质功能的预测,再将此类信息与生物体和生命过程的生理生化信息相结合,阐明其分子机制,最终进行蛋白质、核酸分子设计和药物设计,从而开发新的数据分析工具以实现对各种信息的获取和管理的学科。具体包括括生物学数据的研究、存档、显示、处理和模拟,基因遗传和物理图谱的处理,核苷酸和氨基酸序列分析,新基因的发现和蛋白质结构的预测等。
经历阶段
前基因组时代(20世纪90年代前) 这一阶段主要是各种序列比较算法的建立、生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等。
基因组时代(20世纪90年代后至2001年) 这一阶段主要是大规模的基因组测序,基因识别和发现,网络数据库系统地建立和交互界面工具的开发等。
后基因组时代(2001至今) 随着人类基因组测序工作的完成,各种模式生物基因组测序的完成,生物科学的发展已经进入了后基因组时代,基因组学研究的重心由基因组的结构向基因的功能转移。这种转移的一个重要标志是产生了功能基因组学,而基因组学的前期工作相应地被称为结构基因组学。
研究内容
一、生物信息的收集、存储、管理与提供:
包括建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统;生物信息的在线服务;生物信息可视化和专家系统。
二、基因组序列信息的提取和分析
包括基因的发现与鉴定,如利用国际EST 数据库 (dbEST) 和各自实验室测定的相应数据,经过大规模 并行计算发现新基因和新SNPs以及各种功能位点;基因组中非编码区的信息结构分析,提出理论模型,阐明该区域的重要生物学功能;进行模式生物完整基因组的信息结构分析和比较研究;利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与DNA折叠的关系以及基因组信息与生物进化关系等生物学的重大问题。
三、功能基因组相关信息分析
包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测的研究。
四、生物大分子结构模拟和药物设计
包括RNA(核糖核酸)的结构模拟和反义RNA的分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于DNA结构的药物设计等。
五、生物信息分析的技术与方法研究
包括发展有效的能支持大尺度作图与测序需要的软件、数据库以及若干数据库工具,诸如电子网络等远程通讯工具;改进现有的理论分析方法,如统计方法、模式识别方法、隐马尔科夫过程方法、分维方法、神经网络方法、复杂性分析方法、密码学方法、多序列比较方法等;创建一切适用于基因组信息分析的新方法、新技术。包括引入复杂系统分析技术、信息系统分析技术等;建立严格的多序列比较方法;发展与应用密码学方法以及其他算法和分析技术,用于解释基因组的信息,探索DNA序列及其空间结构信息的新表征;发展研究基因组完整信息结构和信息网络的研究方法等;发展生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。
六、应用与发展研究
汇集与疾病相关的人类基因信息,发展患者样品序列信息检测技术和基于序列信息选择表达载体、引物的技术,建立与动植物良种繁育相关的数据库以及与大分子设计和药物设计相关的数据库。
总的来说近期生物信息学将在以下几方面迅速发展:大规模基因组测序中的信息分析;新基因和新SNPs(单核苷酸多态性)的发现与鉴定;完整的比较基因组研究;大规模基因功能表达谱的分析;生物大分子的结构模拟与药物设计。而其长远任务是非编码区信息结构分析和遗传密码起源与生物进化的研究。读懂人类基因组,发现人类遗传语言的根本规律,从而阐明若干生物学中的重大自然哲学问题,像生命的起源与进化等。
发表回复