如何挖掘基因全基因组测序数据分析的价值

转录组测序数据分析在玉米籽粒功能基因挖掘中的应用--《中国农业大学》2017年博士论文
转录组测序数据分析在玉米籽粒功能基因挖掘中的应用
【摘要】:玉米籽粒的物质积累过程是影响玉米产量与品质的重要因素之一。随着测序技术与生物信息学的发展,以高通量测序数据为基础,在全基因组范围内发掘玉米籽粒物质积累相关的功能基因,不仅对作物育种及改良具有重要的意义,同时也为作物功能基因组学研究提供了新的策略与方法。本研究通过构建玉米转录组测序数据分析平台,对368个玉米自交系籽粒的转录组测序数据进行了分析,以玉米籽粒物质积累过程为研究重点,从中找到了在玉米改良过程中受选择作用的功能基因。此外,本研究也通过转录组测序数据的从头组装,构建了玉米的泛转录组,研究了其中与籽粒物质积累过程相关的遗传组分。主要研究结果如下:1.利用目前主流的转录组分析软件,构建了玉米转录组测序数据分析平台。该平台主要由基于参考基因组的比对分析平台和无参考基因组的Denovo组装平台构成。其中,基于参考基因组的平台中又包含了序列比对、SNP Calling和表达分析三个子平台,能够满足群体转录组分析的多种需求。无参考基因组的Denovo组装平台则可以对测序数据进行从头组装,在玉米新基因挖掘及泛转录组的构建上具有重要的应用价值。此外,利用统计学及生物学的方法对平台分析结果进行验证,均显示其具有较高的准确性与可信度。2.根据群体结构及适应性将368份玉米自交系分为温带(190份)和热带(178份)两个玉米类群,结合转录组分析所获的558,579个高质量SNP标记,利用XP-EHH选择信号检测方法对群体间受选择的情况进行了研究。在温带和热带玉米中分别鉴定了 730个和421个选择区域,其中温带玉米受到了更强的选择作用。对选择区域中受选择的基因进行功能注释,发现调控相关基因在选择区域内显著富集,并且在群体间存在表达差异(P-value0.05)。进一步对其中与玉米籽粒物质积累相关的基因进行分析,发现蔗糖降解途径两个关键酶的编码基因sus1和incw1在温带玉米中受到了强烈的选择(top 0.5%),并且在温带玉米中的表达水平极显著地高于热带玉米(P-value0.01)。同时,在该途径的其它基因及玉米油分合成途径的相关基因中也检测到了类似的选择信号,表明玉米籽粒物质积累相关基因在玉米育种改良过程中受到了明显的人工选择作用。3.通过对玉米基因表达的存在/缺失变异(ePAV)模式进行转化,并设计了"先组装后比对"的策略将玉米转录组测序数据进行从头组装,分别获得了 13,382个ePAV基因和2,355条高质量的新序列(novel sequences),并以此构建了玉米的泛转录组。序列数据分析与重测序实验验证表明,ePAV表达模式更能够反映玉米基因在不同自交系中的表达差异,而"先组装后比对"的策略也更适用于玉米转录组的从头组装。与严建兵教授实验室合作,利用玉米泛转录组中的遗传变异,与玉米15个农艺性状表型和526个籽粒代谢相关性状进行全基因组关联分析,发现类黄酮代谢途径中相关基因的ePAV表达模式与该途径中代谢物的含量显著关联(P-value7.49E-5),表明ePAV基因及ePAV模式对玉米籽粒物质积累过程中代谢物合成调控过程具有重要的影响。本研究旨在利用转录组测序数据,在全基因组的水平上发掘对玉米籽粒物质积累过程具有重要影响的功能基因,并尝试解析其遗传机理和生物学功能,从而为玉米育种改良工作提供重要的遗传资源。
【学位授予单位】:中国农业大学【学位级别】:博士【学位授予年份】:2017【分类号】:S513
欢迎:、、)
支持CAJ、PDF文件格式
【参考文献】
中国期刊全文数据库
许波;张伟强;冯晓曦;王成业;张海申;许海涛;王友华;张今瀚;;[J];玉米科学;2014年01期
仇焕广;张世煌;杨军;井月;;[J];中国农业科技导报;2013年01期
徐雷;贾飞飞;王利琳;;[J];西北植物学报;2011年05期
解增言;林俊华;谭军;舒坤贤;;[J];生物技术通报;2010年08期
陈福禄;傅永福;林辰涛;;[J];中国农业科技导报;2009年02期
吴东东;张亚平;;[J];科学通报;2008年07期
邓立彬;汤晓丽;康健;王青芸;曾长青;;[J];科学通报;2007年18期
唐祈林;荣廷昭;;[J];玉米科学;2007年04期
王晓燕,高荣岐,董树亭;[J];中国农学通报;2005年06期
李明顺,张世煌,李新海,田清震,白丽;[J];玉米科学;2004年03期
【共引文献】
中国期刊全文数据库
王跃;毛开云;王恒哲;马征远;;[J];生物产业技术;2017年05期
彭乙申;易福金;;[J];江苏农业科学;2017年16期
汪希成;谢冬梅;;[J];石河子大学学报(哲学社会科学版);2017年04期
靳旺杰;李莉艳;钟梅;宋兰林;阚文宏;;[J];国际检验医学杂志;2017年15期
邢菁华;;[J];医学与哲学(B);2017年07期
王全忠;薛超;周宏;;[J];农业现代化研究;2017年04期
张淳;张媛媛;;[J];中国医学装备;2017年07期
易浪波;李富;崔国贤;;[J];中国麻业科学;2017年02期
于恒;张春良;余徐润;熊飞;王忠;顾蕴洁;;[J];扬州大学学报(农业与生命科学版);2017年01期
苏日古嘎;恩和;;[J];农业展望;2017年03期
【二级参考文献】
中国期刊全文数据库
张凤霞;王国栋;;[J];中国农业科技导报;2013年02期
夏天;肖丙秀;郭俊明;;[J];遗传;2013年03期
王波;;[J];粮食问题研究;2012年06期
习银生;杨丽;;[J];中国农垦;2012年11期
闫绍鹏;杨瑞华;冷淑娇;王秋玉;周容涛;;[J];中国农学通报;2012年30期
佟屏亚;;[J];农业科技通讯;2012年10期
魏斌;;[J];农业展望;2012年09期
张世煌;;[J];作物杂志;2012年05期
孟春红;路振广;;[J];中国农村水利水电;2012年09期
郝大程;马培;穆军;陈士林;肖培根;彭勇;霍利;许利嘉;孙超;;[J];中国科学:生命科学;2012年05期
【相似文献】
中国期刊全文数据库
牛海华;赵武云;史增录;;[J];中国农机化;2011年02期
张烨;邹湘军;方壮东;李建民;李长友;;[J];广东农业科学;2012年20期
B.д.普卡陀夫;翟允禔;;[J];西北农学院学报;1956年03期
袁月明;李云飞;栾玉振;王玫;;[J];试验技术与试验机;1994年Z2期
武聪颖;;[J];农业机械;2013年33期
黄平;[J];生物学教学;2000年10期
孙庆元,张雪崧;[J];大连轻工业学院学报;2003年01期
孙庆元,张雪崧;[J];大连轻工业学院学报;2003年03期
宋海霞;杨亮;李国;赵宏伟;;[J];东北农业大学学报;2008年11期
张愿;张录达;白琪林;陈绍江;;[J];光谱学与光谱分析;2009年03期
中国重要会议论文全文数据库
唐德东;;[A];中国农学会农业气象分会2006年学术年会论文集[C];2006年
周海玲;李清龙;张强强;于亚军;付宏;于建群;;[A];颗粒材料计算力学研究进展[C];2012年
赵利梅;李志平;高翔;李柏年;;[A];内蒙古旱地玉米马铃薯地膜覆盖栽培技术研究会论文集[C];2001年
袁守善;;[A];第四届全国鲜食玉米暨速冻果蔬大会专集[C];2008年
张战辉;丁冬;付志远;李卫华;李浩川;胡彦民;汤继华;刘宗华;;[A];2012年全国玉米遗传育种学术研讨会暨新品种展示观摩会论文及摘要集[C];2012年
中国重要报纸全文数据库
王润茁;[N];中国县域经济报;2014年
;[N];农民日报;2014年
马跃;[N];长春日报;2014年
中国博士学位论文全文数据库
李东;[D];华中农业大学;2016年
何骋;[D];中国农业大学;2017年
彭勃;[D];中国农业科学院;2010年
向葵;[D];四川农业大学;2011年
宋秀芳;[D];中国农业大学;2003年
王建伟;[D];西北农林科技大学;2012年
中国硕士学位论文全文数据库
汪珂;[D];华中农业大学;2015年
付萌;[D];河北农业大学;2015年
李媛珍;[D];山西大学;2015年
周文秀;[D];东北农业大学;2015年
张传根;[D];东北农业大学;2016年
赵丹;[D];四川农业大学;2016年
夏雪;[D];河南农业大学;2016年
崔丽娜;[D];山东农业大学;2009年
相茂国;[D];山东理工大学;2014年
孙国伟;[D];河北农业大学;2005年
&快捷付款方式
&订购知网充值卡
400-819-9993精准医疗时代已至 基因测序数据分析成为关键
得益于大数据分析和研究领域的快速发展,精准医疗也越来越多的受到关注和重视。在过去几年里,许多国家已经启动了基因组等精准医疗相关领域的研究和应用计划。 2015年初,美国正式启动了“精准医学”计划,推动个性化医疗的发展。而2016年初,美国总统巴拉克?奥巴马在发表国情咨文期间宣布了“癌症登月计划”,并任命副总统拜登牵头开展这一计划。2016年,中国科技部最新发布的“国家重点研发计划”中,精准医疗位列国家重点研发计划首位。此外,英国、澳大利亚等多个国家已经启动和推进精准医疗相关领域研究。 梁晗认为,精准医疗最核心的技术——基因测序的研究已经进行多年,属于精准医疗的时代也已经逐渐到来。 目前,高通量测序设备的广泛应用,基因数据量也呈倍数增长,基因组序列测序成本大幅下降。2016年5月,艾瑞咨询发布《2016年全球二代基因测序行业投研》中提到,平均每兆数据量基因测序成本和单人类基因测序成本都有超“摩尔定律”的大幅度下降,2001年人类基因组测序成本高达9526.3万美元,但如今单人类基因组测序成本已下降到几千美元。
测序成本的降低、分析能力的提升,是否意味着基因测序在临床上广泛应用?事实并非如此。目前,基因测序的应用主要集中在无创产检和肿瘤诊断治疗两个领域,在临床方面并未广泛应用。 据梁晗分析,目前基因测序的工作重心已经从繁重的人工测序转向数据分析,而基因数据分析和解读是关系到基因测序发展和精准医疗应用的关键环节。但是,当前基因测序的数据分析主要存在两个方面的难点,在一定程度上阻碍了临床应用的发展。 第一,虽然基因数据量规模不断扩大,但大量数据分散在不同的国家、城市、,缺乏统一性。这样分散、游离状态的数据不利于大数据指导下的精准医疗研究。数据统合和共享是阻碍基因测序数据临床转化的一个难点。 第二,目前的数据缺乏标准化,在很多情况下,即便是同一家医院,由于生物测序设备、软件甚至流程不同,测序结果都会大相径庭。“当我们把这种数据放在一起,会出现系统性的偏差。”梁晗说,“标准化所指的不仅是分子数据,也包括患者的个体信息、用药和愈后随访。这些数据信息的统一和共享,需要得到解决。” 此外,即便基因测序成本大幅下降,但对于部分患者来说仍是一笔不小的成本。再加上目前靶点药物有限,很多医生拿到所谓的测序报告,所获得的有效信息也仅有20-30%,对于临床诊疗的意义并不大。梁晗认为,当基因测序被有效地推广起来,越来越多靶向药物投入临床试验,医生从测序报告中获得的有效信息将会大幅提升,只有这样基因测序才会在临床上得到广泛应用。可见,“精准医疗”需要通过对数据进行深度挖掘,以提高医生从基因数据中提取有效信息的能力,进而提高对用药和治疗手段的匹配程度。同时,“精准医疗”在临床上的广泛应用,则需要基因测序价格进一步下降和相关部门建立数据共享平台。 ▌“精准匹配癌症疗法”未来可期
【版权提示】中商情报网倡导尊重与保护知识产权。如发现本站文章存在版权问题,烦请联系、4,我们将及时沟通与处理。
【数据平台合作】我们的数据自媒体平台“”、数据交易所“”正式上线了!欢迎各位数据自媒体们合作入驻。免费入驻类型:各行业数据自媒体、数据企业。咨询QQ :
中商情报网扫一扫、与您一起发现数据的价值
中商产业研究院扫一扫、每天阅读免费高价值报告
中商情报网始终聚焦科技、互联网+、创业、财经、产经大数据等,目前在全国财经网站中排名居前,旗下中商产业研究院专注产业经济细分市场研究,中商可以为用您提供一手的市场数据和高价值的商业资讯,欢迎沟通交流合作!
广告、内容合作请点这里:
askci Corporation, All Rights Reserved
中商情报网版权所有
增值电信业务经营许可证:粤B2-热门标签:
·····
中国生物信息云计算产业联盟成立 以基因大数据推进“精准医疗”
人人都在说“基因大数据”,有人说它是概念泡沫,有人说它是未来金矿。那么,基因大数据到底是什么?基因组云计算技术开发者大会10日在深圳召开。来自华大基因、阿里云、英特尔、百度开放云、华为、聚道科技、微基因等单位的技术开发者共同探讨基因大数据的行业动态,解读技术标准,拓展基因组云计算的应用领域。会上正式成立了“中国生物信息云计算产业联盟”,该联盟将推进以基因大数据为基础的“精准医疗”战略规划,并加快生物信息与云计算技术的融合,通过成员企业间的协作与交流,促进产学研合作,推动整个产业的发展。
基因数据样本量尚嫌不足
基因测序为生命科学研究开辟了新的领域,而大数据的应用则是学术研究转化的基础。深圳国家基因库主任、华大农业集团董事长梅永红表示,以大数据平台为基础的各类软件、产品,将充分展示这一新兴产业的活力与前景。而必须是协作共建的结果,开放和共享是大数据平台生命力的源泉,并寄望基因测序、大数据平台与更多的技术融合发展,期待基因组云计算体系的建构与完善。
基因大数据能给老百姓带来哪些实实在在的好处呢?“大家比较关心的是跟健康之间的关系。”微基因创始人CEO郑强在接受记者采访时表示,“我们认为在一定数量下,在几百万或者几千万用户级别下,能给大众带来的健康指导意见会有非常大的帮助。从统计和概率的角度来说,能够为用户提供决策的依据,比如说做购买保险的决策、体检的决策等等。”
郑强说,基因大数据对于疾病健康风险的预测和指导,需要大样本量,甚至百万级的样本来做对照,但从目前的情况来看,整个样本量尚未达到一定程度。要挖掘基因大数据背后的价值,首先必须要获得足够的基因样本量。
华大基因股份有限公司执行总裁尹烨指出,生命本身是数字化的,每一个人都是大数据的载体。不久的将来,基因测序企业要考虑的不再是基因测序本身的成本,而是数据传输及存储的成本。生物大数据还可以用于罕见疾病及肿瘤的诊断、治疗和预防,农业分子育种服务,肠道菌群的调整指导等。
“牛企”合作共推产业发展
会上,华大基因、、百度开放云、华为、聚道科技、微基因联合发起“中国生物信息云计算产业联盟”,该联盟将推进以基因大数据为基础的“精准医疗”战略规划,并加快生物信息与云计算技术的融合。联盟的成立将联合生物信息云计算行业内的机构企业,秉承人类基因组计划“共有、共享、共为”的协作精神,共同推动生物信息云计算领域的国内外技术交流与创新,加快其在各领域的产业化应用。同时,联盟将积极主导和参与领域内的国际标准、国家标准与行业标准的制定,保证行业发展健康有序。通过成员单位间的协作与交流,凝聚产业链上下游资源,促进产学研合作,营造良好的产业发展环境。
百度开放云资深解决方案架构师吴李知说,在该领域,有像百度、阿里、华为等几家IT企业,可以提供最底层的计算资源、基础设施,有像聚道科技这样的企业来提供数据分析服务,有像微基因这样的企业来提供个人测序服务,也有像华大基因这样的企业来推进医学、农业等方方面面的研究与服务,“各家企业从不同的层面、不同的角度共同合作,推进行业发展”。
基因组、云计算是当今炙手可热的领域。基因测序或将根本改变生物医学基础研究和医疗实践,但由此产生的数据也呈现出爆炸式的增长,也对海量数据的计算、存储和分析提出新的挑战。大会还发布了“风云挑战赛”,旨在通过公开竞赛的形式,汇聚BT和IT领域的行业精英,以共同解决基因组学数据在大规模存储、计算和知识积累等方面所面临的挑战。(记者/向雨航)
责任编辑:王培
贵州大数据产业政策
近日,为推进贵州省数据中心绿色化发展,打造 ...
贵州大数据产业动态
贵州省统计局、贵州省大数据发展管理局日前联 ...
贵州大数据企业
2014年以来,贵阳市全力实施大数据发展战略,创 ...
11月8日,2017腾讯全球合作伙伴大会在成都举行...近日,阿里资深技术专家姚滨晖发表了主题为《 ...近日,在2017杭州云栖大会-阿里大数据分论坛上...国内生物云计算公司简介
已有 2145 次阅读
|系统分类:
在中国,在基因组学为代表的生物数据分析市场上,基于云计算的生物数据分析创业公司也开始涌现,下面为大家简单介绍下国内云计算生物信息公司的情况:是由华大基因推出的基因数据分析的平台,它旨在为研究机构、医院等用户,提供专业高效、简单易用的生物信息云服务。通过,可以快速处理庞大的基因组学数据,结合华大基因不断积累更新的知识库,挖掘其中的生物学意义,并以易于理解的方式进行展示,帮助基因组学的行业应用和科学研究。为新一代测序项目的管理提供一站式解决方案,其拥有强大和可靠的基础设施和一流的安全性,可以为各种类型、大小的机构提供数据存储、自动化分析、数据传输、生物信息方法开发和共享服务,为科研数据研究提供更便利、更有效的解决方案。凭借丰富的新一代测序数据分析经验,华大基因开发了基于云的解决方案,来应对海量新一代测序数据的分析、存储和共享的传统难题。此外,该平台使用了最先进的资源管理系统,以确保资源在运行计算任务时的精确分配和实时的任务监控,并对可能遇到的错误进行及时反馈。年月上线测试版已经搭建了人类重测序分析平台。)北京百迈客生物科技有限公司历经三年开发了生物大数据自主分析平台百迈客云。百迈客云是一个基于基因大数据的挖掘,管理和科研协作的整合平台可以使不具备生物信息分析基础的用户,快速掌握独立的生物信息分析能力,实现高通量数据的深度解读。百迈客云提供:大生物信息分析平台(重测序、外显子、转录组、非编码等),基本分析个性化分析,轻松实现原始数据到生物学问题准确解读的转化款数据分析工具,涵盖数据处理,文件操作,序列比对,基因注释和图表制作等,满足常规数据分析需求大热点研究领域数据库,让数据流动,获得更多的数据资源,为实验设计提供数据基础,更好的完善实验数据。)基云惠康基云惠康是一家精准健康服务公司主要围绕全基因组测序、解读、监测、应用开发以及专家指导等环节为个人提供最佳的健康管理解决方案。专注于人的外显子测序数据分析和全基因组测序数据分析服务。)聚道科技聚道科技的就是一家基因大数据云计算服务平台,。公司提供基因数据的传输、存储、分析、计算、协作和应用等一体化解决方案,将生物信息云服务化。同时提供开放的接口,让企业用户能够方便地来管理和操作数据,最后根据用户需求生产报告。的合作伙伴包括生物信息研发团队、科研机构、检测测序服务商等。这些机构擅长通过测序所获得的信息来进行肿瘤诊断、遗传病风险评估、传染病源分析等。)是一个面向基因芯片技术领域的开放服务平台。平台以基因样本临床信息数据为核心,通过大数据分析、高性能运算及实时交互等多项技术,提供贯穿数据管理、分析挖掘、结果解读、成果转化、临床诊断的闭环服务,并在此基础上实现多元化商业模式。目前平台已经汇聚万篇文献数据、万份全基因样本数据及数十个全球主流的数据库,在肿瘤、慢性病、围术期医学、围产期医学等领域与众多科研机构共同推动多个临床辅助类服务产品开发,未来将在诊断试剂、新药测试及健康管理方向持续推动新产品研发。
转载本文请联系原作者获取授权,同时请注明本文来自张栋科学网博客。链接地址:
上一篇:下一篇:
当前推荐数:0
评论 ( 个评论)
扫一扫,分享此博文
作者的其他最新博文
热门博文导读
Powered by
Copyright &癌症组学大数据的可视化与再挖掘
大型的国际项目如TCGA,GTEx创造出了大量的转录组数据,为人们提供了数据挖掘、理解基因功能的机会。而如何能快速获取到这些生物大数据,从其中能够得到什么有价值的信息,是人们一直在探索的命题。为了让没有生物信息学背景的研究人员也能够轻易获取、分析生物大数据,北京大学张泽民教授实验室的唐泽方等人通过 R 、Perl等语言对数据进行处理、可视化,设计了癌症大数据可视化手机 APP GE-mini (gemini.)以及癌症大数据分析网站GEPIA (gepia.)。研究人员能够通过 GE-mini 和 GEPIA来提出问题或是验证假设。
高通量RNA测序(RNA-Seq)已经成为一个强有力的转录组分析方法,广泛应用于基因功能和模式生物研究、寻找候选药物靶点、识别疾病分类和诊断的生物标记物等领域。癌症基因组图谱(TCGA)和GTEx项目对数以万计癌症和非癌症样本进行了RNA-Seq,为包括癌症生物学在内的许多相关领域提供了前所未有的机会。TCGA项目中,除了726个癌旁正常组织的数据外,来自33种癌症类型的9736例肿瘤样本也进行了RNA-seq分析。
GTEx项目产生的RNA-Seq数据包含超过8000例正常样本。由于存在一定的差异,这样的数据不能直接用于综合分析。为使来源不同的数据更为兼容,UCSC Xena项目(http://xena.ucsc.edu/)已基于标准流程重新计算所有表达的原始数据,成为了迄今为止最全面的表达数据。
一些分析工具,如Xena、cBioPortal 、HPA等,提供了一定程度的可视化和分析功能,也在被广泛使用,但没有充分解决实验生物学家需要的许多额外的表达分析功能。
唐泽方博士等人开发的GEPIA,满足了上述未得到充分解决的需求。
GEPIA提供了关键的交互分析和定制功能,包括肿瘤/正常差异表达谱分析、剖面绘制、病理分期、患者生存分析,相似基因检测分析和降维分析。通过简单的点击GEPIA 就可以进行综合全面的表达分析,大大促进了研究领域内的数据挖掘、科学讨论和治疗的发现过程。GEPIA能够提供快速定制功能,填补了癌症基因组学大数据和为终端用户提供集成信息之间的缺口,从而帮助实现当前数据资源的价值。基于基因表达水平的生存分析也被广泛用于评估某一特定基因的临床重要性。此外,由于具有相似表达模式的基因可能具有相关功能,因此在需要识别与已知基因相似基因时,GEPIA的表现令人满意。
---------------------------------------------
【免责声明】:基因测序产业网转载上述内容,对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证,仅作参考。
---------------------------------------------
责任编辑:
声明:本文由入驻搜狐号的作者撰写,除搜狐官方账号外,观点仅代表作者本人,不代表搜狐立场。
今日搜狐热点}

我要回帖

更多关于 基因测序数据量 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信