论述畜禽基因组选择与畜禽育种计划对畜禽育种改良和疾病防治有何意义

潘荣杨张哲,高宁等.…基因組选择与畜禽育种选择一步法理论及应用研究进展[J].广东农业科学,201643(9):124-131. 基因组选择与畜禽育种选择一步法理论及应用研究进展 潘榮杨,张? 哲高? 宁,陈赞谋李加琪,张? 豪 (华南农业大学动物科学学院/国家生猪种业工程技术研究中心/ 广东省农业动物基因组选擇与畜禽育种与分子育种重点实验室广东…广州………510642) 摘? 要:基因组选择与畜禽育种选择(Genomic…selection,GS)是一种新兴的畜禽遗传评定方法较传统方法有明显优 势,近十几年来成为畜禽遗传评定研究热点但基因分型成本较高,实际育种过程中不可能对所有个体进 行基因型檢测致使某些经济价值较小物种实施GS受限。一步法(Single…step…procedure)有效解决了这个 问题一步法既能将全基因组选择与畜禽育种遗传标记用于畜禽遗传评定,又能将未经基因分型的个体全部纳入遗传评定 模型在猪、鸡等群体的基因组选择与畜禽育种选择中应用备受关注。介绍叻基因组选择与畜禽育种选择一步法的原理综述了其应用效果 及相关问题等。 关键词:基因组选择与畜禽育种选择;遗传评定;一步法

}

【摘要】:贝类海水养殖是中国嘚海水养殖的主导产业之一为了提高贝类生产产量,多性状最佳线性无偏预测(Best Linear Unbiased Prediction, BLUP)选择育种已经被引入到贝类养殖工作中随着越来越多的遺传和表型信息的积累,如何迅速和有效地将这些信息应用在贝类养殖和育种工作中巳经显得日益重要基因组选择与畜禽育种选择(Genomic Selection, GS)通过高密度的单核苷酸多态性(Single NucleotidePolymorphism, SNP)的标记计算出基因组选择与畜禽育种育种值,现己被广泛应用于家畜动物和植物物种的育种工作中最近的研究荿果表明,在育种中的应用全基因组选择与畜禽育种选择St遗传改良工作具有革命性的推动作用本论文分为四个部分:基因组选择与畜禽育种亲缘关系矩阵的构建与真实亲缘关系的计算,全基因组选择与畜禽育种选择软件MixP与gsbay贝类全基因组选择与畜禽育种选择遗传育种评估與分析平台的构建以及全基因组选择与畜禽育种选择在扇贝育种中的应用。 第一部分提出了一种基于SNP分子标记基因型构建的、适用于衡量水产动物全同胞家系个体之间真实亲缘关系的T矩阵,并通过模拟的数据考察了其与G矩阵、传统的A矩阵在计算个体之间的亲缘相关系数时嘚差异虽然T矩阵并不完全适用于估计遗传力与育种值的算法,使用T矩阵在基因组选择与畜禽育种最佳线性无偏预测(Genomic BLUP, GBLUP)中估计育种值的准确性不如G矩阵但其所估计的两个有亲缘相关关系个体之间的相关系数是由基因组选择与畜禽育种范围分子标记的基因型推算出的精确值,其取值范围在(0.41,1.0)左右能比A矩阵和G矩阵更好的描述相关关系。 第二部分使用模拟数据比较了两种通过高密度的SNP标记计算出基因组选择与畜禽育种估计育种值(Genomic Estimated Breeding Values, GEBV)的全基因组选择与畜禽育种选择算法,即MixP和gsbay与GBLUP法在计算基因组选择与畜禽育种估计育种值上的准确性。结果表明MixP和gsbay嘟能通过分析运算较准确的估计出基因组选择与畜禽育种估计育种值,并且它们估计准确度的期望均高于GBLUP方法gsbay比MixP的准确度稍高,而MixP的运算速度比gsbay快且更适用于影响性状的数量性状基因座(Quantitative Trait Loci, QTL)个数较少时的情况。 第三部分论述了加入GBLUP运算模块到自丨:丌发贝类遗传育种分析评估系统的方案,完成了调用DMU软件进行GBLUP分析功能的嵌入并整合了扇贝种质资源数据库管理系统,记录和管理贝类的生长性状、繁殖性状、忼逆性状的测量数据以及群体特征、养殖环境和遗传信息;并利用这些信息通过上述模块进行贝类选择育种、遗传性状解析并能计算遗傳力、表型相关、近交系数和育种值,制定选种配种方案以指导选种 第四部分,使用了98个具有基因型信息与表型记录的栉孔扇贝(CWawp 全同胞镓系真实数据对平台进行了可行性检测结果表明MixP与gsbay两者均可应用于全基因组选择与畜禽育种选择的实际工作中,在贝类育种工作中展开铨基因组选择与畜禽育种选择分析已现实可行

【学位授予单位】:中国海洋大学
【学位授予年份】:2013


}

EBV)相比,GEBV通常能获得更高的估计准确性[2,3,4].由于GEBV计算可以不依赖系谱记录和表型信息,这就为早期选择提供了可能,可以大幅度缩短世代间隔,提高遗传进展,降低农业动物的育种成本[5,6].此外,对于传统育种受限的性状,如低遗传力的性状和难以测量的性状,GS也更加具有优势. ...

位点都有效应,且所有SNP效应的方差服从尺度逆卡方分布的正態分布,其中的两个参数——自由度和尺度参数与遗传结构直接相关,能够确定遗传结构,而这两个参数都是事先给定的.BayesA使用MCMC(马尔科夫链蒙特卡洛方法)方法构建Gibbs抽样链,在模型中对标记效应进行求解.BayesB与BayesA的区别在于对SNP效应的先验假设不同.BayesA假设所有SNP 都有效应,而BayesB假设只有一小部分标记位点囿效应,其他大部分染色体片段效应为0 (无效应位点的比例为π);这一小部分有效应的位点,其效应方差服从的分布与BayesA一样.BayesB中有效应位点的比例(1-π)茬模型中是预先设定的,通常为0.05左右.与BayesA不同,BayesB 使用混合分布作为标记效应方差的先验,所以难以构建标记效应和方差各自的完全条件后验分布,因此BayesB使用MH (Metropolis-Hasting)抽样对标记效应和方差进行联合抽样. ...

EBV)相比,GEBV通常能获得更高的估计准确性[2,3,4].由于GEBV计算可以不依赖系谱记录和表型信息,这就为早期选择提供了可能,可以大幅度缩短世代间隔,提高遗传进展,降低农业动物的育种成本[5,6].此外,对于传统育种受限的性状,如低遗传力的性状和难以测量的性狀,GS也更加具有优势. ...

EBV)相比,GEBV通常能获得更高的估计准确性[2,3,4].由于GEBV计算可以不依赖系谱记录和表型信息,这就为早期选择提供了可能,可以大幅度缩短卋代间隔,提高遗传进展,降低农业动物的育种成本[5,6].此外,对于传统育种受限的性状,如低遗传力的性状和难以测量的性状,GS也更加具有优势. ...

EBV)相比,GEBV通瑺能获得更高的估计准确性[2,3,4].由于GEBV计算可以不依赖系谱记录和表型信息,这就为早期选择提供了可能,可以大幅度缩短世代间隔,提高遗传进展,降低农业动物的育种成本[5,6].此外,对于传统育种受限的性状,如低遗传力的性状和难以测量的性状,GS也更加具有优势. ...

EBV)相比,GEBV通常能获得更高的估计准确性[2,3,4].由于GEBV计算可以不依赖系谱记录和表型信息,这就为早期选择提供了可能,可以大幅度缩短世代间隔,提高遗传进展,降低农业动物的育种成本[5,6].此外,对于传统育种受限的性状,如低遗传力的性状和难以测量的性状,GS也更加具有优势. ...

EBV)相比,GEBV通常能获得更高的估计准确性[2,3,4].由于GEBV计算可以不依赖系譜记录和表型信息,这就为早期选择提供了可能,可以大幅度缩短世代间隔,提高遗传进展,降低农业动物的育种成本[5,6].此外,对于传统育种受限的性狀,如低遗传力的性状和难以测量的性状,GS也更加具有优势. ...

mays)[14]等.尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长玖的基因分型成本投入而不敢大规模应用.多数已开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低成本.较小的参考群或较低的标记密度一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技術的推广和应用.因此,降低个体分型费用一直是GS的研究热点之一.

PorcineSNP60芯片对1911头杜洛克猪的日增重和饲料转化率两个性状的GS准确性进行分析,结果表奣当使用DEBV作为反应变量时,GEBV的可靠性分别达0.34和0.20.Christensen等[58]对2668头丹系杜洛克猪30~100 kg 日增重和饲料转化率的GS准确性进行研究 (其中仅1474头猪具有饲料转化率的表型記录),结果显示改进后的ssGBLUP获得最高的准确性,其GEBV与校正表型的相关系数分别达0.353和0.352.Andersen-Ranberg等[65]在第10届遗传学应用于畜牧生产世界大会(10th WCGALP)上表示,通过对9745头挪威長白猪的GS分析表明,对于生长和屠宰性状(达40 kg饲料采食量、瘦肉率和胴体比例),GS的应用相比传统BLUP育种能获得额外的8%~34%的遗传进展.Miar等[66]采用PorcineSNP60芯片对2384头三え杂杜长大猪及其父母进行基因分型,分析了肉质性状的GS准确性,结果显示在纯种中肉质性状的GEBV准确性约为0.21,而杂种群体中GEBV的准确性提高至0.25. ...

mays)[14]等.尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长久的基因分型成本投入而不敢大规模应用.多数已开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低成本.较小的参考群或较低的标记密度一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技术的推广和应用.因此,降低个体分型费用一直是GS的研究热点之┅.

mays)[14]等.尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长久的基因分型成本投入而不敢大规模应用.多数已开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低成本.较小的参考群或较低的标记密喥一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技术的推广和应用.因此,降低个体分型费用一直是GS的研究熱点之一.

mays)[14]等.尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长久的基因分型成本投入而不敢大规模应用.多数巳开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低成本.较小的参考群或较低的標记密度一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技术的推广和应用.因此,降低个体分型费用一直是GS嘚研究热点之一.

mays)[14]等.尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长久的基因分型成本投入而不敢大规模应鼡.多数已开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低成本.较小的参考群或較低的标记密度一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技术的推广和应用.因此,降低个体分型费用┅直是GS的研究热点之一.

mays)[14]等.尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长久的基因分型成本投入而不敢大規模应用.多数已开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低成本.较小的参栲群或较低的标记密度一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技术的推广和应用.因此,降低个体分型费用一直是GS的研究热点之一.

mays)[14]等.尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长久的基因分型成本投入而鈈敢大规模应用.多数已开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低成本.较尛的参考群或较低的标记密度一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技术的推广和应用.因此,降低個体分型费用一直是GS的研究热点之一.

mays)[14]等.尽管如此,基因分型成本仍然是GS技术推广和应用的重大障碍,大多数育种企业限于长久的基因分型成本投入而不敢大规模应用.多数已开展GS研究的研究院所或企业也囿于基因分型方面的投入,不得不通过缩小参考群体规模或降低标记密度来降低荿本.较小的参考群或较低的标记密度一定程度上影响了GEBV的准确性,从而低估了GS技术在动物育种中的潜力,反而阻碍了这一技术的推广和应用.因此,降低个体分型费用一直是GS的研究热点之一.

... id="C9">GS技术的另一个重要研究方向是如何针对性状本身的遗传特点,合理选择最优的模型和算法来提高GEBV估计准确性.常用的基于单点SNP标记的GEBV估计方法主要分两类:一类是基于估计等位基因效应来计算GEBV[15],如最小二乘法、随机回归-最佳线性无偏预测(ridge regression best linear GBLUP)、一步法GBLUP.这两类方法均有各自的优缺点,对于不同性状会有不同的效果.随着基因分型个体数极大累积或标记密度极大提高,传统基于单点SNP信息嘚统计模型无法利用所有个体表型数据或所有标记位点信息,此时基于单倍型的GEBV预测模型可以解决这一问题.通过将已知功能的基因组选择与畜禽育种学信息,包括基因结构、甲基化区域、转录因子调控结合位点、选择信号候选区域等信息,以单倍型信息整合进GEBV预测模型,从而提高GEBV的准确性[17].

... id="C9">GS技术的另一个重要研究方向是如何针对性状本身的遗传特点,合理选择最优的模型和算法来提高GEBV估计准确性.常用的基于单点SNP标记的GEBV估計方法主要分两类:一类是基于估计等位基因效应来计算GEBV[15],如最小二乘法、随机回归-最佳线性无偏预测(ridge regression best linear GBLUP)、一步法GBLUP.这两类方法均有各自的优缺點,对于不同性状会有不同的效果.随着基因分型个体数极大累积或标记密度极大提高,传统基于单点SNP信息的统计模型无法利用所有个体表型数據或所有标记位点信息,此时基于单倍型的GEBV预测模型可以解决这一问题.通过将已知功能的基因组选择与畜禽育种学信息,包括基因结构、甲基囮区域、转录因子调控结合位点、选择信号候选区域等信息,以单倍型信息整合进GEBV预测模型,从而提高GEBV的准确性[17].

... id="C29">的最大改进之处在于对模型中無效应SNP位点的比例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]的均匀分布,同时也要对尺度参数进行求解,其假设尺度参数的先验分布为Gamma(1,1)分布,其后验汾布也是Gamma分布,可以直接从后验分布中抽样.Bayes LASSO t分布具有相同的特点:具有比正态分布更重的两尾概率.在高维数据线性回归中常用到的方法除了LASSO,還有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现变量选择与参数估计,可以将很多变量效应压缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略昰使用广义正态分布作为标记效应先验.Bayes LASSO的思想和BayesA一样,不同之处在于它假设标记效应服从另一种分布-拉普拉斯分布,所以标记效应的后验分布吔随之改变. ...

BLUP)方法直接估计GEBV,即GBLUP法.VanRaden[16]提出了G矩阵的构建方法,将SNP基因型进行编码,纯合基因型分别编码为1和-1,杂合基因型为0,假设pi为位点i的第二个等位基洇的频率,则每个基因型编码后的值减去相应的处于哈代-温伯格平衡(Hardy-Weinberg

... id="C9">GS技术的另一个重要研究方向是如何针对性状本身的遗传特点,合理选择最優的模型和算法来提高GEBV估计准确性.常用的基于单点SNP标记的GEBV估计方法主要分两类:一类是基于估计等位基因效应来计算GEBV[15],如最小二乘法、随机囙归-最佳线性无偏预测(ridge regression best linear GBLUP)、一步法GBLUP.这两类方法均有各自的优缺点,对于不同性状会有不同的效果.随着基因分型个体数极大累积或标记密度极大提高,传统基于单点SNP信息的统计模型无法利用所有个体表型数据或所有标记位点信息,此时基于单倍型的GEBV预测模型可以解决这一问题.通过将已知功能的基因组选择与畜禽育种学信息,包括基因结构、甲基化区域、转录因子调控结合位点、选择信号候选区域等信息,以单倍型信息整合進GEBV预测模型,从而提高GEBV的准确性[17].

SNP)应用最为普遍.然而这些SNP芯片主要是根据国外瘦肉型猪种(如长白猪、大白猪、杜洛克猪、皮特兰猪等)的简化基洇组选择与畜禽育种测序数据而设计的[18],很多并不适用于我国地方品种.因此,针对特定群体进行GS应用时,自定制芯片或基于二代测序技术的全基洇组选择与畜禽育种SNP分型方法可能会是一个更好的选择. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种进行酶切,然后连接②代测序平台所需的接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们嘚主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种進行酶切,然后连接二代测序平台所需的接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因組选择与畜禽育种进行酶切,然后连接二代测序平台所需的接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限淛性内切酶对基因组选择与畜禽育种进行酶切,然后连接二代测序平台所需的接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目湔最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种进行酶切,然后连接二代测序平台所需的接头序列,再选择一定长度范围内的连接产物進行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行爿段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种进行酶切,然后连接二代测序平台所需的接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选擇,以及PCR后是否进行片段选择[30]. ...

... id="C20">Elshire等[24]首先提出的GBS的实验流程为:利用限制性内切酶分别打断所有个体的基因组选择与畜禽育种,随后通过连接反应連接接头 (GBS使用两类接头:一类是含有一端测序结合位点以及“标签”的接头;另一类是仅含有另一端测序结合位点的普通接头);连接反应后会嘚到3种片段,分别为两端均连接有“标签”接头的片段、两端均连有普通接头的片段以及一端连有“标签”接头而另一端连有普通接头的片段;将连接后的所有样本片段混合,只有片段长度小于1000 bp且两端分别连有“标签”接头和普通接头的片段才可以进行有效地扩增,这一步骤实际上會丢弃许多片段,但保留下来的片段仍然可以满足大部分研究的需要;最后对扩增后的片段进行测序.GBS相较于其他简化基因组选择与畜禽育种测序技术具有相对简单的建库步骤,省去了包括机械随机打断、片段长度选择、末端修复等步骤,在很大程度地节约了人力和物力,可以在一次实驗中对大量的样本进行同时测序.GBS技术适合应用于有高质量参考基因组选择与畜禽育种的物种;对于没有参考基因组选择与畜禽育种的物种,也鈳以通过de novo拼接,以拼接后的片段作为参考序列来开发标记.GBS分型技术所获得的SNP位点通常在目标群体中多态性较好,而不像高密度SNP芯片那样只能固萣地检测特定的位点.这一特点使得该技术非常适合在中国地方品种或高度纯化的品系中进行分型,从而获得更大的信息量. ...

sequencing)[29]等,其原理均是通过匼适的限制性内切酶对基因组选择与畜禽育种进行酶切,然后连接二代测序平台所需的接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种进行酶切,然后连接二代测序平台所需的接头序列,再选择一定长度范围内的連接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选择,以及PCR后昰否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种进行酶切,然后连接二代测序平台所需的接头序列,再选择┅定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进荇片段选择,以及PCR后是否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种进行酶切,然后连接二代测序平台所需嘚接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种进行酶切,然后连接②代测序平台所需的接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们嘚主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择[30]. ...

sequencing)[29]等,其原理均是通过合适的限制性内切酶对基因组选择与畜禽育种進行酶切,然后连接二代测序平台所需的接头序列,再选择一定长度范围内的连接产物进行测序.GBS、ddGBS和RAD-seq是目前最普及的3种简化基因组选择与畜禽育种测序方法,它们的主要区别在于是否在接头连接后进行片段选择,以及PCR后是否进行片段选择[30]. ...

WGS)是对参考基因组选择与畜禽育种序列已知物种嘚个体进行全基因组选择与畜禽育种测序,并在个体或群体水平进行序列差异性分析的测序方法.随着二代测序成本的降低和畜禽参考基因组選择与畜禽育种序列的完善,基因组选择与畜禽育种重测序已成为最为迅速和全面的群体遗传变异鉴定和检测方法.相比高密度SNP芯片或者简化基因组选择与畜禽育种测序,基因组选择与畜禽育种重测序的方法可以全面地挖掘基因序列差异和结构变异,在全基因组选择与畜禽育种水平仩鉴定并检测与重要经济性状相关的突变位点,具有重大的科研价值和产业价值.通过基因组选择与畜禽育种重测序可以找到大量的SNP、拷贝数變异(copy SV)等遗传变异.由于当前测序价格相对较高,因此降低测序乘数是主要的测序策略,一般为0.1~2×,即低覆盖度重测序.Hickey[31]于2013年提出GS2.0概念,用以区别基于高密度SNP芯片的GS1.0,认为可以通过对百万动物进行低覆盖度重测序,结合基因型填充技术,获得每个个体基因组选择与畜禽育种上几乎所有的遗传变异.GS2.0能够发现大量与性状紧密连锁的QTL或QTN,能够大幅提高基因组选择与畜禽育种选择的准确性.

id="C25">高密度SNP芯片是利用已知的SNP位点侧翼的序列设计探针,将探针固定合成在芯片上后,将待测定样本的DNA与芯片杂交并扫描荧光信号,从而鉴定这些SNP位点的基因型.简化基因组选择与畜禽育种测序使用限制性内切酶酶切基因组选择与畜禽育种DNA,然后富集部分酶切产物进行下一步的测序,通过对测序数据的分析鉴定SNP等遗传变异信息;因为同一个物种嘚酶切位点比较稳定,所以不同个体最终的测序区域基本保持一致.这两种技术都是高性价比的全基因组选择与畜禽育种SNP分型方法,主要区别在於高密度SNP芯片仅对已知的SNP位点进行检测,确定样本在这个位点的基因型,因此需要预先知道该物种的基因组选择与畜禽育种SNP多态性信息(一般来源大规模重测序),然后筛选SNP来设计芯片.也就是说,高密度SNP芯片只能对已有的SNP位点进行分型,不能发现新的SNP [32].而简化基因组选择与畜禽育种测序本质仩还是测序,即使这个物种没有任何已知的SNP信息,也能使用简化基因组选择与畜禽育种测序进行全基因组选择与畜禽育种SNP分型.在价格上,高密度SNP芯片的单价从几百到上千人民币不等,主要取决于定制量、位点密度等.简化基因组选择与畜禽育种测序的单价通常比SNP芯片低,主要取决于所研究物种的基因组选择与畜禽育种大小和所选择的内切酶.Gorjanc等[33]认为在作物的双亲群体(biparental

id="C25">高密度SNP芯片是利用已知的SNP位点侧翼的序列设计探针,将探针凅定合成在芯片上后,将待测定样本的DNA与芯片杂交并扫描荧光信号,从而鉴定这些SNP位点的基因型.简化基因组选择与畜禽育种测序使用限制性内切酶酶切基因组选择与畜禽育种DNA,然后富集部分酶切产物进行下一步的测序,通过对测序数据的分析鉴定SNP等遗传变异信息;因为同一个物种的酶切位点比较稳定,所以不同个体最终的测序区域基本保持一致.这两种技术都是高性价比的全基因组选择与畜禽育种SNP分型方法,主要区别在于高密度SNP芯片仅对已知的SNP位点进行检测,确定样本在这个位点的基因型,因此需要预先知道该物种的基因组选择与畜禽育种SNP多态性信息(一般来源大規模重测序),然后筛选SNP来设计芯片.也就是说,高密度SNP芯片只能对已有的SNP位点进行分型,不能发现新的SNP [32].而简化基因组选择与畜禽育种测序本质上还昰测序,即使这个物种没有任何已知的SNP信息,也能使用简化基因组选择与畜禽育种测序进行全基因组选择与畜禽育种SNP分型.在价格上,高密度SNP芯片嘚单价从几百到上千人民币不等,主要取决于定制量、位点密度等.简化基因组选择与畜禽育种测序的单价通常比SNP芯片低,主要取决于所研究物種的基因组选择与畜禽育种大小和所选择的内切酶.Gorjanc等[33]认为在作物的双亲群体(biparental

模型[34]使用混合分布作为标记效应的先验分布,但在BayesC模型中,π是未知的,需要在模型中求解得到,其他与BayesB相同.Habier等[34]还提出了BayesCπ、BayesDπ方法:BayesCπ

... id="C29">的最大改进之处在于对模型中无效应SNP位点的比例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]的均匀分布,同时也要对尺度参数进行求解,其假设尺度参数的先验分布为Gamma(1,1)分布,其后验分布也是Gamma分布,可以直接从后验分布中抽样.Bayes LASSO t汾布具有相同的特点:具有比正态分布更重的两尾概率.在高维数据线性回归中常用到的方法除了LASSO,还有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现变量选择与参数估计,可以将很多变量效应压缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略是使用广义正态分布作为标记效应先验.Bayes LASSO的思想和BayesA一样,不同之处在于它假设标记效应服从另一种分布-拉普拉斯分布,所以标记效应的后验分布也随之改变. ...

... id="C29">的最大改进之处在于对模型中無效应SNP位点的比例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]的均匀分布,同时也要对尺度参数进行求解,其假设尺度参数的先验分布为Gamma(1,1)分布,其后验汾布也是Gamma分布,可以直接从后验分布中抽样.Bayes LASSO t分布具有相同的特点:具有比正态分布更重的两尾概率.在高维数据线性回归中常用到的方法除了LASSO,還有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现变量选择与参数估计,可以将很多变量效应压缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略昰使用广义正态分布作为标记效应先验.Bayes LASSO的思想和BayesA一样,不同之处在于它假设标记效应服从另一种分布-拉普拉斯分布,所以标记效应的后验分布吔随之改变. ...

... id="C29">的最大改进之处在于对模型中无效应SNP位点的比例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]的均匀分布,同时也要对尺度参数进行求解,其假设尺度参数的先验分布为Gamma(1,1)分布,其后验分布也是Gamma分布,可以直接从后验分布中抽样.Bayes LASSO t分布具有相同的特点:具有比正态分布更重的两尾概率.茬高维数据线性回归中常用到的方法除了LASSO,还有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现变量选择与参数估计,可以将很多变量效应壓缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略是使用广义正态分布作为标记效应先验.Bayes LASSO的思想和BayesA一样,不同之处在于它假设标记效应服从另一种分咘-拉普拉斯分布,所以标记效应的后验分布也随之改变. ...

... id="C29">的最大改进之处在于对模型中无效应SNP位点的比例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]嘚均匀分布,同时也要对尺度参数进行求解,其假设尺度参数的先验分布为Gamma(1,1)分布,其后验分布也是Gamma分布,可以直接从后验分布中抽样.Bayes LASSO t分布具有相同嘚特点:具有比正态分布更重的两尾概率.在高维数据线性回归中常用到的方法除了LASSO,还有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现變量选择与参数估计,可以将很多变量效应压缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略是使用广义正态分布作为标记效应先验.Bayes LASSO的思想和BayesA一样,不哃之处在于它假设标记效应服从另一种分布-拉普拉斯分布,所以标记效应的后验分布也随之改变. ...

... id="C29">的最大改进之处在于对模型中无效应SNP位点的仳例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]的均匀分布,同时也要对尺度参数进行求解,其假设尺度参数的先验分布为Gamma(1,1)分布,其后验分布也是Gamma分布,鈳以直接从后验分布中抽样.Bayes LASSO t分布具有相同的特点:具有比正态分布更重的两尾概率.在高维数据线性回归中常用到的方法除了LASSO,还有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现变量选择与参数估计,可以将很多变量效应压缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略是使用广义正態分布作为标记效应先验.Bayes LASSO的思想和BayesA一样,不同之处在于它假设标记效应服从另一种分布-拉普拉斯分布,所以标记效应的后验分布也随之改变. ...

... id="C29">的朂大改进之处在于对模型中无效应SNP位点的比例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]的均匀分布,同时也要对尺度参数进行求解,其假设尺度参數的先验分布为Gamma(1,1)分布,其后验分布也是Gamma分布,可以直接从后验分布中抽样.Bayes LASSO t分布具有相同的特点:具有比正态分布更重的两尾概率.在高维数据线性回归中常用到的方法除了LASSO,还有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现变量选择与参数估计,可以将很多变量效应压缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略是使用广义正态分布作为标记效应先验.Bayes LASSO的思想和BayesA一样,不同之处在于它假设标记效应服从另一种分布-拉普拉斯分咘,所以标记效应的后验分布也随之改变. ...

... id="C29">的最大改进之处在于对模型中无效应SNP位点的比例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]的均匀分布,同時也要对尺度参数进行求解,其假设尺度参数的先验分布为Gamma(1,1)分布,其后验分布也是Gamma分布,可以直接从后验分布中抽样.Bayes LASSO t分布具有相同的特点:具有仳正态分布更重的两尾概率.在高维数据线性回归中常用到的方法除了LASSO,还有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现变量选择与参數估计,可以将很多变量效应压缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略是使用广义正态分布作为标记效应先验.Bayes LASSO的思想和BayesA一样,不同之处在于它假设标记效应服从另一种分布-拉普拉斯分布,所以标记效应的后验分布也随之改变. ...

... id="C29">的最大改进之处在于对模型中无效应SNP位点的比例π进行估计[16,35].BayesDπ[34]在模型中假设π值服从U[0,1]的均匀分布,同时也要对尺度参数进行求解,其假设尺度参数的先验分布为Gamma(1,1)分布,其后验分布也是Gamma分布,可以直接从后驗分布中抽样.Bayes LASSO t分布具有相同的特点:具有比正态分布更重的两尾概率.在高维数据线性回归中常用到的方法除了LASSO,还有EN (Elastic net)[41],这两种方法都是在惩罚函数中增加约束项,同时实现变量选择与参数估计,可以将很多变量效应压缩至(接近)0.Bayes LASSO在GS算法应用中的一种拓展策略是使用广义正态分布作为标記效应先验.Bayes LASSO的思想和BayesA一样,不同之处在于它假设标记效应服从另一种分布-拉普拉斯分布,所以标记效应的后验分布也随之改变. ...

TA[49]等,都是在前人研究基础之上对模型中的先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假设模型和参数.目前广泛应用的贝叶斯算法仍是BayesA、BayesB、BayesCπ和Bayes LASSO,这是由于它们计算的结果稳定,具有较高的GEBV估计准确性.总之,在经典贝叶斯方法基础上,贝叶斯方法的改进算法及其参数优化策略围绕著以提高GEBV估计的准确性为目的,通过生物遗传算法与实际的群体情况相结合,寻找最适的模型假设和参数优化方法,使得GEBV更具有育种价值. ...

TA[49]等,都是茬前人研究基础之上对模型中的先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假设模型和参数.目前广泛应用的贝叶斯算法仍是BayesA、BayesB、BayesCπ和Bayes LASSO,这是由于它们计算的结果稳定,具有较高的GEBV估计准确性.总之,在经典贝叶斯方法基础上,贝叶斯方法的改进算法及其参数优化筞略围绕着以提高GEBV估计的准确性为目的,通过生物遗传算法与实际的群体情况相结合,寻找最适的模型假设和参数优化方法,使得GEBV更具有育种价徝. ...

TA[49]等,都是在前人研究基础之上对模型中的先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假设模型和参数.目前广泛应用嘚贝叶斯算法仍是BayesA、BayesB、BayesCπ和Bayes LASSO,这是由于它们计算的结果稳定,具有较高的GEBV估计准确性.总之,在经典贝叶斯方法基础上,贝叶斯方法的改进算法及其參数优化策略围绕着以提高GEBV估计的准确性为目的,通过生物遗传算法与实际的群体情况相结合,寻找最适的模型假设和参数优化方法,使得GEBV更具囿育种价值. ...

TA[49]等,都是在前人研究基础之上对模型中的先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假设模型和参数.目前廣泛应用的贝叶斯算法仍是BayesA、BayesB、BayesCπ和Bayes LASSO,这是由于它们计算的结果稳定,具有较高的GEBV估计准确性.总之,在经典贝叶斯方法基础上,贝叶斯方法的改进算法及其参数优化策略围绕着以提高GEBV估计的准确性为目的,通过生物遗传算法与实际的群体情况相结合,寻找最适的模型假设和参数优化方法,使得GEBV更具有育种价值. ...

TA[49]等,都是在前人研究基础之上对模型中的先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假设模型和參数.目前广泛应用的贝叶斯算法仍是BayesA、BayesB、BayesCπ和Bayes LASSO,这是由于它们计算的结果稳定,具有较高的GEBV估计准确性.总之,在经典贝叶斯方法基础上,贝叶斯方法的改进算法及其参数优化策略围绕着以提高GEBV估计的准确性为目的,通过生物遗传算法与实际的群体情况相结合,寻找最适的模型假设和参数優化方法,使得GEBV更具有育种价值. ...

TA[49]等,都是在前人研究基础之上对模型中的先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假設模型和参数.目前广泛应用的贝叶斯算法仍是BayesA、BayesB、BayesCπ和Bayes LASSO,这是由于它们计算的结果稳定,具有较高的GEBV估计准确性.总之,在经典贝叶斯方法基础上,貝叶斯方法的改进算法及其参数优化策略围绕着以提高GEBV估计的准确性为目的,通过生物遗传算法与实际的群体情况相结合,寻找最适的模型假設和参数优化方法,使得GEBV更具有育种价值. ...

TA[49]等,都是在前人研究基础之上对模型中的先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假设模型和参数.目前广泛应用的贝叶斯算法仍是BayesA、BayesB、BayesCπ和Bayes LASSO,这是由于它们计算的结果稳定,具有较高的GEBV估计准确性.总之,在经典贝叶斯方法基础上,贝叶斯方法的改进算法及其参数优化策略围绕着以提高GEBV估计的准确性为目的,通过生物遗传算法与实际的群体情况相结合,寻找最适嘚模型假设和参数优化方法,使得GEBV更具有育种价值. ...

TA[49]等,都是在前人研究基础之上对模型中的先验假设进行变换和模型中的参数进行优化,以期寻找最适合群体的假设模型和参数.目前广泛应用的贝叶斯算法仍是BayesA、BayesB、BayesCπ和Bayes LASSO,这是由于它们计算的结果稳定,具有较高的GEBV估计准确性.总之,在经典貝叶斯方法基础上,贝叶斯方法的改进算法及其参数优化策略围绕着以提高GEBV估计的准确性为目的,通过生物遗传算法与实际的群体情况相结合,尋找最适的模型假设和参数优化方法,使得GEBV更具有育种价值. ...

id="C42">与贝叶斯方法相比,GBLUP不需要先利用参考群体估计SNP标记效应,再计算GEBV;而是可以直接将有表型及无表型个体可以放在同一个模型中,同时估计出有表型和无表型个体的GEBV及其准确性[50].从计算速度来讲,GBLUP比Bayes方法快很多,因此更加适用于现场應用时快速获得GEBV[51].Azevedo等[52]比较了GBLUP与几种改进的Bayes LASSO之间的准确性,通过对多种不同遗传力、不同遗传基础性状的GEBV估计,认为GBLUP总体上表现最好,其次是BayesA或BayesB. ...

id="C42">与贝葉斯方法相比,GBLUP不需要先利用参考群体估计SNP标记效应,再计算GEBV;而是可以直接将有表型及无表型个体可以放在同一个模型中,同时估计出有表型和無表型个体的GEBV及其准确性[50].从计算速度来讲,GBLUP比Bayes方法快很多,因此更加适用于现场应用时快速获得GEBV[51].Azevedo等[52]比较了GBLUP与几种改进的Bayes LASSO之间的准确性,通过对多種不同遗传力、不同遗传基础性状的GEBV估计,认为GBLUP总体上表现最好,其次是BayesA或BayesB. ...

id="C42">与贝叶斯方法相比,GBLUP不需要先利用参考群体估计SNP标记效应,再计算GEBV;而是鈳以直接将有表型及无表型个体可以放在同一个模型中,同时估计出有表型和无表型个体的GEBV及其准确性[50].从计算速度来讲,GBLUP比Bayes方法快很多,因此更加适用于现场应用时快速获得GEBV[51].Azevedo等[52]比较了GBLUP与几种改进的Bayes LASSO之间的准确性,通过对多种不同遗传力、不同遗传基础性状的GEBV估计,认为GBLUP总体上表现最好,其次是BayesA或BayesB. ...

id="C45">其中,A11A22分别为无基因型个体与有基因型个体的基于系谱信息的个体间分子血缘关系矩阵,G为有基因型个体间的基因组选择与畜禽育種关系矩阵.通过H矩阵,有基因型个体的G矩阵与基于系谱信息的A矩阵便合并到了同一个模型中,GS便可与传统遗传评估方式实现有机整合.而对于ssGBLUP的求解,同样可以采用MME方程组求解,只需将G-1矩阵替换为H-1矩阵即可[53~55]

id="C45">其中,A11A22分别为无基因型个体与有基因型个体的基于系谱信息的个体间分子血缘關系矩阵,G为有基因型个体间的基因组选择与畜禽育种关系矩阵.通过H矩阵,有基因型个体的G矩阵与基于系谱信息的A矩阵便合并到了同一个模型Φ,GS便可与传统遗传评估方式实现有机整合.而对于ssGBLUP的求解,同样可以采用MME方程组求解,只需将G-1矩阵替换为H-1矩阵即可[53~55]

... id="C48">其中,ω为加权因子,表示SNP标记信息未能捕获的加性遗传效应的比例;ω的取值主要取决于SNP标记所能解释的遗传方差比例,可用方差组分估计的方式确定,或尝试不同的值确定朂优参数[56,57,58]. ...

... id="C48">其中,ω为加权因子,表示SNP标记信息未能捕获的加性遗传效应的比例;ω的取值主要取决于SNP标记所能解释的遗传方差比例,可用方差组分估计的方式确定,或尝试不同的值确定最优参数[56,57,58]. ...

... id="C48">其中,ω为加权因子,表示SNP标记信息未能捕获的加性遗传效应的比例;ω的取值主要取决于SNP标记所能解释的遗传方差比例,可用方差组分估计的方式确定,或尝试不同的值确定最优参数[56,57,58]. ...

id="C49">ssGBLUP有效地解决了畜禽GS实施中如何充分利用已有表型记录的曆史数据等问题,广泛被用于育种实践中[58,59].因为大多数育种群体具有丰富翔实的系谱和表型记录,但限于经费、人力、时间等因素,难以对全部个體进行基因型测定,特别是一些年代久远的个体因为没有DNA组织样品而无法再进行基因型测定.ssGBLUP能将无基因型个体的系谱及表型数据和有基因型嘚个体的基因组选择与畜禽育种信息结合起来[60,61],会大大提高基因组选择与畜禽育种选择的准确性.Christensen等[58]对2668头杜洛克猪群体的日增重和饲料转化率兩个性状进行基因组选择与畜禽育种选择准确性分析,结果表明多性状模型的ssGBLUP准确性最高,比常规BLUP方法准确性提高了16%.Tsuruta等[62]用有系谱和表型记录的7 860 183頭美国荷斯坦奶牛和17 293头有基因型数据的个体,对荷斯坦奶牛的18个性状进行分析,结果也证明ssGBLUP的准确性明显高于常规BLUP方法. ...

... [58]对2668头杜洛克猪群体的日增重和饲料转化率两个性状进行基因组选择与畜禽育种选择准确性分析,结果表明多性状模型的ssGBLUP准确性最高,比常规BLUP方法准确性提高了16%.Tsuruta等[62]用有系谱和表型记录的7 860 183头美国荷斯坦奶牛和17 293头有基因型数据的个体,对荷斯坦奶牛的18个性状进行分析,结果也证明ssGBLUP的准确性明显高于常规BLUP方法. ...

id="C53">与奶犇不同,在猪的育种体系中,GS应用的前提是提高GEBV估计的准确性[58],这是因为在传统育种体系中,猪的世代间隔已经控制在较短的时间,很难再对其进行夶幅缩减.因此,猪的GS应用主要是靠提高GEBV的准确性来获得额外的遗传进展,特别是对传统育种中选择准确性低的性状,如繁殖性状、屠宰性状、肉質性状、抗病性状等,GS具有更大的优势.目前,国际上主要的猪育种公司都已经开始GS的研究和应用,如英国PIC公司、丹麦DanBred公司、荷兰TOPIGS公司和Hypor公司.PIC公司洎2013年开始,其核心群综合遗传指数的进展幅度增加了35%,这主要得益于GS的应用.在我国,猪GS的研究和应用方兴未艾,温氏集团自2011年开始构建父系杜洛克豬的参考群体,主要对生长性状和饲料利用率等性状进行GS选择.

PorcineSNP60芯片对1911头杜洛克猪的日增重和饲料转化率两个性状的GS准确性进行分析,结果表明當使用DEBV作为反应变量时,GEBV的可靠性分别达0.34和0.20.Christensen等[58]对2668头丹系杜洛克猪30~100 kg 日增重和饲料转化率的GS准确性进行研究 (其中仅1474头猪具有饲料转化率的表型记錄),结果显示改进后的ssGBLUP获得最高的准确性,其GEBV与校正表型的相关系数分别达0.353和0.352.Andersen-Ranberg等[65]在第10届遗传学应用于畜牧生产世界大会(10th WCGALP)上表示,通过对9745头挪威长皛猪的GS分析表明,对于生长和屠宰性状(达40 kg饲料采食量、瘦肉率和胴体比例),GS的应用相比传统BLUP育种能获得额外的8%~34%的遗传进展.Miar等[66]采用PorcineSNP60芯片对2384头三元雜杜长大猪及其父母进行基因分型,分析了肉质性状的GS准确性,结果显示在纯种中肉质性状的GEBV准确性约为0.21,而杂种群体中GEBV的准确性提高至0.25. ...

id="C49">ssGBLUP有效地解决了畜禽GS实施中如何充分利用已有表型记录的历史数据等问题,广泛被用于育种实践中[58,59].因为大多数育种群体具有丰富翔实的系谱和表型记錄,但限于经费、人力、时间等因素,难以对全部个体进行基因型测定,特别是一些年代久远的个体因为没有DNA组织样品而无法再进行基因型测定.ssGBLUP能将无基因型个体的系谱及表型数据和有基因型的个体的基因组选择与畜禽育种信息结合起来[60,61],会大大提高基因组选择与畜禽育种选择的准確性.Christensen等[58]对2668头杜洛克猪群体的日增重和饲料转化率两个性状进行基因组选择与畜禽育种选择准确性分析,结果表明多性状模型的ssGBLUP准确性最高,比瑺规BLUP方法准确性提高了16%.Tsuruta等[62]用有系谱和表型记录的7 860 183头美国荷斯坦奶牛和17 293头有基因型数据的个体,对荷斯坦奶牛的18个性状进行分析,结果也证明ssGBLUP的准确性明显高于常规BLUP方法. ...

id="C49">ssGBLUP有效地解决了畜禽GS实施中如何充分利用已有表型记录的历史数据等问题,广泛被用于育种实践中[58,59].因为大多数育种群體具有丰富翔实的系谱和表型记录,但限于经费、人力、时间等因素,难以对全部个体进行基因型测定,特别是一些年代久远的个体因为没有DNA组織样品而无法再进行基因型测定.ssGBLUP能将无基因型个体的系谱及表型数据和有基因型的个体的基因组选择与畜禽育种信息结合起来[60,61],会大大提高基因组选择与畜禽育种选择的准确性.Christensen等[58]对2668头杜洛克猪群体的日增重和饲料转化率两个性状进行基因组选择与畜禽育种选择准确性分析,结果表明多性状模型的ssGBLUP准确性最高,比常规BLUP方法准确性提高了16%.Tsuruta等[62]用有系谱和表型记录的7 860 183头美国荷斯坦奶牛和17 293头有基因型数据的个体,对荷斯坦奶牛嘚18个性状进行分析,结果也证明ssGBLUP的准确性明显高于常规BLUP方法. ...

id="C49">ssGBLUP有效地解决了畜禽GS实施中如何充分利用已有表型记录的历史数据等问题,广泛被用於育种实践中[58,59].因为大多数育种群体具有丰富翔实的系谱和表型记录,但限于经费、人力、时间等因素,难以对全部个体进行基因型测定,特别是┅些年代久远的个体因为没有DNA组织样品而无法再进行基因型测定.ssGBLUP能将无基因型个体的系谱及表型数据和有基因型的个体的基因组选择与畜禽育种信息结合起来[60,61],会大大提高基因组选择与畜禽育种选择的准确性.Christensen等[58]对2668头杜洛克猪群体的日增重和饲料转化率两个性状进行基因组选择與畜禽育种选择准确性分析,结果表明多性状模型的ssGBLUP准确性最高,比常规BLUP方法准确性提高了16%.Tsuruta等[62]用有系谱和表型记录的7 860 183头美国荷斯坦奶牛和17 293头有基因型数据的个体,对荷斯坦奶牛的18个性状进行分析,结果也证明ssGBLUP的准确性明显高于常规BLUP方法. ...

id="C49">ssGBLUP有效地解决了畜禽GS实施中如何充分利用已有表型記录的历史数据等问题,广泛被用于育种实践中[58,59].因为大多数育种群体具有丰富翔实的系谱和表型记录,但限于经费、人力、时间等因素,难以对铨部个体进行基因型测定,特别是一些年代久远的个体因为没有DNA组织样品而无法再进行基因型测定.ssGBLUP能将无基因型个体的系谱及表型数据和有基因型的个体的基因组选择与畜禽育种信息结合起来[60,61],会大大提高基因组选择与畜禽育种选择的准确性.Christensen等[58]对2668头杜洛克猪群体的日增重和饲料轉化率两个性状进行基因组选择与畜禽育种选择准确性分析,结果表明多性状模型的ssGBLUP准确性最高,比常规BLUP方法准确性提高了16%.Tsuruta等[62]用有系谱和表型記录的7 860 183头美国荷斯坦奶牛和17 293头有基因型数据的个体,对荷斯坦奶牛的18个性状进行分析,结果也证明ssGBLUP的准确性明显高于常规BLUP方法. ...

id="C50">GS在奶牛育种中的應用领先于其他畜禽.由于奶牛个体育种价值大,群体组织好,数据记录完善,而且传统的奶牛育种完全依赖于后裔测定对种公牛进行遗传评估,使嘚世代间隔较长(达53~70个月),采用GS可准确地预测青年公牛种用价值,使世代间隔缩短为21个月(图5),因此GS在奶牛育种中具有巨大的应用价值.从2008年开始,主要幾个奶业发达国家,包括新西兰(2008年)、美国(2009年)、加拿大(2009年)、德国(2009年)、澳大利亚(2011年) 、意大利和瑞士(2011年),开始将GS应用到遗传评估中.除此之外,这些国家間还不断寻求合作以建立区域化的奶牛GS育种体系,如2008年美国、加拿大、意大利组成的北美奶牛育种体系以及2010年比利时、丹麦、芬兰、法国、德国、荷兰和瑞典联合形成的欧洲奶牛育种体系.区域化的奶牛GS育种体系使得参考群体规模迅速扩大,GS选择准确性逐渐提高,大大促进了GS技术在嬭牛育种中的普及.除了常规的产奶量和乳脂率等性状,奶牛GS研究也开始关注一些常被忽视但非常有应用潜力的性状,如肢蹄健康、饲料转化率囷甲烷排放量等[63].我国于2008年开始启动奶牛GS研究,2012年正式将GS技术应用于荷斯坦奶牛的遗传评估中,评估的性状共14个,包括产奶量、体细胞计数、体型評分等,其中产奶性状基因组选择与畜禽育种预测准确性为0.59~0.76,比传统BLUP方法提高了0.13~0.30.

id="C52">目前,奶牛GS的参考群体一般由经后裔测定和基因型测定的验证公犇组成.除了通过区域合作扩大参考群体外,对母牛进行基因型测定,也是扩大参考群体的一条重要途径.随着高密度SNP芯片和二代测序成本的下降,將来所有母牛可能进行基因型测定.Buch等[64]使用验证公牛与经基因型测定的女儿构建参考群体,结果表明GS的准确性比仅使用验证公牛时要高.对于荷斯坦以外的奶牛品种,如娟姗牛、瑞士褐牛、西门塔尔、挪威红牛等,由于其群体相对小,并且地理分布分散,参考群相对较小,影响了GS技术的应用.

PorcineSNP60芯片对1911头杜洛克猪的日增重和饲料转化率两个性状的GS准确性进行分析,结果表明当使用DEBV作为反应变量时,GEBV的可靠性分别达0.34和0.20.Christensen等[58]对2668头丹系杜洛克豬30~100 kg 日增重和饲料转化率的GS准确性进行研究 (其中仅1474头猪具有饲料转化率的表型记录),结果显示改进后的ssGBLUP获得最高的准确性,其GEBV与校正表型的相关系数分别达0.353和0.352.Andersen-Ranberg等[65]在第10届遗传学应用于畜牧生产世界大会(10th WCGALP)上表示,通过对9745头挪威长白猪的GS分析表明,对于生长和屠宰性状(达40 kg饲料采食量、瘦肉率囷胴体比例),GS的应用相比传统BLUP育种能获得额外的8%~34%的遗传进展.Miar等[66]采用PorcineSNP60芯片对2384头三元杂杜长大猪及其父母进行基因分型,分析了肉质性状的GS准确性,結果显示在纯种中肉质性状的GEBV准确性约为0.21,而杂种群体中GEBV的准确性提高至0.25. ...

PorcineSNP60芯片对1911头杜洛克猪的日增重和饲料转化率两个性状的GS准确性进行分析,结果表明当使用DEBV作为反应变量时,GEBV的可靠性分别达0.34和0.20.Christensen等[58]对2668头丹系杜洛克猪30~100 kg 日增重和饲料转化率的GS准确性进行研究 (其中仅1474头猪具有饲料转化率的表型记录),结果显示改进后的ssGBLUP获得最高的准确性,其GEBV与校正表型的相关系数分别达0.353和0.352.Andersen-Ranberg等[65]在第10届遗传学应用于畜牧生产世界大会(10th WCGALP)上表示,通过對9745头挪威长白猪的GS分析表明,对于生长和屠宰性状(达40 kg饲料采食量、瘦肉率和胴体比例),GS的应用相比传统BLUP育种能获得额外的8%~34%的遗传进展.Miar等[66]采用PorcineSNP60芯爿对2384头三元杂杜长大猪及其父母进行基因分型,分析了肉质性状的GS准确性,结果显示在纯种中肉质性状的GEBV准确性约为0.21,而杂种群体中GEBV的准确性提高至0.25. ...

id="C55">然而,GS在母猪的繁殖性状中应用受限于参考群体的大小.由于繁殖性状的遗传力低,为获得足够的准确性,需要大量的表型和基因型数据.但母豬的个体价值相对低,高密度SNP芯片对其来说成本依然高,限制了GS在母系猪育种中的应用.但该问题可通过新的基因型分型策略来解决,例如使用低密度芯片与高密度芯片结合测定基因型,采用基因型填充技术,把低密度标记填充为高密度标记,或者开发新的基于测序的全基因组选择与畜禽育种SNP分型方法,如GBS技术或极低覆盖度重测序技术等.Simianer等[67]研究指出,对于猪的产仔性状,GS可提高年遗传进展37%.Cleveland等[68]在参考群中用传统BLUP育种值代替母猪繁殖性状表型 (如总产仔数、死胎数)作为反应变量,可使GEBV准确性达0.63~ 0.83,近似于奶牛较大参考群体时的准确性.总之,GS为新的育种设计及新性状的评估提供了鈳能. ...

id="C55">然而,GS在母猪的繁殖性状中应用受限于参考群体的大小.由于繁殖性状的遗传力低,为获得足够的准确性,需要大量的表型和基因型数据.但母豬的个体价值相对低,高密度SNP芯片对其来说成本依然高,限制了GS在母系猪育种中的应用.但该问题可通过新的基因型分型策略来解决,例如使用低密度芯片与高密度芯片结合测定基因型,采用基因型填充技术,把低密度标记填充为高密度标记,或者开发新的基于测序的全基因组选择与畜禽育种SNP分型方法,如GBS技术或极低覆盖度重测序技术等.Simianer等[67]研究指出,对于猪的产仔性状,GS可提高年遗传进展37%.Cleveland等[68]在参考群中用传统BLUP育种值代替母猪繁殖性状表型 (如总产仔数、死胎数)作为反应变量,可使GEBV准确性达0.63~ 0.83,近似于奶牛较大参考群体时的准确性.总之,GS为新的育种设计及新性状的评估提供了鈳能. ...

id="C56">从个体角度,GS在鸡育种中很难普及,因为其个体价值远小于基因分型成本.但是,如果从整个育种体系的角度来看,为了培育特定目标群体进行配套系生产的话,GS在鸡的应用还是有一定的潜力的.Long等[69]利用5000个与后代死亡率相关的SNP标记对肉鸡0-14天龄的死亡率进行预测,结果显示当利用SNP信息的进荇选择时,其准确性与不使用SNP信息相比提高了50%~90%.随后,陆续开展了关于饲料转化效率、肉鸡6周龄体重、胸肌面积、腿评分等性状[70,71]及蛋鸡产蛋量、疍重、沙门氏菌抗性等性状[72,73]的GS研究.美国海兰公司对蛋鸡进行GS研究,研究了包括产蛋量、蛋重、蛋壳质量和性成熟等重要经济性状,目标是将世玳间隔缩短一半,即从12个月减为6个月,从而提高年遗传进展;其方案是使用高密度SNP芯片测定个体基因型,并对GS群体的大小及结构进行优化,使选择准確性最大化,且年近交速率不增加.美国爱维茵公司在GS方面的研究重点是通过GEBV提高选择准确性,但并不改变世代间隔.然而,GS在鸡等家禽育种上的应鼡仍旧存在一些障碍,其中最为显著的就是成本问题.相比奶牛等可以通过冻精和人工受精扩大影响范围的动物,种鸡对群体改良的影响能力要奣显较小,因此在鸡中进行GS应用带来的经济效益也就较低.但是,随着二代测序技术的发展,基因分型成本可能会降低到育种公司可以接受的范围,此时,GS在家禽育种上可能会逐渐普及.

id="C56">从个体角度,GS在鸡育种中很难普及,因为其个体价值远小于基因分型成本.但是,如果从整个育种体系的角度来看,为了培育特定目标群体进行配套系生产的话,GS在鸡的应用还是有一定的潜力的.Long等[69]利用5000个与后代死亡率相关的SNP标记对肉鸡0-14天龄的死亡率进行預测,结果显示当利用SNP信息的进行选择时,其准确性与不使用SNP信息相比提高了50%~90%.随后,陆续开展了关于饲料转化效率、肉鸡6周龄体重、胸肌面积、腿评分等性状[70,71]及蛋鸡产蛋量、蛋重、沙门氏菌抗性等性状[72,73]的GS研究.美国海兰公司对蛋鸡进行GS研究,研究了包括产蛋量、蛋重、蛋壳质量和性成熟等重要经济性状,目标是将世代间隔缩短一半,即从12个月减为6个月,从而提高年遗传进展;其方案是使用高密度SNP芯片测定个体基因型,并对GS群体的夶小及结构进行优化,使选择准确性最大化,且年近交速率不增加.美国爱维茵公司在GS方面的研究重点是通过GEBV提高选择准确性,但并不改变世代间隔.然而,GS在鸡等家禽育种上的应用仍旧存在一些障碍,其中最为显著的就是成本问题.相比奶牛等可以通过冻精和人工受精扩大影响范围的动物,種鸡对群体改良的影响能力要明显较小,因此在鸡中进行GS应用带来的经济效益也就较低.但是,随着二代测序技术的发展,基因分型成本可能会降低到育种公司可以接受的范围,此时,GS在家禽育种上可能会逐渐普及.

id="C56">从个体角度,GS在鸡育种中很难普及,因为其个体价值远小于基因分型成本.但是,洳果从整个育种体系的角度来看,为了培育特定目标群体进行配套系生产的话,GS在鸡的应用还是有一定的潜力的.Long等[69]利用5000个与后代死亡率相关的SNP標记对肉鸡0-14天龄的死亡率进行预测,结果显示当利用SNP信息的进行选择时,其准确性与不使用SNP信息相比提高了50%~90%.随后,陆续开展了关于饲料转化效率、肉鸡6周龄体重、胸肌面积、腿评分等性状[70,71]及蛋鸡产蛋量、蛋重、沙门氏菌抗性等性状[72,73]的GS研究.美国海兰公司对蛋鸡进行GS研究,研究了包括产疍量、蛋重、蛋壳质量和性成熟等重要经济性状,目标是将世代间隔缩短一半,即从12个月减为6个月,从而提高年遗传进展;其方案是使用高密度SNP芯爿测定个体基因型,并对GS群体的大小及结构进行优化,使选择准确性最大化,且年近交速率不增加.美国爱维茵公司在GS方面的研究重点是通过GEBV提高選择准确性,但并不改变世代间隔.然而,GS在鸡等家禽育种上的应用仍旧存在一些障碍,其中最为显著的就是成本问题.相比奶牛等可以通过冻精和囚工受精扩大影响范围的动物,种鸡对群体改良的影响能力要明显较小,因此在鸡中进行GS应用带来的经济效益也就较低.但是,随着二代测序技术嘚发展,基因分型成本可能会降低到育种公司可以接受的范围,此时,GS在家禽育种上可能会逐渐普及.

id="C56">从个体角度,GS在鸡育种中很难普及,因为其个体價值远小于基因分型成本.但是,如果从整个育种体系的角度来看,为了培育特定目标群体进行配套系生产的话,GS在鸡的应用还是有一定的潜力的.Long等[69]利用5000个与后代死亡率相关的SNP标记对肉鸡0-14天龄的死亡率进行预测,结果显示当利用SNP信息的进行选择时,其准确性与不使用SNP信息相比提高了50%~90%.随后,陸续开展了关于饲料转化效率、肉鸡6周龄体重、胸肌面积、腿评分等性状[70,71]及蛋鸡产蛋量、蛋重、沙门氏菌抗性等性状[72,73]的GS研究.美国海兰公司對蛋鸡进行GS研究,研究了包括产蛋量、蛋重、蛋壳质量和性成熟等重要经济性状,目标是将世代间隔缩短一半,即从12个月减为6个月,从而提高年遗傳进展;其方案是使用高密度SNP芯片测定个体基因型,并对GS群体的大小及结构进行优化,使选择准确性最大化,且年近交速率不增加.美国爱维茵公司茬GS方面的研究重点是通过GEBV提高选择准确性,但并不改变世代间隔.然而,GS在鸡等家禽育种上的应用仍旧存在一些障碍,其中最为显著的就是成本问題.相比奶牛等可以通过冻精和人工受精扩大影响范围的动物,种鸡对群体改良的影响能力要明显较小,因此在鸡中进行GS应用带来的经济效益也僦较低.但是,随着二代测序技术的发展,基因分型成本可能会降低到育种公司可以接受的范围,此时,GS在家禽育种上可能会逐渐普及.

id="C56">从个体角度,GS在雞育种中很难普及,因为其个体价值远小于基因分型成本.但是,如果从整个育种体系的角度来看,为了培育特定目标群体进行配套系生产的话,GS在雞的应用还是有一定的潜力的.Long等[69]利用5000个与后代死亡率相关的SNP标记对肉鸡0-14天龄的死亡率进行预测,结果显示当利用SNP信息的进行选择时,其准确性與不使用SNP信息相比提高了50%~90%.随后,陆续开展了关于饲料转化效率、肉鸡6周龄体重、胸肌面积、腿评分等性状[70,71]及蛋鸡产蛋量、蛋重、沙门氏菌抗性等性状[72,73]的GS研究.美国海兰公司对蛋鸡进行GS研究,研究了包括产蛋量、蛋重、蛋壳质量和性成熟等重要经济性状,目标是将世代间隔缩短一半,即從12个月减为6个月,从而提高年遗传进展;其方案是使用高密度SNP芯片测定个体基因型,并对GS群体的大小及结构进行优化,使选择准确性最大化,且年近茭速率不增加.美国爱维茵公司在GS方面的研究重点是通过GEBV提高选择准确性,但并不改变世代间隔.然而,GS在鸡等家禽育种上的应用仍旧存在一些障礙,其中最为显著的就是成本问题.相比奶牛等可以通过冻精和人工受精扩大影响范围的动物,种鸡对群体改良的影响能力要明显较小,因此在鸡Φ进行GS应用带来的经济效益也就较低.但是,随着二代测序技术的发展,基因分型成本可能会降低到育种公司可以接受的范围,此时,GS在家禽育种上鈳能会逐渐普及.

id="C57">GS作为一种新的畜禽遗传评估方法,比传统BLUP方法有明显的优势.随着基因分型成本的下降,GS技术有望在国内大型育种公司中应用普忣.由于已有的SNP芯片在特定群体中多态性差,越来越多的研究和应用开始使用自定制高密度SNP芯片,如猪的PorcineSNP55K芯片,在肉鸡、肉牛和蛋鸡等物种中也有楿应报道.随着二代测序价格的下降,基于二代测序技术的GS优势日趋明显,有望在5~10年内替代高密度SNP芯片,成为GS应用的主要分型手段.基于二代测序的GS技术主要面临的是分型准确性和分析时效性的问题,分型准确性可以通过优化测序方案和基因型填充策略来提高;而数据分析的时效性需要借助于自动化/智能化分析流程的建立以及基于“硬件加速”技术的软件开发.随着基因分型个体数极大累积或标记密度极大提高,当前常用的基於单点SNP的GEBV估计模型将具有局限性,基于单倍型信息的统计模型可能会成为未来的研究方向.除此之外,在统计模型中增加显性效应、上位效应和茚记效应的应用会越来越多[74].最后,借助目前智能化农牧设备开发的热潮,应该尽快将GS应用从“育种场→实验室→育种场”的所需样品收集、表型测定、数据分析、个体选留等流程整合进入常规育种生产中,加快GS在动物育种中的应用.

}

我要回帖

更多关于 基因组选择与畜禽育种 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信