世代平均数的遗传分析1加性显性模型的基因效应估计.docx
- 文档编号:11260411
- 上传时间:2023-02-26
- 格式:DOCX
- 页数:14
- 大小:168KB
世代平均数的遗传分析1加性显性模型的基因效应估计.docx
《世代平均数的遗传分析1加性显性模型的基因效应估计.docx》由会员分享,可在线阅读,更多相关《世代平均数的遗传分析1加性显性模型的基因效应估计.docx(14页珍藏版)》请在冰豆网上搜索。
世代平均数的遗传分析1加性显性模型的基因效应估计
世代平均数的遗传分析
Ⅰ.加性-显性模型的基因效应估计
莫惠栋
AGeneticAnalysisofGenerationMeans
.EstimationofGenicEffectsforAdditive-DominanceModel
概述
控制一个数量性状的多基因系统,其个别基因的效应,一般都不可能用孟德尔的归类法进行分析。
因为这些基因的个别效应太小而又极易受环境的影响,难以划分不同基因型舰的界限。
但是,一切数量性状,都有着一个特定的多基因系统(遗传作用)加环境修饰而形成的频率分布,这是在任何数量遗传实验中都可以观察到的。
而频率分布,我们知道,其特征是可以用以诸如平均数、方差、协方差等统计数描述的。
因此,计算这些统计数,并理解其遗传学意义(这是至关重要的),同样可对多基因控制的性状作出遗传分析。
只是应注意到:
(1)这类分析通常都是将多基因系统作为一个整体来处理,因而其结果是该系统中全部基因成员的一种总的或平均的性质,个别基因的作用一般不是很清楚;(2)这类分析多是依赖于“黑箱”理论的一种最佳估计,如果一系统中的各别基因皆能在细胞学上定位,并在生物化学上明了其作用方式,分析当然可以更为深入。
数量性状的遗传分析,在遗传理论和育种实践上,都有重要意义,而且又是一个相当庞大的论题。
我们将从自花授粉植物世代平均数的遗传分析入手,联系我国育种实际,逐步展开讨论。
、世代平均数的加性-显性模型
设某性状仅由一对等位基因Aa控制,其中A对a为增效(A表示增效,a表示减小),且纯合体AA和aa的平均值(中亲值)为m。
则AA和aa的基因型值可分别记为
AAmd和aamd,而杂合体Aa的基因型值可记为Aamh。
这里,
d(AAaa)2,是纯合情况下以等位基因A替代a的平均效应,称加性效应;h是杂合
体Aa的基因型值对m的离差(其加性期望的离差),即hAam,表示了等位基因A和
和aad。
这样显然可得:
md,Aam,aamd),不存在显性。
(1)若h0或hd0(即AA
2)若0hd或0(hd)1(即mAa(md)),为正向部分显性。
3)若0hd或0(hd)1(即(md)Aam),为负向部分显性。
(4)若|h|d或|hd|1(Aa(md)或(md)),为完全显性。
(A对a为显性,A对a为隐性)
(5)若|h|d或|hd|1(即Aa(md)或(md)),为超显性。
一般称上述
(1)为加性模型,即等位基因A对a只有加性效应;
(2)~(5)为加性-显性模型,即等位基因A对a除纯合时的加性效应外,在杂合时尚有显性效应。
以上推断皆是就基因型而言,未考虑随机误差。
有了上述概念,就可方便地导出自花授粉植物纯系杂交后,各世代平均数的遗传分量。
例如:
亲本AA(P1)和aa(P2)杂交,F1代皆为
Aa,
故F
基因型
值为
F1
mh;
F2代为
14AA12Aa14aa,故F2基因型平均数为
F2
14(m
d)
12(m
h)
14(m
d)
1
m12h;
F3代为83AA41Aa83aa,故F383(m
d)
14(m
h)
38(m
d)
m14
h;F1
P1的B1
代为12AA12Aa,故B112(md)
12(m
h)
m
12d
12h;
F1
P2的
B2代为
21aa21Aa,故B221(md)21(mh)m12d21h;LL等。
其有关结果列于表1“一对等位基因”栏下。
将上述模式推广于有k对独立等位基因的多基因系统时,情况要复杂些。
例如,在有
Aa、Bb两对独立基因,且A对a、B对b为增效时,各种基因型的遗传分量就要写
成:
AABBmd1d2,aabbmd1d2,AaBbmh1h2,LL等(这里d1和
可记为F1mh1h2Lhkmh,LL等。
其有关结果列于表1“k对等位基因”
栏下。
注意,这里的d和h仍是对两纯系亲本中亲值m的离差。
但在推断显性的性质(无显性、部分显性、完全显性或超显性)时,应注意d和h与d和h是由区别的。
应当分清两种情况:
(1)如果控制某一性状的有关基因在两纯系亲本中的分布是联合态的(并且各di近似
F121(P1P2)
21(P1P2)
相等的情况下,所有都是增效或减效),即在P1和P2上是分别集中了所有增效和减效等位基
因(如P1为AABBCC,P2为aabbcc),则势能比(potenceratio):
和hd一样,可用以推断显性的性质。
因为在此情况下,hd反映了显性在所有位点上
的平均性质。
(尽管不能反映各个位点的显性性质,但可反映所有位点的平均性质)
(2)如果有关基因在两纯系亲本中的分布是分散态的,即P1和P2分别集中了部分增效
和减效等位基因(如P1为AABBcc,P2为aabbCC;或P1为AABBcc,P2为aaBBcc等),则hd一般与每一位点上的显性性质不相干。
因为在此情况下,d不是一个所基因系统的所有增效基因的加性效应之和,h也可能不是所有杂合基因的显性效应之和。
例如,设某性状受3对等位基因控制,且d1d2d33,h1h2h32,即每一位点都属于正向部分显性。
当P1为AABBcc,P2为aabbCC时,F1为AaBbCc,得d3333,h2226,hd632。
这一hd2表明F1代出现了超亲的杂种优势,但各位点上的基因都没有超亲效应。
同样,若出现了超亲的杂种优势也不能肯定是由超显性造成的。
在数量遗传和植物育种试验中,控制数量性状的基因在两亲中的分布,通常都是不同程度的分散态,极少为联合态。
而且,即使某一性状可能达到联合态,其余性状一般仍是不同程度的分散态。
所以,hd通常是不能用来推断显性性质。
三、加性-显性模型的遗传分析
m、d和h的3个世代平均数
1、试验设计在加性-显性模型下,要估计纯合体平均数m、加性效应d和显性效应h3个遗传参数,因而至少要有在遗传分量中包含有
(如P1、P2和F1)。
但这样所得的估计数误差大,且因期望平均数皆等于观察平均数,没有剩余的自由度可供测验模型的适合性。
为了更精确地估计和发现在加性-显性模型中未予考虑而实际上可能存在的上位性效应,一般宜有P1、P2、F1、F2、B1和B26个世代平均
数。
这些平均数需经三个生长季节的工作才可以获得,即:
第一个生长季节,以P1P2(或
P2P1)获得F1;第二个生长季节,以P1F1、P2F1和F1自交,分别获得B1、B2和F2,并保留(或复制)部分F1种子;第三个生长季节,将P1、P2、F1、F2、B1和B2植于可比较的环境中(环境设计一般用完全随机或随机区组),得到6个平均数计其误差方差。
若希望有更广泛的信息,则可再添加F2自交(F3)、B1自交、B2自交和F2P1、F2P2、F2F1等世代,但这样就要到第四个生长季节才能进行比较。
2、统计分析这一分析包含三项内容:
(1)由观察结果,应用最小平方和法求的遗传分量m、d和h的估计值m?
、d?
Vi的倒数)为加
和h?
的:
设有k个世代平均数Yi(i1,2,Lk)及其误差方差Vi参加分析,我们可以定义A为平均数遗传分量系数的结构矩阵(k3阶)、b为未知元的三维列向量,Y为k个观察平均数的k维列向量,V为k个平均数误差方差的对角阵,既有:
X11X12X13
b1
m?
Y1
V1
0
X21X22X23A212223,b
b2
[d?
],Y
Y2
2,Vdiag(V1,V2,LVk)
V
2
MMM
M12k
L
Xk1Xk2Xk3
b3
[h?
]
Yk
0
Vk
由于各Yi的Vi不同,在计算时各家系均应以其平均数的精确系数
i
因而需要再
1)
权值,以使误差较大的平均数具有较小的权,误差较大的平均数具有较大的权。
引入:
111
V1V2
V1diag(V1,V1,L,V1)diag(f1,f2,Lfk)
这样k个观察平均数的方程组即可写成:
(fA)b(fY)
根据最小平方和原理,在
(1)的两侧同时左乘以A的转置矩阵AT,即得正规方程组:
AT(fA)bAT(fY)
(2)
或简写为:
Jbk(2‘)
(2‘)中的:
fX12
fX1X2
fX1X3
fX1Y
JAT(fA)
fX1X2
fX22
fX2X3,KA
T(fY)fX2Y
(3)
fX1X3
fX2X3
fX32
fX3Y
因此,列出各家系得
f、X1
、X2、X3
和Y,通过简单的乘、
加运算。
即可得(
2)。
砸次
计算中,由于
X1(
m的系数)在任一家系皆为1,故有:
fX12
fX1
f,
fX1X2
fX2,fX1X3
fX3,fX1Y
fY
可注意应用。
由
(2)即可解得各遗传分量估计值:
bJ1K(4)
(4)中的J1(cij)33,为J的逆阵。
(2)测验观察结果是否符合加性-显性模型:
得到b后,可进而算出根据加性-显性
模型的各家系平均数期望值列向量Y?
(k维):
AbY?
(5)
由于统计数2系正态标准离差的平方和,因而即可得出:
2(YY?
)Tf(YY?
)f(YY?
)2(6)
此2值的自由度为(k3),当其02.05,(k3)时,表示性状遗传是符合加性-显性模型的;
如果02.05,(k3),则表明该性状遗传不符合加性-显性模型,需考虑用加性-显性-上位性
模型,方法见下期。
这里需要注意到,以上计算实际上只是以各世代的m、d和h的系数(表1所列)
为X1、X2和X3变数,以世代平均数为Y变数的较为简单的三元线性回归分析。
Y变数的总变异平方和fy2被分解为回归于加性-显性模型的平方和U和离回归平方和Q两部
分,其值为:
fy2fY2(fY)2f
Ubifxiy(fxiyfXiY(fXi)(fY)f(7)
Qf(YY?
)2fy2U
(7)中的Q即(6)的2值。
3)测验各遗传分量m、d?
和h?
与0的差异显著性,即测验H0:
m0,
H0:
d0和H0:
h0。
根据多元分析理论,各遗传分量估计值bi的标准误为:
8)中cij为J1中的主对角线之素,?
e为离回归标准误:
?
eQ(k3)(9)
10)
所以在大样本时,由ubiSbi
可测验上述各H0被接受或否定。
如有接受H0的分量,应予剔除(方法见下期),以使保留
的基因效应都是显著不同于0的(模型适合性测验的2值及其自由度亦要根据保留的基因
效应重新计算)。
这里可注意,(9)根号内的分子Q为2值,而分母则为该2值的自由度数(在此
k3)。
根据统计理论,当在同一正态总体抽样时,2的数学期望为其自由度数,
即E
(2)或E
(2)1。
因而,K.Mather等曾建议*:
当观察结果符合模型时,遗传
分量估计值的标准误可简为:
Sbcii(11)
这就是假定?
e1。
作者检查过几百组6家系资料,认为以之作为遗传分量与0的差异显著性的近似测验,是可行的。
对实际资料进行上述分析还需注意一个前提,即模型的建立是以P1和P2在被研究性状
上的基因组成有着真实的差异为基础的。
因此,在选用两亲时,就应使用其在被研究性状上的差异尽可能大(即基因分布尽可
能接近联合态);在统计分析时,则
应首先证实两亲本的平均数间是有
表2
桂花黄(P1)×阿抱罗(有关家系的出穗期观察结果
P2)
显著差异的。
一般的说,两亲平均
家系
平均数
方差
样本容量
平均数方差
数的差数,应大于其差数标准误的
Y
2s
n
s2n
两倍;如果不是这样,就不适于作
P1
25.7
3.69
87
0.04241
遗传分析。
因为环境误差已大到不
P2
8.2
6.80
59
0.11525
能识别亲本差异,丧失了估计基因
F1
20.0
5.48
13
0.42154
效应的基础。
F2
17.6
114.55
79
1.45000
B1
21.4
43.85
18
2.43611
四、实例
B2
19.2
138.47
18
7.69278
*江苏农学院数量遗传研究室1983年试验
粳稻桂花黄(P1)×阿抱罗(P2)
有关6个家系的出穗期(以7月31日为0)资料列于表2。
该结果的两亲差异为:
t(25.78.2)0.042410.1152544.07,为极显著,故可进一步作基因效应的遗传分析。
根据加性
-显性模型,这里的有关矩阵和向量为:
23.577240
8.67647
2.37226
0.68966
0.41049
0.12999
为便于求得正规方程组,可将上述结果列成表3式样。
由表3得到:
222
fX12fX1f35.85611,fX2232.38883,fX322.679795
fX1YfY747.945632,fX2Y537.932353,fX3Y59.154355
因而既有表2资料的正规方程组为:
表4
求表2资料正规方程组系数矩阵J的逆阵J1
35.85611
15.04102
2.98733
1
0
0
15.04102
32.38883
0.070125
0
1
0
2.98733
0.070125
2.679795
0
0
1
35.85611
0.41948276
0.08331439
0.02788925
0
0
15.04102
26.07938142
-0.04536183
-0.01608484
0.03834447
0
2.98733
-1.18300843
2.37724400
-0.04305107
0.01908169
0.42065518
0.03904253
-0.01803772
-0.04305107
J1
-0.01803772
0.03921005
0.01908169
-0.04305107
0.01908169
0.42065518
在表4解得J的逆阵J1。
故根据(4)和(11),得到各遗传分量估计值及其标准误为:
说明这里的遗传分量m?
、d?
和h?
都是显著的。
为测验表2资料结果是否符合加性-显性模型,算得各家系平均数的期望值为:
1
1
0
25.6819
1
1
0
8.2221
16.9520
1
0
1
19.9004
1
8.7299
1
0
1
2
18.4262
2.9484
1
1
2
1
2
22.7912
1
1
2
1
2
14.0612
Ab
观察平均数和期望平均数的离差为:
25.7
25.6819
0.0181
8.2
8.2221
0.0221
(Y
Y?
)
20.0
19.9004
0.0996
17.6
18.4262
0.8262
21.4
22.7912
1.3912
19.2
14.0612
5.1388
Y
Y?
(YY?
)
故2(YY?
)Tf(YY?
)
4.73
。
如根据(
7)计算,
2
则由表3得fY217554.37769,
并有:
fy217554.37769(747.945632)235.856111952.499277
fx1y747.945632(747.945632)(35.85611)35.856110
fx2y537.932353(747.945632)(15.04102)35.85611224.1820547fx3y59.154355(747.945632)(2.98733)35.856113.16028049
0
U16.95208.72992.9484224.18205471447.7691于是,
3.16028049
Q21952.4991447.7694.73
结果同上。
但这里的程序不必计算Y?
,较为简便。
以上24.73的自由度df3,其P0.2,为不显著,为不显著。
所以说明标2出穗期性状的遗传是符合加性-显性模型的,且有m?
16.95200.1976,d?
8.72990.1980,h?
2.94840.6486,杂种的显性方向为正(即比中亲值迟熟)。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 世代 平均数 遗传 分析 显性 模型 基因 效应 估计