数学建模作业 实验6数理统计实验.docx
- 文档编号:11559141
- 上传时间:2023-03-19
- 格式:DOCX
- 页数:13
- 大小:54.11KB
数学建模作业 实验6数理统计实验.docx
《数学建模作业 实验6数理统计实验.docx》由会员分享,可在线阅读,更多相关《数学建模作业 实验6数理统计实验.docx(13页珍藏版)》请在冰豆网上搜索。
数学建模作业实验6数理统计实验
实验6数理统计实验
1.区间估计
解:
(1)根据题意,用R软件求解
>X<-c(1067,919,1196,785,1126,936,918,1156,920,948)
>t.test(X,al="g")
得到如下结果:
OneSamplet-test
data:
X
t=23.9693,df=9,p-value=9.148e-10
alternativehypothesis:
truemeanisgreaterthan0
95percentconfidenceinterval:
920.8443Inf
sampleestimates:
meanofx
997.1
由此知道这批灯泡中大约95%的灯泡至少使用920.8443小时。
(2)
> x<-c(1067,919,1196,785,1126,936,918,1156,920,948)
> x
[1] 1067 919 1196 785 1126 936 918 1156 920 948
> pnorm(1000,mean(x),sd(x))
[1] 0.5087941
x<=1000的概率为0.5087941,
故x大于1000的概率为0.4912059
即这个星期生产出的灯泡能使用1000h以上的概率为0.4912059。
2.假设检验I
解:
根据题意,用R软件求解
> x<-c(220, 188, 162, 230, 145, 160, 238, 188, 247, 113, 126, 245, 164, 231, 256, 183, 190, 158, 224, 175)
> t.test(x,mu=225,alternative="less")
One Sample t-test
data:
x
t = -3.4783, df = 19, p-value = 0.001258
alternative hypothesis:
true mean is less than 225
95 percent confidence interval:
-Inf 208.4806
sample estimates:
mean of x
192.15
油漆工人的血小板计数与正常成年男子有差异。
p值为0.002516小于0.05,原假设不成立,
因此认为油漆作业对男子血小板含量有影响。
3.假设检验II
解:
根据题意:
建立检验假设,确定检验水准:
H0:
1=2即阿卡波糖胶囊组与拜糖平胶囊组空腹血糖下降值总体均数相等;H1:
1≠2即阿卡波糖胶囊组与拜糖平胶囊组空腹血糖下降值总体均数不相等;=0.05。
使用t检验,若两组数据方差相同时,编辑R软件程序如下:
>x<-c(-0.70,-5.60,2.00,2.80,0.70,3.50,4.00,5.80,7.10,-0.50,2.50,-1.60,1.70,3.00,0.40,4.50,4.60,2.50,6.00,-1.40)
>y<-c(3.70,6.50,5.00,5.20,0.80,0.20,0.60,3.40,6.60,-1.10,6.00,3.80,2.00,1.60,2.00,2.20,1.20,3.10,1.70,-2.00)
>t.test(x,y,var.equal=TRUE)
得到如下结果:
TwoSamplet-test
data:
xandy
t=-0.6419,df=38,p-value=0.5248
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-2.3261791.206179
sampleestimates:
meanofxmeanofy
2.0652.625
分析结果,p-value=0.5248>0.05,所以接受原假设H0,即试验组与对照组没有显著差异。
根据题意,若两组数据方差不同时,利用R软件进行t检验:
>t.test(x,y)
得到如下结果
WelchTwoSamplet-test
data:
xandy
t=-0.6419,df=36.086,p-value=0.525
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-2.329261.20926
sampleestimates:
meanofxmeanofy
2.0652.625
因此试验组与对照组的没有显著差异。
进行成对t检验:
>t.test(x,y,paired=TRUE)
得到如下结果:
Pairedt-test
data:
xandy
t=-0.6464,df=19,p-value=0.5257
alternativehypothesis:
truedifferenceinmeansisnotequalto0
95percentconfidenceinterval:
-2.3731461.253146
sampleestimates:
meanofthedifferences
-0.56
即试验组与对照组的结果也没有显著差异。
故三中检验的结果都显示两组数据均值无差异。
对比三种检验方式,如果两个样本是成对的,应该使用成对的t检验,如果不使用成对t检验,t值会变小,p值会变大,准确性差了很多。
(2)方差检验:
>var.test(x,y)
得到如下结果:
Ftesttocomparetwovariances
data:
xandy
F=1.5984,numdf=19,denomdf=19,p-value=0.3153
alternativehypothesis:
trueratioofvariancesisnotequalto1
95percentconfidenceinterval:
0.63265054.0381795
sampleestimates:
ratioofvariances
1.598361
故两组数据方差相同。
4.假设检验III
解:
根据题意提出假设:
建立检验假设,确定检验水准:
H0:
p=p0=2%即患病率相符;H1:
p≠p0即患病率不符;=0.05。
使用R软件进行校验:
>binom.test(400,10000,p=0.002)
得到如下结果:
Exactbinomialtest
data:
400and10000
numberofsuccesses=400,numberoftrials=10000,p-value<
2.2e-16
alternativehypothesis:
trueprobabilityofsuccessisnotequalto0.002
95percentconfidenceinterval:
0.036243780.04402702
sampleestimates:
probabilityofsuccess
0.04
检验出P-值<0.05,因此不符合原假设,即这组数据不能说明乳腺癌的患病率与家族遗传有关。
5.分布检验I
解:
根据题意提出假设:
建立检验假设,确定检验水准:
H0:
结果符合自由组合规律;H1:
结果不符合自由组合规律;=0.05。
使用R软件进行校验,利用pearson卡方检验是否符合特定分布:
>chisq.test(c(315,101,108,32),p=c(9,3,3,1)/16)
得到如下结果:
Chi-squaredtestforgivenprobabilities
data:
c(315,101,108,32)
X-squared=0.47,df=3,p-value=0.9254
分析结果结果p-值为0.9254>0.05,所以接受原假设,即此结果符合自由组合规律。
6.分布检验II
解:
根据题意提出假设:
建立检验假设,确定检验水准:
H0:
每分钟顾客数X服从Poisson分布;H1:
每分钟顾客数X不服从Poisson分布;=0.1。
使用R软件进行校验:
首先利用pearson卡方检验是否符合泊松分布:
>X<-0:
5;Y<-c(92,68,28,11,1,0)
>q<-ppois(X,mean(rep(X,Y)));
>n<-length(Y)
>p<-numeric(n);
>p[1]<-q[1];
>p[n]<-1-q[n-1];
>for(iin2:
(n-1))
+p[i]<-q[i]-q[i-1]
>chisq.test(Y,p=p)
得到如下结果:
Chi-squaredtestforgivenprobabilities
data:
Y
X-squared=2.1596,df=5,p-value=0.8267
警告信息:
Inchisq.test(Y,p=p):
Chi-squared近似算法有可能不准
得到警告,因为Pearsonχ2检验要求在分组后,至少要大于等于5,而后两组中出现的顾客数是1,0,均小于5,重新分组,合并频数小于5的组:
>Z<-c(92,68,28,12)
>n<-length(Z);p<-p[1:
n-1];p[n]<-1-q[n-1]
>chisq.test(Z,p=p)
得到如下结果:
Chi-squaredtestforgivenprobabilities
data:
Z
X-squared=0.9113,df=3,p-value=0.8227
分析结果,p-值为0.8227>0.1,因此,接受原假设,即每分钟顾客数X服从Poisson分布。
7.分布检验III
解:
根据打进的电话时间算出时间间隔:
1:
00
1:
06
1:
08
1:
16
1:
22
1:
23
1:
34
1:
44
1:
47
1:
51
1:
57
6
2
8
6
1
11
10
3
4
6
建立检验假设,确定检验水准:
H0:
打进电话的时间间隔服从指数分布;H1:
打进电话的时间间隔不服从指数分布;=0.05。
假设指数分布的参数λ为
=0.1,利用R软件进行检验:
x<-c(6,2,8,6,1,11,10,3,4,6)
ks.test(x,"pexp",0.1)
得到如下结果:
One-sampleKolmogorov-Smirnovtest
data:
x
D=0.3329,p-value=0.2178
alternativehypothesis:
two-sided
因此P-值为0.2178>0.05,因此接受原假设,即打进电话的时间间隔是否服从指数分布。
8.列联表检验I
解:
根据题意,利用R软件输入数据,使用chisq.test()作检验。
>compare<-matrix(c(28,42,34,31,23,9,7,11,13,7,15,20),nr=2,dimnames=list(c("女性","男性"),c("配偶","父母","子女","兄弟姐妹","姻亲","其他亲属")))
>chisq.test(compare,correct=TRUE)
得到如下结果:
Pearson'sChi-squaredtest
data:
compare
X-squared=12.4666,df=5,p-value=0.02892
由于p-值为0.02892<0.05,因此拒绝原假设,认为女性和男性在关于给谁买节日礼物最难的看法上是有显著差异的。
9.列联表检验II
解:
根据题意,其所给数据不满足χ2检验条件,固使用Fisher精确检验。
>x<-matrix(c(9,1,3,3),nc=2)
>fisher.test(x)
得到如下结果:
Fisher'sExactTestforCountData
data:
x
p-value=0.1181
alternativehypothesis:
trueoddsratioisnotequalto1
95percentconfidenceinterval:
0.4313171521.0928115
sampleestimates:
oddsratio
7.63506
由此计算出的p-值=0.1181>0.05,并且区间估计得到的区间包含有1,因此说明两个变量是独立的,即认为左右半球恶性肿瘤的发病率并无显著差异。
10.Wilcoxon秩和检验I
(1)解:
因为Wilcoxon秩和检验本质只需排出样本的秩次,而且题目中的数据本身就是一个排序,因此可直接使用,编写R程序如下:
>x<-c(3,5,7,9,10)
>y<-c(1,2,4,6,8)
>wilcox.test(x,y,alternative="greater")
得到如下结果:
Wilcoxonranksumtest
data:
xandy
W=19,p-value=0.1111
alternativehypothesis:
truelocationshiftisgreaterthan0
得到的p-值为0.1111>0.05,因此接受原假设,即并不能认为新的教学效果显著优于原方法。
(2)同第一问,编写R程序如下:
>x<-c(4,6,7,9,10)
>y<-c(1,2,3,5,8)
>wilcox.test(x,y,alternative="greater")
得到如下结果:
Wilcoxonranksumtest
data:
xandy
W=21,p-value=0.04762
alternativehypothesis:
truelocationshiftisgreaterthan0
得到的p-值为0.0.04762<0.05,因此拒绝原假设,即认为新方法比原方法显著提高了教学效果。
11.Wilcoxon秩和检验II
解:
根据题意,可以将不同方法治疗后的结果用5个不同的值表示,1表示最差,5表示最好,这样就可以为这些病人排序,因此,可用Wilcoxon秩和检验来分析问题。
编写R程序:
>x<-rep(1:
5,c(0,1,9,7,3))
>y<-rep(1:
5,c(2,2,11,4,1))
>wilcox.test(x,y,exact=F)
得到如下结果:
Wilcoxonranksumtestwithcontinuitycorrection
data:
xandy
W=266,p-value=0.05509
alternativehypothesis:
truelocationshiftisnotequalto0
由计算结果知道p-的值为0.05509大于0.05,不能拒绝原假设,尚不能认为新方法的疗效显著优于原疗法。
6.3加分实验
解:
(1)使用Matlab和R软件两种方法求解(两种思路)
(i)第一问使用两种方法求解(Matlab和R软件)
使用Matlab求解:
对题目意思的理解说明:
1)题目中的正态分布N(100,4)中的4看做标准差,若为方差,可以在程序中将sigma改为2即可。
2)电脑根据称重情况T判断是否符合设定个数n的原则:
round(T/100)=n就表示满足要求。
应用MC方法对系统进行模拟,系统模拟封装100万盒螺母,源程序如下:
>>functiony=test2(n)
%%该程序计算一直终端控制个数时,求P(m<200),即实际个数小于200的个数
%%采用MC算法
%%输入参数:
n表示终端控制个数,输出为概率y
max=210;
mu=100;
sigma=4;
T=0;
all=1000000;
out=0;
D=tril(ones(max,max),0);%下三角矩阵
fort=1:
all
ifmod(t,all/100)==0
disp(['正在计算次数',num2str(t),'剩余次数',num2str(all-t),'请等待...']);
end
T0=normrnd(mu,sigma,max,1);%生成一批螺母
T0=D*T0;%累加螺母重量
T=normrnd(T0,3);%机器称重
T=round(T/100);%机器估算个数
iffind(T==n)<200%实际个数小于200就计数
out=out+1;
end
end%fort
y=out/all;
end
得到设定202个可以满足要求。
具体结果如下表所示:
设定个数
实际个数少于200个的概率
200
0.1767
201
0.0036
202
5.00E-06
203
0
使用R软件求解:
若使用R软件进行求解,可套用现成的函数,题目可以理解为当测量总重量W>=N*100的时候装盒结束,N为电脑设置的。
盒子中实际的螺母数量是随机的,可能比N大也可能比N小。
目的是当W刚好大于N*100的时候,实际螺母数量<=199的概率小于0.0001。
这个条件可以认为等价于装到199个的时候,总重量W_199>=N*100的概率小于0.0001。
W_199等于199个螺母重量加上秤的误差,所以分布为N(199*100,sqrt(199*4^2+3^2))
从N=200开始增加,直到P(W_199>=N*100)小于0.0001
编程如下:
>sim<-function(n){
simfun<-function(aaaa){
x<-rnorm(300,100,4)
x<-cumsum(x)
which(x>=rnorm(300,100*n,3))[1]
}
y<-sapply(1:
1000000,simfun)
sum(y<200)/length(y)
}
带入数值进行运算:
>sim(200)
[1]0.038265
>sim(201)
[1]0.000242
>sim(202)
[1]0
由R软件得到的结果为将设定数目设定为202个。
(2)设终端设置为
个时,每盒螺母少于200个的概率为
,则用户需要200盒螺母,生产线停工的次数
服从
,平均停工次数为
。
计算平均损失可以计算为:
超过200个的成本+因停工造成的损失。
因此平均损失
利用Matlab代入上表数值计算得:
设定个数
平均损失(元)
200
0.1767
176700
201
0.0036
3800
202
5.00E-06
405
203
0
600
经比较发现,设定个数为202时,平均损失最小。
若使用R软件,在1(i)的基础上,1(ii)就很直接了,假设停工的概率为p,那么平均停工200*p次那么成本为200*N+p*200*5000
编程如下:
>cost<-function(N){
p<-1-pnorm(N*100,199*100,sqrt(4^2*199+3^2))
N*200+p*5000*200}
>cost(200:
205)
得到如下结果
[1]78388.2640400.5140400.0640600.0040800.0041000.00
所以202个的时候总cost最小
(2)设螺母个数为
,第
个螺母的重量
,其中
未知,且各螺母的重量相互独立,则一盒螺母的重量
电子称称量结果记为
,则当已知
时,
的条件分布为
,
根据条件方差的公式,可以计算出
的无条件方差为:
根据条件,无条件方差
可以根据前20个螺母的称重情况进行估计:
设五次的称重读数为:
,则无条件方差的估计量
其中
是
的算术平均值。
那么:
每个螺母的标准差估计值为:
有了估计值,代入问题1的程序就可以同样计算了。
由于没有
的实际数据,没有给出相应的计算结果。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学建模作业 实验6数理统计实验 数学 建模 作业 实验 数理统计