书签分享收藏举报版权申诉 / 18

立即下载加入VIP,免费下载

当前位置：首页 > 人文社科 > 法律资料 > 非参数统计(R软件)参考答案.doc

非参数统计(R软件)参考答案.doc

文档编号：95428
上传时间：2022-10-02
格式：DOC
页数：18
大小：500.50KB

非参数统计(R软件)参考答案.doc

《非参数统计(R软件)参考答案.doc》由会员分享，可在线阅读，更多相关《非参数统计(R软件)参考答案.doc（18页珍藏版）》请在冰豆网上搜索。

非参数统计(R软件)参考答案.doc

内容：

,

上机实践：

将MASS数据包用命令library（MASS）加载到R中，调用自带“老忠实”喷泉数据集geyer，它有两个变量：

等待时间waiting和喷涌时间duration，其中…

（1）将等待时间70min以下的数据挑选出来;

（2）将等待时间70min以下,且等待时间不等于57min的数据挑选出来;

（3）将等待时间70min以下喷泉的喷涌时间挑选出来;

（4）将喷涌时间大于70min喷泉的等待时间挑选出来。

解:

读取数据的R命令：

library（MASS）;#加载MASS包

data（geyser）;#加载数据集geyser

attach（geyser）;#将数据集geyser的变量置为内存变量

（1）依题意编定R程序如下：

sub1geyser=geyser[which（waiting<70）,1];

#提取满足条件（waiting<70）的数据,which（），读取下标

sub1geyser[1:

5];#显示子数据集sub1geyser的前5行

[1]5760565054

（2）依题意编定R程序如下：

Sub2geyser=geyser[which（（waiting<70）&（waiting!

=57））,1];

#提取满足条件（waiting<70&（waiting!

=57）的数据.

Sub2geyser[1:

5];#显示子数据集sub1geyser的前5行

[1]6056505460……

原数据集的第1列为waiting喷涌时间，所以用[which（waiting<70）,2]

（3）

Sub3geyser=geyser[which（waiting<70）,2];

#提取满足条件（waiting<70）的数据,which（），读取下标

Sub3geyser[1:

5];#显示子数据集sub1geyser的前5行

[1]……

原数据集的第2列为喷涌时间，所以用[which（waiting<70）,2]

（4）

Sub4geyser=geyser[which（waiting>70）,1];

#提取满足条件（waiting<70）的数据,which（），读取下标

Sub4geyser[1:

5];#显示子数据集sub1geyser的前5行

[1]8071807577…….

如光盘文件中的数据，一个班有30名学生，每名学生有5门课程的成绩，编写函数实现下述要求：

（1）以的格式保存上述数据；

（2）计算每个学生各科平均分，并将该数据加入

（1）数据集的最后一列；

（3）找出各科平均分的最高分所对应的学生和他所修课程的成绩；

（4）找出至少两门课程不及格的学生，输出他们的全部成绩和平均成绩；

（5）比较具有（4）特点学生的各科平均分与其余学生平均分之间是否存在差异。

先将数据集读入R系统

student=（"…",header=T）

class（student）:

#显示数据集student的类型，

[1]""#student是数据框

names（student）;#显示数据框student的变量

[1]"name""math""physics""chem""literat""english""mean"

#输出显示，数据框student有7个变量,第7个变量是平均值mean。

（1）

（student,"F:

\\gzmu非参数统计\\data2014\\各章数据\\附录A\\",=T）

打开

"name""math""physics""chem""literat""english"

"1""Katty"6561728479

"2""Leo"7777766455

……

（2）依题意，要为原始数据集添加一个变量，即添加一列在最后。

[,6]=

me=rep（0,30）;

for（iin1:

30）{x=（student[i,2:

6]）;

me[i]=mean（x）;}

student$mean=me;

#上面程序的最后一行也可以如此:

student[,7]=me

names（student）;

[1]"name""math""physics""chem""literat""english""mean"

#如上显示，程序运行后数据框student添加了第7列mean.

（3）依题意，在

（2）的程序运行后做，要用到which（mean==max（mean）），如同。

attach（student）;

maxme=student[which（mean==max（mean））,];#找出最高平均分的记录，并赋予maxme;

maxme;

namemathphysicschemliteratenglishmean

15Liggle7896818076

（4）依题意，要用到二重的for和if.由原数据框geyser给data1赋值时要用到数据转换：

#x=（student[i,2:

6]）;#读取student第i行2:

6列的数据，#data1[k,]=x;#将x赋给data4

#的第k行。

sum（x<60）是不及格门数。

Data1=student[1,];#赋初值

k=0;

for（iin1:

30）{x=（student[i,2:

6]）;

if（sum（x<60）>1）{k=k+1;data1[k,]=student[i,];}}

data1

namemathphysicschemliteratenglishmean

1Ricky6763496557

7Simon6671675257

9Jed83100794150

10Jack8694975155

12Jetty6784535856

13Corner8162695652

14Osten7164945252

25Amon7479955959

（5）依题意，要创造两个子集data4和data2,用两样本的比较方法比较他们的平均成绩是否有显着差异。

类似创造data1的方法，创造data2。

并设x=data1$mean,y=data2$mean,比较二样本x,y是否有显着差异，由于还没有学非参数检验，试用t检验检验之（R的t检验函数为（x,y），原假设H0是两样本的均值相等，备择假设H1是两样本不等）。

如果P值p-value<,则拒绝原假设。

data2=student[1,];k=0;

for（iin1:

30）{x=（student[i,2:

6]）;

if（sum（x<60）<2）{k=k+1;data2[k,]=student[i,];}

};

下面做t检验

x=data1$mean;y=data2$mean;

（x,y）

WelchTwoSamplet-test

data:

xandy

t=,df=,p-value=

alternativehypothesis:

truedifferenceinmeansisnotequalto0

95percentconfidenceinterval:

sampleestimates:

meanofxmeanofy：

结论：

p-value=<,拒绝原假设，即认为两样本的平均成绩有显着差异。

在一张图上，用取值（-10，10）之间间隔均等的1000个点，采用不同的线型一颜色给制sin（）,cos（）,sin（）+cos（）的函数图形，图形要求有主标题和副标题，标示出从坐标

x=seq（-10,10,length=50）;#构造向量x,

x[1:

5];#显示x的前5个数据

[1]

sin=sin（x）;#计算sin函数值

cos=cos（x）;

sc=sin（x）+cos（x）;

plot（sin~x,xlab="x",ylab="y",ylim=c,,type="l",col=1）;

lines（cos~x,type="b",col=2）;#点线图

lines（sc~x,type="o",col=1）;

title（"三角函数图"）;

所得图形如下图，sin为黑色，cos为红色，sin+cos为绿色：

内容：

;;;（附加题：

;;有能力的可做附加题）

某批发市场从厂家购置一批灯泡，根据合同的规定，灯泡的使用的寿命平均不低于1000h。

已知灯泡的使用寿命服从正态分布，标准差是20h，从总体中随机抽取了100只灯泡，得知样本均值为996h，问题是：

批发商是否应该购买该批灯泡

（1）零假设和备择假设应该如何设置给出你的理由。

（2）在零假设之下，给出检验的过程并做出决策，如果不能拒绝零假设，可能是哪里出了问题。

解：

（1）根据题意，问题的假设为

理由：

是批发商的意愿，违背这个意愿，也就是拒绝原假设H0，他就购这批灯泡了。

不能轻易否定的事情应置于被保护地位H0。

这个问题的检验统计量为

z=（996-1000）/2=-2

P值pvalue=pnorm（z,0,1）=,在alpha=时拒绝原假设，根据合同，不购这批灯泡。

（2）假设检验问题：

。

这样的假设是有问题的。

假设检验是一种这样哲学：

不轻易否定旧过程，置旧过程为H0于被保护的位置，而以小概率否定之。

而一但被拒绝，以小概率事件原理，拒绝域不是小概率。

反证H0不真。

所谓“天欲报之，必先厚之”也，以显我为人之厚道，虽如此也不能保护H0,怪不得我也。

面此假设违返旧过程，这样的假设毫无意义。

如果按照这个检验问题，检验的P值是pvalue=1-pnorm（z,0,1）=,没有充分的理由拒绝原假设，结论也是不购进这批灯泡。

但是犯批II类错误的概率是多少，鬼才知道呢。

考虑下面检验问题（不用计算已给的数据）.

（1）如果X服从N（0,1）分布，假设检验问题。

可以知道的似然比检验，如果X>,则将会拒绝H0：

，而且按照Neyman-Pearson引理，该检验是最优的。

现在，如果我们观察到X=，该水平的最优检验告诉我们拒绝=0的零假设，接受=1000的备择假设，你觉得有问题吗问题在哪里如何解决

答：

有问题。

假设检验在原假设条件成立下，得到拒绝域，意思是拒绝，接受。

而只是其中的一种情况，故不能接受。

改进方法：

可直接提出假设“均值为1000”进行检验。

即检验

（2）有两组学生的成绩，第一组为11名，成绩为x:

100,99,99,100,100,100,100,99,100,99,99;第二组为2名，成绩为y:

50,0.我们对这两组数据作同样水平=的t检验（假设总体的均值为），。

对第二组数据的检验结果为：

df=10,t=,mean（x）=,单边检验（<100,less）的P值为p-value=。

所以拒绝原假设，认为<100。

对第二组数据检验的结果为：

df=

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 参数统计软件参考答案

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：非参数统计(R软件)参考答案.doc
链接地址：https://www.bdocx.com/doc/95428.html

非参数统计(R软件)参考答案.doc

热门标签