书签分享收藏举报版权申诉 / 10

立即下载加入VIP,免费下载

当前位置：首页 > 经管营销 > 企业管理 > R语言实验4.docx

R语言实验4.docx

文档编号：298528
上传时间：2022-10-08
格式：DOCX
页数：10
大小：178.41KB

R语言实验4.docx

《R语言实验4.docx》由会员分享，可在线阅读，更多相关《R语言实验4.docx（10页珍藏版）》请在冰豆网上搜索。

R语言实验4.docx

R语言实验4

实验4R绘图

（一）

一、实验目的：

1.掌握描述性统计分析中常用的统计量；

2.掌握R语言绘制直方图、密度估计曲线、经验分布图和QQ图的方法；

3.掌握R语言绘制茎叶图、箱线图的方法；

4.掌握W检验方法和K-S检验方法完成数据的正态分布检验。

二、实验内容：

练习：

要求：

①完成练习并粘贴运行截图到文档相应位置（截图方法见下），并将所有自己输入文字的字体颜色设为红色（包括后面的思考及小结），②回答思考题，③简要书写实验小结。

④修改本文档名为“本人完整学号姓名1”，其中1表示第1次实验，以后更改为2,3,...。

如文件名为“1305543109张立1”，表示学号为1305543109的张立同学的第1次实验，注意文件名中没有空格及任何其它字符。

最后连同数据文件、源程序文件等（如果有的话，本次实验没有），一起压缩打包发给课代表，压缩包的文件名同上。

截图方法：

法1：

调整需要截图的窗口至合适的大小，并使该窗口为当前激活窗口（即该窗口在屏幕最前方），按住键盘Alt键（空格键两侧各有一个）不放，再按键盘右上角的截图键（通常印有“印屏幕”或“PrScrn”等字符），即完成截图。

再粘贴到word文档的相应位置即可。

法2：

利用QQ输入法的截屏工具。

点击QQ输入法工具条最右边的“扳手”图标

，选择其中的“截屏”工具。

）

1.自行完成教材P107页开始的3.1-3.2节中的例题。

2.以前在做实验1的练习时，我们画过直方图。

当时的题目是这样的：

利用hist（）函数画直方图。

>X<-c（35,40,40,42,37,45,43,37,44,42,41,39）

>hist（X）

这次实验先重新运行以上命令后，接着运行以下命令：

>windows（）#R作图会覆盖前一幅图，此命令是新开一个画图窗口

>hist（X,freq=F）

把两个图分别截下复制到下面，进行比较，你发现有什么不同？

答：

纵坐标不同，一个是频数（Frequency），一个是密度（Density）

如果想把这两幅图画在同一个画图窗口中，可以输入以下命令：

>par（mfrow=c（1,2））#在一个窗口里放多张图，这里是1行2列共2个图

>hist（X）

>hist（X,freq=F）

运行结果截图：

3.（习题3.1）某单位对100名女生测定血清总蛋白含量（g/L），数据如下：

74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.073.573.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4

计算均值、方差、标准差、极差、标准误、变异系数、偏度、峰度。

要求：

先将上述数据单独存为一个文本文件，名字为STP.txt。

然后利用scan（）函数读取并计算。

源代码及运行结果（不需要截图，直接把运算结果复制过来）：

data_outline<-function（x）{

n<-length（x）

m<-mean（x）

v<-var（x）

s<-sd（x）

me<-median（x）

cv<-100*s/m

css<-sum（（x-m）^2）

uss<-sum（x^2）

R<-max（x）-min（x）

R1<-quantile（x,3/4）-quantile（x,1/4）

sm<-s/sqrt（n）

g1<-n/（（n-1）*（n-2））*sum（（x-m）^3）/s^3

g2<-（（n*（n+1））/（（n-1）*（n-2）*（n-3））*sum（（x-m）^4）/s^4-（3*（n-1）^2）/（（n-2）*（n-3）））

data.frame（N=n,Mean=m,Var=v,std_dev=s,Median=me,std_mean=sm,CV=cv,CSS=css,USS=uss,R=R,R1=R1,Skewness=g1,Kurtosis=g2,row.names=1）

}

进入R，

>source（"data_outline.R"）

>w<-scan（"STP.txt"）

>w

>data_outline（w）

运行结果：

NMeanVarstd_devMedianstd_meanCVCSSUSSR

110073.66815.515133.93892573.50.39389255.346861535.998544233.420

R1SkewnessKurtosis

14.60.05405930.03702249

4.（习题3.2）绘出习题3.1的直方图、密度估计曲线、经验分布图和QQ图，并将密度估计曲线与正态密度曲线相比较，将经验分布曲线与正态分布曲线相比较（其中正态曲线的均值和标准差取习题3.1计算出的值）。

注意：

以上4个图形的颜色自行定义，只要能区分开来就行。

源代码：

>hist（w,freq=FALSE）

>lines（density（w）,col="green"）

>x<-64:

85

>lines（x,dnorm（x,mean（w）,sd（w））,col="red"）

>plot（ecdf（w）,verticals=TRUE,do.p=FALSE）

>lines（x,pnorm（x,mean（w）,sd（w））,col="blue"）

>qqnorm（w,col="blue"）

>qqline（w,col="red"）

运行截图：

5.（习题3.3）绘出习题3.1的茎叶图、箱线图，并计算五数总括。

注意：

以上图形的颜色自行定义。

源代码：

>stem（w）

>boxplot（w,col="lightgreen",name=c（'w'）,notch=T）

>fivenum（w）

运行截图：

6.（习题3.4）分别用W检验方法和Kolmogorov-Smirnov检验方法检验习题3.1的数据是否服从正态分布。

源代码：

>shapiro.test（w）

>ks.test（w,"pnorm",mean（w）,sd（w））

运行截图：

结论：

正态性W检验得出P值为0.6708>0.05,因此，认为样本来自正态分布的总体。

经验分布的检验：

P>0.05，可认为来自正态分布总体。

有警告信息是因为数据有重复数值，ks检验要求待检数据时连续的，不被重复的。

思考：

1.统计分析包括哪两个方面的分析？

统计描述和统计推断

2.描述集中趋势的统计量有哪些？

均值，众数，百分位数，中位数等

3.描述分散程度的统计量有哪些？

方差，标准差，极差，四分位极差，变异系数和标准误差等

4.描述分布形状的统计量有哪些？

偏度系数和峰度系数

5.标准差刻画的是样本值与样本均值的偏离程度，标准误刻画的是样本均值与_____的偏离程度。

样本

6.lapply（）函数和sapply（）函数有什么异同点？

异：

lapply（）函数输出列表；sapply（）函数输出向量

同：

作用于向量或列表的数据集合上（数据框）

7.R中每一个分布都对应有四个函数，以正态分布norm为例，请写出它对应的4个函数，并简要说明每个函数的作用。

dnorm（）的返回值是正态分布的概率密度函数

pnorm（）的返回值是正态分布的分布函数

qnorm（）的返回值是给定概率p后的下分位点

rnorm（）的返回值是n个正态分布随机数构成的向量

8.QQ图有什么作用？

QQ图可以帮助我们鉴别样本的分布是否近似于某种类型分布

9.箱线图中，箱的底部，中部和顶部分别表示什么？

在箱线图中，上（Q3）下（Q1）四分位点分别确定出中间箱体的顶部和底部，箱体中间的粗线是中位数（me）所在位置

10.在R中，如果想在一个输出窗口里放2行3列共6张图，需要运行什么命令？

>par（mfrow=c（2,3））

三、实验小结（必写，但字数不限）

这次实验主要是数据分布，统计描述通过绘制图（直方图、茎叶图、箱线图等）对数据进行分析，还需要进行正态w和分布ks进行检验是否服从正态分布，进行五数的总括，最能反应数据重要特征。

掌握统计描述是非常重要的，因为是数据分析的基础。

学会进行密度估计曲线与正态密度曲线相比较，经验分布曲线与正态分布曲线相比较。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 语言实验

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：R语言实验4.docx
链接地址：https://www.bdocx.com/doc/298528.html

R语言实验4.docx

热门标签