数据结构试题.docx
- 文档编号:29299282
- 上传时间:2023-07-22
- 格式:DOCX
- 页数:8
- 大小:18.70KB
数据结构试题.docx
《数据结构试题.docx》由会员分享,可在线阅读,更多相关《数据结构试题.docx(8页珍藏版)》请在冰豆网上搜索。
数据结构试题
R语言实验指导书
(二)
2016年10月27日
实验三创建和使用R语言数据集
实验目的:
1.了解R语言中的数据结构。
2.熟练掌握他们的创建方法,和函数中一些参数的使用。
3.对创建的数据结构进行,排序、查找、删除等简单的操作。
实验内容:
1.向量的创建及因子的创建和查看
有一份来自澳大利亚所有州和行政区的20个税务会计师的信息样本1
以及他们各自所在地的州名。
州名为:
tas,sa,qld,nsw,nsw,nt,wa,
wa,qld,vic,nsw,vic,qld,qld,sa,tas,sa,nt,wa,vic。
1)将这些州名以字符串的形式保存在state当中。
2)创建一个为这个向量创建一个因子statef。
3)使用levels函数查看因子的水平。
2.矩阵与数组。
i.创建一个4*5的数组如图,创建一个索引矩阵如图,用这个索引矩阵访问数组,观察
L.1J
L2]
[.3]
L-4]
[.5]
[1J
1
5
9
13
17
⑵]
2
6
10
14
18
[3J
3
7
11
15
19
L4J
4
12
16
20
【•1]【⑵
1
3
[3J
2
2
13J
3
1
3.将之前的state
,数组,矩阵合在一起创建一个长度为3的列表
4.创建一个数据框如图。
实验目的:
mpgcyl
disp
hpdrat
MazdaRX4
21.0
6
160.0
110
3.90
MazdaRX4Wag
21.0
6
160.0
110
3.90
Datsun710
22.8
、
108.0
93
3.85
Hornet4Drnve
21.4
6
25S.O
110
3,08
5.将这个数据框按照mpg列进行排序。
6.访问数据框中drat列值为3.90的数据。
实验要求
要求学生熟练掌握向量、矩阵、数据框、列表、因子的创建和使用
实验四数据的导入导出
实验目的
1.熟练掌握从一些包中读取数据。
2.熟练掌握csv文件的导入。
3.创建一个数据框,并导出为csv格式实验内容
1.创建一个csv文件(内容自定),并用readtable函数导入该文件。
2.查看R语言自带的数据集airquality(纽约1973年5-9月每日空气质量)。
3.列出airquality的前十列,并将这前十列保存到air中
4.查看airquality中列的对象类型
5.查看airquality数据集中各成分的名称
6.将air这个数据框导出为csv格式文件。
(write.table(x,file="",sep
="",row.names=TRUE,col.names=TRUE,quote=TRUE))
实验要求
要求学生掌握从包中读取数据,导入csv文件的数据,并学会将文件导出
实验五R语言数据的清洗
实验目的
1.查看数据集的缺失值,并学会对缺失值进行处理。
2.对异常变量重新赋值。
3.将某一列的字符型转化为日期型。
4.利用subset()获取子集。
实验内容
1.有一个数据框代码如下,使用summary函数查看,那一列含有缺失值,有几个。
并查看wind列的最大值。
Ozone<-c(41,36,12,18,NA,28)Solar.R<-c(190,118,149,313,NA,
NA)wind<-c(7.4,8.0,12.6,11.5,14.3,14.9)Temp<-c(67,82,74,62,86,66)
date<-c("1997/05/01","1997/05/02","1997/05/03","1997/05/04","1997/05/05","1997/05/06")
air<-data.frame(date,Ozone,Solar.R,wind,Temp,stringsAsFactors=FALSE)
2.使用class()函数查看date函数的类型,并将其转化为data型,格式为月/日/年。
3.使用subset()根据Temp列获取air中Temp大于60小于70的数据。
4.将air中含有缺失值的列去掉。
5.找出Temp中大于85的值将其设置为缺失值。
6.创建一个air1包含两个列q1,q2。
用cbind函数添加到air中。
7.使用names函数查看air的列名,并根据列自己创建一个数据框。
使用rbind函数添加到air中
实验要求要求学生会用subset获取子集,学会对缺失值进行一些简单的处理和对一些异常值的查找和修改。
实验六高级数据管理
实验目的
1.学会简单的数值和字符处理函数。
2.学会自己编写一个函数。
实验内容
1.使用下面代码创建roster数据集。
Student<-c("JohnDavis","AngelaWilliams",
"BullwinkleMoose","DavidJones",
"JaniceMarkhammer","CherylCushing","ReuvenYtzrhak","GregKnox","JoelEngland","MaryRayburn")
Math<-c(502,600,412,358,495,512,410,625,573,522)
Scienee<-c(95,99,80,82,75,85,80,95,89,86)
English<-c(25,22,18,15,20,28,15,30,27,18)roster<-data.frame(Student,Math,Science,English,stringsAsFactors=FALSE)
2.使用length函数查看Student的长度。
3.计算该班级数学的平均成绩,最高成绩。
4.将成绩单按照姓和名进行排序,将学生的各科考试成绩组合为单一的成绩衡量指标、基于相对名次(前20%,下20%等等)给出从A到F的评分。
1)使用quantile函数按20%40%60%80%求分位数。
2)使用变量重命名的方法将grade列分为A、BCDF几个等级。
3)使用strsplit函数将Student列的名字分割,存到name中。
4)创建一个函数x1,功能为实现返回值为传入参数的第一个值。
5)使用sapply函数将name中的firstname提取出来。
(“sapply
(data,function)”)同理即可提取出lastname。
6)将lastname和firstname与roster合并,同时去掉roster的第一列。
7)将成绩单用姓和名进行排序。
实验要求
要求学生学会一些简单的数值和字符处理函数。
学会如何自己创建一个函数。
和对
一些简单问题的处理。
用MAS包中的t.test独立样本的t检验,So因子为是否为南方
实验七基本统计分析实验
实验目的
学会使用summary函数和Hmisc包中的describe函数来计算统计量。
使用table函数生成一维、二维、多维列联表。
学会用R实现卡方独立性检验。
学会用R进行相关性的度量。
学会用R进行Pearson、Spearman和Kendall相关。
学会用R进行相关性的显著性检验。
学会用R进行组间差异的非参数检验。
实验内容
描述性统计分析
1)对R自带的数据集rock(48块石头的形态数据)使用summary函数、Himisc包中的describe函数、pastecs包中的stats.desc函数计算描述性统计量。
1.
2.
3.
4.
5.
6.
7.
1.
2.
3.
4.
欢迎下载
2)
使用aggregate、doby中的
summaryBy对sleep数据集的
group列
分组获取描述性统计量。
频数表和列联表
1)加载vcd包中的Arthritis数据集使用table
2)列联表。
并使用addmargins为这些表格添加边际和(根据
生成简单的频数统计
使用table、xtabs对Arthritis生成二维
Treatment、Improved)。
3)使用xtabs,table生成三维列联表(根据Treatment、sex>Improved三个因子)。
4)使用chisq.testhan()函数对二维表的行和列进
行卡方独立性检验,
并观察他们是否独立。
5)使用vcd包中的assocstats()函数计算二维列联表的phi系数、列联系数和Cramer'sV系数。
相关
1)Pearson、Spearman和Kendall相关
a)对state.x77数据集计算方差和协方差、Pearson积差相关系数、Spearman等级相关系数。
b)使用psych包中的corr.test对state.x77数据集IIIiteracy
、
Murder因子计算相关显著性检验
T检验
1)比较了南方(group1)和非南方(group0)各州的监禁概率(使
实验要求
t检
如何用
用MAS包中的t.test独立样本的t检验,So因子为是否为南方
Prob因子表示监禁率)。
5.组间差异的非参数检验。
1)使用Mann-WhitneyU检验回答4中关于监禁率的问题,。
通过本次实验让学生学会基本统计分析用到的频数表、列联表、相关、验、组间差异的分参数检验。
让学生可以掌握一些基本的统计分析的概念和R来进行统计分析。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据结构 试题