《统计学》实验指导书.docx
- 文档编号:26639473
- 上传时间:2023-06-21
- 格式:DOCX
- 页数:23
- 大小:32KB
《统计学》实验指导书.docx
《《统计学》实验指导书.docx》由会员分享,可在线阅读,更多相关《《统计学》实验指导书.docx(23页珍藏版)》请在冰豆网上搜索。
《统计学》实验指导书
《统计学》实验指导书
《统计学》实验指导书朱帮助五邑大学管理学院二00七七年年十一月印刷
实验一SPSS软件的根底知识实验工程名称:
SPSS软件的根底知识实验工程性质:
综合设计类所属课程名称:
统计学实验方案学时:
3学时一、实验目的:
了解SPSS软件的根本特点、运行环境、功能、主要窗口、数据的输入和输出、数据文件的与管理等,为进一步实验打好根底。
二、实验内容:
利用SSPSS软件完成以下操作。
(1)输入张三信息:
姓名:
张三;性别:
男;民族:
汉;身高:
175cm;统计学成绩:
优秀;英语成绩:
82分;专业:
国际经济与贸易。
(2)分别建立一个.XLS、.TXT文件,并将其调入SPSS系统,并练习数据工作。
(3)调入数据(数据CH4CH6CH7配对问卷试验差值前),练习产生一个新变量;(4)产生一个服从N(1,4)分布的随机变量;(5)调入数据(数据CH3HCH430、CH3CH4科室文化16),练习变量值排序;(6)调入数据(数据CH4男女性别身高32),练习直接排名和分类/分组排名;(7)调入数据(数据CH3HCH430),练习数据标准化。
三、实验要求:
根本熟悉SPSS软件环境,掌握SPSS软件的根底操作方法,根据实验内容写出相应的实验报告。
附附11..SSPSS根底知识1.SPSSWIN的启动与退出
(1)启动:
鼠标左键双击SPSSWIN的图标,自动进入数据器(DataEditor)窗口。
(2)退出:
鼠标左键单击主菜单窗口的“File”,出现下拉菜单,单击最后一项“Exit”,或单击窗口右上角的“×”。
2.变量类型与定义变量定义变量是输入数据的前提。
定义变量,不仅要按照规那么定义变量名,而且要定义标量的类型,说明变量的实际含义(即写明变量的标签。
虽然不写标签,软件系统照样运行,但是从数据积累的角度看,写明标签是非常重要的),定义名义级数据和顺序级数据的“值”的具体含义(例如,m代表男性,f代表女性。
“1”代表小学文化程度,“2”代表中学文化程度等)等。
(1)启动后,屏幕显示的是数据器(DataEditor)窗口(类似于Exl表格),然后自动弹出一个菜单窗口,包括6个功能工程,供你选择.初学时,可先不理睬它,关闭这个窗口。
(2)该窗口的“VariableView”,窗口切换为“变量输入”窗口。
这个窗口包括如下栏目:
Name栏目:
要求键入变量名。
不能超过8位(可以输入汉字,不能超过4个汉字)。
Type栏目:
要求定义变量类型。
在SPSS中变量分为字符串型(String),日期型(Date),数值型(Numeric)3大类。
字符串型(String):
变量值的长度是任意的。
但在使用时,分为两类:
1、短字符串变量值,最长8位。
2、长字符串变量值,由8位以上的字符串组成,但使用时受到限制。
日期型(Data):
有dd-mm-yy(两位数的“日—月—年”,如06-08-02),mm-dd-yy(两位数的“月—日—年”),dd-mmmm(英文)-yyyy(如:
05-May-xx),dd-mm(英文)-mm(如:
05-June-02),dd/mm/yy(如:
06/10/01),mm/dd/yy(如:
10/28/02)等多种表达方式。
中选择”Date”类型后,系统(指SPSS软件,下同)会自动显示上述日期类型,供选择。
数值型(Numeric)包括:
①标准数值型(Numeric):
默认总长度(Width)为8位,小数(Decil)是两位。
用户可以修改其位数。
②带逗号的数值型变量(Com):
位数同上。
整数局部,从右向左,每三位一个逗号。
③圆点数值型变量(Dot):
位数同上。
整数局部,从右向左,每三位一个圆点,但对小数位的分割,应用逗号表示。
④科学计算表示型(ScienNotation):
指数局部可以用E或D开头,后面跟“次方数”,表示乘以10的假设干次方。
“次方数”的前面,可以有“+”号或“-”号。
在“次方数”的前面,有“+”号或“-”号时,E或D也可以省略。
例如,7,可表达为:
7.D2,7.E+2,7.D+2,7.+2等。
⑤带美元符号的数值型变量(Dollar):
在Com型的根底上,增加一个美元符号“$”。
美元符号计算在总位数内。
⑥自定义变量(CustomCurrency):
选择该工程后,机器自动提示选择方法。
在SPSSWIN中,上述类型是并列地排放的。
Label栏目:
由于变量名的长度有限,变量名常常不能清楚地说明变量的含义,SPSS设计了Label栏目,在Label(标签)中,可进一步说明有关变量的详细含义。
例如,变量Expfod,可在Label中键入汉字“食品支出额,单位:
元”;又如,变量用“土流态度”,可在Label中键入汉字“对土地使用权流转的态度”。
此功能非常有用,可以补充新的时间点上的数据,使用。
Value栏目:
对变量值的进一步说明,主要用于对名义级变量和顺序级变量的“值”的说明。
例如,“f”=“女”,“m”=“男”,“1”=“不及格”,“5”=“优秀”等。
一般说来,在SPSS软件中,在定义顺序级的变量时,采用数字型的数据来代表顺序级数据的不同级别,更方便一些。
由于变量值的标签(Value),已经限定各个数值的含义(级别),所以不会引起混乱。
Missing栏目缺失值选择。
输入数据时可能击错键,资料可能写错数字(出现异常值),当用户注明这些值之后,在运算时,机器会自动把这些值消去,作为缺少这个值处理。
默认状态是没有缺失值(Nomissingvalue)选取Discretemissingvalue,用户可以送入缺失的可能的离散值(只留了3个空格,最多送入3个可能的异常值)。
选取Rangeplusoneoptionaldiscretemiss,可以送入异常值的区间()和一个离散值。
例如,当正常值是1~5时,异常值的区间可以为6~9,在离散值方格中,可以送入0。
Columns栏目:
送入“在屏幕上,变量的显示宽度(不是前面定义的内在宽度蜜月”。
默认的显示宽度是8位。
用户可以改变这个宽度,范围是1~255。
Align(即Aligent)栏目:
显示的对齐方式。
有左对齐(Left)、右对齐(Right)、居中(Center)三种。
M栏目:
选择测度级别。
有三种测度级别可供选择:
①Scale(刻度级):
这是最高等级,又分为两个子级别:
间距级(interval),可以加减运算的;比率级(ratio),可做四那么运算。
②Ordinal(序次级):
我们举例来说明。
比方,受教育程度这个;序次测度等级的变量,采用数字编码表示不同等级,比方:
文盲半文盲=1,小学=2,初中=3,高中=4,大学=5。
这些编码值可以应用于不等式运算。
比方从受教育程度而言,如果高中>初中,初中>小学,便可以肯定有高中>小学的数量关系。
该级别的变量值,可以用数字来表示,也可以用字母来表示。
③Nominal(名义级):
仅仅是一种标志,没有序次关系,如顾客所喜爱的颜色。
该级别的变值,可以用数字来表示,也可以用字母来表示。
在定义变量的过程中,相同的定义内容,可用“”→“粘贴”的方式完成。
3.输入数据在输入数据前,需明了数据窗口(DataView)的结构。
数据窗口的第一行是变量名的行。
每一个变量所在的列,将录入这个变量的所有数据。
数据窗口最左边的第一列,是机器自动产生的序号。
每一个被调查对象的数据,占一行。
送入数据时,只要在数据器的DataView窗口中,把光标指到需要的位置,送入数据即可。
如果有多个变量(在实际问题中,变量的个数可多达数百甚至上千个),最简便的方式是一行一行地输入数据。
一行,称为一个case,从统计学角度看,是一个个体;从调查所得角度看,是一张调查表上的数据。
作为实用技巧,在一张调查表的数据输入完成后,应当把屏幕上该行最左边格子中的顺序号(机器自动产生的),标注在表格上方,以便今后核对数据。
当然,也可以在录入数据前,对表格编号,并且把表号作为一个变量,录入到数据窗口中。
这种作法,虽然多了一个变量,但是更可靠。
即便是在操作过程中,删除某些行,也不会把屏幕上SPSS数据窗口中自动产生行号和调查表的编号搞错。
4.保存数据在数据器(DataEditor)状态下,屏幕左上角的保存图标即可。
或者,主菜单file,此时系统出现一个下拉菜单(形式与word软件一致),然后选save(或saveas),再选择所要保存的位置,保存即可。
此时,保存的文件名的后缀是“.sav”。
在保存“确定”前,要输入文件名。
文件名要有较强的提示作用,便于今后调用。
①变量定义的实用要求:
一定要重视变量标签(Label)的填写。
这是在处理数据时,减少翻阅调查表,直接依据SPSS的数据文件,处理数据的关键;也要注意变量值标签(Value)的填写,否那么,以后看不懂相关数据的含义;由于Value标签的限定作用,可以把顺序级的变量,定义为数字型的。
这样,有时更方便一些;在调查表的栏目很多(也就是变量个数很多)时,可考虑在变量名中安排编号,以便录入数据时易于正确地把数据送入到相应的变量列。
②送入数据的实用要求:
对回收的有效调查表编号,把调查表的号码,作为第一个变量,定义在SPSS的数据文件中,不仅有利于减少漏送、重送调查表的可能,而且,有利于今后的数据校对。
5.读入SPSS格式的数据
(1)可从启动SPSSWIN时,会弹出一个有6个选项的小菜单。
这个菜单中显示的SPSS的数据文件,是机器不久前使用过的文件。
在菜单中,选择第五个选项Openanexitingdatasour,在该选项下面的框中,翻开一个所需要的数据文件(如“*.sav”文件)。
如果在这个框中,没有所需要的文件,就关闭这个窗口,按照下一个方法,读入SPSS格式的数据文件。
(2)在数据器(DataEditor)状态下的DataView窗口中,屏幕左上角的“翻开文件”的图标,或者从主菜单开始,File→Open→Data。
完成上述选择后,机器弹出一个OpenFile窗口,通过调节“查找范围”,选择所要读入的“*.sav”的数据。
6.读入其他格式的数据
(1)读入EXCEL格式的数据在dataview中,左上角的“翻开文件”图标,或从主菜单,file、open、data,选择需要读入的“*.xls”的数据。
(2)读入TXT格式的数据在dataview中,左上角的“翻开文件”图标,或从主菜单,file、open、data,选择需要读入的“*.”的数据。
(3)读已有数据库中的数据要读取Dbase,Foxbase,Foxpro,Oracle等数据库中的数据,可从启动SPSS时选Runanexitingquery:
从一个现存的数据库中读取数据文件;也可以从主菜单开始,file→opendatabase→editquery,从弹出的菜单中选择所要读入的数据库中数据文件。
7.数据
(1)修改数据①找到所要修改的数据(所在的格子:
ll),激活(双击)这个ll,修改就行。
②插入或删除一行数据(一个):
插入行:
所要插入的行号,工具栏的“插入行Insertcase”的图标(望远镜图标的后面),就在此行增加一空行,等着填入数据。
(同时,把此行后面的数据,都后移一行)。
删除行:
找到所要删除的行,选中,按Delete键。
③插入或删除一列数据(一个变量):
插入列:
找到所要插入的列,工具栏的“插入列”的图标(望远镜图标的后面第二个),就在此列增加一空列,等着填入变量名与数据(同时,把此行后面的数据,都后移一列)。
删除列:
找到所要删除的列,选中,按Delete键。
该列的数据与变量名一起删除。
④数据的剪切、、粘贴:
*找到所要操作的数据,(如果是一群数据,要拖黑选中)。
*假设要删除,按Delete键,或者:
Edit→Cut。
*假设要:
Edit→Copy;*找到要粘贴的位置(要与粘贴板上的数据格子的长宽相同),(如果是一群数据,要拖黑),然后:
Edit→Paste.以上粘贴操作,可以在两张表之间进行。
要反复用File→Open来切换两张表。
7.产生一个新变量目的:
根据统计分析的目的,产生新的统计变量。
读入数据后,在数据器窗口中:
(1)Transform→Compute系统弹出一个窗口。
在这个窗口的目标变量(TargetVariable)中送入你想要得到的目标变量的名称。
(2)Type&Label按钮,系统又弹出一个小窗口。
要求送入新变量的标签和类型。
Continue,返回上一个窗口。
(3)通过箭头,把函数符号、原来的变量、四那么运算等符号、系数等组合起来。
(4)如果选用If按钮,可以限定哪些变量的哪些范围的值,能够投入运算。
(5)OK,数据窗口中增加一列新变量的值。
8.产生随机变量选择transform、pute,在出现的对话框中的targetvariable中输入目标变量的名称,在functions中选择随机变量的概率密度函数,加到numericexpression中,并设置好参数,单击ok。
9.选择观测值
(1)目的:
选择局部样本数据;
(2)条件式选取:
data、selectcases,在出现的对话框中,选中ifconditionissatisfied选项,单击if,在出现的对话框中,设定相应条件,单击continue、ok。
(3)随机式选取:
data、selectcases,在出现的对话框中,选中randomsampleofcases,单击samples按钮,在出现的对话框中,设置样本容量,单击continue、ok。
10.合并数据文件:
追加case
(1)目的:
两个文件的变量名都相同,把两个文件的记录合并起来;假设不同,那么需要改变变量名来实现合并。
(2)Data、mergefile、addcases,在出现的对话框中,选出要输出数据的文件,单击ok。
11.合并数据文件:
追加变量
(1)目的:
在原来的数件中,增加其他文件的变量及其数据。
**注意:
两个文件的case数必须对应。
(2)Data、mergefile、addvariables,在出现的对话框中,选出要输出数据的文件,单击ok。
12.分割文件
(1)目的:
将数据依类别变量分组,以便于在执行各种数据分析时能做个群组比拟。
(2)比拟组别:
为了进行比拟,将输出结果汇总与同一个表格。
依组别输出:
输出结果依群组分别成不同表格。
(3)Data、splitfile,在出现的对话框中,选中相应按钮,然后在groupbasedon中设定分组标志,单击ok。
13.给变量值排序在读入数据后,从主菜单的Data开始,依次:
Data\Sortcases。
机器弹出一个窗口,要求用户从左边框中的变量清单中,选取所要排序的变量,用窗口中间的箭头,把选中的变量送入右边的框中。
然后,在窗口的下部,选Asnding(升序)或Desnding(降序),OK。
机器就在SPSS的数据窗口中,按照所选中的变量,从上到下,重新排序。
14.给变量值排直接排名次读入数据后,从主菜单的Transform开始,依次Transform→RankCases机器弹出一个窗口,要求用户从左边框中的变量清单中,选取所要排序的变量。
然后,用窗口中间的位置较高的箭头,把选中的变量送入右边的框中。
再OK。
机器弹出一个窗口,说明机器自动赋予的、表示排序结果的变量名(其实就是在原变量名前加一个r,作为排序结果的变量名),以及机器自动给出的该变量名的标签(Label)。
当把屏幕切换到数据窗口后,就会显出所选中变量的排名情况。
注意:
(1)如果有两个第一名,就假设其中一个第1,另一个第2,然后把这两个名次加起来,再除以同名次的个体个数,于是这两个个体都排1.5名。
(2)如果有两个第1.5名后,接下去的只能排第3名,而不能排第2名。
以后的名次,都类似处理。
上例中,有3个第9名,也就是说,在第7名之后,第8、9、10名是并列的。
15.分类(分组)排名次
(1)Transform→RankCases。
机器弹出一个窗口。
(2)从左边框中的变量清单中,选取所要排序的变量。
用窗口中间的位置较高的箭头,把选中的变量送入右边上面的(Variables)框中。
(3)从左边框中的变量清单中,选取所要分类的变量(注意,如果把“性别”变量定义为字符串型的,它就不会出现在左框中)。
用窗口中间的位置较低的箭头,把选中的变量送入右边下面的(By)框中。
(4)OK。
机器弹出一个窗口,说明机器自动赋予的、表示排序结果的变量名(其实就是在原变量名前加一个r,作为排序结果的变量名),以及机器自动给出的该变量名的
标签(Label)(5)把屏幕切换到数据窗口,就会显出所选中变量的排名情况。
16.数据标准化SPSS软件能够统计计算的几乎所有的量,如均值、标准差、均值的标准误差、最大值、最小值、分布的峰度、分布的偏度等,都是频次分析模块所具有的。
只有一个例外,能够计算标准化数据。
所谓“标准化数据”就是把样本数据的所有离差值除以样本标准,其公式是sxxzii?
?
在读入数据后,Analyze→Decriptivestatitics→Decriptives。
此时,系统弹出一个窗口,在该窗口的下端,问是否要把标准化的值作为变量值保存起来(Savestandardizedvalueasvariable)。
如果选择了这一要求,系统将对你选择变量(用箭头把所选择的一个或多个变量送入右框中),做标准化处理,并作为新的变量存入“数据器”中。
标准化数据的变量名,由机器自动赋予:
在原变量名前面加字母z)。
右下角的Option键,弹出一个Option子窗口。
OK,数据窗口会出现所选择变量的标准化值。
实验二2D统计图的制作实验工程名称:
2D统计图的制作实验工程性质:
综合设计类所属课程名称:
统计学实验方案学时:
3学时一、实验目的:
掌握散布图、饼图、条形图、直方图、频率分布图、累积分布图等2D图的SPSS软件实现方法。
二、实验内容:
利用SSPSS软件完成以下操作。
(1)下面的数频是某文具店出售文件夹的40个交易的收入(元)记录,试:
①统计数据的频次,频率,累积频次与累计频率;②计算众数,众位数,样本均值等;③计算极值,四分点,百分点,极差,四分位距,离差,离差平方和,方差;④绘制饼图,条形图,直方图。
3.623.623.803.704.152.073.775.777.864.634.033.563.106.045.623.162.933.824.303.864.812.865.025.244.025.444.653.4.002.994.573.594.576.162.885.035.463.876.814.91
(2)某牙科诊所费用开支比例如下表所示,试:
①用SPSS绘制一张饼图;②用SPSS绘制一张条形图。
开支类型金额%开支类型金额%医生个人收支53.60医疗失当保障金3.5非医生人员个人收入15.70雇用医生2.3办公费用11.90医疗设备1.5医疗供给5.00其他6.5(3)某医院眼科门诊看病者的年龄如下,试:
①制作这些年龄的一张不分组的频数分布表;②制作这些数据的一张局部组的频率分布表;③制作这些的局部组频率条形图;④制作同一组数据的频率分布表;⑤用SPSS制作这些数据的累积频率条形。
组121192121191920191919组218211918222124202417组321192219182023191920组419202122212022202120(4)某高校海外学生的第一学期的汉语成绩如下,如:
①用SPSSS制作频数分布表;②用SPSS制作成绩的直方图。
676971707274767575747374747877817373746871747870697372747780757472836873757876747368717275797475747468797576757774747575797775757473737271687071727373727271717082777673706869717778687273787779727272757574747476767473747372727471727372727474687172727574767774747373787876747572727275747677
三、实验要求:
进一步熟悉SPSS软件环境,掌握散布图、饼图、条形图、直方图、频率分布图、累积分布图等2D图的SPSS软件实现方法,并根据实验内容写出相应的实验报告。
附附1.2D统计图的SPSS制作1.饼图的制作①选择“Graphs”(统计图)“PIE”命令。
②在出现的“piecharts”对话框中选中“Sumriesforgroupsofcases”(群组类别的总合)单项选择按钮,再单击“Define”按钮(Sumriesofseparatevariables单项选择按钮代表许多个别变量的总合,Valuesofindividualcases单项选择按钮代表单一观察值的数值总合)。
③在出现的“Definepie:
SumriesforGroupsofCases”对话框中选中“Nofcases”(个别的数值)单项选择按钮,在其中的列表框中选择用户需要的选项,在单击右后面的三角形按钮将之放入“DefineSlisby”(定义图块根据)文本中,再单击“OK”按钮,即得饼图。
2.饼图
(1)参加标题①双击输出的图形,就可以图形了。
②选择“Chart”(图表)|“Title…”(标题)命令,参加标题。
③在出现的“Titles”对话框输入标题名称(都选的择Cent
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 实验 指导书