SPSS常用函数.docx
- 文档编号:27265668
- 上传时间:2023-06-28
- 格式:DOCX
- 页数:13
- 大小:20.23KB
SPSS常用函数.docx
《SPSS常用函数.docx》由会员分享,可在线阅读,更多相关《SPSS常用函数.docx(13页珍藏版)》请在冰豆网上搜索。
SPSS常用函数
SPSS常用函数
SPSS函数是一个常用程序,并且利用一个或多个自变量(参数)来执行。
每个SPSS函数均有一个关键名称,且绝不能写错。
通常,函数的格式为:
函数名称(自变量,自变量,……),某些函数可能只含有一个自变量,而有些函数则可能含有多个自变量,当一个函数含有多个自变量时,各自变量间用逗号(,)隔开,而函数的自变量通常又可分为以下三种:
(1)常数,如SQRT(100);
(2)变量名称,如MEAN(VAR1,VAR2,VAR3);
(3)表达式,如MIN(30,SQRT(100))。
总之,SPSS函数和我们平时EXCEL里面函数格式规则并无差别。
SPSS提供了180多种函数,共可分为十多类(SPSS中大大小小分了18类)。
和EXCEL一样,我们也不可能记住所有函数,只要知道一些常用函数,至于其他函数要用的时候再去查找也不迟,下面将列举一些常用函数:
算术函数
算术函数是最常用的函数,可以满足对变量进行的一般运算,算术函数主要有:
函数名
自变量涵义
函数类型
函数功能及说明
ABS(numexpr)
(算术表达式)﹡
数值型函数
求绝对值,例如:
ABS(Y-850):
将分别计算变量Y的每个数据与20的差的绝对值
ARSIN(numexpr)
(角度;弧度单位)
数值型函数
求反正弦值。
ARTAN(numexpr)
(角度;弧度单位)
数值型函数,
求反正切值。
COS(radians)
(角度;弧度单位)
数值型函数
求余弦值。
EXP(numexPr)
(算术表达式)
数值型函数
求e的指数幂值。
例如:
Exp(4)=e4=。
注意:
若函数值太大,其结果会超出SPSS的计算范围。
LGl0(numexp)
(算术表达式)
数值型函数
求以10为底的对数值。
例如:
Ln(Y):
分别计算变量Y中每个数据的以10为底的对数值。
LN(numexpr)
(算术表达式)
数值型函数
求以e为底的对数。
例如:
Ln(Y):
分别计算变量Y中每个数据的自然对数值。
MOD(numexpr,modulus)
(算术表达式;摸数(常数))
数值型函数
求算术表达式除以模数的余数。
例如:
Mod(10.3):
函数值=1
SIN(radians)
(角度;弧度单位)
数值型函数
求正弦值。
SQRT(numexpr)
(正数)
数值型函数
求平方根。
例如:
Sqrt(9)=3
RND(numexpr)
(算术表达式)
数值型函数
求算术表达式的值四舍五入后的整数。
例如:
RND=3
TRUNC(numexpr)
(算术表达式)
数值型函数
求算术表达式的值被截去小数部分的整数。
例如:
Trunc=2
﹡算术表达式也包括单值与变量名的情况。
统计函数
统计函数也是统计分析中常用的函数之一,主要反映变量的数据特征,时间序列的滞后期变量等,具体函数有:
函数名
自变量涵义
函数类型
函数功能与说明
CFVAR(numexpr,numexpr,...)
(变量名,变量名,...)
数值型函数
求出多个变量值的变异系数(标准差/均值)。
例如Cfvar(数学,物理,化学):
分别计算每个学生三门成绩的变异系数。
LAG(variable)
(变量名)
数值型函数或字符型函数
返回滞后一期的变量数据。
对第一个观测量来说,将返回系统缺失值,如果指定的变量是字符型,则返回空格。
LAG(variable,ncases)
(变量名,自然数n)
数值型函数
返回滞后n期的变量数据。
对第前n个观测量来说,将返回系统缺失值,如果指定的变量是字符型,则返回空格。
MAX(ivalue,value[,...])
(变量名,变量名,…)
数值型函数
求多个变量值中的最大值;例如MAX(数学,物理,化学):
分别计算每个学生三门成绩中的最高分。
MEAN(numexpr,numexpr,...)
(变量名,变量名,…)
数值型函数
求多个变量值的平均值;例如MEAN(数学,物理,化学):
分别计算每个学生三门成绩的平均值。
MIN(value,value[,...])
(变量名,变量名,…)
数值型函数
求多个变量值中的最小值;例如Min(数学,物理,化学):
分别计算每个个案三门成绩中的最低分。
NVALID(variable,variable,...)
(变量名,变量名,…)
数值型函数
求出变量的(不包括缺失值)的数量。
SD(numexpr,numexpr,...)
(变量名,变量名,…)
数值型函数
求多个变量值的标准差;例如SD(数学,物理,化学):
分别计算每个学生三门成绩的标准差。
SUM(numexpr,numexpr,...)
(变量名,变量名,…)
数值型函数
求多个变量值的和;例如Sum(数学,物理,化学):
分别计算每个个案三门成绩的总和。
VARIANCE((numexpr,numexpr,...)
(变量名,变量名,…)
数值型函数,
求多个变量值的方差;例如Variance(数学,物理,化学):
分别计算每个学生三门成绩的方差。
逻辑函数
l ANY(test,valu,value,…])逻辑型函数,自变量为(变量名,x1,x2,…),函数功能是判断变量值是否是x1、x2…中的一个,例如:
Any(数学,80,90,70):
分别对每条个案判断其数学成绩是否为80或90或70分。
l RANGE(test,lo,hi[,10,hi...]逻辑型函数变量必须都为数值型或都为字符型,自变量为(变量名,x1,x2),其中:
x1≤x2,函数功能是判断某变量值是否在x1至x2之间,例如:
RANGE(数学,80,90):
分别对每条个案判断其数学成绩是否在80至90分之间
日期和时间函数
l (day,month,year)SPSS日期型格式的数值函数,返回与指定的日、月、年相应的日期值。
要正确显示这个值,必须将变量赋予DATE格式。
自变量必须为整数。
day的范围在1~31,month的范围在1~12,year的范围在4位数时要大于1582,2位数时应是该世纪的后两位年代数值。
l (year,daynum)SPSS格式日期型数值函数,返回与指定的天数、年相应的日期值。
要正确显示这个值,必须赋予其DATE格式。
Daynum取值范围在1~366。
l (datevalue)SPSS日期格式的数值型函数,从具有SPSS的日期格式的自变量数值返回一个日期,自变量数值由函数产生或按DATEs输入格式读取。
该函数用于将日期的数值格式转换为日期格式,因此要想按日期格式显示必须再在Variable View中定义一种日期格式,否则会按SPSS日期的数值格式显示。
此函数无2000年问题21世纪的日期也能正确显示。
l (datevalue)数值型函数,从函数产生或按一种DATE格式读入的SPSS日期格式的数值,返回一个小时数(0~23)。
l (datevalue)数值型函数,通过产生或由DATE输入格式读入SPSS日期格式的数值,返回一年的天数(1~366)。
l (datevalue)数值型函数,从一个SPSS日期格式的数值通过函数产生或由DATE输入格式读入,返回一个月的天数(1~31)。
l (datevalue)数值型函数,通过产生或由DATE输入格式读入SPSS日期格式的数值,返回分钟数(0-59)。
l (datevalue)数值型函数,通过产生或由DATE输入格式读入SPSS日期格式的数值,返回一年中的月数(1~12)。
l (timevalue)数值型函数,自变量是由函数产生或由TIME输入格式读取的SPSS时间间隔格式的数值,返回整天数(正整数)。
l (datevalue)SPSS时间间隔格式的数值型函数,把自变量的值看作从午夜开始的秒数,返回一天中的时间(小时、分、秒)。
自变量是SPSS日期格式的数值,可以是由函数产生的或由DATE输入格式读入的。
由该函数建立的变量应该给定一个合适的显示格式。
在VariableView中,赋予它一个时间显示格式,将变量值显示成小时和分。
l (datevalue)数值型函数。
由一个SPSS日期格式数值(由函数产生或由一种DATE输入格式读入),返回周数(1~53整数)。
l (datevalue)数值型函数,由一种通过函数产生或用DATE格式读入的SPSS日期格式数值,返回的数值表示一周的星期几(星期1~星期日用1~7之间的整数表示)。
l (datevalue)数值型函数,由函数产生或用DATE格式读入的SPSS日期格式的数值,返回年数。
l YRMODA(year,month,day)数值型函数,返回一个由1582年10月15日到自变量给定的年月日(year,month,day)之间的天数。
总结:
以上的日期函数分为三大类:
(); (datevalue); YRMODA(year,month,day); 他们有各自不同的作用,其中的变量也不尽相同。
其中date函数中()主要是用来返回
其中XDATE函数中的()主要是用来返回具体的日期数据的。
随机变量函数
随机变量函数的一般形式为:
RV.分布名(参数,…)。
其中圆点前是函数类名,圆点后是分布名称,圆点是半角的圆点,括号内是自变量。
自变量是分布参数。
如果在数据文件中建立新变量时使用这些函数,变量值的个数等于数据文件中有效观测量数。
函数值为产生服从指定统计分布的随机序列。
下面列出常用的分布函数的随机数。
l NORMAL(stddev)数值型函数,产生一个来自均值为0标准差为stddev的分布总体的随机数。
l (p)数值型函数,产生一个来自伯努利分布具有指定概率参数P的随机数。
l (n,p)数值型函数,产生一个来自二项式分布具有指定试验次数n和概率参数p的随机数。
l (df)数值型函数,产生一个来自卡方分布具有指定自由度df的随机数。
l (shape)数值型函数,产生一个来自指数分布具有指定形状参数的随机数。
l (df1,df2)数值型函数,产生一个来自F分布具有指定自由度的随机数。
l (p)数值型函数,产生一个来自几何分布具有指定概率参数P的随机数。
l (totd,sample,hits) 数值型函数,产生一个来自超几何分布具有指定参数的随机数。
l (mean,scale)数值型函数,产生一个来自逻辑斯蒂分布具有指定的均数mean和标度scale参数的随机数。
l (a,b)数值型函数,产生一个来自对数正态分布具有指定参数的随机数。
l (mean,stddev)数值型函数,产生一个来自正态分布具有指定均值mean和标准差stddev的随机数。
l (threshold,shape)数值型函数,产生一个来自帕雷托分布具有指定临界值threshold和形状shape参数的随机数。
l (mean)数值型函数,产生一个来自泊松分布具有指定均值或比率参数的随机数。
l (df)数值型函数,产生一个来自学生T分布具有指定自由度的随机数。
l (min,max)数值型函数,产生一个来自具有指定最大值max和最小值mill的均匀一致分布的随机数.
l (a,b)数值型函数,产生一个来自威布尔分布具有指定参数的随机数。
l UNIFORM(max)数值型函数,产生一个来自一致分布的值在0和自变量给定的Max之间的伪随机数。
自变量Max必须是一个数值,但可以是负数。
反分布函数
反分布函数的一般形式为:
IDF.分布名(p,参数,…)。
其中圆点前是函数类名,圆点后是分布名称,括号内是自变量。
第一个自变量p是这个分布的累积概率,其后的自变量是指定分布的参数。
函数值是相应分布的累计概率值为p的临界值。
l ((p,df)数值型函数,产生来自卡方分布的临界值,第一个自变量为概率值p,第二个自变量为自由度df。
例如:
累积概率为,自由度为5的卡方分布的临界值记作,5),其函数值,5)=。
l (p,scale)数值型函数。
产生一个来自指数分布的临界值,该分布具有给定行状参数shape,概率值p。
l (p,dfl,df2)数值型函数,产生一个来自F分布的值,该分布自由度为dfl、df2,累计概率p的临界值。
例如显著性概率在水平上,自由度分别为6、5的F值为,6,5)=。
l (prob,mean,scale)数值型函数,产生一个均值为mean和标度参数为scale,累计概率为p的逻辑斯蒂分布的临界值。
l (p,a,b)数值型函数,产生具有指定参数和累计概率p的对数正态分布的临界值。
l (p,mean,stddev)数值型函数,产生来自正态分布具有指定均值和标准差的累计概率。
例如,显著性水平为,均值为0,标准差为1的标准正态分布的临界值,0,1)=。
l (prob,threshold,shape)数值型函数,产生一个来自帕累托分布,累计概率为p的值,该分布的临界值为threshold,尺度参数为scale。
l (prob,df)数值型函数,产生一个自由度df,累计概率为p的来自学生T分布的临界值。
l (p,min,max)数值型函数,产生一个累计概率p的来自均匀分布的临界值,均匀分布的最大值max、最小值min。
l PROBIT(p)数值型函数,产生累计概率为p的标准正态分布的临界值。
累计分布函数
累计分布函数的一般形式为:
CDF.分布名(q,参数,…),其中圆点前是函数类名,圆点后是分布名称,括号内是自变量。
第一个自变量q是符合分布的数值,后面的自变量是相应分布的参数。
函数值是相应分布的随机变量取值小于等于q的概率值。
l (q,p)数值型函数,产生来自具有给定概率参数p的伯努利分布,变量值小于q的累计概率值。
l (q,shapel,shape2)数值型函数,产生来自Bate分布的变量取值小于q累计概率值,该分布具有给定的形状参数shapel、shape2。
l (q,n,p)数值型函数,产生来自二项分布的变量取值小于q的累计概率值,该分布具有给定每次实验成功的概率P,成功的实验次数是n,。
当n=1时,该函数与相同。
l (q,loc,scale)数值型函数,产生来自柯西分布的变量取值小于q的累计概率值,该分布具有给定的位置参数loc和标度参数scale。
l (q,df)数值型函数,返回来自卡方分布的变量取值小于q的累计概率值,该分布具有给定的自由度df。
l (q,shape)数值型函数,产生来自指数分布的变量取值小于q的累计概率,该分布具有给定的形状参数shape。
l (q,df1,df2)数值型函数,产生来自F分布的变量取值小于q的累计概率值,该分布具有给定的自由度dfl、df2,累计概率值小于quant。
l (q,shape,scale)数值型函数,产生来自伽玛分布的变量取值小于q的累计概率,该分布具有给定的形状参数shape和标度参数scale。
l (q,p)数值型函数,产生一个几何分布的变量取值小于q的累积概率,即获得一次成功的试验次数,当成功概率由p确定。
l (q,total,sample,hits)数值型函数,产生小于q的累积概率,即具有指定特性的事件数q,当样品sample事件是从尺寸为total的总体中随机选择出来的情况下,其命中数hits具有指定的特性。
l (q,mean,scale)数值型函数,产生来自拉普拉斯分布的变量取值小于q的累计概率,该分布具有给定的均值mean和标度参数scale。
l (q,mean,scale)数值型函数,产生来自逻辑斯蒂分布的变量取值小于q的累计概率,该分布具有给定的均值mean和标度参数scale。
l (q,a,b)数值型函数,产生具有指定参数的对数正态分布变量取值小于q的累计概率值。
l (q,thresh,p)数值型函数。
产生变量取值小于q的累计概率值,即当临界参数为thresh,p给出成功的概率。
l CDFNORM(zvalue)数值型函数,产生一个具有均值为0,标准差为1的随机变量的取值小于zvalue的概率。
l (q,mean,stddev)数值型函数,产生一个正态分布的变量取值小于q的累计概率,该分布均值为mean,标准差为stddev。
l (q,threshold,shape)数值型函数,产生一个变量取值小于q的帕雷托分布的累计概率,该分布具有指定的限值threshold和形状参数shape。
l (q,mean)数值型函数,产生一个来自POISSON分布的小于q的累计概率值,它具有指定的均值或率参数。
l (q,df)数值型函数,产生一个变量取值小于q的学生T分布的累计概率,该分布具有指定的自由度参数df。
l (q,min,max)数值型函数,产生一个变量取值小于q的均匀一致分布的累计概率,该分布具有指定的最小值rain和最大值max参数。
l (q,a,b)数值型函数,产生一个变量取值小于q的威布尔分布的累计概率,该分布具有指定的参数。
缺失值函数
l NMISS(variable,…)数值型函数,自变量是当前工作数据文件中的变量名。
计算自变量中缺失值的数目。
例如:
Missing(数学):
分别对数学这个变量逐个判断是否为系统缺失值或用户缺失值。
l表示是,0为不是。
l MISSING(variable))逻辑型函数,自变量应该是工作数据文件中的变量名。
如果变量具有缺失值,返回1或者true。
l SYSMIS(numvar))逻辑型函数,自变量numva是工作数据文件中的一个数值型变量的变量名。
如果numvar的值为系统缺失值,返回1或者true。
l VALUE(variable)数值型或字符型函数,忽略用户定缺失值,即将用户缺失值看成是普通的数据,返回变量值。
自变量必需是工作数据文件中的变量名。
字符串函数
l CONCAT(strexpr,strexpr,...)字符型函数,函数中每个自变量都是一个字符串表达式。
该函数值是一个字符串,是各自变量代表的字符串按括号中的顺序串接起来的。
此函数要求两个或两个以上的自变量。
eg:
concat(woder,ful)=wonderful;
l INDEX(haystack,needle)数值型函数,产生一个整数,它表明字符串needle在字符串haystack中第一次出现的起始位置。
如果返回值为0,表明字符串needle不在字符串haystack中存在。
例如:
INDEX(“ABCDEFG”,“DE”):
找到字符串DE在字符串ABCDEFG中第一次出现的位置,INDEX(“ABCDEFG”,“DE”)=4
l INDEX(haystack,needle,divisor)数值型函数,见前一个函数。
其第三个自变量divisor是可选择的,它必须是一个整数,表明将字符串needle均匀地分为要被查询的独立字符串的字符数。
l LENGTH(strexpr)数值型函数,自变量是字符串,函数值是字符串表达式值的长度。
这里获得的长度包括尾部空格。
l LPAD(strexpr,length)字符型函数,第一个自变量strexpr是字符串,第二个自变量length是正整数,其范围从1到255。
函数值是字符串表达式的左侧增加空格扩展到length所规定的长度。
l LTRIM(strexpr)字符型函数,返回的字符串是自变量表达式的值去除打头的空格后的字符串。
l LOWER(strexpr)字符型函数,返回字符串,将字符串中的大写字母改变为小写字母。
l RINDEX(haystack,needlel)数值型函数,产生一个整数,它表明字符串needle在字符串haystack中最后出现的开始位置。
返回0表示字符串needle不在haystack中。
l RPAD(strexpr,length)字符型函数,返回字符串,其长度由length决定:
在字符串表达式的右侧加空格,以达到length的长度,length的值在1到255之间。
l RPAD(strexpr,length,char)字符型函数,返回字符串,见前一个函数。
第三个变量char是可以选择使用的,它表示在字符串的右侧增加一个字符char。
char必需是一个带有引号的单个字符或其值是单个字符的字符表达式。
l RTRIM(strexpr)字符型函数,返回截取了尾部空格后的字符串。
该函数通常用于大字符串表达式中,要把压缩了尾部空格的字符串赋予一个变量。
l RTRIM(strexpr,char)字符型函数,返回截取了尾部字符char后的字符串。
char必需是一个带有引号的单个字符或其值是单个字符的字符表达式。
l STRING(numexpr,format)字符型函数,根据format所设定的格式将数值表达式转换为字符串。
例如string,返回字符串‘’。
第二个自变量format必需是写一个数值的格式。
l SUBSTR(strexpr,pos)字符型函数,返回字符串表达式中从pos开始到其结尾处的子字符串。
l SUBSTR(strexpr,pos,length)字符型函数,返回字符串表达式中从pos开始长度为length的子字符串。
l UPCAS(strexpr)字符型函数,返回将字符串表达式中小写字符变为大写字符串。
注意:
数值与数字有区别,以上所讲的数值是数,数字指的是表现为数字的字符。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 常用 函数