书签分享收藏举报版权申诉 / 14

立即下载加入VIP,免费下载

当前位置：首页 > 人文社科 > 军事政治 > STATA入门5函数与运算符.docx

STATA入门5函数与运算符.docx

文档编号：5862521
上传时间：2023-01-01
格式：DOCX
页数：14
大小：27.81KB

STATA入门5函数与运算符.docx

《STATA入门5函数与运算符.docx》由会员分享，可在线阅读，更多相关《STATA入门5函数与运算符.docx（14页珍藏版）》请在冰豆网上搜索。

STATA入门5函数与运算符.docx

STATA入门5函数与运算符

5函数与运算符

5．1运算符eｘp

SＴATA共有四种运算,分别是代数运算、字符运算、关系运算和逻辑运算。

运算符一览表

代数运算

逻辑运算

比较关系

+

加

!

不

>

大于

－

减

～

不

<

小于

*

乘

｜

或

>=

不小于

/

除

&

和

<＝

不大于

^

指数

==

等于

sqｒt（）

开方

!

＝

不等于

~=

不等于

~＝

不等于

+

字符相加

运算的优先序：

！

（或～），^，-（负号），/,＊，-（减），+，！

=（或~=）,>,<,<=,>=,==,&,|

当不确定优先序的时候,最好用括号将优先序直接表达出来。

5.1.1代数运算

包括加（+）、减（-）、乘（＊）、除（/）,幂（＾）和负数（-）,当遇到缺失值或者运算不可行时（比如除数为零）均会得到缺失值。

例：

求正式的值，若ｘ=4,ｙ=2，显然经过心算,应该为：

-1

.　ｄi–（４+2^（４-2））/（2*4）//di是disｐlａy命令的略写，表示显示结果

.　di4-2　　//输出2

.ｄi3＊5　　//输出15

．di８／2　　//8除以2,输出4

．di2^3//２的立方，输出8

.dｉ　–（2+3^（2-3））/ｓqrt（2*3）　//括号运算优先，想一想，结果应为多少?

实际上，更多的情形是两个或多个变量的直接运算。

比如,将进口车的价格都增加10０元（可能是关税）,而国产车不变。

.　syｓuse　auｔo,　clear

.gen　npriｃe=pricｅ+ｆoreign*1０0

.　listnpriｃepricｅｆoreigｎ

5．1.2字符运算

加（+）号同样可用于字符运算，当加号出现在两个字符之间时，两个字符将被连成一个字符。

比如把”我爱”“SＴＡTA”合并在一起,命令为：

.scaｌara=”我爱”+“STAＴA”　/／要特别注意,引号必须是半角和英文模式

.ｓcalarlisｔ　a　　　//scalar命令将两个字符运算后的结果赋于a，然后显示a

.scａlara＝2+“3”　//注意到:

字符与数值不能直接相加，显示类型不匹配

type　mismatcｈ

ｒ（109）；

5.1.3关系运算

关系运算包括大于、小于、等于；不等于、不小于、不大于等多种比较关系。

特别要注意到STAＴA中的等于符号为“==”，是两个等号连写在一起,不同于赋值时用的单个等号“=”。

.di３<5　　／／输出结果为1,意味着３小于５为真

.di3＞5　／／输出的结果为0,意味着3大于5为假。

当数据中含有缺失值的时候需要特别小心，因为系统缺失值大于任何一个数据，利用这一点，我们可以使用条件语句排除缺失值。

任务：

将年龄分组为65岁以下和65岁及以上两组,缺失值显然不能包括在任何一组中。

ａgｅ

38

．

65

42

18

8０

.cleａr

．ｅｄｉt

将上述数据复制到ＳTATＡ中，然后退出数据编辑器。

.　genageｇrp1=（age＞＝６5）

生成的数据中，将缺失值视为６5岁以上分在了高龄组,这是错误的

.　genagegrp2=（ａge>＝65）iｆaｇe<.

生成的数据中,将缺失值排除在外，正确！

这一命令常被用于生成虚拟变量。

．ｇenagegrp3＝（age＝＝65）if　aｇe＜.　／／仅判断是否恰好为6５岁

．　list／/比较agegrｐ１、agｅgｒｐ2和aｇegrｐ３的差异,体会if　age<.的作用。

ａge

Agegrp１

Agｅgrp２

Agegrｐ3

3８

０

0

.

1

.

65

1

42

0

０

1８

０

0

80

1

１

0

5.1．4逻辑运算

逻辑运算包括非（!

）,和（&）、或（|）三种，主要用于条件语句中。

例：

列示出价格大于1０000元的任何车,或者小于4000元的国产车。

.　ｓysuｓｅauｔo,　clｅar

.listprｉce　fｏreiｇnｉｆｐrice>1０000|ｐｒicｅ<4000&　forei＝＝0

在ＳTATA中,和（&）优先于或（|）,因此上述命令与下面的命令等价：

．　lｉstpｒicｅｆoreｉｇｎｉfｐrice>10000｜　（price＜40０0&forei==0）

试一试下面的命令,这里列示的是国产车中价格高于1０000元或者低于４0００元的车。

．ｌiｓｔ　ｐｒiｃeforeｉｇnｉf　（price＞１０００0　｜　price<4000）　＆　ｆoｒeｉ==0

5.２函数概览fｕnｃtion

函数只不过是一些编号的小程序,它会按一定的规则进行处理，之后报告结果。

实际上,谁也记不住这么多函数，因此，首先要学会查找函数的帮助,当记不住的时候,随时去查寻帮助。

记住下面的命令才是最关键的。

.hｅlpfunction

Typeｏｆfuncｔｉoｎ　　　　　　　Seｅhelp　　　　　

----－-－－-－－----－－－--－--－----－-－－-－-－-－＋---－----－－－-－---－-－--－---

Mathｅｍatｉｃal　functionｓ　　　　　　　　　　mathｆunctions　

Pｒoｂabilitｙdistrｉｂutｉoｎsand　　　　　

denｓｉtｙ　funｃtions　　　　　deｎsityｆunctｉons　

Random-numberｆｕncｔiｏｎｓ　　　　　　ｒaｎdoｍ-number　fｕnｃtioｎs

Ｓtring　functｉoｎs　　　　　striｎgfunctｉonｓ　　

Programmｉｎｇfｕnctionｓ　　　　ｐrograｍmingfuｎctiｏns　　

Date　fuｎctioｎs　　　　　　datefunctｉons　　

Ｔime－sｅriesfunｃｔionｓ　　　tiｍe－ｓeｒies　functｉｏns

Ｍatrixfunｃtioｎs　　　ｍａtriｘｆuｎctｉons　

弹出来的对话框告诉我们,STATA包括八类函数,分别是数学函数，分布函数,随机数函数,字符函数，程序函数，日期函数，时间序列函数和矩阵函数。

本章主要介绍数学函数和字符函数,其他函数将在后面相应的章节介绍。

常用函数一览表

函数

含义

举例

数值型函数

abs（x）

绝对值

abs（－9）=9

coｍｂ（n，k）

从ｎ中取ｋ个的组合

ｃomb（10,２）=45

exp（x）

指数

exｐ（0）=1

fｉll（）

自动填充数据

int（ｘ）

取整

inｔ（5.6）=5,iｎt（-5．2）＝-5.

ｌn（x）

对数

lｎ

（1）=０

log10（x）

以１０为底的对数

ｌog10（1000）=3

ｍod（ｘ,y）

=　x　-　y*ｉnt（x/ｙ）

mod（９,2）=1

round（x）

四舍五入

rounｄ（5.６）=6

sqrｔ（ｘ）

开方

sｑrt（16）=4

ｓｕm（ｘ）

求和

随机函数

unｉｆｏrm（）

均匀分布随机数

第10讲将介绍

inｖnormal（uniｆoｒm（））

标准正态分布随机数

第11讲将介绍

字符函数

real（ｓ）

字符型转化为数值型

ｓtｒiｎｇ（ｎ）

数值型转化为字符型

ｓuｂstr（s,n1,n2）

从Ｓ的第n1个字符开始,截取n2个字符

Subｓｔｒ（“ｔhis”，2,2）＝iｓ

woｒd（ｓ,n）

返回s的第ｎ个字符

Wｏrk（“thｉs”,3）＝i

系统变量

_n

当前观察值的序号

＿N

共有多少观察值

_ｐi

π

5.3数学函数matｈfｕｎctｉｏns

5.３.1三角函数,指数和对数函数

数学函数可以直接对数据进行运算，也可以对变量进行运算。

.dｉsqrｔ（4）　/／开方,输出2

.dｉsqｒｔ（6+3）　　/／先相加,再开方，输出３

．　diabｓ（-100）　　/／求绝对值，输出100

．　diｅｘp（１）　　/／表示e１，输出2.７182８18

.di　lｎ（ｅxp（２））//先求ｅ2,再取对数，得到2

．di_pｉ　　／/_pi为圆周率，得到3.1４15９２7

.　dｉｃos（＿pｉ）　　/／_ｐi的余弦值,得到－1

数学函数可以直接对数据进行运算，也可以对变量进行运算。

对变量的操作:

clear

　sｅtｏbｓ5　　

gen　x=_n　　//生成新变量　ｘ,取值为1,2，3,4,5

　geny1=ｅxp（ｘ）　　／/取指数

　gen　y2=ln（ｘ）//取对数

gen　ｙ３=ｓiｎ（exp（x））　＋cｏｓ（ln（ｘ））/／取对数

ｌ

5.3．2取整和四舍五入

取整

.　dｉiｎｔ（３.49）　//int（）取整,不论后面的小数是什么,只取小数点前的数值

.diiｎt（3.５1）　//输出3

.　di　int（-3.49）　　//输出-3

.diint（－3.５1）　//输出-3

四舍五入

.ｄiround（３.49）　//ｒoｕｎd（）取整，四舍五入,结果为３

.di　rouｎd（3.51）　　//四舍五入，结果为４

.di　rouｎd（－3．49）　/／四舍五入，结果为-３

.diｒound（-3．51）　//四舍五入到个位数，结果为-4

．　ｄirounｄ（3．3４5,．1）　//四舍五入到十分位，结果为3．3

．ｄiｒoｕnｄ（3.351,.1）//四舍五入到十分位，结果为3．４

.　ｄｉround（3.345,.01）　//四舍五入到百分位，结果为３．35

．di　rounｄ（3.３5１,.01）　　／/四舍五入到百分位,结果为3.3５

．dｉｒound（335.1,１0）　　　//四舍五入到十位,结果为330

对变量的操作

.ｓyｓusｅauｔｏ,cｌear

.gen　ｎprice=pｒicｅ／1０0０0／/将价格变到以万为单位

.gen　nｐrｉce2=rouｎd（ｎｐrice,0.０1）　/／四舍五入到百分位

.　liｓtnprice*//比较结果

５.3.3求和及求均值ｇen和egen

cｌear

　sｅtobs5

gｅn　x=_ｎ　　//生成新变量x，x的取值从1到5

　ｇｅny=sｕm（x）　　//求列累积和

egeｎz=sｕｍ（x）　　／/求列总和

eｇenr=rsum（xy　z）　　／/求ｘ+y+ｚ总和

　egen　hsum　＝　rｏwtoｔａl（ｘyｚ）　　//求hsum=a+b+c

egenhavg　=rowmｅan（x　yz）//求ｈavg=（a＋b+c）/3

eｇenhｓd＝rowsd（xｙ　ｚ）　//求a、b和c的方差

　ｅgeｎｒmiｎ=ｒowmin（xｙz）　/／求xｙz）三个变量的最小值

ｅｇeｎrmax=rｏｗmａｘ（x　ｙｚ）　　/／求xy　z）三个变量的最大值

liｓt　/／注意比较y和ｚ的不同。

eｇenavgx＝ｍｅan（x）　　//求列均值

egｅnmeｄx=ｍedian（ｘ）　　/／求列中值

egｅｎ　ｓtdx=ｓtd（x）//求列标准差

rｅpｌaceｙ=3iｎ3

egenbytedxy＝diff（x　y）　／/当ｘ与y相等时,diｆfｅr取0,若不相等为1

更多关于egen命令的用法将参考帮助：

heｌｐeｇeｎ

5．3．4其他

　sｙsusｅ　auto，clｅaｒ

　ｅｇｅｎ　ｒｍpg=　ｒａnk（mpｇ）//求mpg的次序

sｏrtｒmpg

lisｔmpｇrank　//列示结果

egeｎhigｈrep７8=　ａnyvalue（rep7８），v（3/5）　/*若rep78不为3、4或５,

　　　　　　　　　则为缺失值＊/

　lｉstrep78　highreｐ78

clear

inputaﻩb

１ﻩ0

０ﻩ0

１１

0ﻩ1

00

1.

.ﻩ0

eｎd

egenａb=gｒouｐ（ａb）

egenａb２=gｒoup（ab）,misｓing

l

ﻩab　ａbab２

-－---－－----------－

1.1０　3　　3　

2．0　　0　1　　１

3．１　1４　　　4　

4.ﻩ01　22　

5.0　01　　　1　

ﻩ----－-----－----－--

6.1　..5

7.．0　　．6

5.4字符函数strｉｎgfuncｔionｓ

任务:

将美国汽车数据中汽车商标变量值简化为取前三个字母，得到一个新的变量makｅ3

sysｕseaｕto，cｌeａr

genｓtｒ３　ｍａke3=ｓubsｔr（ｍake,１,3）

ｌiｓtｍake*

任务：

下表的数据是一个多选题，请把这道多选题转化为四个单选题

ａﻭ

2

2、1、3

1、2、４

4、2、1

1、2

2

1、2

gｅnnａ1=stｒpos（a,"1"）!

＝0　　/／strops（ｓ1,s２）返回字符ｓ２在s1中的位置

ｇennａ2=strpｏs（a，　＂2"）！

=0

ｇｅn　na3=stｒpos（ａ,"3"）！

=0

gｅnna4＝strpos（a,"4"）!

=0

list

ﻩａﻩﻩna1　nａ2　na３　na４

1.2　ﻩﻩ　0　　　１　0　　　0

2.2ﻩ　0　　1　0　　0

3.1、2、３　　　11　１　0

４.1、2、41　１0　1

5.１、2、4　1　１0　1

6.1、2　　　1　1　0　０　

7.2　ﻩ　0　　1　00

８.ﻩ1、2　1　１　0　０

ｗebuse　genxmｐl2,clear

　geｎnaｍe２=　wｏrd（name,2）　//新变量ｎamｅ2，取值为ｎａme的第二个字母

　ｌiｓtn＊

５.５分类操作bｙ

clear

edit

*将下表复制粘贴到STＡTA数据编辑器中，注意粘贴时把光标停在第一格。

x

y

1

1.1

1

１.2

1

１.3

2

２.1

２

2．2

geｎn=_n　／/生成一个新变量n=1,２,3，4,5

genN=_N　　／/生成一个新变量N＝5,5,５,5,5

ｇenz＝y[1］　　　//生成一个新变量z=y的第一个观察值

l

xｙ　ｎ　　N　　ｚ

-------－----－--－--－----

1.1　　１．1　１　51．１　

２.ﻩ1　　1.22　５　1．１

3．ﻩ11.3　3　51.1　

4.2　　2．1　　4　　51．1　

5．22.25５　　1．１

by　x,sorｔ:

　ｇenn1=_n/／注意到n1与ｎ的不同，ｎ1按ｘ分类进行操作

bｙｘ,soｒt:

　genＮ1=_N

byx,ｓoｒt:

gｅnz1=y［1]

liｓt

xyｎN　ｚ　n１　N1　z1　

1.ﻩ1　1.11　５1.11　　３1.１

2.ﻩ11.22　　5　１.１2　　3　　1.１　

3.ﻩ11．３　３　51.1　　3　　3　　　１.1　

4.ﻩ22.１　45１.１　　1　2　　２．1　

5.ﻩ2２.2　　55　1.1　22　2.1

任务：

下列数据为家庭成员数据faｍｉly.dta,其中ｈhid为家庭编码，age为家庭成员的年龄。

将下表数据复制到ＳTＡTA,然后另存为ｆａmiｌy.dta

hhid

agｅ

1

８6

1

4２

1

３６

1

57

1

28

2

42

2

5

2

40

要求:

（1）生成一个新变量ｈhsize，该变量表示共有多少个家庭成员。

（2）给每个家庭成员一个编码id。

如第一个家庭的第一个成员编码为11；（3）按家庭生成一个全家成员平均年龄值mage。

（4）对每个家庭，分别按年龄大小排序,然后生成一个家庭成员代码,即家庭内年龄最小的成员代码为１，年龄最大的家庭成员,代码为nid。

最后需要生成的数据集如下：

hhiｄ

age

ｈhsize

id

mａge

nｉd

1

２8

５

1５

49.８

1

3６

5

１3

49．8

2

1

42

5

１２

49．８

3

１

57

5

14

4９.８

4

1

86

5

11

4９.８

5

２

5

3

２2

２9

１

2

40

3

23

29

2

４2

3

２1

29

3

请自己先思考,再参考如下操作　：

将上表数据复制粘贴到ＳTATA数据编辑器,然后执行下面的命令

ｕsefamily,cｌear

bｙhhｉd,sｏｒｔ:

geｎ　hhsｉzｅ＝_N//得到家庭规模ｈhsｉzｅ

ｂyｈhid,ｓort:

ｇｅn　ｉd=_ｎ+ｈhｉd*１0　／/为家庭成员编码

byhhｉd,ｓort:

egｅnmａge=ｍean（ａｇｅ）　//求平均年龄

sorthhiｄ　age　　／/按户排序,在每个户内按年龄大小排序

by　ｈhiｄ：

ｇen　nｉd=_ｎ　／/在户内按年龄大小为家庭成员编码

　+--------－----－----－-－-----－----－-－-----+

　|hhｉdagｅ　ｈｈsize　ｉdmａgｅｎｉd|

|--－--－－-－－－－--------－-----－－－－-－-------｜

　1.|1　28　　　　５　　1149.8　　1　｜

　2.|１3６5１2　49.8　　2|

3.|　　1　4２5１3　49.8　　3|

　4.|　　1　575　1449.８　　４｜

５.｜　　1　８6　　515　　49.8　5|

|－-－----－------－-----－-－---－-－－－－-－--－--|

６.｜　　　2　5　　　3　2１　　29　１|

7.　|　2　40　　　　　3　22　　２9　2|

　８.|　　２　4２　　３　23　　　2９　3　|

另一个例子:

ｕse　ｆａmily,ｃｌｅar

bysorthｈid　（agｅ）:

genｎid1＝_n　//括号中的变量agｅ只排序,不参于分组。

ｂyｓorｔｈhidａgｅ：

　geｎｎｉｄ2＝_ｎ　　//　hｈid和age都既用来参与排序也分组

lｉsｔ　　　　//比较上面两个命令得到的不同结果

ｈhid　age　nid1　nid2

ﻩ---－---－-－--－----－-－-－----

１．1　2８　1　　　1

２.ﻩ1３62　　１

３.ﻩ１　４2　　3　　1

4.ﻩ1　57　　4　　　1

5．ﻩ1　86　　　　５　１

-－－-－-----－--------－－---－-

6.ﻩ2　　5　　1　1

7.２　　40　２　　１

8.2４２　　3　　　1

webuｓesｔａｎ2,ｃlｅar

eｘpand２iftraｎsｐlant　//将trａnspｌanｔ==1的观察值再复制一个

sortid

bｙ　ｉd:

generateｂｙｔeposttraｎ＝（_n==2）/＊生成一个新变量poｓttraｎ，使得

　　　　　　　　对同一个人，第一个观察值取0,第

　　　　　　　　　　　　　二个观察值取１*／

by　ｉｄ:

　geｎerａtｅ　t1=ｓtiｍeif_n==_N/*生成新变量t１,使得在同一个id下,

　　　　　　　对第二期取值为stｉme,否则为“.”

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: STATA 入门函数运算

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：STATA入门5函数与运算符.docx
链接地址：https://www.bdocx.com/doc/5862521.html

STATA入门5函数与运算符.docx

热门标签