stata初级入门2数据篇.ppt
- 文档编号:1392190
- 上传时间:2022-10-22
- 格式:PPT
- 页数:32
- 大小:711.50KB
stata初级入门2数据篇.ppt
《stata初级入门2数据篇.ppt》由会员分享,可在线阅读,更多相关《stata初级入门2数据篇.ppt(32页珍藏版)》请在冰豆网上搜索。
Stata入门2数据篇,2022年10月22日星期六,计量经济学软件应用课程讲义,1,一、数据录入,直接录入打开dta数据文件导入其它格式的数据文件其它方式,2022年10月22日星期六,计量经济学软件应用课程讲义,2,1直接录入,
(1)直接在stata中录入(适用于小样本少变量数据):
打开程序,调用数据编辑窗口,直接录入数据,如excel中操作。
调用数据窗口方式:
(a)在command窗口中输入edit命令;(b)点工具栏上的
(2)在excel中录入后,直接复制到stata数据编辑窗口中。
(3)键盘直接输入:
在command窗口,用input命令。
划线部分输入,.drop_all.inputxyxy1.122.343.564.785.9106.end,2022年10月22日星期六,计量经济学软件应用课程讲义,3,2.数据文件的读取,
(1)Stata数据文件,后缀.dta直接双击菜单操作:
在工具栏上直接点击或FileOpen:
2022年10月22日星期六,计量经济学软件应用课程讲义,4,use命令,语法格式:
usefilename,clearnolabel,读取整个数据文件usevarlistifinusingfilename,clearnolabel,从数据文件中仅读取几个变量范例:
useC:
ProgramFiles(x86)Stata12auto.dta,clearuseC:
ProgramFiles(x86)Stata12auto.dta,clearnolabelusemakepriceusingC:
ProgramFiles(x86)Stata12auto.dta,clear,
(2)其它格式的数据文件,Excel数据:
*.xls,*xlsx。
这是stata12新增的功能。
用spreadsheet建立的ASCII(txt)数据:
*.raw,*.txt,*.csv,用insheet命令。
固定列宽的ASCII(txt)数据:
*.dct,用infix命令以dictionary格式建的ASCII(txt)数据:
*.dct,*.raw,用infile命令。
无格式的ASCII(txt)数据:
*.txt,*.raw,用infile命令。
SASXPORT数据:
*.xpt,用fdause命令。
ODBC数据源:
包括access数据源,*.mdb,dBase数据源,*.dbfxml数据:
*.xml,菜单操作:
fileimport,2022年10月22日星期六,计量经济学软件应用课程讲义,7,3.其它方式,
(1)用StatTransfer软件转换可以用statTranser9软件将各种格式的数据转换成dta格式数据前提是你安装了这个软件
(2)安装外挂命令程序包,如usespss.ado程序包就是一个用于读取spss生成的格式数据的程序包。
在searchall中敲入搜索关键词:
找到可能你需要的程序包,而后安装即可。
这个方法安装的外挂命令,不会在菜单中出现,需要你记住命令名。
2022年10月22日星期六,计量经济学软件应用课程讲义,8,二、数据的保存或导出,1保存用save/saveas2导出从file菜单中export选项下选择你想保存的格式;用outfile,outsheet,fdasave,xmlsave命令,2022年10月22日星期六,计量经济学软件应用课程讲义,9,三、数据操作,变量名、标签等属性变量属性显示和修改变量的数据类型和长度变量生成和变量值修改缺失值的处理变量的剔除和保留数据的排序字符变量和数值变量的相互转换,2022年10月22日星期六,计量经济学软件应用课程讲义,10,1.变量属性,如名称、标签、值标签,变量名:
由英文字符、数字、中文字符组成。
字母大小写表示的含义不同!
标签:
对变量含义的解释值标签:
用于对分类变量值的含义进行解释如foreign有domestic和foreign,在数据量化上,可用0代表domestic,1代表foreign。
2022年10月22日星期六,计量经济学软件应用课程讲义,11,2.变量属性的显示,菜单操作:
DataDescribeDatainMemoryDescribe命令,语法格式:
describevar1var2用于,可显示1个,或多个。
如describeforeign,2022年10月22日星期六,计量经济学软件应用课程讲义,12,3.变量属性的修改,变量名更改:
rename命令,常用语法格式:
renameold_varnew_var,如renameincomeinc.变量标签(label)的定义:
label命令,语法:
labelvarvarname“#”,如labelvarforeign“cartype”。
除用于定义变量的标签外,其还可用于定义数据的标签,如labeldata“autoinAmerican”分类(或指示)变量的值标签定义:
亦label命令,要完成分类变量值的标签定义有两步,如把变量foreign取值为0,定义为domestic,取值为1,定义为foreign,并用origin表示该变量值标签定义结果:
labeldefineorigin0“domestic”1“foreign”labelvaluesforeignorigin,2022年10月22日星期六,计量经济学软件应用课程讲义,13,4.变量的数据类型和长度,整数数值型:
(1)byte,
(2)int,(3)long。
小数数值型:
(1)float,
(2)double。
数值型数据一般定义为float型,除非你有特别定义。
字符串型:
string,2022年10月22日星期六,计量经济学软件应用课程讲义,14,数值型数据,字符型数据,数值变量和字符变量的转换,encode命令:
将字符变量转换为数值变量。
格式:
encodevarnameifin,generate(newvar)label(name)noextend菜单:
DataCreateorchangedataOthervariable-transformationcommandsConvertvariablesfromstringtonumeric范例:
encodemake,generate(make2)decode命令:
将数值变量转换为字符变量格式:
decodevarnameifin,generate(newvar)maxlength(#)菜单:
DataCreateorchangedataOthervariable-transformationcommandsConvertvariablesfromnumerictostring范例:
deocdeprice,genrate(price2),包括数值数据的字符转换,destring命令:
将字符变量转换为数值变量语法:
destringvarlist,generate(newvarlist)|replaceoptionsoptions:
ignore(“chars”)删除字符变量中的非数值字符,force将非数值字符转换为缺失值tostring命令:
将字符变量转换为数值变量语法:
tostringvarlist,generate(newvarlist)|replace,5.新变量生成,generate/egen命令:
gen命令格式:
generatetypenewvar=expifin范例:
genid=.egen命令格式:
它是gen的更高级应用,egentypenewvar=fcn(arguments)ifin,options范例:
egenmmpg=mean(mpg),2022年10月22日星期六,计量经济学软件应用课程讲义,18,菜单操作:
DataCreateorchangedataCreatenewvariableDataCreateorchangedataCreatenewvariable(extended),6.变量值的修改,replace命令格式:
replaceoldvar=expifin,nopromote范例:
如replaceid=1,7.缺失值的处理,在现有的调查中,经常用88,99,888,999,.等来表示不知道或不清楚。
在stata中如何一般用”.”来表示该变量的观测缺失值。
将变量缺失值转化为数值,用mvencode命令格式:
mvencodevarlistifin,mv(#|mvc=#mvc=#.else=#)override范例:
mvencoderep78ifforeign=0,mv(998)将变量的某些数值转化为缺失值,用mvdecode命令格式:
mvdecodevarlistifin,mv(numlist|numlist=mvcnumlist=mvc.)范例:
mvdecoderep78,mv(998=.999=.a),2022年10月22日星期六,计量经济学软件应用课程讲义,21,菜单操作:
DataCreateorchangedataOthervariable-transformationcommandsChangemissingvaluestonumeric或Changenumericvaluestomissing,8.变量(观测值)的剔除,保留,显示,drop/keep命令:
格式:
(1)变量:
drop/keepvarlist;
(2)观测值:
drop/keepifexp范例:
droppop*,dropifmedage32菜单操作:
(1)变量:
DataVariablesManager;
(2)观测值:
DataCreateorchangedataKeepordropobservationsClear命令list命令:
格式:
listvarlistifin,options,9.数据的排序,Sort命令语法:
升序sortvarlistin,stable。
选项stable指如果两个观测值相同,则保持其顺序不变。
降序gsort-varname-varname,generate(newvar)mfirst。
选项mfirst表示将缺失值放在前面。
菜单操作:
(1)只完成升序:
DataSortAscendingsort
(2)升、降序皆可:
DataSortAscendinganddescendingsort范例:
2022年10月22日星期六,计量经济学软件应用课程讲义,25,四、分类数据的处理,变量:
连续变量、分类变量将连续变量转化为指示变量如generatepriceg=(price=6000)将连续变量转化为分类变量语法:
generatenewvar=recode(varname,num1,num2,num3,.,numk)将分类变量转化为指示变量语法:
xii.varname,五、数据集的合并和附加,1.数据集的合并:
merge命令语法:
(1)按指定的关键变量进行1对1匹配合并(One-to-onemergeonspecifiedkeyvariables)merge1:
1varlistusingfilename,options
(2)按指定的关键变量进行多对一匹配合并(Many-to-onemergeonspecifiedkeyvariables)(外部数据文件的关键变量值唯一值)mergem:
1varlistusingfilename,options,菜单操作:
DataCombinedatasetsMergetwodatasets范例:
usec:
programfilesstata12auto1.dtamerge1:
1idusingc:
programfiless
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- stata 初级 入门 数据