第2讲 新手入门指南.docx
- 文档编号:27775029
- 上传时间:2023-07-04
- 格式:DOCX
- 页数:13
- 大小:30.88KB
第2讲 新手入门指南.docx
《第2讲 新手入门指南.docx》由会员分享,可在线阅读,更多相关《第2讲 新手入门指南.docx(13页珍藏版)》请在冰豆网上搜索。
第2讲新手入门指南
[GSW]GettingStartedwithStataforWindows新手入门指南(第二讲)
Stata是一个博大精深的(richanddeep)统计软件包,正如统计学本身的博大精深。
新用户的最佳学习途径是练习手册上的每一个例子,在这方面花费时间多多练习会对今后从事真正的统计分析大有裨益(greatbenefit)。
Stata全部的官方指导手册都有一个符号标识:
[GSM]GettingStartedwithStataforMac
[GSU]GettingStartedwithStataforUnix
[GSW]GettingStartedwithStataforWindows
[U]StataUser’sGuide
[R]StataBaseReferenceManual
[D]StataDataManagementReferenceManual
[G]StataGraphicsReferenceManual
[XT]StataLongitudinal-Data/Panel-DataReferenceManual
[ME]StataMultilevelMixed-EffectsReferenceManual
[MI]StataMultiple-ImputationReferenceManual
[MV]StataMultivariateStatisticsReferenceManual
[PSS]StataPowerandSample-SizeReferenceManual
[P]StataProgrammingReferenceManual
[SEM]StataStructuralEquationModelingReferenceManual
[SVY]StataSurveyDataReferenceManual
[ST]StataSurvivalAnalysisandEpidemiologicalTablesReferenceManual
[TS]StataTime-SeriesReferenceManual
[TE]StataTreatment-EffectsReferenceManual:
PotentialOutcomes/CounterfactualOutcomes
[I]StataGlossaryandIndex
[M]MataReferenceManual
1.Stata入门示例
第二讲将介绍几个Stata可以完成的基本任务,如打开一个数据集,调查数据集的内容,使用一些描述性统计,制作一些图表,并做一个简单的回归分析。
这个方法应该给你一个直观印象:
Stata可以做什么,以及Stata是如何工作的。
会通过两种模式来进行:
一是菜单和对话框模式;二是Stata命令行模式,这样就可以熟悉这两种模式。
一、打开示例文件:
1.选择File>ExampleDatasets
2.点击ExampledatasetsinstalledwithStata
3.点击useforauto.dta
二、简单的数据管理
命令:
browse(1快捷键;2菜单;3命令,三种方式)
数据窗口类似于Excel电子表格,纵列表示变量,横行表示观测值。
单元格中的数据有多种颜色:
数值型变量:
黑色
字符串变量:
红色
分类变量:
蓝色
命令:
describe(描述数据结构)
引申命令:
notes(数据集的注释)
命令:
summarize(变量的概要统计)
引申命令:
codebook(更详细的描述数据集的结构、内容和变量值)
codebookmake
codebookforeign
给分类变量/指标(虚拟)变量添加值标签有两个优点:
第一,变量存储为1个字节占用更少内存,相反,存储字符串“Domestic”需要8个字节。
第二,指标变量很容易纳入统计模型。
引申命令:
codebookrep78
引申命令:
browseifmissing(rep78)(仅显示缺失值)
命令:
listmakeifmissing(rep78)[注意用法:
if条件语句和missing()函数]
三、描述性统计
summarizeprice,detail
browseifprice>13000
tabulateforeign(一维频数表one-waytable,借助了值标签和变量标签)
tabulaterep78(一维频数表one-waytable)
tabulaterep78foreign,row(二维交互表Two-waytable,row表示加入行内百分比)
方法1:
summarizempgifforeign==0
summarizempgifforeign==1
方法2:
byforeign,sort:
summarizempg(比前面的命令更好:
第一,值标签代替了数字,分组清楚明了;第二,不必事先知道分组变量的数值。
注意:
前缀命令by的用法)
byforeign,sort:
summarizempg
方法3:
tabulateforeign,summarize(mpg)
四、一个简单的假设检验
ttestmpg,by(foreign)(检验进口车和国产车的平均油耗是否相同)
五、描述性统计——相关矩阵
correlatempgweight
byforeign,sort:
correlatempgweight
correlatempgweightlengthturndisplacement
六、作图
scattermpgweight或twoway(scattermpgweight)
twoway(scattermpgweight),by(foreign,total)
七、模型拟合:
线性回归
如上图所示,可以得出两点结论:
第一,mpg和weight的关系是非线性的,所以引入weight的平方项;第二,进口车和国产车的关系不同,所以引入foreign指标(虚拟)变量。
因此,拟合模型:
regressmpgweightc.weight#c.weightforeign
predictmpghat(得到预测值/拟合值)
twoway(scattermpgweight)(linempghatweight,sort),by(foreign)
引申出一个构建模型的问题:
移动2000磅1英里与移动1000磅1英里相比,应该消耗两倍的能量。
也就是说,重量和能量是线性关系,而英里(每加仑英里数(Milespergallon))和重量不是线性关系,所以每英里加仑数(gallonspermile)是重量的线性函数。
因此,操作如下:
generategp100m=100/mpg
labelvariablegp100m“Gallonsper100miles”(添加变量标签是为了作图更清楚)
twoway(scattergp100mweight),by(foreign,total)
regressgp100mweightforeign
结论:
从前面的描述性统计我们发现,进口车比国产车油耗更低(mpg更大),这是因为进口车重量更轻的缘故。
根据我们的模型,相同重量的进口车比国产车每百英里额外耗油0.622加仑(或5品脱)。
Stata的强项之一就是其命令语法的一致性。
大多数Stata命令共享通用的语法规则,其中方括号表示可选项,varlist表示变量列表。
[prefix:
]command[varlist][if][in][weight][,options]
一些通用规则:
1.大多数命令允许前缀命令,一个常用的前缀命令是by
2.如果没有指定varlist,那就表示纳入全部变量。
3.if和in限定了命令运行的数据子集。
4.options表示命令的可选项。
5.每条命令的语法都能在系统帮助(help)和参考手册中找到。
例如,查找summarize的详细语法规则有三种方式:
第一,手册[R]summarize;第二,菜单Help>StataCommand,输入summarize;第三,命令窗口helpsummarize
6.Stata的命令语法包括更多没有在这里演示的内容,这里的介绍只是引导你入门的指南,详细信息可以借助helplanguage
八、记录工作日志
如果我们记录了工作日志,就可以方便的回顾操作历史。
日志文件记录了出现在结果窗口的全部操作内容,包含输入的命令和输出的结果。
创建日志文件的三种方法:
方法1:
快捷键
方法2:
菜单
方法3:
命令(logusingfilename)
临时打开和关闭:
logon
logoff
关闭日志文件:
logclose
重新打开日志文件:
logusingfilename,append
2.Stata的用户界面
一、窗口
用户界面包括:
主窗口、工具栏、菜单和对话框。
五个主窗口分别是命令回顾窗口、结果窗口、命令窗口、变量窗口和属性窗口。
还有其他的专门窗口,如浏览器,数据编辑器,变量管理器,Do-file编辑器,图表窗口和图表编辑窗口。
可以从窗口菜单中选择窗口,或从工具栏中选择合适的窗口。
二、工具栏
工具栏包含快捷键,可以快速访问Stata更常用的功能。
工具栏快捷键及其功能的概述:
Open打开一个Stata数据集。
Save把内存中的数据集保存到磁盘。
Print选择某一窗口,并打印其中的内容。
Log创建一个新的日志或关闭、暂停或恢复当前日志。
Viewer打开浏览器。
Graph显示图形窗口。
Do-fileEditor打开Do-file编辑器。
DataEditor(Edit)打开数据编辑器。
DataEditor(Browse)打开数据编辑器的浏览模式。
VariablesManager打开变量管理器。
Clear—more—Condition输出结果暂停后继续进行。
Break停止Stata的当前任务。
三、命令窗口
命令窗口类似于人机交互界面,命令通过窗口提交给Stata完成指定操作。
命令窗口支持基本的文本修改、复制粘贴、命令历史记录(PageUp/PageDown翻页键)、功能键映射。
四、结果窗口
滚动结果窗口来查看先前完成的工作,或者通过搜索栏在结果窗口内搜索,两种方法:
Edit>Find;快捷键Ctrl+F。
清理结果窗口的两种方法:
Edit>ClearResults;在结果窗口单击鼠标右键,选择ClearResults,此操作不可撤消。
五、命令回顾窗口
命令回顾窗口显示命令历史记录。
黑色表示命令成功,不成功的命令以及错误代码用红色表示。
从命令回顾窗口调用命令:
单击命令将其复制到命令窗口,替换命令窗口中的内容;双击命令,重新执行该命令。
右键单击显示一个菜单,从中可以选择不同的操作:
Cut;
Copy;
Delete;
SelectAll;
ClearAll;
DoSelected;
SendtoDo-fileEditor;
SaveAll;
SaveSelected;
Font
六、变量窗口
变量窗口在默认情况下显示数据集的变量列表及其变量标签。
右键单击变量窗口的列标题栏可以改变显示的属性。
在变量窗口点击一次选中一个变量。
选择多个变量可以用通常的方式,或者用Ctrl键选择不相邻的变量,或者用Shift键选择相邻的变量。
双击变量会将选定的变量复制到命令窗口中的插入点。
在变量窗口右键单击可显示一个菜单,可以从中选择:
KeepOnlySelectedVariables;
DropSelectedVariables;
CopyVarlist;
SelectAll;
SendVarlisttoCommandWindow;
Font
七、属性窗口
属性窗口显示变量和数据集的属性,它可以方便的管理注释,修改变量标签和值标签,修改显示格式。
单击属性窗口标题栏的锁定/解锁图标,可以打开/关闭属性窗口的修改模式。
默认情况下,不允许修改属性。
一旦属性窗口被解锁,就可以任意修改变量或数据集的属性。
修改内容会同时出现在结果和命令回顾窗口。
八、菜单和对话框
Stata的Data;Graphics;Statistics菜单涵盖了几乎每一条可以点击访问的Stata命令。
Stata是完全可编程的,Stata用户甚至可以创建自己的对话框和菜单。
User菜单为程序员提供了自己添加菜单项的地方。
最初,User菜单仅仅包含一些空的子菜单。
假设执行泊松回归,选择Statistics>Countoutcomes>Poissonregression,打开对话框。
对话框提供了执行泊松命令的所有功能。
通过点击对话框顶部的多个选项卡可以访问泊松命令的很多选项。
查看每个选项卡的内容,这样你就会知道对话框的全部功能,例如很多命令的对话框都有by/if/in和Weights选项卡。
大多数对话框的底部有六个相同的按钮:
OK执行命令,然后关闭对话框。
Cancel取消命令,关闭对话框。
Submit执行命令,不关闭对话框。
因此可以方便的修改并执行新的命令。
当学习新命令或构建复杂的图形,此项功能是很方便的。
Help访问Stata的帮助系统。
Reset重置对话框,恢复其默认状态。
CopyCommandtoClipboard复制命令到剪贴板。
然后可以粘贴到其他地方(如Do-fileEditor)。
通过对话框执行的命令会同时出现在结果窗口和命令回顾窗口,留意查看这些完整的命令将有助于学习Stata的命令语法。
启动对话框的三种方法:
通过菜单,如Statistics>Countoutcomes>Poissonregression
db命令名,如dbpoisson
命令的帮助文件,如helppoisson
九、工作目录
当前的工作目录是保存图形和数据集的文件夹。
Stata安装之后,或许需要指定工作目录为Stata的安装目录:
创建一个profile.do文件,写入:
cd"Stata13安装路径"
3使用浏览器
一、浏览器的目的
浏览器是Stata的一个多功能的工具。
它不仅是一个帮助系统,还可以用来添加,删除和管理第三方扩展程序(又称为用户编写的程序);查看并打印日志记录;查看并打印SMCL格式文件或纯文本文件;甚至启动Web浏览器来跟踪超链接。
打开浏览器的方式:
工具栏的浏览器按键;
Window菜单;
help[命令]
例:
helppoisson
二、浏览器按钮
浏览器的工具栏有五个按钮,一个命令框和一个搜索框。
Back后退
Forward前进
Refresh刷新浏览器
Print打印
Find打开浏览器底部的查找栏,也可用快捷键ctrl+F。
查找栏用于查找当前浏览器的关键词。
查找栏有自己的按钮、输入区域和复选框。
在查找栏中:
Close关闭查找栏
Find输入搜索关键词的区域,可以使用复选框更改搜索设置。
Next后向查找
Previous前向查找
Highlight高亮显示。
MatchCase区分大小写。
Search搜索框
在浏览器窗口中单击鼠标右键显示的菜单提供下列选项:
SelectAll全选
Preferences首选项
Font字体
Print打印
三、浏览器的功能
浏览器类似于Web浏览器。
它有链接(以蓝色文本显示),可以点击查看相关的帮助主题,并安装和管理第三方软件。
当移动鼠标指针到一个链接上,浏览器底部的状态栏会显示与该链接关联的操作。
例如一个链接的操作是helplogistic,点击该链接会显示logistic命令的帮助文件。
按Shift键点击链接会打开一个新的浏览器窗口。
按Ctrl键点击链接会在当前浏览器窗口打开一个新的标签页。
四、浏览文本文件和SMCL文件
除了查看Stata内置的帮助文件,浏览器还可以查看SMCL文件以及纯文本文件。
选择File>Open,打开对话框。
五、浏览器的标签页
浏览器窗口可以添加多个标签,以便在不同的标签页查看不同的文档或同一文档的不同页。
建立标签有多种方式,其中之一是点击OpenNewTab键,在当前浏览器窗口中建立一个新的标签。
沿着标签栏水平拖动标签可以更改标签的顺序。
如果向下拖动标签会出现一个菜单,有两个选项:
NewHorizontalTabGroup;NewVerticalTabGroup
六、在浏览器中寻找帮助
浏览器的搜索框可以用来搜索官方手册、FAQs和网络资源。
点击放大镜,有三种搜索模式可选:
Searchall;SearchdocumentationandFAQs;Searchnetresources。
七、浏览器的命令模式
在浏览器中通过点击链接和按钮实现的一切操作,也可以通过在浏览器的命令框或在Stata的命令窗口中输入命令来完成。
在浏览器的命令框中执行的操作包括:
获得帮助:
输入contents(相当于在Stata的命令窗口中输入helpcontents),查看Stata帮助系统的内容
输入命令名(相当于在Stata的命令窗口中输入help命令名),查看Stata命令的帮助文件
搜索:
输入searchkeyword搜索官方手册、FAQs和网络资源。
输入searchkeyword,local搜索官方手册和FAQs。
输入searchkeyword,net搜索网络资源。
查找安装用户编写的程序:
输入net查找安装StataJournal,StataTechnicalBulletin和用户编写的程序。
输入ado查看已安装的用户编写的程序。
输入adouninstall卸载已安装的用户编写的程序。
查看文件:
输入viewfilename.smcl查看SMCL文件。
输入viewfilename.txt查看文本文件。
输入viewfilename.log查看文本型日志文件。
在结果窗口中查看文件:
在命令窗口中输入typefilename.smcl查看SMCL文件
在命令窗口中输入typefilename.txt查看文本文件
在命令窗口中输入typefilename.log查看文本型日志文件
启动浏览器打开网址:
输入browseURL启动浏览器。
获取新闻:
输入news查看的最新消息。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第2讲 新手入门指南 新手入门 指南