stata使用手册Word文档下载推荐.docx
- 文档编号:21232609
- 上传时间:2023-01-28
- 格式:DOCX
- 页数:14
- 大小:101.82KB
stata使用手册Word文档下载推荐.docx
《stata使用手册Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《stata使用手册Word文档下载推荐.docx(14页珍藏版)》请在冰豆网上搜索。
以上四个窗口都可以从”Fonts”去更改字体大小。
三、输入数据(Entering
data)
3
在本小节中,我们将介绍如何把数据读进
STATA。
但是在正式介绍之前,
我们必须先对几个一般性的指令(general
command)有所了解,说明如下:
cd:
即
change
directory,简言之,告知
数据储存的地方。
例如当
数据储存在
e
槽的
sample
数据夹时,则必须先输入
cd
e:
\sample。
dir/ls:
用来显示目录的内容。
set
memory
#m:
设定内存的容量。
例如:
当有一笔庞大的数据要处理时,
则可设定
100mb
的容量,此时可输入
setmemory
100m。
(输入指令
可以知道内存容量的大小
以及使用情况。
)
matsize
#:
设定所需的变量个数。
一般而言,不须对此部分进行设定,
除非所欲处理的资料庞大或是当执行后出现
matsizetoo
small
的讯息时再进行修改即可。
内建为
40。
more
off/on:
若欲执行结果以分页的型式呈现时,则输入
more
on;
若欲执行结果同时呈现时,则输入
off。
help:
求助键。
后面必须接的是指令。
说明如何使用该指令,例如:
help
regress。
search:
后面可接任何文字。
说明在何处可以找到该文字。
search
normal
distribution。
clear:
清除键。
用来删除所有数据。
接下来,根据数据类型或指令的不同,数据输入的方法可分成以下四种:
1、输入
EXCEL
数据
将
的数据输入
的方式还可细分成以下两种:
①将
之前,必须先将数据存成
csv
文件,再利用
指令
insheet
来读数据。
Example:
❶当
档的第一列有变量名称时:
\sample
dir
memory
10m
using
sample1-1.csv
4
variable
name
Column
number
id
1-2
eng
3-4
math
5-6
sex
7
micro
8-9
macro
10-11
❷当
档的第一列没有变量名称时:
gender
id
race
ses
schtyp
prgtype
read
write
science
socst
sample1-2.csv
②直接复制
上的数据,再到
选取”Window”下的”Data
Editor”,
点选后会出现”Stata
Editor”工作表,再到”Edit”下选取”Paste”即可贴上数据。
2、输入
ASCII
的数据型态
依
ASCII的数据型态区分,将
ASCII的数据输入
的方式也有以
下两种:
①数据型态一:
见
sample1-3.txt
infile
str10
记住文字的设定方式(str#
name)。
②数据型态二:
sample1-4.txt
第二种的数据型态通常须要
codebook。
如下表所示。
infix
1-2
eng
3-4
math
5-6
7
micro
8-9
macro
10-11
using
3、利用
Do-file
editor
输入数据
5
insheet
(text)
data
created
by
a
spreadsheet
infile
unformatted
data
infix
in
fixed
format
input
enter
from
keyboard
use
load
Stata-format
dataset
将数据或是指令写入
editor,再执行即可。
将下面数
据复制并贴在
editor(选取”Window”下的”Do-file
editor”)上,再
选择”do
currnet
file”执行即可。
input
female
str3
schtype
prog
science
socst
147
1
3
pub
47
62
53
61
108
0
2
34
33
41
36
36
18
50
49
44
153
39
31
40
51
59
42
51
39
102
52
56
57
71
65
72
66
160
55
136
70
63
end
4、利用
的数据型态输入
除了以上三种方法之外,还可以开启之前以
储存的资料。
use
sample1-6.dta
此一指令亦可用在读取网络上的数据(use
网址)。
最后,将数据输入的相关指令整理成下表。
四、探索资料(Exploring
为了更详细地呈现出在数据探索时所需使用的相关指令,我们利用
sample4-1
来说明指令的用法。
首先,利用前节所提及的数据输入方法将
读进
6
在正式分析数据之前,我们可以利用一个
log
档来储存之后所要执行的指
令以及所得到的结果。
指令的表示方法如下:
result4-1,
text(log
檔的名稱為
result4-1)
接下来,我们可以先利用下面的指令来检视
的数据:
count:
可得样本数。
describe:
描述数据来源以及数据大小。
list:
依序列出观察值的各个变量值。
codebook:
描述资料的详细内容。
此外,我们就可以利用
summarize、tabulate
和
tabstat
等指令得到数据
的叙述统计与基本特性。
表示如下:
summarize:
列出资料的叙述统计。
summarize
write,
detail
sum
if
read>
=60(sum
是
的简写)
prgtype=="
academic"
(接在
之后的句子中
的”=”要放两个)
1/40(只列出第
笔到第
笔资料)
tabulate:
列出变数的次数表。
tabulate
prgtype
race
prgtype,
summarize(read)
race,
summarize(write)
tabstat:
列出变量的叙述统计。
math,
by(prgtype)
stat(n
mean
sd)
sd
p25
p50
p75)
by(prgtype)
接下来,我们介绍一些用来划图的指令:
茎叶图:
stem
write
lines
(2)
直方图:
graph
bin(10)
hist
count
Show
the
number
of
observations
describe
Describe
contents
or
on
disk
list
List
values
variables
codebook
Detailed
log
Create
file
summarize
Descriptive
statistics
tabulate
One-
&
two-way
frequency
tables
tabstat
Table
descriptive
stem
Stem-and-leaf
plot
graph
High
resolution
graphs
sort
Sort
observations
hist
Histogram
categorical
variable
correlate
Correlations
箱形图:
box
sort
prgtype(要先有这个指令才能执行下一个指令)
box
此外,利用
correlate
或是
pwcorr
可以得到相关矩阵;
亦可利用
划出散布图。
science,
obs
read,
twoway
two
jitter
(2)(two
twoway
的簡稱,jitter
是用來區分
重疊的觀察點)
jitter
(2)
matrix
half
现在我们可以将
文件结束了,指令输入如下:
close
若欲检视
档中的结果,可以输入指令:
type
result4-1.log
或是到所储存的目录下点选。
最后,将数据探索的相关指令整理成下表。
8
pwcorr
Pairwise
correlations
type
Display
an
五、修饰资料(Modifying
在本小节中,我们亦利用
的数据进行说明。
首先,读进数据。
读完数据后,可以为此数据取个名称,指令如下:
label
"
School
and
Beyond,
200
cases"
现在我们可以将变量的顺序作一排列。
原先的变量顺序为
gender、id
race…,但是我们想把顺序改成
id、gender
race…,则可以
下面的指令来执行:
order
gender
在执行
codebook
时,我们会发现有些变量尚未加上卷标(label),为了
更清楚地表达变量所代表的意义,我们可以执行以下的指令:
The
school
student
attended."
现在,我们想要产生一个新变量
total,此变量代表
read、write
的总和。
指令如下:
generate
total
=
+
此外,若是我们想加总的分数是
socst,而非
math,此时的指令输入如下:
replace
另一方面,我们还可以将变量
表示成以等级(A、B、C、D
F)
的形式。
grade
total
recode
0/80=0
80/110=1
110/140=2
140/170=3
170/300=4
define
abcdf
F"
D"
C"
B"
4
A"
abcdf
9
Apply
to
set
order
Order
variables
generate
Creates
new
replace
Replaces
one
value
with
another
value
recode
Recode
Label
values
labels
define
Define
for
levels
notes
notes
egen
Extended
-
has
special
functions
that
can
be
used
when
creating
save
Store
dataset
currently
disk
Stata
为了记忆变量的意义为何,我们还可以利用
note
的方式来记录变量。
指令如
下:
race:
values
coded
as
5
were
recoded
be
missing
notes(叫出
的指令)
另外,介绍一些利用公式来产生变量的指令。
egen
zread
std(read)
zread
list
1/10
rmean
mean(read),
by(ses)
mread
median(read),
by(prog)
最后,我们可以将以上的执行结果储存下来。
save
sample5-1(存成另一個檔)
sample4-1(取代原來的
sample4-1)
现在亦将数据修饰的相关指令整理成下表。
六、管理数据(Managing
10
在本节中,我们将进一步介绍如何将数据作一些特殊的处理,例如:
保留
所欲分析的数据、删除多余的数据或是将两份数据结合等等。
假设我们只想针对部分的数据进行处理,而又想保留原始资料时,则有以
下两种方法可进行:
1、另存新檔:
亦即将所欲分析的部分数据储存在另一个档案中。
我们只
针对
成绩大于或是等于
60
分的学生进行分析,则可利用
下面的指令来筛选。
keep
>
60
sample6-1
当只要保留某些变量时,则利用指令
keep。
write。
2、直接处理:
亦即在原始数据上进行分析。
承上例,指令输入如下:
preserve
drop
<
restore
若要删除某些变量时,则利用指令
drop。
接下来,我们介绍如何将两笔数据结合在一起。
数据的结合主要可以分为
两种,水平合并和垂直合并。
前者是指变量的增加;
后者则是指样本数的增加。
说明如下:
1、水平合并
sampleh1
append
sampleh2
2、垂直合并:
samplev1
samplev1,
samplev2,
clear
merge
samplev2
11
if
Keep
condition
is
met
Drop
keep
(dropping
others)
drop
(keeping
Append
file
current
merge
Merge
在垂直合并前要记得先
sort。
最后,我们将数据修饰的相关指令整理成下表。
七、资料分析
透过前面几节的介绍,应该对于
的指令和使用方法有了基本的认
识。
现在,我们开始说明如何利用
来处现统计上的问题以及计量方面
的模型。
1、检定:
我们利用下面的例子来示范如何进行统计上的检定工作。
sample4-1:
ttest
=60
(gender)
(gender)
unequal
sample7-1:
before=
after
2、回归
在执行回归分析时所使用的指令为
sample7-2
regress
growth
lnrlp84
lnemp
oclnemp
cr4
lnrd
oc
另外,当存在
heterogeneityofvariance
的问题时,可在后面加上
robust;
另外,若是不想放入截距项时,可在后面加上
noconstant。
若欲得
到残差值,可输入以下指令:
predict
residual
12
3、二元选择模型
在执行二元选择模型时所使用的程序写法与执行回归分析时相同,只是所
使用的指令不同。
在
logit
模型时为
logit;
progit
progit。
sample7-3
oc
rlp
emptot
rlp2
emptot2
rlpemp
lnrd
lstat
lnrd,or
probit
dprobit
4、Treatment
effect
model
原则上,STATA
在处理计量模型时,格式上大都一致,亦即〝指令
被解
释变量
解释变量〞的输入型式。
我们再举一个计量模型来说明,例如:
在有关
自我选择的问题时,为了考虑内生性的情形,计量学家提出了一个
Treatment
model,其指令的撰写如下:
treatreg
cr4,treat(oc=
rlp84
emptotrlp842
lnrd)
lnrd)two
由上述可知,STATA
在使用上真的相当方便、容易,尤其对于初学者而
言,更是一个相当值得推荐的软件包。
最后,整理一些
的相关网站以
供参考:
http:
//www.ats.ucla.edu/stat/stata/default.htm
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- stata 使用手册
![提示](https://static.bdocx.com/images/bang_tan.gif)