多元回归分析SPSSWord格式文档下载.docx
- 文档编号:22079258
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:14
- 大小:32.69KB
多元回归分析SPSSWord格式文档下载.docx
《多元回归分析SPSSWord格式文档下载.docx》由会员分享,可在线阅读,更多相关《多元回归分析SPSSWord格式文档下载.docx(14页珍藏版)》请在冰豆网上搜索。
,b\血…bk为回归系敛,A为亠23…,Xfc固定时,X毎增加一个单位对y的效应,即x对y的用回IH系预,等等。
如果两个自变量尤虫同一f因变量y呈找相关旳,可用二元线牲回IFI模型描迷为:
y=A+b、x、+Zu+e
建立乡元性回IH模里时,为了保it回『I模型具有优良的解释能力相预測效果,应首先注意自变量的选择,其准唧是:
(1)自变量对因变量必頻有显著的辦,并呈密幼的线性相关;
(2)自变量与因变量之间的线性相关必须是頁实的,而不是形氏上的;
⑶自变量之彰应具有一定的互斥性,即自变量之彰的相关桦厦不应高干自变量与因变量之因的相关程废;
⑷自变量两具有完整的统廿预据,其硕測值容易确定。
名元性回川模里的参数俗计,同一元线性回I)inw-样,也是在要求误差平方和工°
:
为最小的前提下,用最小二乘法求解参数。
以二线性回U1模型为何,求解回IH参数的标准方程组为
刀y=nb{}+%刀Ti+他刀帀
刀叭"
=馆刀爼1+加刀话+址工>诃2刀龙霑=如刀疔2+加刀父1龙2+&
2刀喊
解此方程可求得ZUM>的做值。
亦可用下列矩阵袪求得
b==-(xy)
站
■
n
E^i
bi
=
E-^i
刀硏
f>
2
工>
E习”2
即
w
-1
ry
E力询2
V
/xiw
刀诚J
y•
L^xryJ
多元线性回归模型的检验⑴
多元性回IH模里与一元线牲回IH模里一样,在胃到参或的最小二乘法的估计值之后,也需要逍行必要的检骏与评价,以决定模里是否«
JW®
用。
1、按合程度的雷定。
与一元线牲回IH中可决系数尸相对应,乡元«
0«
1中也有多重可决系数人宅是在因变量的总变化中,由回町方栉解释的变动(回IH平方和)所占的比重,/?
趙大,回IH方各对样本数囲点抵合的稈殛邈强,所有自变量与因变量的关系趟密切。
计算公式为:
对工(—0尸
~B(v-yy
1刀@_汗
_-E(t/-y?
其中,
E(y-y)2=52y2-(%D+%工龙叨+仇工血?
/+…+加E如
工(”一y)2=工“2-补(工"
)"
i/•
2血汁标准淚差
估卄标准误差,即因变量y的实麻何与回卅方桿求岀的估it何$之同的标准误差,侑汁标准
淚差越小,回PI方程抑合程度越程。
其中,k为多元践性回13方程中的自变量的tfio
3•回!
0方程的显普性检螫
回10方程的显著性检验,即枪验整个回01方程的显著性,或者说评价所有自变量与因变量的毀牲关系是否密切。
能常采用F枪验,FtJ£
itS的汁算公式为:
E(^-^)2/fc
_-02/仇-k-1
f^/k
=(l-/?
2)/n-fe-l
根掘给定的显普水平a,自由S(k,n-k-1)查F分布表,得到相应的苗界值£
若尸>
民H回!
0方程貝有显普意义,回IH效果显善;
F5哪回IH方程无显善意义,回IH效果不显蓍。
4.®
DI系数的显普性检验
在一元找性回IH中,回!
0系数显著性检验(t检验)与回H方程的显著性检验(F检验)是等价的,但在多元线牲回IH中,逹个等价不成立。
t检骏是分别检骏回HI模里中各f0IR系数是否貝有显著性,以便使模型中只些对因变量有显着鄭响的因素。
枪骏时先廿算^ifg/;
然后恨据给定的显着水平a,自由Mn-k-1査t分市表,得临界值£
Ut>
t-a或打,呵回旧系数Q.与0有显蓍关异,反之,则与0无显蓍差异。
境廿量t的廿算公式为:
bibi
其中,C是多元线性回!
0方程中求解HUI系数矩阵的逆傩阵化力“的主对角歩上的第j个元素。
对二元线性回IH而言,可用下列公式廿算:
Q1G22一
C22=
Sil
S11S22_S(2
其中.
511=刀(攵1一可)2=52^1-乂工引)2
J/•
$22=工(为2-蠢)2=工喝一+(工①2)'
S12=工佃1一町)佃2-①2)=«
21
工孙龙2-土(1>
」(1>
2)
/V
5.多重共线性判别
若某个回旧系数的t购骏通不过,可能是逹个系数相对应的自变量对因变量的瓠平不显普所致,Ht时,®
U0«
I模型中副除逹彳、自变量,重新建立更为简单的HlUI模型或更换自变量。
也可粧是自变量之间有共线牲两致,此旳应设送降攸共线牲的影哨。
多重共找牲是指在多元线牲回IH方桿中,自变量之彰有较强的线性关系,这种关系若越过了因变量与自变量的线牲关系,U硼模型的隐定性受到破坏,回IH系数竹计不准确。
需要牯出的是,在乡元回IH模型中,多重剧性的难M免的,只要多重MStt不太严重就行了。
卵别多元毀松回IH方祥是否存在严恁的乡重共线牲,可分别计算每两个自变量之间的可决系敛儿若f>
R或接近于尺,则应设法降假多重线性的做响。
亦可廿算自变量间的相关系数矩阵的特征值的条件数k=k、g为最大特征值,爲为最小特征®
),k<
lOO,D不存在多重点共线也;
若lOO<
k<
lOOO,则自变量间存在较强的多重共线性,若k>
1000,I自变量同存在严重的多重共线性。
障OS多重共线性的亦进王要是转换自变量的取值,如变绝对敛为相对数或平均做,或者更旗其他的自变量。
6.D.W检曹
当回旧模里是根掘动态数醫建立的,剧误差《!
e也是一个旳间序列,若误差序列诸顷之同相互恢立,剧娱差序列各原之间没有相关关系,若误差序列之同存在密切的相关关系,呱建立的回H模型就不能表述自变量与因变量之同的真实变动关系。
D.W枪验就是淚差序列的自相关检验。
檜骏的方进与一元线性回!
0相同。
多元线性回归分析预鴻法案例分桥
案例一:
公路客货运输量多元线ttSHKil方法探如“
一、背景
公路容、货运箱量的定量预側,近几年来在我国公路运输领域大面枳广泛地开展垃来,并有效的促进了公路运输经营决策的科学化和现代化。
关于公路容、货运输量的定量预測方法很多,本文壬要介缙多元线Usui方法在公路客货运输量预测中的貝体操作。
眼摇笔者先后参加的册、省、帀的料研课題的实裁,证明了多元线性回HI方进是对公路客、货运输量预測的一种置信度较高的有效方法。
二、多元线性回IH预測
线牲回IH分桥送是以相关牲原理为基協的.相关11原理是预測学巾的基本原理之一。
由于公路容、货运输量受社会经济有关因素的嫁合影哨。
所以,多元线性回01fl<
1首先是建立公路容、除运输量与其有关影哨因素之间线牲关系的数学模里。
幣后通过对各影哨因素未来值的预測推算出公路客货运输量的
三、公路容、货运输量乡元找性回IH预測方进的买施步鳩
1.84因素的确定
影哨公路容货运摘量的因素很多,壬要包括以下一些因素:
⑴客运量甥喑因素
人口19荒量稠保有量、国民生产总皿、国民收入工农业总产何,基本建i殳投资额城乡居民储蓄顧跌路和水运容运量等。
(2)货运量甥喑因素
人口货车保有量(包抵拖殖$1),国民生产总値,国民收人、工农业总产睛,基本建设投资额,主要工农业产品产量,柱令商品购买力,社会商品零售总额.跌路和水运货运量菩。
上迷影哨因素仅是对一般而言,在针对貝体研究对象时会有所帽城。
因lit,在建立模型时只须列人重覆的影响因素,对于非重要因素可不列人模型巾。
若甬漏了某些重要的影附因素,叱ifi成预測结果的失真。
另外,素太少会ifi战模型的敏恳性丈强.反之,若為非重要爲附因素列人模里,呱会19)11it算工作量,使模里的建立复杂化并用大劭机误差。
影哨因素的选择是建立预測模里首要的关址坏节,可采瓜定相给合的方进进丨敷附因素的确宦可以通过专家调查送,其目的是为了充分发挥专家的唱明才智和经骏。
貝W除法就是通过对荒期从事该龙区公路运输企业和运输管理部D的領导干部、专家、工作人员和行家进仃调查。
可通过组级召开座谈会.也可以通过果前,填写嗚查表等方法进行,从中选岀壬要那响因素为了遁免那响因素确定的酿意性,提M0Hl模型的精厦和城少预测工作量,可通过查阅有关貌廿资科后,再对各影哨因素进仃相关及(或关联废)和共找性分桥,从而再次籥选岀最壬要的影哨因素•所谓相关殛什桥魁是務各诙因素的时同序列与公路客货运量的时同序列做相关分杯事先确定一个相关系数,对相关系散爪于的敷叫因素进仃漓法•关联厦是及色系貌理论中反映事物发杲变化过桿中各因素之间的关联桿废,可通过建空仝路客、货运量与各敷喑敷响因素之间关联系数矩阵,按一定的标准系数舍去关取阪爪的影叫因素.所谓共线性是指某些尉响因素之呵存在着线牲关系或按近于线牲关系.由于公甜运松经济自身的特点,翻4公路客,货运输量的诸多因素之PU是存在着一定的相关性,持朋是号国民经济有关的一些价值型摘标。
我in研究的不是有无相关mo而是共找性的桿及,如果那哨因素之间的共线性桿厦限畐,首先会降瓜参数估廿值的桶废。
其次在回innw建立后的貌计於验中导致舍去重要的影响因素或錯误ffHO受无显普影哨的因素,从而使整个flill作矢去实际意义。
关于共找性桿厦的卵定,可利用逐步弁桥估廿袪的数理缆廿理论编制廿算#i程序来实现。
或者通过比较“柯斤的大小来判定。
在预测学上,一般从为当〃>斤时,共线性是严重的,其含义是,多元线性回旧方桿中所含的If意两彳、自变量尤丸之同的相关系数〃大于或等于该方稈的样本可决系数斤时,说明自变量中存在看严重的共找性何题。
2准立经骑找性回归方程利用最小二乘法原理寻求使误差平方和达到撮小的经验找牲回HI方桿:
"
=°
可+^1^1+02©
2+・・・+伉曲叽
y一预測的客、货运量
g一各土要影喑因预
3我需整理
对收隼的历年容、货运输量和各壬要影哨因素的貌计资料进行审核和Dll工整理是为了尺证檢#Ift的质握。
资料整理壬要包括下列内容:
(1)«
料的补的推算。
(2)对不可H资料加以核实调整•对査明原因的异常值加以修正。
(3)对时间序列中不可比的资料加以调整相观X化;
对按当年价格计算的价值摘标应折算底按筑。
4•多元找性回归模型的参数俗廿
在经验线性回『I模里中,00卫1,02,・・・是要估廿的参数,nJJi过数理绣廿理论建立模里来确定。
在实麻喪測中,可利用名元线牲回旧貝相关分桥的计算机桿序来实现・5・对模型参数的估计值进行检验。
此険工作的目的在于卵定mtffl是否満意、可靠。
一般检驴工作殛从以下几方而来进打。
•经济意义检骏
关于经济预測的数学模里,首先要脸验模型是否有经济意丈,於若参数估计值的符号和大小与公路运输经济发果以政经济卵别不符合M.ji时所估计的模型就不能或很难解释公路运输经济的一般发展规律.親应Uft弃迪f模里.需要重新枸直模型或重新桃选帑喑因素。
・貌计检骏
貌计检骏是数理貌计理论的重要内容,用于检验模型竹计值的可靠性。
通常,在公路客、货运量预測中应采用的统廿检验是:
•扭合废检骏
合废是惰所建立的模里与观察的实麻情况珈连是否Ml合、接近,接近到什么耳废。
统计学是通il枸逋貌廿量斤来量厦的,/?
可由样本数摒计算得出。
若建立的模里愈按近于实麻,HR"
接近于1。
•昌I月方程的显普性检验
回IH方f?
的显普性检骏是通过方差分桥构逋貌廿量F来进行的,筑廿量F是通过样本数醫廿算得出的。
当给定某一胃信殛后,可以通过查阅F表来确定回IH模里从总体效果来看是否可以采纳。
•参数估it值的标准差检验
估计值的标准差是檢量估廿值与頁买参数值的离差的一种量页。
参数的标准差越大,估汁值的可靠性也離趟小;
反之,如果标准差蝕小,朋久估汁值的可靠性也覇逋大。
参做值林准差的於验,可口通过构适大统计量来进行量度。
当给定某一曽信庇后,可以通过查表来确定模里中某f参数估it值的可靠性。
应当强调岳出.貌计检骏相对于经济意义检骏来说是第二位的。
如果经济意义检骏不合理,那么即使貌计检骏可以达刘很高的胃信殛,也应当鉅弃逹种估汁给果,因为用这样的结果来进打经济预測是设有意义的。
6•最优回!
0方程的爾定
经过上述的经济意义和筑廿检骏后,挾选出的线W0II1方梓住住是好几个、为了从中优选出用于进行实麻预测的方程,我II可以采用定牲和定量相结合的亦进。
从数理貌计的原理来jH,应桃选方程的刘余均方和S・E较爪为好.個作为经济損'
剧还必须尽量考處片方桿中的影哨因素更切合实际和其未来值更易把押的闻呱来绘合考虑。
当慾、有时也可以从中挑选出奸几f较优的回IH方承通过損测后,什别作为不同的高、巾、低方案以供决策人员选择。
7.模型的实厢预測檢验
在获胃模里参数估廿值后,Q经illiii一系列购骏而选出的最优(或较优)回旧方桿,还必须对模里的预測能力则以检骏。
不难理解、最ft0DI方程对于样本期间来说是正确的,個是対用于买麻预測是否合适昵?
为此,还吩须册究参散估it値的稳定11及相对于样本容量变化时的灵敏度,也必须研究确定估计出来的模里是否可以用于样本观察值以外的X国,其貝I*做迭是:
(1)采用犯增大样本容量以后模型估it的结果与原来的估it结果进行比较,并检勁其差异的显普性。
(2)把估汁出来的模型用于样本以外某一时同的实际硕河,并務这个頂關值与实牍的观察值作一比较,然后检骏其差异的显善牲。
8•模型的应用
公路容、货运输量多元线牲回IH预測模里的研究目的壬要有以下几f方面。
(1)进行结构仿桥,邪究敷喑该地区的公路客、货运输量的壬耍因素和各影叫因素翻喑桿厦的大小,进一步探甘该堆区公路运输经济理论。
(2)预潯该地区今后年卅的公路客、货运输量的变化,以便为公路运输市场、公路运输政策及处路运埔建设加目投资作出正确决策提供理论依掘。
另外,ii可以通il女路客.货运输量与公路交通量作相关什桥来对公路的馳和厦发杲赶势进行预澳I。
U而为公路的餌建、扩建顷目的投资提供决第分桥。
(3)模按各种经济取策下的经济效果,以便对有关取策进行评价。
四、经调査分桥,欝响某堆区藏容运输量的因素为。
X—国民收入
x一工衣业总产值
x、一it僉总产值
X人口
%一客车氏有量
丸一域乡居民储蓄存款
经廿算得下列相关系数表:
%
Xi
Y
0.9439
0.9287
0.9043
0.9914
0.9670
0.7021
Z
0.9736
0.9614
0.9326
0.8645
0.9321
0.6678
Y—客运磴
Z—旅客周转量
若令a=0.85,则可以舍去鬼这个敷响因索,也就是从为“城乡居民储蓄存款"
不能作为响族客运输量的主要因素。
2•经调查什桥、翻响某地区號客运输量的因素为:
X一工衣业总产值
X、一社僉总产值
%一客车保有量
%一国民生产总値
人一公路通车里程
经计算胃容运量和廉客周转量的经骏线牲回归方程如下:
K=CU+a,A;
+a:
x+oM;
R'
2=0.9997
F=&
)+Q;
Ri+a血+讣4
R2=0・9962
Z=P)+0&
+险+p.xR"
2=0.9983
Z=烷+鶴①4+烷龙5+侏检
=0.9990
Y—客运戏
Z—族客周转量
各自变量冋的相关系数表如下:
ru
J
叼
0.9836
0.9621
0.9710
0.9342
0.9036
0.9344
0.9&
36
\
0.9$23
0,9607
0.9466
0.9«
25
0.9823
0.8523
、
0.8924
0.$205
0.9773
0.9114
<
4
0.9607
0.9348
0.9766
0.«
928
0.9342
0.9205
0.9817
其6
0.9825
O.9&
L7
0.9715
X7
0,9823
0.^928
由上迷计算可知,四f方桿中均未出现〃>/?
的情此因就可以认为各自方桿中的影哨因素之间不存在严重共缆性冋聶。
3•经调查什桥,影4某地区货运周转量的因素为:
x—国民收入
X—工农业总产值
X、一基建投资破
%一原煤产量
%一朋鉄、化见、水泥、粮食总产量
X一国民总产值
人一社会商品寥售总濒
丸一相邻地、帀工农业总产值炖平均値
/=2+也力+2尤+4力
(1)
其中:
斤二0.9875F=206.33S-E=1673.24
£
—2.8321心3.1407心2.7431
/?
二0.9764F=164.59
S-E=1044.27
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 回归 分析 SPSS