深圳成指每周数据分析实验.docx
- 文档编号:27080734
- 上传时间:2023-06-26
- 格式:DOCX
- 页数:13
- 大小:946.76KB
深圳成指每周数据分析实验.docx
《深圳成指每周数据分析实验.docx》由会员分享,可在线阅读,更多相关《深圳成指每周数据分析实验.docx(13页珍藏版)》请在冰豆网上搜索。
深圳成指每周数据分析实验
2009年深圳成指(每周)数据分析实验
一、基本情况:
实验要求:
数据来源真实,用学过的各种分析方法进行数据分析
二、实验过程:
(1)寻找真实数据
1、到网上查找2009年1月1号到12月31号深圳指数的历史数据,按照每周的间隔,将其复制到excel,并让其按照日期做升序排列。
如下图,命名为‘1.xls’,路径为F:
\Experiment\1.xls。
数据来源网址:
(2)导入数据
1、将数据导入SAS,过程如下图:
导入成功!
2、打开数据集查看:
(3)进行统计分析
1、打开SAS/Analyst进行分析:
(变量选择‘label’)
第一、先进行描述性统计分析,研究各个变量之间的数据基本信息:
根据以上可以看到各个变量的均值,标准差,方差,数据个数,最小值,最大值,中位数,偏度,峰度和P值。
从以上可以看到各变量峰度和偏度较大,不接近0,所以变量应该不都很符合正态分布。
再根据直方图输出结果,可以直观看出变量“收盘”,“涨跌额”,“涨跌幅”,“成交量(手)”,“成交金额(万)”比较符合正态分布,其它都不大符合正态分布。
再进行“正态性检验”分析对变量是否满足正态进行定量分析,这里取显著性水平a=0.05,
对于变量“开盘”,检验输出如下,P=0.034<0.05,所以显著不符合正态分布。
对于变量“收盘”,检验输出如下,P=0.93>0.05,所以认为符合正态分布。
对于变量“涨跌额”,检验输出如下,P=0.15>0.05,所以认为符合正态分布。
对于变量“涨跌幅”,检验输出如下,P=0.15>0.05,所以认为符合正态分布。
对于变量“最低”,检验输出如下,P=0.15>0.05,所以认为符合正态分布。
对于变量“最高”,检验输出如下,P=0.15>0.05,所以认为符合正态分布。
对于变量“成交量(手)”,检验输出如下,P=0.034<0.05,所以认为不符合正态分布。
对于变量“成交金额(万)”,检验输出如下,P=0.15>0.05,所以认为符合正态分布。
从以上可以看出比较多的变量还是符合正态分布的,所以2009年股市价格和交易量的的变动在某种程度上符合正态分布。
第二、为了研究变量之间的关系,可以用归方法,但是考虑到变量之间的关联性可能比较大,先进行主分量回归分析:
先设置3个主分量,输出结果为:
从以上输出结果可以看到用前两个主分量的效果已经达到83.53%,前三个主分量的效果更是达到了99.34%,所以用三个主分量已经很好地拟合原来的数据。
由Eigenvectors输出可以看到主分量和原来的变量之间的线性关系。
从系数看到Print1对于变量:
开盘,收盘,最低,最高的系数大概在0.5左右,所以Print1主要反映价格的情况,其中开盘和收盘的相关系数也达到了0.97,最低和最高达到了0.99,也有很强的相关性;Print2主要反映的是涨跌额和涨跌幅的情况,从相关系数矩阵也可以看出这两个变量的相关系数为0.97,所以有很高的相关性;Print3主要反映成交量和成交金额的情况,其相关系数达到0.87。
输出的第一、二主分量的增强型分量图:
从以上输出可以看到变量“开盘”,“收盘”,“最低”,“最高”可以归为一类,“成交量(手)”,“成交金额(万)”可以归为一类,“涨跌额”,“涨跌幅”可以归为一类。
从分析结果可以看到股市中价格变化会有一定的制约,收盘一般受到开盘的影响,最高跟最低之间也会相互影响,且影响是正相关的。
成交量和成交金额,涨跌额和涨跌幅也是有正相关的关系。
第三、为研究一年来股市的各种因素关于时间的变化,可以从以上得到的三个主分量对时间进行回归分析:
(1)对于第一个反映价格的主分量Print1,得到的分析结果为:
从以上结果可以看出Print1=-151.03+0.00835t,t的系数为正数,即价格随时间是显稍微上升的趋势。
观察值对预测值的散点图:
观测值Print1对时间的散点图:
从以上可以看到Print1随着时间总体呈上升趋势,而且在t为2009-7-1到2009-8-15,Print1呈明显加快上升趋势,所以股价在这个阶段是比较上升得比较快的。
输出关于自变量时间的残差图:
以上的残差图比较接近正常的残差图。
(2)对于第一个反映涨跌幅(额)的主分量Print2,得到的分析结果为:
从以上结果可以看出Print1=18.19723-0.001t,t的系数为负数,即涨跌的幅度随时间是显稍微下降的趋势。
观察值对预测值的散点图:
观测值Print2对时间的散点图:
从以下散点图可以看到Print2的均值>0,所以涨跌幅大于0,即股价总体呈上升趋势,同Print2呈下降趋势,所以股价的涨速随着时间越变得缓慢。
输出关于自变量时间的残差图:
以上的残差图比较接近正常的残差图。
(3)对于第三个反映交易量(额)的主分量Print3,得到的分析结果为:
从以上结果可以看出Print3=-66.38+0.00367t,t的系数为正数,即交易量随时间是显稍微上升的趋势。
观察值对预测值的散点图:
观测值Print3对时间的散点图:
从以上可以看到Print3随着时间总体呈上升趋势。
即交易量越来越多,可以理解为投资者投入的金额越来越多,或者是越来越多的人投入股市。
输出对自变量时间的残差图:
以上的残差图比较接近正常的残差图。
三、总结
通过以上的描述性统计分析,正态性检验分析,主分量分析和对时间的回归分析,可以大致总结出以下结论:
2009年深圳成指的多个因素总体呈正态分布,这些变量可以总结为三个主变量:
价格,涨跌幅和成交量。
在2009年股价总体随着时间呈上升趋势,在8月份左右的时候上升得比较快,涨跌幅总体呈下降趋势,也就是股价增长趋向缓慢,而成交量呈上升趋势,可以看出投资者在股市的投入增多,或者股民数量增加。
从2009年的情况,大概可以预测出2010年的股市情况,股价总体会呈缓慢上升趋势,成交量也会有所增多。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深圳 每周 数据 分析 实验