统计学教学案例一.docx
- 文档编号:12886490
- 上传时间:2023-04-22
- 格式:DOCX
- 页数:39
- 大小:92.25KB
统计学教学案例一.docx
《统计学教学案例一.docx》由会员分享,可在线阅读,更多相关《统计学教学案例一.docx(39页珍藏版)》请在冰豆网上搜索。
统计学教学案例一
统计教学案例
上市公司年报数据分析案例
经统计调查取得数据后,需要通过统计整理、综合指标计算与相关回归分析等方法技术对总
体数据进行处理,以认识总体变量分布状态(如正态分布)、特征表现(如结构相对数、平均数和
标准差)、相关关系(如相关系数)和变化规律(如回归模型),从而了解事物或现象的本质及其
依存因素。
其中统计整理技术包括总量指标、相对指标、平均指标和标志变异指标的揭示,他们的计算既是对总体基本特征的描述,又是对事物或现象进一步定量研究的基础;相关和回归是研究总体各事物或现象间相互关系的定量分析,用以测定不同特征相互联系的紧密程度,揭示变化形式和规律。
本章案例主要通过对总体静态数据处理过程的介绍,帮助读者掌握统计整理、指标描述和相关回归分析技术结合运用的技术与经验。
本章由1个大型案例构成,案例以沪深股市制造业上市公司为对象,系统介绍了静态数据总
体的统计处理过程,包括分布描述、分类研究和相关因素分析。
上市公司年报数据分析案例的教学目的:
数据整理是统计分析的基础工作,在总体规模很大,
数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。
由于具体的工作过程与教科书的知识点讲授顺序并不完全一致,因此本案例通过对1999年沪深股市制造业上市公司年报数据分析过程的介绍,
给读者以处理总体静态数据的思路和技巧,从而训练读者解决实际问题的能力。
案例的背景分析与数据资料
一、案例的现实意义
上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。
对所有上市公司的财务报告进行统计整理和分析,把握上市公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是政府的决策与监督,都是不可或缺的。
本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。
通过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实际经验和教训。
二、案例所依托的总体及其现状与研究目的
(一)案例所依托的客体
本案例所依托的客体是1999年上市公司年报中的有关财务指标。
1999年末,沪、深两市共有上市公司949家。
这些上市公司分布在13个行业部门。
根据中国证监会的《上市公司分类指引》中规定的分类方法,其中制造业共有578家,占60.91%。
总股本1938亿元,占62.73%,制造业
是上市公司最集中的行业。
截止2000年4月30日,已公布年报的有560家。
所以本案例研究的
总体范围确定为如期公布年报的制造业560家上市公司。
(二)案例研究的目的与任务
1.上市公司年报财务数据统计分析的目的
通过对制造业1999年报有关数据进行系统的统计整理、描述和回归分析,揭示1999年制造业上
市公司主要财务指标的总体分布、分行业的经营业绩水平和重要特征,从中掌握认识总体分布特征和数量变化的技巧和方法,提高用统计思想和方法解决实际问题的能力。
2.上市公司年报财务数据统计分析的任务
对纷繁的数据进行不同的分类、分组、汇总、综合、分析、归纳、推断,显示上市公司财务
报告中的主要财务指标的分布形态和主要特性,寻找财务指标之间的相互关系和表现规律。
3.上市公司年报财务数据统计分析的对象
本案例所引用资料取自《上海证券报》,包括了制造业560家上市公司。
共选有8个财务指标:
总资产、净利润、主营业务收入、股东权益、每股收益、每股净资产和股东权益比率。
其中,前4个为反映资产、收益方面的总量指标,后4个为反映盈利能力、业绩水平的相对指标。
4•数据的初步分析一一制造业上市公司行业结构
在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。
为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。
根据《上市公司分类指引》,制造业进一步分为10个行业种类,
编码为COC1、C2、,、C9。
分类统计属于定名测定。
从上述资料经计数整理后即可得到如表一的分布数列。
表2—1制造业上市公司行业分布
代码
行业分类
上市公司数
比重(%
C0
食品、饮料
48
8.57
C1
纺织、服装、皮毛
45
8.04
C2
木材、家具
2
0.36
C3
造纸、印刷
16
2.86
C4
石油、化学
130
23.21
C5
橡胶、塑料
10
1.79
C6
金属、非金属
96
17.14
C7
机械、仪表、设备
151
26.96
C8
通讯、电子
51
9.11
C9
其他
11
1.96
合计
560
100.00
这是一个品质标志分组的分布数列。
从该数列中可以知道上市公司的行业结构。
1999年560
个制造业上市公司中,27%是机械、仪表、设备制造业(包括汽车、船舶、摩托车、家电等);23%
是石化类行业;而冶金、钢铁等金属非金属类公司占17%;通讯电子章9%所以,制造业上市公
司中传统产业占了较大比重。
这些行业中大部分是国有或国有控股企业,是国企改革中率先建立现代企业制度进入资本市场的排头兵。
行业的分布也体现了国家的产业政策导向,在1999年新发
行的A股中,大盘股和高科技股明显增多,有力地支持了国企改革和高科技企业的发展,推动了上市公司的行业结构优化。
方案设计
一、案例设计的思路
本案例研究的总体对象是某一特定时间的静态数据集,为了对它有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。
根据这一目的,本案例按照如下顺序对数据进行处理:
1•分别对总体个单位的数量标志按值的大小作升序排列,以大概认识个变量的变化范围及其
一般水平。
2.分别计算总体个变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众
数、方差、峰度度、偏度等。
3•分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。
4•分别按品质标志和数量标志对总体进行分类,通过计算派生指标,以深入认识总体各指标在不同类别间的差异,包括总体结构、强度,比例关系等。
5•分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上进行回归分析,从而更深层次地认识总体的规律与特征。
6•在上述研究分析的基础上给岀关于对对象的定性认识结论。
二、案例设计的工作过程
(一)数据整理与描述
1•编制按各财务指标的变量数列
(1)将数据顺序排列。
(2)计算描述统计指标。
在Excel“工具”的“数据分析”中,“描述统计”提供了所分析数据的主要描述指标和有关信息。
其内容是;
-Zx
平均一一算术平均数,即x=
n
标准误差一一抽样平均误差,即一
Vn
中值——中位数,即Me
模式——众数,即Mo
标准偏差—标准差,即c;
样本方差方差,即CT2
3
偏斜度偏度,即m§;
■.
区域一一全距,即最大值减最小值;
求和标志总量;
计数一一总体单位总数;
最大(K)第K个最大值;
最小(K)第K个最小值;
置信度一一“数据分析”中默认概率为95%(也可自行选择)的1/2误差范围。
(3)分析描述统计指标一一比较平均数、众数、中位数的大小;偏度系数的大小、方向等。
(4)确定组数和组距一一当偏度系数不大时,用斯特吉斯经验公式确定组数;偏度系数较大、
分布明显偏态时,以平均数为中心,以K倍标准差为组距。
(5)整理成频数分布和直方图(或其他图形),显示总体分布特征。
2•制造业公司主要财务指标的分布
(1)总资产分布数列和直方图
总资产描述统计1
平均
158315.1
标准误差
8970.946
中值
95296.9
模式
标准偏差;
212291.3
样本方差
4.51E+10
峰值
30.19077
偏斜度
4.705128
区域
2178598
最小值
12256.69
最大值
2190846
求和
88656452
计数
560
置信度
17620.89
(95%
总资产描述统计2
平均
144640.7
标准误差
6388.948
中值
95410.48
模式
标准偏差;
149424.9
样本方差
2.23E=10
峰值
9.916375
偏斜度
2.885238
区域
955269.6
最小值
21671.49
最大值
976941.1
求和
79118478
计数
547
置信度
12549.92
(95%
从描述统计1看,560家公司的总资产呈高度偏态。
总资产最大值是上海石化219亿元,最
小值是ST黔凯涤1.2亿元,相差近200倍。
将6个总资产100亿和7个2亿元以下的数据作为极值舍去,计算得到描述统计2,此时的标准差和偏度系数都降低了,说明数据间的差异小了。
但
仍呈偏态,不能用斯特吉斯经验确定组数。
不论何种分布,均值和方差其分布的两个主要特征值。
根据切比雪夫定理,可以平均数为中
心,以K倍的标准差为组距,因为此时平均数—K倍的标准差所涵盖的数据范围不小于1-1/K2。
本例中,均值14.5亿元,中位数9.5亿元,标准差15亿元,说明560家公司的总资产分布
为右偏态。
若以1个标准差为组距,则中位数以下部分的描述势必过于概括。
所以考虑用1/2标
准差,即7.5亿元为组距,由于100亿元以上只有7家,将105亿元以上并为一组,组数=15。
分组后变量数列及直方图如表二和图一所示。
表2—2560家上市公司总资产分组统计
分组(万元)
频数
频率(%
75000以下
209
37.32
75000〜150000
192
34.29
150000〜225000
64
11.43
225000〜300000
33
5.89
300000~375000
18
3.21
375000~450000
15
2.68
450000~525000
4
0.71
525000~600000
2
0.36
600000~675000
4
0.71
675000~750000
6
1.07
750000~825000
2
0.36
825000~900000
1
0.18
900000~975000
3
0.54
975000~1050000
1
0.18
1050000以上
6
1.07
合计
560
100.00
从图表中可以知道,制造业中,总资产8866亿元,平均规模在15亿元左右。
82%勺上市公司总姿产
在22.5亿元以下,100亿元以上的只有1%。
在各行业中,总资产规模最大的是C8――通信电子行业20.3亿元,最低的是C2――木材家具业6.38亿元,另外,C4――石油化工、C5――橡胶塑料、C6――金属非金属的总资产规模在平均之上。
(2)净利润分布数列和直方图
净利润描述统计
平均
6669.48
标准误差
516.2828
中值
4120.164
模式
#N/A
标准偏差;
12217.48
样本方差
1.49E+08
峰值
11.33344
偏斜度
2.485572
区域
112886.5
最小值
-37417.9
最大值
75468.6
求和
3734913
计数
560
置信度
1014.092
(95%
净利润分布呈右偏态。
以1/2标准差6500万元为组距,可分17组。
分组后3.25亿元以上各组不仅频
数少,而且有两组频数为0。
这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。
见表2—3和图2—2。
表2—3560家上市公司净利润分布
净利润分组(万元)
频数(个)
频率(%
-13000以下
14
2.50
-13000〜—6500
10
79
-6500~0
22
3.93
0~6500
332
59.29
6500~13000
112
20.00
13000~19500
24
4.29
19500~26000
13
2.32
26000~32500
16
2.86
32500以上
17
3.04
合计
560
100.00
净利润分组(万元)
图2—2560家上市公司净利润分布
将亏损1.3亿元以下的公司合并为一组,3.25亿元以上的公司合并为一组,组数减少到9组,总体
仍为右偏态。
从整理后的净利润的资料我们注意到:
第一,制造业中,1999年度46家公司亏损,亏损面8.2%,最多的亏损3.7亿元。
第二,制造业1999年度净利润总额373.9亿元,受亏损公司的影响,560家公司总体平均利润只有6500万元。
79%勺上市公司净利润在70万~1.3亿元之间。
第三,上海汽车、邯郸钢铁、上海石化、仪征化纤、首钢股份等大型国企全年利润均在7亿元以上;
年净利润在4.5亿元以上的公司有16个,不足总数的3%但它们的净利润占到制造业全行业的25.5%,充
分体现了大型国企确实是国民经济的脊梁。
第四,进一步研究各行业的利润水平,可以看到有三个行业高与总体水平;co――食品饮料净利闰
0.79亿元;C6金属非金属净利闰0.85亿元;C8――通信电子净利闰1亿元。
(3)每股收益分布数列和直方图
每股收益描述统计1
平均
0.199427
标准误差
0.011551
中值
0.2225
模式
0.21
标准偏差;
0.273352
样本方差
0.074721
峰值
6.75641
偏斜度
-1.51182
区域
2.632
最小值
-1.28
最大值
1.352
求和
111.6792
计数
560
置信度
0.022689
(95%
每股收益描述统计2
平均
0.204943
标准误差
0.010571
中值
0.223
模式
0.21
标准偏差;
0.249255
样本方差
0.062128
峰值
4.912174
偏斜度
-1.27499
区域
1.8891
最小值
-0.98
最大值
0.9091
求和
113.9482
计数
556
置信度
0.020764
(95%
每股收益是一强度相对指标。
从描述统计指标看,舍弃一个最大值后,均值、中位数、众数比较接近,偏度系数也不很大。
尝试按经验公式确定组数:
组数=1+3.322Xlog560=10;
组距=2/10=0.2,极值用开口组处理。
见表2—4和图2—3。
分组
频数(个)
频率(%
—0.6以下
14
2.50
—0.60.4
6
1.07
-0.4~—0.2
13
2.32
—0.2~0
13
2.32
0~0.2
197
35.18
0.2~0.4
231
41.25
0.4~0.6
60
10.71
0.6~0.8
19
3.39
0.8~1.0
6
1.07
1.0以上
1
0.18
合计
560
100.00
560
家上市公司每股收益分组统计
每股收益分组(元)
图2—3560家上市公司每股收益分布
每股收益是按总股本平均的净利润,它排除了股本规模大小对净利润水平高低影响,反映了上市公
司经营业绩水平。
不仅在行业之间,而且可以在公司之间进行比较。
从表2—4图2—3看560家公司每股
收益的特点:
第一,1999年制造业的每股收益的分布略乘左偏态,即平均数为0.2元,但是相对多数的公司每股
收益高于0.2元。
第二,35%勺公司在0.01〜0.2元的微利水平,52%勺公司盈利水平再0.2~0.6元之间。
26家公司盈利水平较高,在0.6元以上,但只占4.5%。
1999年的改制表状元是五粮液,达到每股收益1.35元。
第三,分行也看,经营业绩差别的行业因素非常明显:
最高的是C0――食品饮料,达到每股收益0.31元;大于等于每股收益0.2元的还有C1—纺织、服装,C5――橡胶塑料,C8――同新点子,C9――其他;最低的事C2木材家具,只有0.08元。
(4)净资产收益率分布数列和直方图
净资产收益率1
平均
2.971477
标准误差
1.993256
中值
9.04
模式
6.21
标准偏差;
47.08475
样本方差
2216.974
峰值
117.5889
偏斜度
—10.1028
区域
736.156
最小值
—639.53
最大值
96.626
求和
1658.08
计数
558
置信度
3.915216
(95%
净资产收益率2
平均
8.006386
标准误差
0.352228
中值
9.14
模式
6.21
标准偏差;
8.185041
样本方差
66.9949
峰值
6.881908
偏斜度
—1.63102
区域
69.26
最小值
—34.92
最大值
34.34
求和
4323.448
计数
540
置信度
0.691909
(95%
由于资料中两个公司(0515PT渝钛白和600818ST永久)的净利润净资产为负值,所以此处只有58个公司的数据。
558个公司的净资产旅呈高度左偏态。
净资产收益率过高或过低,都数不正常情况。
舍弃40%以上和—40%以下的18个极端值后,描述指标基本正常。
以1倍标准差8%为组距、48%以上
和一48%一下合并各1组,共分14组。
表25和图24显示,集中趋势非常明显。
表2——5560家公司净资产收益率分组统计
分组(%)
频数
频率(%
小于—48
13
2.33
-48〜一40
1
0.18
-40〜一32
2
0.36
-32〜一24
5
0.90
-24〜一16
6
4.08
-16〜一8
8
1.43
-8〜0
10
1.79
0〜8
190
34.05
8〜16
270
48.39
16〜24
39
6.99
24〜32
7
1.25
32〜40
3
0.54
40〜48
1
0.18
大于48
3
0.54
合计
558
100.00
净资产收益率分组(%
图2—4560家上市公司净资产收益率分布
净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水平。
从统计资料看到:
第一,1999年度,制造业的总体净资产收益率9%(这里采用了中位数,因为忽略极值厚中位数没有
变化,但平均数却差了几倍,而净资产收益率极端值时有个别特殊原因所致)。
第二,8%勺公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负数,以资不抵债。
第三,34%勺公司净资产收益率在0.1%〜8%之间;48%勺公司在0.8%〜16%之间。
第四,8%勺公司净资产在16%-32%勺高水平上,从行业看,这些公司集中在生物制药、通信电子、汽车等高新技术产业,显示岀发展最快、盈利水平最强的势头。
3.制造业各行业主要财务指标的分布
接下来利用符合分组表统计表的形式,总体分组的划分,展示制造业内部各行业的净利润、每股收益、净资产收益率的分布特征。
(1)制造业各行业净利润分布频数统计表和频率统计表
合计栏显示的是总体的净利润分布频数或频率,其他各栏显示的是个行业的分布(见表2—6、表2
—5))
表2—6制造业各行业净利润分布统计(频数)
代
码
\净利润分组(万、、元)
行业分类、
小
于
-1.
3
-1.
3
-0.
65
-0.
65
〜0
0〜
0.6
5
0.6
5
1.3
1.3
1.9
5
1.9
5
2.6
2.6
3.2
5
大于
3.2
5
合
计
C0
食品、饮料
1
27
14
3
1
1
1
48
C1
纺织、服装、皮毛
1
1
2
27
13
1
45
C2
木材、家具
1
1
2
C3
造纸、印刷
1
12
3
16
C4
石油、化工
2
2
5
81
28
6
2
4
130
C5
橡胶、塑料
8
1
1
10
C6
金属、非金属
3
4
2
53
17
4
3
5
5
96
C7
机械、仪表、设备
6
10
94
24
4
5
4
4
151
C8
通信、电子
2
2
1
22
10
3
4
4
3
51
C9
其他
7
2
2
11
合计
14
10
22
332
112
24
13
16
17
560
从表2—6、2—7中可以看到:
第一,总共45个亏损公司,占全部公司的8%他们的行业间分布是:
C7――机械、仪表、设备行业
亏损面最大,有16家,占行业10.7%;其次是C8C6和C1――分别为9.8%、9.4%、8.8%;C2木材家具仅有2家公司,亏损1家。
第二,C5――橡胶、塑料和C9――其他行业无亏损企业,且净利润水均衡,集中在0〜19500万元。
第三,净利润绝对水平的高低与行业类别有关联,3亿元以上净利润集中在酿酒、石化、冶金、电子
通信设备等行业;利润水平较低的有纺织、木材家具及印刷、造纸行业。
表2—7制造业各行业净利润分布统计(频率%
代
净利润分组(万
小
-1.
-0.
0〜
0.6
1.3
1.9
2.6
大
""元)、
于
3
65
0.6
5
〜
5
〜
于
合计
码
-1.
〜
〜0
5
〜
1.9
〜
3.2
3.2
'行业分类^
3
-0.
65
1.3
5
2.6
5
5
C0
食品、饮料
2.1
56.
29.
6.3
2.1
2.1
2.1
100.0
3
2
C1
纺织、服装、皮毛
2.2
2.2
4.4
60.
28.
2.2
100.0
0
9
C2
木材、家具
50
50.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 教学 案例