数据分析.ppt
- 文档编号:1205009
- 上传时间:2022-10-18
- 格式:PPT
- 页数:14
- 大小:111KB
数据分析.ppt
《数据分析.ppt》由会员分享,可在线阅读,更多相关《数据分析.ppt(14页珍藏版)》请在冰豆网上搜索。
第十四章数据分析技术1、数据分析的含义:
对原始数据进行处理,以显示不同数据之间以及新数据与原始数据之间的联系,并通过分析得出某些结论的过程。
2、数据分析的功能:
通过数据分析,使原有的信息资料更好的反映客观经济事物的本来面貌和内在联系(例:
长虹29TV与1980元的关系:
价格优势;价格变动趋势)3、数据分析的要求:
做好数据分析计划:
所需研究的主要变量;测量这些变量所有的方法;数据分析的过程及应用的技术一.交叉列表分析的含义:
同时将两个或两个以上变量按照一定的顺序对应排列在一张表中,从中分析变量之间的相关关系,得出结论的方法。
例1对企业业务增长同企业经营年限之间的关系进行研究变量为1)业务增长(速度慢;速度快)2)经营年限(5年以下,5年10年,10年以上)表一交叉列表分析技术的特点:
容易掌握;适用面广266828792列总计1325352速度快134553445速度慢行总计10年以上5年10年小于5年经经营年限营年限业务增长业务增长27例2将其变成百分数表则更为清晰表二266100%100%100%列总计13232.9%60.9%53.6%速度快13467.1%39.1%46.4%速度慢行总计10年以上5年10年小于5年经经营年限营年限业务增长业务增长二二.双变量交叉列表分析法与三变量交叉分析法的关系双变量交叉列表分析法与三变量交叉分析法的关系在双变量交叉列表中加入第三个变量,则原有双变量交叉列表分析的结果可能出现四种情况(简言分析其可能情况)1.更精确显示原有数据的联系例3.研究时装购买与婚姻状态之间关系,样本数为1000,已婚700人,未婚300人变量1.时装购买情况:
其分为高和底两种状态变量2.婚姻状态:
其分为已婚和未婚两种状态表三婚姻状态与时装购买状况的关系结论:
未婚者比已婚者购买更多的时装.现引入第三变量:
性别,见表四300700被调查者数100%100%列总计48%69%低52%31%高未婚已婚婚姻状态购买状况表四婚姻状态.性别与时装购买状况的关系180300120400被调查者数被调查者数100%100%100%100%列总计40%75%60%65%低60%25%40%35%高未婚已婚未婚已婚婚姻状态女男性别购买状况结果:
1.未婚者比以婚者购买更多时装2.女性婚前购买时装者比例大,婚后比例大幅减少,而男性的变化不大2.显示原有联系是虚假的例4.某高级住宅购买意向的市场调研.样本1000人变量1.高级住宅购买意向变量2.被调查者的受教育程度表五教育程度与高级住宅购买意向的关系结论:
教育程度影响高级住宅购买意向750250被调查者数100%100%列总计79%68%否21%32%是低于大学本科大学本科以上教育程度高级住宅购买意向插入第三变量:
收入水平表六三变量交叉列表被调查者数列总计否是高级住宅购买意向收入水平50150700100100%100%100%100%60%60%80%80%40%40%20%20%低高低高教育程度高收入低收入结论:
收入水平是影响高级住宅购买意向的因素,而教育程度并无影响3.显示出原先被隐含联系例6.某项研究年龄与出国旅游愿望之间关系的调研项目变量1.年龄:
小于45岁;大于45岁变量2.出国旅游愿望:
有,无表七结论:
年龄不是影响人们出国旅游愿望的因素100%100%列总计50%50%有50%50%无500500被调查者数大于45岁小于45岁年龄出国旅游愿望现引入第三变量:
性别表八200200300300被调查数100%100%100%100%列总计35%65%60%40%否65%35%40%60%有45以上小于4545以上小于45年龄年龄女男性别出国旅游愿望结论:
年龄与出国旅游的愿望有关,男性中小于45岁者有更多人有出国旅游的愿望,而女性中大于45岁者有更多人有出国旅游的愿望(四)不改变原先反映出的联系例7.某项研究家庭规模和经常外出吃快餐之间的关系的项目.变量.1:
被调查者家庭规模:
大和小变量。
2:
经常外出吃快餐:
是和否表九.结论:
两者无直接关系。
引入第三变量:
收入水平(高和低)见表11500500被调查数100%100%列总计35%35%否65%65%是大小家庭规模经常外出吃快餐表十结论:
两者无直接关系250250250250被调查者数100%100%100%100%列总计35%35%35%35%否65%65%65%65%是大小大小家庭规模高低收入水平经常外出吃快餐三、交叉列表中变量的选择和确定1.是关系到分析结果的关键因素之一。
例8.某保险公司关于交通事故调查的记录内容如下:
保户14030,其中62%从未出过事故,38%出过一次以上事故。
(1)按变量性别和是否出过事故列出以下交差列表。
表十一男性和女性驾驶员的事故比率69507080被调查总数32%44%至少出过一次事故68%56%未出过事故女性男性结论:
男性事故比率高于女性
(2)把“驾驶里程”作为第三个变量因素加入进行研究,例如下交叉列表:
表十二5035191520705010被调查总数25%52%25%52%至少出过一次事小于10000大于10000小于10000大于10000女性男性结论:
事故发生率多少是与驾驶的里程多少相关,而不是性别.思考题:
为何出现错误结论?
2.变量的确定必须在资料收集之前.3.交叉列表分析中变量的数量和内容的选择考虑调研与预测项目的特征:
有些项目的变量是确定的,有些项目的变量具有一定自由选择度.例企业实力:
市场占有率,产品质量.促销力度.品牌信誉.行业吸引力:
市场容量,利润率,竞争强弱,技术要求.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析