第1讲概述及调查问卷设计PPT文档格式.ppt
- 文档编号:15573137
- 上传时间:2022-11-05
- 格式:PPT
- 页数:52
- 大小:432KB
第1讲概述及调查问卷设计PPT文档格式.ppt
《第1讲概述及调查问卷设计PPT文档格式.ppt》由会员分享,可在线阅读,更多相关《第1讲概述及调查问卷设计PPT文档格式.ppt(52页珍藏版)》请在冰豆网上搜索。
1212学时学时时间安排时间安排l上课时间:
上课时间:
6-8,12,14-176-8,12,14-17周周周三下午第四大节周三下午第四大节1515:
40174017:
2020周五上午第一大节周五上午第一大节88:
009009:
4040l上课地点:
经管楼上课地点:
经管楼C105C105l上机时间:
上机时间:
77周周三第四大节周周三第四大节88、1212、14-1614-16周周五第一大节周周五第一大节l上机地点:
经管楼商务上机地点:
经管楼商务D204D204l基本目标(鱼)基本目标(鱼)学习各种数据分析方法的基本原理学习各种数据分析方法的基本原理掌握掌握SPSS工具的使用工具的使用实现数据分析模型案例实现数据分析模型案例l高级目标(渔)高级目标(渔)基本数据分析的思维方式基本数据分析的思维方式具备对数据分析方面自学的能力具备对数据分析方面自学的能力l统计数据分析基础教程统计数据分析基础教程基于基于SPSSSPSS和和ExcelExcel的调查数据分析的调查数据分析,叶向主编,叶向主编,中国人民大学出版社,中国人民大学出版社,20102010l数据挖掘原理与数据挖掘原理与SPSSClementineSPSSClementine应用应用宝典宝典,元昌安主编,电子工业出版社,元昌安主编,电子工业出版社,20092009lSPSSSPSS应用实验教程应用实验教程,许涤龙主编,许涤龙主编,湖南大学出版社,湖南大学出版社,20072007l从最基本概念出发从最基本概念出发l从最基本的从最基本的SPSSSPSS操作开始学起操作开始学起l用数据分析方法作为课程的基础用数据分析方法作为课程的基础l以数据分析过程作为课程的主线以数据分析过程作为课程的主线l平时成绩平时成绩40%(40%(实验、作业、考勤实验、作业、考勤)l期末考试期末考试60%(60%(结课数据分析大作业结课数据分析大作业)l教学课件等资料、交流与讨论教学课件等资料、交流与讨论密码:
密码:
hebusthebust数据来源数据来源设计调查问卷,发放调查问卷,回收数据设计调查问卷,发放调查问卷,回收数据存储在数据库或其他文件中的数据存储在数据库或其他文件中的数据数据分析工具数据分析工具lExcelExcel、SPSSSPSS、SQLServerSQLServer等数据分析工具。
等数据分析工具。
lExcelExcel、SPSSSPSS侧重于统计数据分析,侧重于统计数据分析,SQLSQLServerServer侧重于对用数据库和数据仓库组织侧重于对用数据库和数据仓库组织的数据进行多维数据分析和数据挖掘,不的数据进行多维数据分析和数据挖掘,不同的数据组织形式可以互相转换。
同的数据组织形式可以互相转换。
统计数据分析举例统计数据分析举例为为了了了了解解护护士士们们对对工工作作的的满满意意程程度度,做做了了一一个个调调查查。
调调查查100100名名护护士士对对工工工工作作作作、工工工工资资资资和和升升升升职职职职机机机机会会会会的的满满意意程程度度。
这这三三个个方方面面的的评评分分都都是是从从00到到100100,分分值值越越大大表表明明满满意意程程度度越越高高。
另另外外,调调查查数数据据还还根根据据该该护护士士所所在在的的医医院院类型,分为类型,分为33类:
私人医院、公立医院和学院医院。
类:
(11)根根据据整整个个数数据据和和三三个个方方面面的的满满意意程程度度,判判断断哪哪一一方面是护士们最为满意的方面是护士们最为满意的?
哪一方面是最不满意的哪一方面是最不满意的?
(22)根根据据离离散散程程度度(标标准准差差、最最小小值值、最最大大值值、极极差差)的描述,判断护士们对哪一方面的满意程度差别最大的描述,判断护士们对哪一方面的满意程度差别最大?
(33)从从医医院院类类型型的的数数据据中中可可以以了了解解到到什什么么?
是是否否有有某某一类型的医院在三个方面的满意程度上优于其他医院一类型的医院在三个方面的满意程度上优于其他医院?
数据挖掘数据挖掘l数据挖掘就是从大型数据库的数据中提取人们感数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识,这些知识是隐含的、实现未知的潜兴趣的知识,这些知识是隐含的、实现未知的潜在的有用信息。
在的有用信息。
l数据挖掘的任务在于聚类(如神经网络聚类)、数据挖掘的任务在于聚类(如神经网络聚类)、分类(如决策树分类)、预测等。
分类(如决策树分类)、预测等。
l数据挖掘研究各种方法和技术,从大量的数据中数据挖掘研究各种方法和技术,从大量的数据中挖掘出有用的信息和知识:
关联规则、决策树、挖掘出有用的信息和知识:
关联规则、决策树、神经网络等技术。
神经网络等技术。
数据挖掘举例数据挖掘举例(关联规则关联规则)l市场购物分析:
根据被放到一个购物袋的(购物)市场购物分析:
根据被放到一个购物袋的(购物)内容记录数据而发现不同(被购买)商品之间所内容记录数据而发现不同(被购买)商品之间所存在的关联知识,帮助商家分析顾客的购买习惯,存在的关联知识,帮助商家分析顾客的购买习惯,制定有针对性的市场营销策略。
制定有针对性的市场营销策略。
l例如,顾客在购买牛奶时,是否也可能同时购买例如,顾客在购买牛奶时,是否也可能同时购买面包或会购买哪个牌子的面包,这样商家就可以面包或会购买哪个牌子的面包,这样商家就可以将牛奶和面包放在相近的地方或许会促进这两个将牛奶和面包放在相近的地方或许会促进这两个商品的销售。
商品的销售。
统计学与数据挖掘统计学与数据挖掘l统计学主要是对数量数据(数值)或连续值数据统计学主要是对数量数据(数值)或连续值数据(如年龄、工资等)进行数值计算的定量分析,(如年龄、工资等)进行数值计算的定量分析,得到数量信息。
得到数量信息。
l数据挖掘主要对离散数据(如职称、病症等)进数据挖掘主要对离散数据(如职称、病症等)进行定性分析(覆盖、归纳等),得到规则知识。
行定性分析(覆盖、归纳等),得到规则知识。
l统计学与数据挖掘是有区别的。
但是,它们之间统计学与数据挖掘是有区别的。
但是,它们之间是相互补充的。
是相互补充的。
课程主要内容课程主要内容调查问卷的数据获得方法及数据的录入与清理调查问卷的数据获得方法及数据的录入与清理定性变量定性变量(分类变量分类变量)常用分析方法:
常用分析方法:
u一维频率分析、交叉表分析、多选题的频率分析一维频率分析、交叉表分析、多选题的频率分析定量变量定量变量(数值型变量数值型变量)常用分析方法:
u描述统计分析、相关与回归分析、聚类分析、判别描述统计分析、相关与回归分析、聚类分析、判别分析、主成分分析与因子分析分析、主成分分析与因子分析调查数据分析步骤调查数据分析步骤l11确定调查目的和内容确定调查目的和内容l22设计调查问卷和发放问卷设计调查问卷和发放问卷l33数据收集数据收集l44问卷数据的录入与清理问卷数据的录入与清理l55数据分析数据分析l66撰写调查报告撰写调查报告第第1部分部分数据获得数据获得调查问卷设计及数据收集调查问卷设计及数据收集问卷数据的录入与清理问卷数据的录入与清理第第11章章概述概述1.11.1什么是统计什么是统计统统计计学学是是用用以以收收集集数数据据、分分析析数数据据并并进进而而由由数数据据得得出出结结论论的的一一组组概概念念、原原则则和和方方法法。
因因而而有有学学者者也也将将统计学称为统计学称为统计方法统计方法。
某某电电视视节节目目的的收收视视率率获获得得:
首首先先要要在在该该节节目目播播出出时时,利利用用电电话话对对看看电电视视的的人人进进行行采采访访,同同时时问问他他们们在在观观看看什什么么节节目目。
在在得得到到了了被被采采访访的的看看电电视视的的总总人人数数和和其其中中观观看看该该节节目目的的人人数数之之后后,就就得得到到这这部部分分观观众众中中观观看看该该节节目目的的比比例例,即即大大致致的的收收视视率率了了。
之之后后还还要要经经过过统统计计分分析析,评评估估这这个个收收视视率率的的可可信信度度和和代代表表性性等等。
显显然然,这这是是一一个个收收集集数数据据,然然后后通通过过分分析析数数据据得到结论的简单例子得到结论的简单例子。
1.1.22变量及其分类变量及其分类变变量量(variablevariable)是是用用来来描描述述总总体体中中成成员员的的某某一一特性的特性的。
在在搜搜集集数数据据的的过过程程中中,需需要要搜搜集集各各类类的的变变量量。
例例如如,性性别别、年年龄龄、职职业业、教教育育程程度度、收收入入等等人人口口统统计计变变量量。
又又如如,为为了了预预测测明明年年的的销销售售量量,所所搜搜集集到到的的数数据据如如广广告告费费、人人事事费费、销售人员数销售人员数等,也都是一种变量。
等,也都是一种变量。
在在现现实实生生活活或或自自然然界界中中的的一一些些现现象象,通通常常都都不不是是单单一一变变量量可可以以描描述述得得很很清清楚楚的的。
例例如如,要要描描述述某某一一个个人人,仅仅使使用用性性别别变变量量,说说他他(或或她她)是是男男性性(或或是是女女性性),肯肯定定是是无无法法说说明明白白的的。
但但随随着着变变量量(例例如如年年龄龄、肤肤色色、头头发发、身身高高、体重体重、种族种族等)的增加,可以逐渐描述得更清楚一些。
等)的增加,可以逐渐描述得更清楚一些。
1.1.22变量及其分类变量及其分类定定性性变变量量也也称称离离散散变变量量或或分分类类变变量量。
例例如如,使使用用的的手手机机品品牌牌、学学生生所所在在的的学学院院、就就读读的的班班级级、宗宗教教信信仰仰、参参加加的的社社团团、喜喜好好的的运运动动、最最常常饮饮用用的的饮饮料料类类别别、最最喜喜欢欢的的歌歌手手、最最喜喜欢欢的的影影星星、民民族族、党党派派,均均属属定定性性变变量量。
分分类类变变量量的的观观测测结结果果称称为为分分类类数数据据。
如如性性别别:
男男11、女、女22。
有有序序变变量量:
如如果果类类别别具具有有一一定定的的顺顺序序,这这样样的的变变量量也也称称为为有有序序变变量量,相相应应的的观观测测结结果果称称为为有有序序数数据据。
例例如如,成成绩绩:
优优55、良良44、中中33、及及格格22、不不及及格格11;
文文化化程程度度:
小小学学11、中中学学22、大大学学33、研研究究生生44;
职职称称:
教教授授44、副副教教授授33、讲讲师师22、助助教教11;
评评价价:
非非常常重重要要55、重重要要44、普普通通33、不不重重要要22、非非常常不不重重要要11;
对对事事物物的的态态度度:
赞赞成成11、中中立立00、反对、反对-1-1。
1.1.22变量及其分类变量及其分类l定定量量变变量量也也称称数数值值型型变变量量或或连连续续变变量量。
例例如如,成成绩绩、年年龄龄、收收入入、国国民民生生产产总总值值、体体重重、身身高高、智智力力、温温度度等等均均属属定定量量变变量量。
定定量量变变量量的的观观测测结结果称为定量数据果称为定量数据或或数值型数据。
数值型数据。
l在在实实际际应应用用中中,变变量量类类型型一一般般只只分分为为定定性性变变量量(分类变量)和(分类变量)和定量变量定量变量(数值型变量)两大类。
(数值型变量)两大类。
1.1.33数据的收集数据的收集(个体、总体和样本个体、总体和样本)要要想想了了解解石石家家庄庄市市民民对对建建设设石石家家庄庄交交通通设设施施是是以以包包括括轨轨道道运运输输在在内内的的公公共共交交通通工工具具为为主主还还是是以以小小汽车为主的观点,需要进行调查。
汽车为主的观点,需要进行调查。
调调查查对对象象是是所所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概述 调查 问卷 设计