纪浩然市场调研分析工具SPSS操作基础.docx
- 文档编号:25705358
- 上传时间:2023-06-11
- 格式:DOCX
- 页数:13
- 大小:188.68KB
纪浩然市场调研分析工具SPSS操作基础.docx
《纪浩然市场调研分析工具SPSS操作基础.docx》由会员分享,可在线阅读,更多相关《纪浩然市场调研分析工具SPSS操作基础.docx(13页珍藏版)》请在冰豆网上搜索。
纪浩然市场调研分析工具SPSS操作基础
市场调研分析工具:
SPSS操作基础
纪浩然
学习导航
通过学习本课程,你将能够:
●掌握SPSS的基本操作;
●熟知SPSS基本分析模块;
●了解统计分析的基本概念。
市场调研分析工具:
SPSS操作基础
一、SPSS基本操作
1.SPSS的基本认识
SPSS是市场调查的有效工具之一,对这一工具应当具备以下基本认识:
SPSS的输出结果基本和office兼容
SPSS提供了一个类似于Excel的操作界面,同时SPSS可以打开Excel文件。
由于很多公司的各类信息是录入到Excel文件中的,这样就能够顺利地将相关信息导入SPSS。
SPSS具备很好的画图功能
SPSS可以将各类信息整理成各类实用而清晰的图表,这是很多公司都非常关心的一项功能。
图1 SPSS的操作界面
如图1所示,SPSS的操作界面与Excel非常相似,这款软件是20世纪50年代斯坦福大学的三个研究生研发成功的,此后不断发展成为世界上最著名和客户占有量最大的统计软件。
2009年,这一软件被IBM公司收购,随后在商务上得到快速推进,因为IBM计划将SPSS打造成一款商务智能软件,而不是只局限在高校范围内。
比如,该软件有一个“直销”(Directsells)模块,这是在数据分析中经常用到的模块,里面放入了一些非常著名的商务分析模型,如客户价值判断模型(RFM),这一模型可以根据客户的购买频次、购买金额、最后一次购买时间等信息,对客户做出价值判断并进行分组,这些都是SPSS被IBM收购后发生的变化。
目前,中国移动、各大银行、淘宝网等知名公司都在应用这些数据分析模块。
由于国内的软件版权保护制度比较落后,IBM目前并不以软件销售作为主赢利渠道,而是主要通过商务咨询和相关服务获取利润。
2.SPSS的操作流程
SPSS的主要操作流程大致可以分为五部分:
第一,数据读入——是将相关数据读入SPSS中;
第二,数据预处理——数据读入后,要稍微做一下预处理才能继续操作;
第三,模型处理——选择一个模型进行分析,然后SPSS就会输出相应的结果;
第四,结果解读——对输出的结果要进行必要的解读;
第六,结果二次处理——最后对结果进行一些再处理。
3.SPSS的操作示例
SPSS的操作基础示例1
动作1:
用SPSS打开一个Excel文件。
点击“打开数据”,并在目录中找到名为“数据购买”的示例文件。
由于SPSS默认的是打开文件名为“sav”的文件,所以要在文件名下拉框中选择文件名为“xls(x)”的Excel文件。
打开界面后,如果Excel文件的第一行有表头,就要勾选;如果没有表头,就点击“确定”,这样就能将Excel文件读入SPSS。
数据读入后能够发现,这是一张市场调查的结果文件,这时会看到两个不同的标签,一是数据视图;一是变量视图,也就是将变量的属性放到视图中去。
然后打开“变量视图”,如图2所示。
图2 变量视图
动作2:
在变量视图中改变“值”,如性别。
变量视图包括表头、宽度小数等内容,尤其是其中的“值”应当予以特别关注,只有完成相关的赋值才能够进行分析。
动作3:
采用“分析-比较均值-均值”,分析不同性别的受访者的产品消息来源、购买来源、购买原因和书价。
在表头中选择“性别”,将其放入“自变量”,然后按“shift”键统一选中消息来源、购买来源、购买原因和书价等进行基本操作,再点击“选项”就会发现不同性别的各类值,在此只关注均值,去掉个案数和标准差。
然后点击“确定”就会输出相应的结果。
SPSS的输出结果有时会非常复杂,为了将其简单化,可以只选择其中的重要部分,对于那些用处不大且比较晦涩的不妨略过。
由于SPSS每次处理都是模式化的,所以当操作熟练后就会得心应手。
在上面的示例中,为了更直观地获取感性认识,采用了“反例”手法,也就是先有了选项和平均值,再点击数据窗口切换到原数据,为了让输出结果中“1”代表男,“2”代表女,可以进入变量视图,在“性别”栏中双击“无”,然后在弹出的窗口中添加用“1”代表男,“2”代表女,然后点击确定。
这时要想在数据视图中检查某个值是否被标记过,可以在“视图”上点击“值标签”,这样设置完的值就会显示出来。
然后可以用同样的方法再进行一遍正常操作,由于之前的“比较均值”和“均值”等已经完成,所以不需要改动,直接点击确定即可,然后就会发现结果的变化。
SPSS的操作基础示例2
动作1:
绘制散点图。
在Excel操作中经常会用到许多图表,如柱状图、饼状图、散点图、射线图、曲线图、气泡图、雷达图、双轴图等,这些图在SPSS中都有,而且分析功能更加强大。
接前文示例1所述,为了分析不同年龄受访者购书价格的分布情况,就可以采用散点图的方式。
绘制散点图可以很好地呈现出数据的分布特征,在实际工作中非常有用,是图形分析的基本功。
具体操作是使用“图形改造程序”或旧版对话框,然后点击“散点图”并为其定义,在X轴中放入书价,在Y轴中放入年龄。
为了使散点图承载的信息量更大,便于更好地根据不同性别进行数据分析,可以打开“设置标记”并点击“确定”,这时就可以看到图中的要素分为几个层次:
首先是书价,从100元一直到700元;其次是年龄,在X轴上呈递增分布;然后可以将男女性别拆分开来,用不同的颜色代表两种性别,分别观察男性受访者和女性受访者的购书数据分布状况。
具体内容如图3所示。
图3 散点图
动作2:
在“图标编辑器”中更改颜色。
为了使图表呈报得更加清晰,可以双击这张图进入“图标编辑器”,双击女性的某个散点进行“预览”,这时就可以更改代表女性的散点图标的格式,比如大小、边框、颜色等。
在这里将其大小改为“10”,边框改为醒目的红色,然后点击“应用”并关闭图标编辑器,图中代表女性的散点图标就会完成更改。
回到图中可以发现,20岁到30岁的女性购书花费比较高,结论是这个年龄段的白领女性购买力较强,而且学习充电的动力很大,所以购书花费较多。
通过上面的示例可以看出,要想绘制出各类实用美观的图表,一是要了解绘图中的X轴、Y轴、设置标记以及面板依据中行、列的意义;二是要了解和掌握图标编辑器的基本功能。
二、SPSS基本分析模块
在市场调研分析中,最常用到的SPSS模块是“数据”、“转换”和“分析”,其中“数据”和“转换”主要是用来做SPSS的商业数据的预处理,而“分析”主要用于各种各样的建模,里面包含了大部分常用的基本分析模块。
具体内容如图4所示。
图4 SPSS的三个常用主模块
在图4的模块下面,市场调查中常用的SPSS基本分析模块主要包括描述统计、交叉表(crosstable,也叫列联表)、相关、回归、分类、降维、多重相应和最优尺度等。
具体内容如表1所示。
表1 SPSS的常用基本分析模块表
模块
作用
子模块/进一步描述
描述统计
通过对数据的基本特征的描述和探索,揭示数据的特征
频率、描述、探索
交叉表
以行列表的方式揭示数据间关系
例如不同性别的客户在购买方面是否不同
相关
分析变量之间是否有相关关系
是否正相关、负相关、无关
回归
揭示变量之间的关系
分为线性回归、logistic回归等
分类
用来做客户分群
聚类、判别分析等
降维
简化指标体系,前提是指标之间足够相关
广泛用于市场调查、人力资源管理、经济分析等领域
多重相应
分析多选题和排序题
最优尺度
适合于因变量和自变量都是离散型并且未必等距的情况
三、统计分析基本概念
统计分析中涉及的基本概念主要包括:
方差和均值、置信度、离散量和连续量、标准化、加权个案、假设检验、检验P值和R平方(R2)等。
1.方差和均值
方差和均值的定义
方差。
方差,主要是用来反映某段数据中数值变量的波动状况。
比如,如果A股大盘指数的方差很大,就说明股票市场还不够成熟,因为成熟的股票市场的波动应当较小。
与其相关的一个概念是标准差。
均值。
均值,就是多个数据的平均值。
如一个公司的平均工资水平、销售的平均业绩等。
方差和均值的作用
方差和均值有着各自不同的作用:
均值反映数据的平均水平,而方差则反映数据的波动情况。
例如:
对于均值相同的两个销售团队,方差小,说明这个团队成员的销售业绩比较平均;方差大,则说明团队成员的销售业绩差距较大,高的高,低的低。
方差和均值的示例
如图5所示,这是两个销售员的业绩数据,将销售1和销售2放到因变量中,将自变量保持不变,然后做一个选项。
这时可以忽略个案数和标准差,只关注平均数和方差,这时就会出来一个报告。
通过报告可以看出,两个销售人员销售数据的均值相同,但销售1的方差为72.727,销售2的方差则是418.182,由此可以得知前者各个月度的销售额差别较小,而后者各个月份的销售额则波动很大。
图5 方差和均值数据分析示例
2.置信度
置信度(Confidence),也叫置信水平,它是指特定个体对待特定命题真实性相信的程度。
例如,找100位金融行业的老总,经过薪资收入水平调查后得出的结果是,95%的金融行业老总的年平均收入在80~100万元人民币,这时就可以说金融行业老总年收入在这一区间的置信度是95%,80~100万元的区间则称为置信区间。
置信区间越大,置信度就越高,例如金融行业老总在0~1000万年收入的置信区间内的置信度几乎为100%。
3.离散量和连续量
离散量
离散量的定义。
离散量,就是一组跳跃的值。
例如:
某品牌或产品是否被客户接受,其结果要么是“是”,要么是“否”,非此即彼,这就是典型的跳跃值。
离散量的分类。
离散量可以分为二项(二元跳跃)、名义值和有序值三类。
二项:
即二元跳跃,只有非此即彼的两个值,例如经济是否增长、是否患病、品牌是否被接受。
名义值:
多个值,但是其之间没有明显的排序关系,如n个城市、m个品牌。
在做数据分析时,销售团队可能分布在多个城市,或者是像宝洁公司一样有多个品牌的“品牌簇”,这时各个城市或品牌之间的值就是跳跃的,相互之间也没有明显的排序关系。
有序值:
有序列关系。
例如空气质量标准欧III、欧IV、欧V,这组数值之间有着明显的递进排序关系,这就是有序值离散量。
要点提示
离散量的分类:
①二项(二元跳跃);
②名义值;
③有序值。
连续量
连续量就是在数值上可以连续变的值,如年龄、啤酒饮用量、渠道铺货率,显然都是连续量。
4.标准化
在数据处理时,经常会出现数据级别差异太大的情况,此时一般需要标准化,通俗地讲,就是“把数据变得差不多大,这样就好处理了”。
例如:
在统计游客数量时,人少时游客数可能是7人,人多时则有2000多人,而在计算景区资金支出时,最少时是700元,多时则有4万多元,这时就需要在SPSS中通过数据转换,既保留各个数值原来的特征,又让这些数据看上去差别不那么大。
具体的操作路径是“分析”—“描述统计”—将四个变量选进去—勾选“将标准化得分另存为变量”,这时就能将其另存为新的四列变量,每一列之前都加了一个“z”,这个“z得分”就是标准化。
5.假设检验
在生活中,实际上就存在很多假设检验,如在与人打交道时就经常发生这一过程。
如图6所示。
图6 假设检验的示例
之所以要了解假设检验,是因为在分析模型中,经常要先做一个假设,然后再去检验统计的量值(俗称“检验P值”)与现实的符合情况。
假设检验的步骤为:
第一,设定虚拟假设H0;
第二,设定对立假设H1;
第三,决定显著水平(α);
第四,选择适当的检验统计量,以及决定危险域(放弃域的临界点);
第五,计算所选检验统计量的观察值;
第六,结论:
当检验统计量的观察值落入危险域,放弃虚拟假设H0,反之则接受。
6.检验P值和R平方
检验P值
检验P值在SPSS的操作中使用极其广泛,几乎所有的检验分析过程都会用到检验P值。
一般来说,检验P值低于5%,就认为差异效果是明显的,而高于5%,则认为差异效果不显著。
例如在前文“置信度”的例子中,金融老总的收入位于80~100万区间的置信度是95%,这时检验P值就是5%(1-95%),在现实统计中如果要衡量该假设是否成立,就要用该项数据与5%的标准进行比较。
R平方
在销售预测等统计分析中,很多情况下要做回归,R平方则是回归或者曲线拟合中的重要指标,它是一个介于0~1的数,越接近1,表示拟合效果越好。
比如,在分析中做了某项预测,如果多个模型中最高的拟合值是0.995,就表明该模型拟合效果最好,应当选择使用该模型。
毋意,毋必,毋固,毋我。
____《论语·子罕篇》
君子有九思:
视思明,听思聪,色思温,貌思恭,言思忠,事思敬,疑思问,忿思难,见得思义。
____《论语·季氏篇》
君子不器。
____《论语·为政篇》
成事不说,遂事不谏,既往不咎。
____《论语·八佾篇》
见贤思齐焉,见不贤而内自省也。
____《论语·里仁篇》
往者不可谏,来者犹可追。
____《论语·微子篇》
巧笑倩兮,美目盼兮,素以为绚兮。
____《论语·八佾篇》
父母在,不远游,游必有方。
____《论语·里仁篇》
君子泰而不骄,小人骄而不泰。
____《论语·子路篇》
我非生而知之者,好古,敏以求之者也。
____《论语·述而篇》
可与言而不与之言,失人;不可与言而与之言,失言。
知者不失人亦不失言。
____《论语·卫灵公篇》
不患无位,患所以立。
不患莫己知,求为可知也。
____《论语·里仁篇》
中人以上,可以语上也;中人以下,不可以语上也。
____《论语·雍也篇》
德不孤,必有邻。
____《论语·里仁篇》
君子欲讷于言而敏于行。
____《论语·里仁篇》
知者乐水,仁者乐山。
知者动,仁者静。
知者乐,仁者寿。
____《论语·雍也篇》
吾十有五而志于学,三十而立,四十而不惑,五十而知天命,六十而耳顺,七十而从心所欲不逾矩。
____《论语·为政篇》
名不正,则言不顺;言不顺,则事不成____《论语·子路篇》
未知生,焉知死?
____《论语·先进篇》
父母之年,不可不知也。
一则以喜,一则以惧。
____《论语·里仁篇》
人而无信,不知其可也。
大车无輗,小车无軏,其何以行之哉?
____《论语·为政篇》
己所不欲,勿施于人。
____《论语·颜渊篇》
志于道,据于德,依于仁,游于艺。
____《论语·述而篇》
益者三友,损者三友。
友直、友谅、友多闻,益矣;友便辟、友善柔、友便佞,损矣。
____《论语·季氏篇》
敏而好学,不耻下问,是以谓之文也。
____《论语·公冶长篇》
从心所欲不逾矩。
____《论语·为政篇》
投之亡地然后存,陷之死地然后生。
____《孙子兵法·九地篇》
今之孝者,是谓能养。
至于犬马皆能有养;不敬,何以别乎?
____《论语·为政篇》
忠告而善道之,不可则止,毋自辱焉。
____《论语·颜渊篇》
视其所以,观其所由,察其所安,人焉廋哉!
人焉廋哉!
____《论语·为政篇》
欲速则不达。
____《论语·子路篇》
朝闻道,夕死可矣。
____《论语·里仁篇》
逝者如斯夫!
不舍昼夜。
____《论语·子罕篇》
吾日三省吾身:
为人谋而不忠乎?
与朋友交而不信乎?
传不习乎?
____《论语·学而篇》
温故而知新,可以为师矣。
____《论语·为政篇》
不在其位,不谋其政。
____《论语·泰伯篇》
君子和而不同,小人同而不和。
____《论语·子路篇》
学而不思则罔,思而不学则殆。
____《论语·为政篇》
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浩然 市场调研 分析 工具 SPSS 操作 基础