观众在选择电影过程中的行为分析与建模.docx
- 文档编号:7479185
- 上传时间:2023-01-24
- 格式:DOCX
- 页数:37
- 大小:686.15KB
观众在选择电影过程中的行为分析与建模.docx
《观众在选择电影过程中的行为分析与建模.docx》由会员分享,可在线阅读,更多相关《观众在选择电影过程中的行为分析与建模.docx(37页珍藏版)》请在冰豆网上搜索。
观众在选择电影过程中的行为分析与建模
观众在选择电影过程中的行为分析与建模
哈尔滨理工大学陈金凯、刘宇、杨航
摘要
随着国民收入及其生活质量的提高,精神娱乐生活的质量已经越来越受到人们的重视。
而观看电影已成为大部分人们精神生活中的重要组成部分。
近年来,我国电影票房呈现跨越式增长,票房的增幅使电影业吸收了大量的投资,为我国经济发展做出了巨大贡献。
而观众在选择电影过程中的行为影响着票房,所以我们有必要对观众行为进行准确深入的了解。
本文选取哈尔滨地区的普通电影观众作为研究对象。
通过抽样调查问卷对观众选择行为进行测量、分析与建模。
在对观众行为进行分析时,根据对所获得的调查问卷的统计分析,提出影响观众选择电影过程中的几个重要因素:
上映档期、电影产地、演员与导演、以及电影题材,然后对以上几个因素进行建模分析。
本文首先根据实际调查研究的情况,用联合分析的方法构建起本文的观众从电影中获得的总效益模型;然后将实际调查研究的数据输入适于联合分析方法建模的专业统计软件(本文运用SPSS17.0)进行建模和实际数据的分析,并结合聚类分析;最后通过最小二乘法进行参数估计,得出本文中上映档期、电影产地、演员与导演、电影题材等因素之间的关系以及影响效果。
通过本文的研究,对电影投资方正确进行自身定位、满足观众的需求以及提高票房收益具有指导意义。
关键词:
电影联合分析聚类分析市场细分最小二乘法回归模型
一、绪论
(一)研究的目的与意义
随着经济的发展和社会的进步,我国居民的生活方式也在发生着巨大的改变,休闲娱乐的时间在人们的生活中所占比重逐步增大,看电影已成为当今人们休闲娱乐的最主流方式,因而电影市场有着巨大的发展潜力。
目前世界电影业正处于蓬勃发展阶段,国外电影想在国内市场占有一席之地,国产电影也不甘落后。
同时,随着观众数量的不断增长和竞争方的不断增加,电影投资方除在电影制作方面加大力度外,也更观众观众的满意状况及其获得的总效用;而观众也面临着更多的选择,其行为表现得更多样化。
因此,对观众的行为分析不仅是当前电影市场的需要,也是对我国电影发展方向的深入探究。
对于研究观众在选择电影中的行为,主要有一下几方面的意义:
(1)通过分析观众的选择行为来发现观众的潜在需求,明确观众的需要和期望;
(2)提高观众所获得的总效用,有助于我国电影市场的发展;(3)增强国产电影的市场竞争力;(4)明确影响票房的主要因素,节省投资,增加收益,促进经济发展。
(二)研究对象及调查样本描述
1.研究对象
本文所采用的抽样调查方法为简单随机抽样,调查方法为人员访谈法。
数据来自2011年6月1日至6月15日,哈理工大学学生在哈尔滨华晨、万达、金安影院的调查问卷。
2.样本描述
根据数据处理需要,调查共有两组,第一组关于电影观看者行为的问卷,采用街坊的形式,在各大影院门口随机访问电影观看者,共发放问卷330份,回收有效问卷273份。
其中男性受访问者143人,占总受访问人数的52.03%,女性访问者130人,占总受访问人数的47.97%。
20岁以下的受访问者47人,占总受访问人数的17.22%,21至30岁的受访问者140人,占总受访问人数的51.28%,31至40岁的受访问者35人,占总受访问人数的12.82%,40岁以上的受访问者51人,占总受访问人数的18.68%。
受访问者的职业包括学生,教师,医护人员,个体,记者,公务员,司机,自由职业等。
后一组问卷是在对第一次调查结果的分析基础上,确定了观看者选择电影时考虑到重要属性及属性水平,根据这些属性和属性水平构造了一些虚拟电影,在华晨影院和万达影院门口随机访问了30名观看者,其中男性受访问者15人,占总受访问人数的50%,女性受访问者15人,占总受访问人数的50%。
二、研究理论方法的简单介绍
(一).联合分析的基本理论
联合分析是在已知受测者对某一受测体集合(asetofstimuli)整体评估结果(overallevaluation)的情形下,经过分解的方法去估计其偏好结构的一种分析方法。
在联合分析中,受测体是由研究人员事先依照某种因子结构加以设计的。
联合分析的目的在于将受测者的整体反映加以分解,从受测者对受测体的整体评估结果中估计每一受测体成分的效用。
联合分析是多变量分析技术中的一种相依方法。
M.安蒂拉(M.Anttila)等人曾指出联合分析具有以下优点:
(1)联合分析既可以分析度量属性(如价格)的重要性,又可以分析非度量属性(如品牌名称)的重要程度。
(2)资料收集的程序简单易行,受测者只需要对受测体进行排序(rank)或者平分(score)。
联合分析对受测者只做很少的要求就可得到相当可靠的资料。
(3)联合分析要求受测者考虑各个属性之间的兑换(trade-off),比直接询问受测者其理想点(ideal-point)的属性水平及属性重要性来得实际。
(4)联合分析所求出的成分效用值可供做尺度不同的属性或是更基本的非度量属性的直接比较,而这些比较因素正是人们选购决策所面临的事实问题。
[1]
(二)联合分析常用的数据收集方法
联合分析中,收集数据的常用方法有:
(1)二因素法,又称兑换法(trade-offapproach)。
(2)整体轮廓法(full-profileapproach),他是最常用的一种表现方法,因为它比较接近于现实,还可以通过部分因子设计减少比较的个数。
(3)两两比较发(pairwisecomparisonapproach),它将前两种方法结合起来、
在对属性和水平的描述中,当属性个数或水平数较多时,析因设计会产生大量的组合,令受测者无法对其一一排序,因此这里需要找到一个合适的子集来代替全集,并且保持全集的某些性质。
部分析因设计(fractionalfactorialdesign)是最常用的定义受测体子集的方法。
部分析因设计选择可能的受测体的一个样本,受测体的数目取决于受测者使用的合成原则。
通常可以采用对称正交设计(一个因子中的每个水平出现相同的次数,水平与属性之间没有相关关系)。
本文即采用这种对称正交设计产生子集。
(三)聚类分析的基本理论
在古老的分类学中,人们主要靠经验和专业知识,很少利用数学方法。
随着生产技术和科学的发展,分类越来越细,以致有时仅凭经验和专业知识还不能进行确切分类,于是统计这个有用的工具逐渐被引入分类学中,形成了数值分类学。
近些年来,数理统计的多元分析方法有了迅速的发展,多元分析的技术自然被引入分类学中,于是从数值分类学中逐渐分离出聚类分析这个新的分支。
我们认为,所研究的样品或指标(变量)之间存在着程度不同的相似性(亲疏关系)。
于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间的相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品(或指标)又聚合为另外一类……关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的样品(或指标)都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。
最后再把整个分类系统画成一张分群图(又称谱系图),用它把所有的样品(或指标)间的亲疏关系表示出来。
聚类分析不仅可以用来对样品进行分类,也可以用来对变量进行分类。
对样品的分类常称为Q型聚类分析,对变量的分类常称为R型聚类分析。
[1]
三、研究框架和模型构建
(一)研究框架
)ointa)eavluation)t.
(二)模型构建
从经济学角度来看,商品(即我们讨论的受测体)会给人们带来满足,经济学家用“效用”(utility)这个词来描述这种满足程度,本文中,电影即为我们讨论的商品。
这里假设由于电影的各种属性(或重要属性,如当期、演员与导演等)给人们带来满足,才使得电影具有效用,于是衡量各种属性(或因子)的水平的效用就用“成分效用”一词。
假设一种产品或服务有
种属性,每种属性有
种水平,则我们所用的模型可表示为:
产品
…,n的总效用=因子1水平
的效用+因子2水平
的效用+…+因子
水平
的效用
(假设产品是因子1的水平
,因子2的水平
,…,因子
的水平
组合而成)
数学表达式为:
计算特征效用的模型和方法有多种,一般地,人们主要用一般最小二乘法回归(OLS)模型、多元方差分析(MONANOVA)模型、Logistic回归(LOGIT)模型等方法。
这里我们选择的是最基本的最小二乘法(OLS)回归模型。
OLS模型对一组自变量组成的模拟矩阵进行分析,每个自变量表示一个属性水平的有或无;因变量是观众对于通过自变量所描述的一个轮廓的主观评价值。
\[2]
四、数据处理与模型分析过程
(一)研究设计和数据收集
1.属性及属性水平的确定
第一,属性的确定。
在第一阶段的调查中我们设计了档期,题材,演员导演,产地,广告宣传,投资方,编剧,影片效果作为备选属性。
调查显示,根据近300名受访问者的作答,观看者在选择电影的时候,考虑最多的是档期,题材,演员导演,产地这四个属性。
第二,属性水平的确定。
我们将电影产地的水平确定为港台,大陆,国外三个水平。
演员导演的水平确定为普通,著名,新人三个水平。
题材的水平确定为动作战争,爱情剧情,悬疑科幻三个水平。
上映档期的水平确定为随便,贺岁档,暑期档三个水平。
2.电影组合的确定。
根据这些属性和水平,我们可以得到3*3*3*3=81种可能的组合,显然这不适于做调查,因此采用SPSS软件的正交设计[3]进行筛选,从而确定9种组合(见表1)以代表全体。
表一正交子集
3.通过调查收集数据
我们请观众对虚拟电影进行评价,通过打分的方法调查消费者对虚拟电影的喜好,观看的可能性等,以揭示出受访的观看者对各属性的重视程度。
本文制作如下测试卡(表二),并将测试卡编入问卷,问卷见附录。
表二测试卡
在本案例中,受访问者需要对估计数据集的9个属性组合进行打分评价,表二最后一栏就是消费者按自己的偏好对9种虚拟电影的打分。
所打的分数即可看做是总效用值
(二)数据分析结果
从收集的信息中分离出观众对每一属性以及属性水平的偏好值,这些偏好值也就是该属性的“效用”。
将数据录入SPSS17.0,运用编程进行联合分析,得到如下结果:
1.个人层面效用系数分析及模型拟合优度的检验
1.1以下是某位观众对于各个属性的不同偏好情况。
模型描述
属性
水平数
与排列或得分相关
电影产地
3
离散
演员导演
3
离散
电影题材
3
离散
上映档期
3
离散
表三模型描述
从表三可以看出所有因子都是正交因子
实用程序
属性
水平
水平值的效度
电影产地
国外
.889
大陆
-1.444
港台
.556
演员导演
新人演员导演
-.444
普通演员导演
-1.111
著名演员导演
1.556
电影题材
爱情剧情片
2.556
悬疑科幻片
-1.111
动作战争片
-1.444
上映档期
随便
-.444
贺岁档
-.111
暑期档
.556
(常数)
4.444
表四实用程序
表四水平值的效度栏表示该特征水平对该消费者而言的效用。
效用越高,则表示该特征水平越受欢迎,表现为表中数值的绝对值越大。
联合分析的特殊功能在于它可以预测电影的前景,在得到属性水平值的效度后,可以对电影的各种属性进行配置组合。
微观经济学理论中认为效用是可以相互替代和累加的。
如在该观看者心目中:
著名演员导演比新人演员导演所能带来的效用高2;爱情剧情片比动作战争片所能带来的效用高4。
由新人演员导演创作的爱情剧情片所带来的效用为2.112(2.556-0.444);由著名演员导演创作的动作战争片所带来的效用为0.112(1.556-1.444)。
题材的效用可以弥补该受访问者对演员导演的认识,电影想赢得该观看者,只需拍摄爱情剧情的题材就可以,即使是由新人演员导演创作的。
假设该观看者想看国外的电影那么可以考虑以下三种组合:
(1)著名演员导演动作战争片暑期档;
(2)新人演员导演爱情剧情片随便;
(3)普通演员导演悬疑科幻片贺岁档
分别计算三种电影对该观看者的效用,计算结果如下:
U1=U(产地+演员导演+题材+档期)=0.889+1.556+(-1.444)+0.556=1.557
U2=U(产地+演员导演+题材+档期)=0.889+(-0.444)+2.556+(-0.444)=2.557
U3=U(产地+演员导演+题材+档期)
=0.889+(-1.111)+(-1.111)+(-1.111)=-2.444
由以上结果可知到U2>U1>U3,因此在该观看者心目中,电影
(2)的效用值最大,即该电影应具有的属性水平为:
外国,新人演员导演,爱情剧情片,随便档期。
重要性值
电影产地
23.333
演员导演
26.667
电影题材
40.000
上映档期
10.000
表五相对重要程度
表五为相对重要程度表,表示该特征在观众选择电影是所关心该因素的程度。
可见,对此观看者而言,电影题材是他所关心的,此属性的相对重要程度为40%,其次为演员导演,重要度为26.667%,再次为电影产地,重要度为23.333%,最后为上映档期,重要度为10%。
那么在选择是否观看一部电影时,该观看者首先会考虑它的题材,然后在考虑其他的因素。
1.2模型拟合优度的检验
值
Sig.
Pearson的R
1.000
.
Kendall的tau
1.000
.000
表六拟合优度
对联合分析进行拟合优度检验,这里使用斯皮尔曼的rho检验和肯德尔的tau检验。
由上表可见,两个相关系数的检验都非常显著,模型拟合的精度相当高,所以认为联合分析模型所做出的假设和得出的成分效用值是合理的,可以说明该观众在选择电影时的偏好结构。
下面是各属性水平的效用图
图1
图2
图3
图4
图5
2.总体层面效用系数分析及模型拟合优度的检验
2.1以下是总体观看者对于各个属性的不同偏好情况
模型描述
水平数
与排列或得分相关
电影产地
3
离散
演员导演
3
离散
电影题材
3
离散
上映档期
3
离散
表七模型描述
从表七可以看出所有因子都是正交因子。
实用程序估计
标准误
电影产地
国外
.274
大陆
-.237
港台
-.037
演员导演
新人演员导演
-.537
普通演员导演
-.237
著名演员导演
.774
电影题材
爱情剧情片
-.015
悬疑科幻片
.119
动作战争片
-.104
上映档期
随便
-.115
贺岁档
.052
暑期档
.063
(常数)
4.526
表八实用程序
重要性值
电影产地
23.000
演员导演
59.000
电影题材
10.000
上映档期
8.000
表九相对重要程度
表九可以看到,对这30个受访者的整体来说,在预测偏好时最重要的属性是演员导演(59%),其次是电影产地(23%),再次是电影题材(10%),最后是上映档期(8%)。
从表八可以分别分析每个具体属性水平的部分效用值。
电影产地:
国外的分值效用最大为0.274,且远高于大陆和港台。
究其原因可能是外国电影的制作效果较好,情节新颖,而且表明中国的观众已经开始乐于了解外国文化。
演员导演:
著名演员导演的分值效用最大为0.774这与我们的直观印象相符。
从而看出人们还是比较喜欢演员名气大,导演水平较高的电影。
所以演员和导演的名望也在很大程度上影响了一部电影是否会受到好评得到票房。
对于由新人演员导演创作的电影想要获得较大收益是有一定的挑战的。
电影题材:
悬疑科幻片的分值效用最大为0.119。
而爱情剧情片和动作战争片的分值效用较低分别为-0.015和-0.104。
从而看出大家比较喜欢看悬疑科幻类型的电影,这类题材的电影的发展空间很大。
而最近上映的《阿凡达》《2012》等科幻电影获得了巨大的成功,也印证了我的结论。
上映档期:
这个因素是所有因素中影响最小的,但从结果中可以看出暑期档和贺岁档的分值效用还是比较高的分别为0.63和0.52。
所以电影的档期也是影响效果的一个重要因素。
电影在选择上映时也应该考虑到上映的档期问题。
从上述分析中,我们看到国外著名演员和导演的悬疑科幻片是大家比较喜爱的电影类型,若在暑期档上映则能更占优势。
2.2模型拟合优度的检验
相关性a
值
Sig.
Pearson的R
1.000
Kendall的tau
1.000
.000
表十拟合优度
这里仍然使用斯皮尔曼的rho检验和肯德尔的tau检验,由上表可见,两个相关系数的检验都非常显著,模型拟合的精度相当高,所以认为联合分析模型所做出的假设和得出的成分效用值是合理的,可以说明观众在选择电影时的偏好结构。
下面是各属性水平的效用图。
图6
图7
图8
图9
图10
3.男女分组的效用分析
上面是对观众总体层面的选择偏好分析,实际上由于观众自身特征的不同,使得属性水平的分值效用在被访问者中存在差异。
因此我们继续考察电影的选择偏好是否与性别存在相关性。
下面是对男性调查者的分析结果。
实用程序
实用程序估计
标准误
电影产地
国外
.570
大陆
-.407
港台
-.163
演员导演
新人演员导演
-.630
普通演员导演
-.052
著名演员导演
.681
电影题材
爱情剧情片
-.674
悬疑科幻片
.259
动作战争片
.415
上映档期
随便
-.074
贺岁档
-.119
暑期档
.193
(常数)
4.741
表十一实用程序
重要性值
电影产地
26.506
演员导演
35.542
电影题材
29.518
上映档期
8.434
表十二相对重要程度
由上表可以看出,在预测偏好时对于男性来说最重要的属性是演员导演,其次是是电影题材,再次电影产地,最后是上映档期。
男性更愿意观看国外电影,他们倾向于观看动作战争片和悬疑科幻片。
具体属性水平效用图见附录。
下面是对女性调查者的分析结果。
实用程序
实用程序估计
标准误
电影产地
国外
-.022
大陆
-.067
港台
.089
演员导演
新人演员导演
-.444
普通演员导演
-.422
著名演员导演
.867
电影题材
爱情剧情片
.644
悬疑科幻片
-.022
动作战争片
-.622
上映档期
随便
-.156
贺岁档
.222
暑期档
-.067
(常数)
4.311
表十三实用程序
重要性值
电影产地
5.000
演员导演
42.143
电影题材
40.714
上映档期
12.143
表十四相对重要性
由上表可以看出,在预测偏好时对于女性来说最重要的属性是演员导演,其次是是电影题材,再次上映档期,最后是电影产地。
此结论与男性的结果基本相似,其中演员导演与电影题材都排在了前两位。
说明电影的这两个因素的确很重要。
女性更愿意观看爱情剧情片。
而对于女性观众,她们并不看重电影的产地,在这个方面与男性观众稍有不同。
具体属性水平效用图见附录。
4.市场细分
市场细分是在计算出观看者个人的效用函数后,通过聚类分析[4],将观看者划分为不同的观看群体,然后将这些群体作为同质个体处理。
这样能更准确的为电影市场发展提供建议。
以下是通过聚类分析得到的结果。
[5]
AgglomerationSchedule
Stage
ClusterCombined
Coefficients
StageClusterFirstAppears
NextStage
Cluster1
Cluster2
Cluster1
Cluster2
1
1
29
3.902
0
0
8
2
8
22
4.457
0
0
3
3
8
9
5.476
2
0
7
4
4
6
5.609
0
0
23
5
2
28
6.384
0
0
13
6
12
26
6.779
0
0
12
7
8
20
7.872
3
0
10
8
1
5
8.656
1
0
14
9
24
27
10.384
0
0
14
10
8
13
10.488
7
0
11
11
8
15
12.547
10
0
15
12
7
12
12.955
0
6
18
13
2
21
13.452
5
0
26
14
1
24
13.894
8
9
19
15
8
18
14.486
11
0
16
16
8
19
16.196
15
0
23
17
17
30
16.343
0
0
22
18
7
11
16.457
12
0
21
19
1
23
16.584
14
0
24
20
10
16
17.713
0
0
24
21
7
25
18.616
18
0
28
22
14
17
20.086
0
17
25
23
4
8
20.488
4
16
26
24
1
10
21.518
19
20
29
25
3
14
24.882
0
22
27
26
2
4
24.897
13
23
27
27
2
3
27.768
26
25
28
28
2
7
28.776
27
21
29
29
1
2
28.936
24
28
0
表十五
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
1 1 ─┬───────┐
29 29 ─┘ ├─────────┐
5 5 ─────────┘ ├─────┐
24 24 ─────────────┬─────┘ ├─────────┐
27 27 ─────────────┘ │ ├─────────────┐
23 23 ─────────────────────────┘
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 观众 选择 电影 过程 中的 行为 分析 建模