国赛建模b题Word格式.docx
- 文档编号:19561177
- 上传时间:2023-01-07
- 格式:DOCX
- 页数:14
- 大小:136.74KB
国赛建模b题Word格式.docx
《国赛建模b题Word格式.docx》由会员分享,可在线阅读,更多相关《国赛建模b题Word格式.docx(14页珍藏版)》请在冰豆网上搜索。
三、模型假设
1.假设同一之间题中会员所在地域(、、、XX等地)的气候条件基本相同,气候差异不会对会员的任务完成情况产生实质性影响。
2.假设会员会以效率优先的原则选择最近的拍照地点,不倾向于在任务充足时刻意绕远路或进入其他城区进行拍摄。
3.假设会员完成任务能力彼此间差异较小可忽略
4.假设同一城市不同区之间的发展状况差异小于不同城市间发展状况差异
5.假设会员对完成任务的积极性相对稳定,一片区域内题中所给任务的完成与否可以体现出该区域会员的积极程度
四、符号说明
Ppt:
平台获得最大利润的定价
fd:
单位地区内平均价格
O:
聚类分析后单位地区定价
d:
会员接取可做任务的概率
td:
接取任务时间范围
np:
任务数量
五、模型的建立与求解
5.1.1影响任务标价主要因素的确认
在附件1中,我们可知835个位置不同的任务的标价与其完成情况。
对题干进行分析可知,所给条件下能够影响任务定价规律的客观因素仅有任务所在的位置以及与可完成其的会员相关情况。
假设任务标价仅与其所在位置(即经纬度)存在联系。
以表1中数据经度与纬度作为因变量,可得仅经纬度一项因素与任务价格分布相关关系:
VariablesEntered/Removeda
Model
VariablesEntered
VariablesRemoved
Method
1
任务gps纬度,任务gps经度b
.
Enter
a.DependentVariable:
任务标价
b.Allrequestedvariablesentered.
ModelSummaryb
R
RSquare
AdjustedRSquare
Std.ErroroftheEstimate
.167a
.028
.025
3.331
a.Predictors:
(Constant),任务gps纬度,任务gps经度
b.DependentVariable:
分析结果显示,该模型在分析价格变化时可用的情况仅占16.7%,不足以证明单纯的经纬度差异与价格变化存在直接相关。
由此可见,任务的定价规律与会员的分布、当地会员对任务总体完成情况以及会员信誉度等因素存在相关关系。
任务的定价规律能直接影响任务的完成状况。
为确认会员总体任务完成情况与任务定价范围差异之间的关系,我们根据人数的差异及奖励金变化的趋势将任务奖励金额分为了三个区间:
[65,69.5],[70,75],[80,+∞],并使用XGeocoding软件求出了题中所给坐标范围内所包含的不同城区内每一个城区分布的会员人数、高信誉度会员人数相应的任务完成状况。
实际情况如附件1所示:
以每个区域内酬金为65至69.5元内成功完成的任务数量为因变量;
该区域任务完成率、分配任务数、会员数及会员完成任务数比例为自变量,通过spss的线性回归方程功能,可建立任务量与各自变量的关系模型。
结果为:
模型摘要
模型
R平方
調整後R平方
標準偏斜度錯誤
.923a
.852
.831
8.007
a.預測值:
(常數),高信誉会员分布,分配任务数,会员数
變異數分析a
平方和
df
平均值平方
F
顯著性
迴歸
7756.602
3
2585.534
40.328
.000b
殘差
1346.358
21
64.112
總計
9102.960
24
a.應變數:
65-69.5
b.預測值:
係數a
非標準化係數
標準化係數
T
B
標準錯誤
Beta
(常數)
-4.074
2.304
-1.768
.092
会员数
-.044
.066
-.198
-.678
.505
分配任务数
.574
.087
1.114
6.631
.000
高信誉会员分布
-.076
.423
-.040
-.180
.859
a.應變數\:
表中数据显示,数据变异数显著性为0.00,适用于线性回归分析情况;
且在任务酬金为65至69.5间时且在其对应区域时,模型对其分析的准确率达到92.4%。
在模型范围内以各变量非标准化系数做出变量拟合方程为:
同理,酬金为70至75元任务与其相应因变量关系为:
.890a
.792
.763
8.119
5279.789
1759.930
26.697
1384.371
65.922
6664.160
70-75
-.741
2.337
-.317
.754
.004
.022
.065
.949
.537
.088
1.218
6.117
-.938
.429
-.581
-2.185
.040
表中数据变异数显著性为0.00,适用于线性回归分析情况;
在对应区域内任务酬金为70至75之间时,模型对其分析的准确率达到89%。
其拟合方程为:
酬金为80元及以上的任务与其相应因变量关系为:
.628a
.394
.308
3.341
152.662
50.887
4.559
.013b
234.378
11.161
387.040
80以上
-.475
.961
-.494
.627
-.021
.027
-.447
-.758
.457
.107
.036
1.002
2.948
.008
-.027
.177
-.070
-.155
.878
上表中数据变异数显著性为0.13,可用于线性回归分析情况;
且在任务酬金为80以上且在其对应区域时,模型对其分析的准确率为62.8%。
对其中数据建立拟合方程为:
综合上表中数据所述,可知影响定价的主要因素分别为。
5.1.2任务未完成的原因分析
因子分析的功能是在多个变量中找出隐藏的具有代表性的因子并将相同本质的变量归入一个因子,有检验变量间关系的功能。
1.1.1中结论显示,影响任务完成情况的因素包括位置因素、价格因素与所在地会员相关因素。
对每个区域的失败任务进行分析时,可用SPSS的因子分析功能分析出价格因素与会员数、高信誉会员分布情况和区域内任务完成率等变量中的每一项对确立失败结果所占影响的比重。
结果如下:
相關性矩陣
失败率
失败量
平均收益
相關
1.000
.452
.026
-.250
-.459
.140
.560
.294
-.462
.653
.857
-.318
.923
-.193
.744
-.386
表中数据显示,会影响失败率的变量中对失败率影响最大的是平均收益,其次是失败量,接下来是分配任务数、高信誉会员分布,最后是会员数。
其中失败量是无法控制的变量,而其余变量除分配任务数与平均收益对失败率呈负相关以外,其余变量与失败率均呈正相关。
由此可知,导致任务未完成的原因可能性由大到小分别为完成任务平均收益低、区域分配任务数过少、区域内会员信誉度高于己方,以及区域内存在过多会员与己方竞争。
5.2附件一项目的新定价方案
以“拍照赚钱”软件的角度考虑,最佳的定价方案无疑是该平台获得最大利润的情况。
目前,“拍照赚钱”类为一名客户提供一对一服务机会的平台有很多,其中各变量要素与拍照赚钱软件平台相似度最高的是出租车APP平台;
在垄断性市场中,相对静止的客户用户通过金钱
根据题意,可将拍照赚钱系统类比为垄断型市场。
其他公司以一定资金向拍照赚钱平台投送任务可类比为行人向平台缴纳注册费;
用户以个数为单位完成平台分配的任务可以类比为垄断型市场中司机单次接触乘客与平台发生的交易费。
因此用户与平台的合理定价关系可类比为司机以交易费形式从打车软件平台搭载注册费形式乘客的定价关系。
为[1]:
式中Ppt为所求的,能使平台获得最大利润的新定价;
fd为单位成本,在本题中即为单位地区内平均价格;
d为司机接触偏好乘客(本题中即为会员接取可做任务)的概率;
0至td为单位司机接触乘客时间范围(接取任务时间范围);
np为乘客(任务)数量;
ap为增加一单位司机(会员)导致乘客(任务)增加的效用,为司机对乘客的交叉网络外部性系数;
θ(ud)的值为驾驶员(θ(ud)=nd,本题中为会员数)数量的效应函数[2]。
由附录1中表格可分别知或求出任务所给范围内各个区域的上述变量,进而求出每一区域Ppt的值(见附录1“O”列);
根据1-1-1分析的数据,可用Matlab的curvefittingtool工具求出价格与完成率曲线及其相关变量。
曲线如下:
其中a0=69.67(66.68,72.66)
a1=0.6826(-4.241,5.606)
b1=-3.552(-5.998,-1.106)
w=4.806(1.194,8.417)
再将新的Ppt值代入曲线,则可求出本方法在每个地区的完成率(见附录1“p”列)。
在此方程中,将本应为因变量的完成率视为了自变量,本应为自变量的定价视为了因变量。
因此以定价为自变量的方程为上述方程的反函数。
为:
将新方案完成率与旧方案完成率进行平均数比较,发现新方案中任务完成率达到0.644,而旧任务的完成率为0.560,证明新模型在增加平台获利的同时可以增加任务完成率。
5.3任务打包发布情况下的定价模型与对结果的影响
5.3.1对任务打包的方案
附录1中数据显示,任务完成情况与任务的相关地理位置有关。
为排除会员在选择任务时发生冲突的情况,我们以5个任务为一组,用spss对所有任务进行k-均值聚类分析。
得出结果见附录2;
将进行过聚类分析的5个点的相关属性范围求和,并将5个点的对应属性(经纬度、价格分配等)的总和视为一个“较大”的点(称为包点)。
图3-1:
附录1中已完成任务确立出的包点数量及分布
5.3.2打包过的任务在原任务相应城区位置的分布与计算
包点的信息代表点内元素的综合信息。
在5.3.1中,我们可以求出各个包点的经纬度,并将经纬度信息与所在城区一一对应(见附1中)。
每一区中包点的数量*5既是影响该区域点总数的数量。
直接将相关数据代入5-2中公式,可求得包点情况下在不同区域范围内每一点的定价和完成率,最后求得的总体平均的完成率为64.5%。
比之前第二问的结果64.4%略有增长。
由此可见将数据打包对提高精确度有一定积极影响。
5.4附件三的任务定价方案与实施效果预估
5.4.1附件三任务的地址分布
通过Matlab的CurveFittingTool工具分析附件3中,可将新旧任务点在地理上的分布较为清楚直观地展现。
图4-1:
已完成任务的地理分布情况。
图:
4-2:
新任务的地理分布情况。
如上图所示,附件三所给任务的经纬度上下限分布与已完成数据基本相同,但附件三中数据密集程度远远大于已完成数据的密集程度。
5.4.2新数据的任务定价方案
由于附件3中任务总数大,分布范围极小且散点较少,可忽略分散分布的点,并将中心周围密集分布的点集中至中心点进行“打包”。
其中由于最下方区域面积较大,根据变量数量与前一问比例将其分层六份。
任务数
打包变量数
平均价格
打包后定价
打包后完成率
上
258
51
66.625
49.625
0.488974
中
249
49
66.192
49.85897
0.528252
下(代表性)240
240
48
66.076
50.07609
0.566258
六、模型评价
模型优点:
1.第一问的模型将任务所在城区作为变量之一,将会员条件、等信息按地区排布并将价格分段进行分析,得出的分析结果在数据密集区域与原变量拟合度较高且可以针对定价的不同进行分区处理。
2.第二问中拟定的模型在提升任务完成率和增加平台收入两方面都较原方案有一定提升。
3.第三问对积极会员实现了较为充分的利用,增加任务完成效率的同时可以充分调动会员积极性
模型不足:
1.第一问及第二问所建立的模型都是按城区的自然分布排布的,没有考虑到城区内部的变量分布状况差异,不适合用于较小区域分析
2.第一问在任务定价较高时拟合度会下降,造成结果不精确。
3.第三问中不同聚类分析点周围任务的分布状况可能不同,导致不同的“任务包”完成难度存在差异,仍然无法完全避免争抢现象。
4.第四问中以任务密集分布点中心为准进行数据的“打包”计算距离不能完全反应会员与任务间距离,可能出现误差。
建议:
1.在分析过程中,我们发现软件用户中的活跃用户数量不多、分布过于密集且与总用户数相比只占很小一部分。
建议通过定期举办活动、在软件内内嵌AR游戏等方案提升用户活跃度,并在任务难以完成区域通过举办活动等方式保障任务的顺利完成。
2.运营方可以根据客户信誉度、完成任务量等变量对用户进行区分并将信誉度高、完成任务量大的的用户设为vip并提供额外任务分配,将会员资源利用率提升。
七、参考文献
[1]:
《打车app平台定价策略分析——基于双边与多边视角》——耿磊
[2]:
《效用函数值的计算方法》——姜青舫
八、附录
数据在各相应城区的分布
聚类分析结果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 建模