数据分析指南1.docx
- 文档编号:24179443
- 上传时间:2023-05-25
- 格式:DOCX
- 页数:16
- 大小:306.94KB
数据分析指南1.docx
《数据分析指南1.docx》由会员分享,可在线阅读,更多相关《数据分析指南1.docx(16页珍藏版)》请在冰豆网上搜索。
数据分析指南1
数据分析指南
目录
1概述3
1.1数据分析的目的3
1.2整体思路3
2项目组数据分析指南3
2.1进度-工作量-规模-成本3
2.1.1进度分析3
2.1.2工作量分析4
2.1.3规模分析4
2.1.4成本分析4
2.2质量4
2.2.1评审分析4
2.2.2测试分析5
2.2.3故障种类分析5
2.2.4品质评价图表5
2.3其他5
3综合数据分析指南5
3.1过程能力的分析5
3.2“2-8”关键问题分析6
3.3趋势分析6
3.4潜在关系分析6
3.5原因分析7
附录1结果分析图表8
趋势图8
直方图8
排列图(Pareto图)9
因果图9
散点图10
控制图10
附录212
数据定义12
1)工作量12
2)进度12
3)成本12
4)规模12
5)质量12
6)其他12
代码行计算标准12
1概述
1.1数据分析的目的
对于项目组来说,数据分析的主要目的是实时了解项目状态,验证计划执行情况,并从数据分析中发现项目潜在的问题或风险,以便尽早采取应对措施,保证项目处于有效控制之下。
对于组织层来说,数据分析的主要目的是分析统计组织过程的能力,为项目组做估计时提供依据,并作为过程改进的基础。
1.2整体思路
对于项目组来说,数据分析主要从三个纬度进行分析:
1、进度-工作量-规模-成本;2、质量;3、其他。
其中进度-工作量-规模-成本和质量是反映项目成功的关键参数,同时也是组织最关注的指标,而其他纬度的数据,主要作为数据分析时的参考。
本文描述的项目层的分析思路或者分析角度主要有:
a)比较计划和实际的数据,验证计划执行情况并发现实际执行中的偏差;
b)将偏差与项目阈值或者组织能力上下限进行比较,发现偏离控制范围的点并找出根本原因,采取应对措施;
c)单一的分析并不能完全判断出过程是否稳定可控,还需要根据数据之间的相互联系结合其他角度或维度的数据分析来辅助判断项目的状态,以便发现潜在的可能超出控制范围的问题;
另外数据还需要进行综合分析,方法主要分成以下5种:
a)通过控制图对过程能力进行分析;
b)通过分布图或排列图情况对问题的等级进行分析。
c)通过趋势图分析变化趋势;
d)通过散点图分析两类数据的潜在关系;
e)通过因果图分析问题产生的原因。
注意:
各分析工具的介绍请参见附录一。
2项目组数据分析指南
2.1进度-工作量-规模-成本
进度、工作量和规模这三者是相互关联的,因此在分析每个指标的同时,可以结合其他两个指标来辅助判断项目的状态,确定项目可能存在的问题。
2.1.1进度分析
✓分析角度:
计划与实际进度的比较,进度偏差率与进度控制阈值的比较
✓分析说明:
⏹进度的跟踪分为:
各阶段进度的跟踪和各任务进度的跟踪。
⏹利用干特图(或其他形式的图表)跟踪各任务的进度,当计划进度和实际进度产生偏差并超出控制界限时,需要分析原因,并及时解决问题。
⏹每个阶段结束时,比较本阶段的计划进度和实际进度,当实际与计划进度有偏差时,计算出进度偏差率,并将进度偏差率与进度控制阈值进行比较,检查进度偏差是否处在控制范围内。
⏹进度阈值是为项目设定的进度偏差的控制限,如果进度偏差在阈值范围内,则认为项目进度处于统计控制之下;如果进度偏差超过了阈值,则说明进度偏离了控制,需要对偏差进行原因分析,找出影响进度的可能原因。
⏹使用趋势图比较各阶段进度的偏差趋势,如果偏差处于逐渐增大的趋势,可能预示着过程有失去控制的风险,因此也需要对这种逐渐增大的趋势进行原因分析,找出导致偏差逐渐增大的原因,以便提前采取措施避免可能发生的进度超出控制范围的风险。
⏹可以使用因果图列举出造成进度偏差的可能原因,再分析这些原因影响的优先级,可以使用Pareto图对原因进行优先级的排序,以便确定导致问题的主要原因,并采取应对措施。
⏹产生进度偏差的可能原因:
⏹计划有问题;
⏹人员有问题;
⏹工作有问题;
⏹沟通有问题;
⏹风险发生;
⏹由外部因素引起问题;
⏹其他原因;
✓注:
进度受到工作量投入的影响,也可以通过产品规模的完成情况来反映,同时由于质量问题也会严重影响进度的完成,因此在进行偏差原因分析时需要注意结合这些相关因素来进行。
2.1.2工作量分析
✓分析角度一:
计划与实际工作量的比较,工作量偏差率与工作量控制阈值的比较
✓分析说明:
⏹工作量的分析和进度分析的方法是一样的,也分为各任务工作量的分析和各阶段工作量的分析,具体可以参见进度分析。
2.1.3规模分析
✓分析角度一:
比较计划与实际的产品规模,比较规模偏差率和规模控制阈值比较
✓分析说明:
⏹当计划与实际存在偏差时,比较规模偏差率与相应的规模控制阈值,检查偏差是否处在控制范围内;
⏹如果偏差超出了控制范围,除了进行原因分析外,要将其作为进度和工作量偏差的可能原因输入,来辅助分析进度和工作量的偏差,考虑从控制规模上来控制进度和工作量。
2.1.4成本分析
✓分析角度一:
比较计划与实际的总成本,比较成本偏差率和成本控制阈值比较
✓分析说明:
⏹当计划与实际存在偏差时,比较成本偏差率与相应的成本控制阈值,检查偏差是否处在控制范围内;
⏹如果偏差超出了控制范围,需要进行原因分析外。
2.2质量
质量指标通过测试、评审以及缺陷的分布情况来表示。
2.2.1评审分析
评审故障检出率反映了被评审工作成果的质量状况;而评审准备速度和评审速度从另一个方面反映了评审过程的有效性,使用这两个参数可以辅助分析缺陷清除过程的有效性,进而帮助判断阶段质量目标的达成情况。
✓分析角度:
评审故障检出率与质量目标相比较;
✓分析说明:
⏹当评审故障检出率在质量目标范围之内时,说明工作成果的质量水平达到了预计的目标。
另外,此时还可以考虑评审速度和评审准备速度,看是否评审的充分的。
⏹当评审故障检出率超出质量目标或未达到质量目标时,需要进行原因分析,分析的结果有两种:
第一,当前质量状况正常,符合实际情况,不需要再次评审;第二,当前质量状况不正常,需要再次评审。
2.2.2测试分析
测试故障检出率反映的代码的质量状况,而测试密度和测试速度反映了测试过程的有效性。
✓分析角度:
测试故障检出率与质量目标相比较;
✓分析说明:
⏹当测试故障检出率在质量目标范围之内时,说明代码的质量水平达到了预计的目标。
另外,此时还可以考查测试速度和测试密度,以此判断测试是否充分。
⏹当测试故障检出率超出质量目标或未达到质量目标时,需要进行原因分析,分析的结果有两种:
第一,当前质量状况正常,符合实际情况,不需要再进一步测试,可以进入下一阶段;第二,当前质量状况不正常,需要进一步的测试。
2.2.3故障种类分析
✓分析角度:
对故障种类的分布数据进行分析
✓分析说明:
⏹故障种类的区分原则有很多种,例如可以按:
用例、缺陷的原因、重要程度、类型等。
⏹计算出各类故障的分布情况后,可以使用排列图或饼图来标识出产生80%故障的种类,并分析其产生的原因,以作为改进项目质量的入口点。
2.2.4品质评价图表
✓分析角度:
对评审和测试的结果进行分析并做出评价
✓分析说明:
使用直方图、折线图、散点图对评审和测试的品质状况、故障趋势、测试覆盖(测试密度、故障密度)状况进行分析。
2.3其他
包括风险数据,悬案数据,变更数据,项目支持过程数据,培训数据等等。
风险数据的分析可以参见《风险管理过程》,培训数据的分析定期由公司级的培训小组进行统计。
3综合数据分析指南
3.1过程能力的分析
●分析目的:
统计过程各项指标的能力,为项目估计提供参考,并为过程改进提供依据。
●分析方法:
一般般采用控制图进行分析,步骤如下:
a)通过统计学方法(XmR)计算样本值的均值和上下限值;
b)对均值和上下限进行合理性调整;
c)画出控制图;
d)观察异常模式;
e)分析异常模式产生的原因(特殊原因和共同原因);
f)剔除异常,形成能力指标值,作为项目估计的参考数据之一;
g)根据以上分析的结果,列出需要解决的问题列表;
h)从问题的普遍性、严重性、紧急性等方面给问题分等级,从中选出最需解决的问题,作为过程改进的目标。
●适用范围:
此分析方法适用与所有能力指标(也就是《测量集》中列出的组织级测量项)。
3.2“2-8”关键问题分析
●分析目的:
把数据按一定准则进行分类,找出关键的类别。
●分析方法:
一般般采用饼图和排列图进行分析,步骤如下:
1)统计各项分布数据的均值;
2)画出饼图和排列图;
3)从图中观察比例占80%少数数据类型;
4)分析产生这80%数据的原因;
5)根据原因列出问题;
6)从问题的普遍性、严重性、紧急性等方面给问题分等级,从中选出最需解决的问题,作为过程改进的目标。
●适用范围:
缺陷种类的分布(按用例,按试样,按功能,按类型,按阶段,按严重程度等),工作量阶段分布,工作量过程分布,各过程裁减次数的比较,各过程NC次数的比较等等。
3.3趋势分析
●分析目的:
通过与以前数据(多个)的比较,观察指标的变化趋势。
●分析方法:
一般趋势图进行分析,步骤如下:
1)统计当前指标值,并收集历史指标值;
2)以时间为横轴画出趋势图;
3)从图中观察指标变化的趋势;
4)如果存在明显的趋势,需要进一步确定是好的趋势还是坏的趋势;
5)对趋势产生的原因进行分析;
6)根据产生的原因,有选择的采取措施,保持好的趋势,抑制坏的趋势。
●适用范围:
适用于各项指标,尤其是效率类、偏差类以及客户满意度指标。
3.4潜在关系分析
●分析目的:
找出两个指标间的关系
●分析方法:
一般采用散点图进行分析,步骤如下:
1)假设两种存在关系的指标;
2)以各项目数据为样本值,画出散点图;
3)从图中观察两种指标的潜在关系;
4)如果从图中能明显看出两者存在关系(线性和非线性),继续下一步;
5)通过回归分析(线性回归和非线性回归)确定两者的函数关系;(此步比较复杂,可以采用最简单的趋势分析来代替,例如:
正比增长关系,负比增长关系等)
6)确定两者关系以后,可以考虑通过改变某一指标的投入情况来影响另外一个指标。
●适用范围:
适用于一切可能存在直接或间接关系的测量项。
例如:
质量成本与客户满意度、需求变更次数与生产率、测试工作量与生产率等。
3.5原因分析
●分析目的:
分析导致特定结果的各种因素,并对各因素规类。
●分析方法:
一般采用因果图(鱼骨图)进行分析,步骤如下:
1)确定特定的结果;
2)确定影响结果的大的因素;
3)细化大因素;
注意:
确定因素时可以采用头脑风暴的方法。
●适用范围:
适用于所有原因分析。
附录1结果分析图表
当我们对收集到的数据进行分析时,需要将这些数据进行分类和整理,并使用一些特定的工具来组织和总结数据以便寻找趋势以及相互关系。
下面就对一些常用的分析工具进行简单的介绍。
趋势图
趋势图是专用于时序形式的散点图,可以快速的检查数据在整个时间出现的趋势或其他模式。
趋势图可以用来监控一个过程,看它是否有明显的趋势,或它的行为是否以其他的方式在改变。
产品生产能力、产品大小、班组规模、发现的缺陷数目、积压的工作、累计或每天的资源消耗量,这些观测值都是趋势图处理的对象。
趋势图能够清楚地显示任何按间隔或比例来标度变量的行为。
如:
工作量偏差有逐渐增大的趋势。
直方图
直方图用于显示以经验为主的观察分布。
它显示了事件在整个一系列给定的观察值上或一段时间内发生的频率。
直方图可以用于刻画几乎任何产品或过程的属性值,例如模块大小、缺陷修复时间、每次评审发现的缺陷数等。
它还有助于揭示在整个过程、项目产品的差异。
如:
柱体的高度与每个单元中出现的次数成比例。
排列图(Pareto图)
是直方图一种特殊形式,该图根据问题、原因和操作数量、发生的频率或影响把它们分为不同的等级,按级别进行排列,有助于判断行为或改进机会的优先级。
它是从“大量的无关紧要的问题”中突出“少数几个至关重要的问题”的一种有用的技术。
如:
因果图
因果图是用来探测和展示问题(后果)与它可能的原因之间的关系图。
它是由Ishikawa在1943年发明的,所以也被称为Ishikawa图。
又因为它看起来像鱼的骨骼,通常也被称为鱼骨图。
这种图通常是在持有不同观点的人一起讨论期间进行绘制。
如:
散点图
根据经验显示过程的两个特征之间的关系。
绘制点的模式可能表明两个因素间有联系,例如因果关系。
如果条件具备,也就是说如果存在一个偶然原因的恒定系统,散点图是回归分析的自然预报器。
它能更准确的揭示数据之间的相互联系。
但是它的局限性在于通常只能处理两个变量。
如:
表示了一个变量相对于另一个变量是如何表现的。
控制图
典型的控制图如下所示:
控制图都有一条中心线,并在中心线的两侧有控制限。
中心线和界限都代表了计算的评估。
计算该评估所用到的一组观察值是在过程运行时采集的。
它用于判断观察值是否处在统计控制范围内,研究说明:
处在控制上下限内的数据之间的偏差是由于过程本身的原因(即公共原因)引起的,反映了过程的正常结果;而落在控制上下限之外的数据是由于可预防的偶然原因引起的,它反映了过程的不稳定性,需要进行原因分析,找到这个偶然原因并进行排除,从而保证过程的稳定性、可控性和可预测性。
如:
下图表示了一个稳定的过程观察值。
附录2
数据定义
1)工作量
●工作量:
用人时、人日、人周、人月表示:
1人日=7.5人时;1人周=5人日;1人月=20人日。
●工作量估算偏差=(估算值-实际值)/实际值
2)进度
●项目周期:
用日历天、日历周、日历月表示;项目周期是从项目正式开始(项目开始日期)到交付给客户(项目结束日期)的时间(日历天数)。
●(项目进行中)进度估算偏差=(最新估算结束日期-最初估算结束日期)/(最新估算结束日期-开始日期+1)
●(项目结束时)进度估算偏差=(项目结束日期-最初估算结束日期)/(项目结束日期-开始日期+1)
3)成本
●项目成本:
这里关注的成本是项目受注书中的直接成本。
●成本估算偏差=(估算值-实际值)/实际值
4)规模
●文档规模:
用页数表示。
●代码规模:
用Kstep表示,不同的语言需要分别收集统计。
代码行LOC的定义以及计算标准请参见下面的“代码行计算标准”。
●代码规模估算偏差=(估算值-实际值)/实际值
5)质量
●故障(Defect):
所有在评审和测试当中发现的对最终产品质量产生直接影响的问题。
●评审故障检出密度:
平均每页或每kstep评审发现的故障数。
●测试故障检出密度:
平均每kstep测试发现的故障数。
●测试速度:
平均每人日所执行的测试项目数。
6)其他
●总生产率(按编程语言的大类(C/C++,Java,Cobol等)进行分类统计)
a)生产率(工作效率)=代码规模/项目的总工作量
b)生产率(成本)=项目总成本/代码规模
●阶段生产率
●质量成本
质量成本=同行评审工数+测试(UT,SI,PT)工数
代码行计算标准
程序中需要统计的部分:
a)数据定义,可执行语句;
b)数据申明;
c)子程序和宏的调用语句(每次调用都统计一次);
d)子程序代码行、宏定义代码行(每个子程序或宏定义的行数都只做一次统计);
e)标号(Labels)、逻辑分界符(delimiter)
例如:
begin,end,{,}etc。
(根据不同的语言有所不同);
f)程序头部(Headers)及包括的文件(每个程序头部和包括的文件的行数都只做一次统
计);
g)程序头部(Header)及包括的命令(每次使用都统计一次)。
程序中不应该统计的部分
a)以开发为目的而编写的临时代码(为了探讨方案的可行性);
b)以测试为目的而编写的临时代码;
c)空白行及程序注释行。
注意:
a)统计应当以行为单位,这里所说的行是指代码的物理行而不是代码的逻辑语句行;另外,
统计代码的对象程序应当是符合编码规约的程序。
(不同的编程语言有不同的编码规约,请参见相应编程语言的编码规约。
)
b)本标准适用于所有的编程语言。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 指南
![提示](https://static.bdocx.com/images/bang_tan.gif)