统计学——Python实现教学课件cha3.pptx
- 文档编号:10525853
- 上传时间:2023-02-17
- 格式:PPTX
- 页数:19
- 大小:1.28MB
统计学——Python实现教学课件cha3.pptx
《统计学——Python实现教学课件cha3.pptx》由会员分享,可在线阅读,更多相关《统计学——Python实现教学课件cha3.pptx(19页珍藏版)》请在冰豆网上搜索。
第1章,统计学Python实现,贾俊平2022-03-12,人生苦短,我要PythonStatisticswithPython,1-,统计学Python实现贾俊平,2022-03-12,第3章,描述水平的统计量描述差异的统计量描述分布形状的统计量数据的综合描述贾俊平2022-03-12,3-,统计学Python实现贾俊平,2022-03-12,第3章数据描述统计量,第3章,3.1,描述水平的统计量,描述水平的统计量平均值简单平均数,加权平均数,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.1描述水平的统计量,描述水平的统计量分位数中位数,分位数一组数据按从小到大,排序后,可以找出排在某个位置,上的数值,该数值可以代表数据水平的高低。
这些位置上的数值就是相应的分位数(quantile)。
常用的分位数有中位数、四分位数、百分位数等,中位数排序后处于中间位置,上的值。
不受极端值影响,位置确定,数值计算,#计算30名学生考试分数的中位数中位数:
85.0,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.1描述水平的统计量,描述水平的统计量分位数四分位数,一组数据排序后处在25%和75%位置上的数值。
它是用3个点将全部数据等分为4部分,其中每部分包含25%的数据。
很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上和75%位置上的两个数值,Python默认的位置确定公式,#【例3-5】,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.1描述水平的统计量,描述水平的统计量分位数百分位数,用99个点将数据分成100等份,处在各分位点上的数值就是百分位数。
百分位数提供了各项数据在最小值和最大值之间分布的信息,Python默认的位置确定公式,#计算30名学生考试分数的百分位数,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.1描述水平的统计量,描述水平的统计量众数一组数据中出现次数最多的变量值一组数据可能没有众数或有几个众数实际中很少使用#计算30名学生考试分数的众数众数=86,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.2描述差异的统计量,描述差异的统计量极差和四分位差极差:
一组数据的最大值与最小值之差四分位差:
上四分位数与下四分位数之差#计算30名学生考试分数的极差和四分位差#极差=47#四分位差:
IQR=19.5,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.2描述差异的统计量,描述差异的统计量方差和标准差方差:
各变量值与均值的平均差异标准差:
方差的,平方根,样本标准差s,#计算30名学生考试分数的方差和标准差方差:
174.6206896551724,3-,统计学Python实现贾俊平,2022-03-12,#标准差标准差:
13.21,第3章,3.2描述差异的统计量,标准差与其相应的均值之比对数据相对离散程度的测度用于比较不同系列数据的离散程度,计算公式,描述差异的统计量变异系数(CV)【例3-9】(数据:
example2_3.csv)沿用第2章的例2-3。
计算6个城市AQI的平均数、标准差和变异系数,比较AQI离散程度的大小,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.2描述差异的统计量,描述差异的统计量标准分数,对某一个值在一组数据中相对位置的度量,也称标准化值可用于判断一组数据是否有离群点(outlier),计算公式,#【例310】计算例3-1的标准分数标准分数:
0.3784-1.89190.8324-1.0594-0.07571.28650.9081-1.89190.52970.75670.227-0.75671.2108-0.60540.7567-1.43780.4540.4540.90810.3784-0.98380.07570.6811-2.27021.13510.454-0.37840.83240.1513-1.0594,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.3描述分布形状的统计量,描述分布形状的统计量偏度系数,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.3描述分布形状的统计量,描述分布形状的统计量峰度系数例题分析,峰度(kurtosis)是指数据分布峰值的高低由统计学家K.Pearson于1905年首次提出峰度系数测度一组数据分布峰值高低的统计量是(coefficientofkurtosis),记作K,计算公式,#计算峰度系数峰度系数:
-0.3515,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.4,数据的综合和描述,数据的综合描述例题分析,【例3-9】,6名运动员的涉及成绩,使用pastecs包中的stat.desc函数计算描述统计量,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.4数据的综合和描述,数据的综合描述例题分析图形描述【例312】60个大学生的调查数据图形分析分布特征的图示,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.4数据的综合和描述,数据的综合描述例题分析图形描述【例312】60个大学生的调查数据图形分析分布特征的图示,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.4数据的综合和描述,数据的综合描述例题分析统计量描述七年性别分组统计频数计算全部学生的描述统计量,按性别和家庭所在地分组,3-,统计学Python实现贾俊平,2022-03-12,第3章,3.4数据的综合和描述,数据的综合描述例题分析统计量描述根据需要自编函数计算描述统计量,3-,统计学Python实现贾俊平,2022-03-12,THEEND,THANKS2022-03-12,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 Python 实现 教学 课件 cha3