资料apstatistics知识点square9829Word下载.docx
- 文档编号:22095625
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:13
- 大小:21.33KB
资料apstatistics知识点square9829Word下载.docx
《资料apstatistics知识点square9829Word下载.docx》由会员分享,可在线阅读,更多相关《资料apstatistics知识点square9829Word下载.docx(13页珍藏版)》请在冰豆网上搜索。
biasedsampling有偏抽样
judgmentalsampling判断抽样
samplesofconvenience方便样本
volunteersamples自愿样本
simplerandomsampling简单随机抽样
systematicsampling系统抽样
stratifiedrandomsampling分层抽样
proportionalsampling比率抽样
clustersampling整群抽样
samplingerror抽样误差
responsebias回答偏差
noresponsebias无回答偏差
undercoveragebias覆盖不全偏差
wordingeffectbias措辞偏差
experimentalunit实验单位
observationalunit观测单位
confoundingvariable混淆变量
factor因子
treatment处理
controlgroup控制组
placebogroup安慰剂组
single-blindexperiments单盲实验
double-blindexperiments双盲实验
randomization随机化
blocking(block)区组
replication复制,重复
completelyrandomizeddesign完全随机设计
randomizedblockdesign随机区组设计
matched-pairsdesign配对设计
part3anticipatingpatterns(预期分布形式)
probability概率
samplespace样本空间
treediagram树形图
impossibleevents不可能事件
sureevents必然事件
complementofanevent事件的补事件
disjointormutuallyexclusiveevents互斥事件
conditionalevent条件事件
independence独立
randomvariable随机变量
discreterandomvariable离散型随机变量
continuousrandomvariable连续型随机变量
probabilitydistributionofadiscreterandomvariable离散型随
机变量的概率分布
cumulativedistributionfunction累积分布函数
expectedvalue期望值,数学期望
probabilitydistributionofacontinuousrandomvariable连续型
随
parameter参数
statistics统计量
samplingdistribution抽样分布
centrallimittheorem中心极限定理
part4statisticalinference(统计推断)
estimationprocess估计过程
estimate估计值
pointestimation点估计
intervalestimation区间估计
marginoferror误差界限
confidenceinterval置信区间
confidencelevel置信水平
significance显著性
statisticalhypothesis统计假设
nullhypothesis零假设,原假设
alternativehypothesis备选假设
teststatistics检验统计量
typeierror第一类错误
typeiierror第二类错误
rejectionregion拒绝域
nonrejectionregion非拒绝域
criticalvalue临界值
left-tailedtest左尾检测
right-tailedtest右尾检测
two-tailedtest双尾检测
samplesize样本容量
studentstdistribution学生t-分布
chi-squaredistribution卡方分布
goodnessoffit拟合优度
contingencytables联列表
apstatistics你需要知道的所有公式!
第一部分:
必须自己记住的公式
第一个是独立随机变量的组合公式,尤其需要注意的是下面那个标
准差的公式必须在x和y独立的条件下才能使用。
第二个是各种自由度的公式
单样本均值t分布时,df=n-1;
双样本均值差t分布时,df=min(n1-1,n2-1),就是n1-1和n2-1当
中较小的值;
回归线的斜率t分布时,df=n-2;
拟合度的卡方检验时,df=i-1,i是分类的总数;
独立性和齐次性的卡方检验时,df=(c-1)(r-1),c是行数,r是
列数;
双样本比例差的假设检验中,由于p1=p2且未知,所以标准差的公
式中,用到的比例p如下面第二行所示
第二部分:
考卷给出的公式(选择和解答都给出)
第一页的公式主要是第一章的内容,重点是最小二乘回归线部分
(有一些概念题),如果需要计算的话,都用计算器直接算出即可。
第二页的公式前两个是概率的加法准则和条件概率的公式,乘法准
则可以直接用条件概率的转换出来。
三、四是随机变量均值和方差(标准差的平方)的算法,这两个公
式是普适的,任意随机变量都可以用。
接下来的五、六、七都是二项式分布随机变量的公式,分别是概率
分布的计算,以及均值和标准差。
最后4个是单样本比例和单样本均值的抽样分布的公式。
第三页是最重要的了,因为计算器的重中之重就是第四章统计推断
部分。
最上面的两个是假设检验和置信区间的核心公式,statistic—
—样本统计量,parameter——总体参数,criticalvalue——根据置
信水平(t分布中还要考虑自由度)算出的临界zscore或者t
score。
【篇三:
ap统计公式+考点最全整理,背完5分准到手!
散文吧>
>
ap统计
公式+考点最全整理,背完5分准到手!
作为中国考生灰常热门的
ap科目之一,ap统计牵动着千万考生的心,眼看着后天就要和大家
见面儿了,小伙伴们复**的肿~么样啦?
ap统计知识点庞杂、公式繁多,这里给大家做了考前梳理,这么强
的助攻贴也是没sei啦,预祝各位小主儿考出新高度一、描述统计
*数据(data)分为定性数据(qualitativeorcategoricaldata)与
定量数据(quantitativedate)。
定性数据:
按照类别进行划分,展示对象的属性;
定量数据:
展示对象的数值特征。
*图(graph):
分为barchart,piechart,dotplot,stemplot,histogram,boxplot
*通过图形可以看出数据的分布特征:
(1)对称(symmetric)
(2)偏态(skewed)
左偏(skewedtotheleft)
右偏(skewedtotheright)
(3)集中趋势(4)异常值
*histogram的画法:
(1)以个数作为高度
(2)以百分比作为高度
(3)以百分比作为面积。
*概率密度(probabilitydensityfunction,pdf)
描绘以百分比作为面积的histogram的曲线。
*累积分布(cumulativedistributionfunction,cdf)以小于等于该
数的数据所占百分比作为该数的纵坐标绘制出的曲线。
*数字特征(numericalvalue)
(1)描述集中趋势
(2)描述离散趋势
(3)描述位置
(4)标准化变量(z-score)
*众数(mode)一组数据中出现次数最多的数;
*平均数(mean)数据求和后除以数据个数。
*方差(variance)与标准差(standarddeviation)
衡量数据与平均值偏离程度平方和的平均值。
*标准化变量(z-score)
计算方式是将原始数据减去平均数之后再除以标准差,用它可以展
示不同度量单位数据的偏离程度。
*散点图(scatterplot)
以一个变量作为横坐标、另一个变量作为纵坐标绘制出的图形,以
散点的形式表现在坐标轴中。
变量选用单位不同,会造成图形有差
异。
*相关系数(linearcorrelationcoefficient)
衡量两个量之间线性关系的指标,介于-1和1之间,负数代表两个
变量之间是反向变化的,正数代表两个变量之间是同向变化的,越
靠近0代表线性关系越弱,越靠近-1和1代表线性关系越强。
它只
能衡量线性关系,不能衡量非线性关系;
只反应关系,不代表因果。
*回归(regression)寻找代表变量之间关系的数学表达式。
*线性回归假定变量之间存在一次函数的关系(形如y=kx+b)。
此
函数在坐标系中图像是一条直线,因此称作线性回归。
*残差(residual)真实值与估计值之间的差。
*残差图(residualplot)以一个变量作为横坐标、该变量所对应的
残差为纵坐标绘制出的图形。
若两变量之间存在线性关系,则残差
图应为无规则的散点。
*最小二乘法(leastsquare)利用残差平方和最小求出直线斜率与
截距(k和b)的方法。
*线性化(linearity)将非线性关系转换为线性关系的方法,常用有
对数变换、指数变换等。
二、抽样方法
*总体(population):
研究对象的全体。
*样本(sample):
总体中的一部分。
*参数(parameter):
描述总体特征的指标,一般用希腊字母表示。
*统计量(statistics):
描述样本特征的指标,一般用拉丁字母表示。
*普查(census):
对总体中的每一个个体都进行研究。
*抽样(sample):
对总体中的部分个体进行研究。
*实验法(experiment):
对目标群体进行干预而得到数据。
*观察法(observation):
不对目标群体进行干预而得到数据。
实验组(treatmentgroup):
对该组中的个体进行干预。
*对照组(controlgroup):
不对该组中的个体进行干预。
*影响因子(factor):
会对实验对象产生影响
*变量混淆(confounded):
无法分离因子的影响
*协同作用(commonresponse):
多个因子共同造成影响
*安慰剂(theplaceboeffect):
心理作用导致的变化
*单盲试验(singleblinding):
实验者知晓每一个体是否受到预先设置的干预,而被实验者不知晓。
*双盲试验(doubleblinding):
实验者与被实验者都不知晓每一个体是否受到预先设置的干预。
*简单随机抽样(simplerandomsampling):
随机地从总体中选取个体,每个个体被选到的概率是相等的。
*系统抽样(systematicsampling):
首先将总体中的个体编号、排序,而后按照固定步长进行抽样。
*分层抽样(stratifiedsampling):
首先将总体中的个体按照某一特征或标准划分为不同的层(strata),
而后从每层中进行抽样。
特征是每个层中的个体具有相似性。
*整群抽样(clustersampling):
首先将不同特征的个体划为分一个群(cluster),而后从每个群中进行抽样。
特征是每个群具有多样性。
三、概率
*频数(frequency):
某一结果出现的次数。
*频率(relativefrequency):
某一结果出现的次数占实验次数的百分比。
*概率(probability):
某一结果出现可能性的大小,介于0和1之间。
不可能事件
(impossibleevent)的概率是0,必然事件(certainevent)的
概率是1,但反之不正确,概率为0的事件不一定是不可能事件,也
有可能发生,概率为1的事件也可能不发生。
*大数定律(thelawoflargenumbers):
实验次数越大,频率越稳定,且取决于事件本身的概率。
*基本公式:
*条件概率(conditionalprobability):
给定某一事件发生的条件下,另一事件发生的概率。
*随机变量(randomvariable):
该变量的取值取决于实验的结果。
*离散型(discrete):
随机变量的取值是一个一个的。
*连续型(continuous):
随机变量的取值是连续不间断的。
*分布(distribution):
实验结果出现的规律。
*均值(mean)与方差(variance):
*二项分布(binomialdistribution):
将具有两个结果的实验重复多次,求其中某一结果出现次数的概率。
*几何分布(geometricdistribution):
将具有两个结果的实验重复多次,求其中某一结果首次出现时实验
次数的概率。
*正态分布(normaldistribution):
代表常规现象出现次数多、极端现象出现次数少这样一种规律。
*标准正态分布(standardnormaldistribution):
均值为0、方差为1的正态分布。
*抽样分布(samplingdistribution):
多次抽样后,样本统计量的分布规律。
*标准误(standarderror):
统计量的标准差。
*单总体样本比例的抽样分布
正态分布:
双总体独立样本比例差的抽样分布:
单总体样本均值的抽样分布:
双总体独立样本均值差的抽样分布:
四、统计推断
*参数估计(estimation):
利用统计量去预测参数。
*区间估计(interval):
给出参数的范围。
*置信水平(confidencelevel):
对参数多次进行估计得到多个区间,其中区间中包含真实参数的次
数占估计次数的比例。
*单总体比例区间估计:
*双总体比例差区间估计:
*单总体均值区间估计:
此时需考虑总体方差是否已知:
(1)若已知则使用正态分布进行估计
(2)若未知则使用t分布进行估计。
*双总体均值差区间估计:
此时需考虑总体方差是否已知
(2)若未知
a.总体方差不等(pooled=no)
b.总体方差相等(pooled=yes),则使用t分布进行估计,但所用
自由度与方差皆不相同。
*假设检验(hypothesistest):
利用统计量对参数的真伪进行检验。
*原假设(nullhypothesis):
待检验参数。
*备择假设(alternativehypothesis):
当原假设被拒时所接受的假设。
根据备择假设形式的不同,分为双尾检验(twotailed)和单尾检验
(onetailed)
*p值(p-value):
当原假设为真的时候得到此样本结果以及比此样本结果更极端结果
的概率。
p值越小,拒绝原假设的可能性越大。
第一类错误(typeierror):
原假设为真时却拒绝原假设。
犯此错
误的概率为显著性水平(significancelevel)。
第二类错误(typeiierror):
原假设为假时却没有拒绝原假设。
不
犯此错误的概率为(powerofthetest)。
在样本容量(samplesize)固定的条件下,两类错误为此消彼长的
关系,若想同时降低两类错误,只能提升样本容量。
*单总体比例检验:
*双总体独立样本比例差检验:
*单总体均值检验:
(1)若已知则使用正态分布进行检验
(2)若未知则使用t分布进行检验。
*双总体均值差检验:
*卡方检验(chi-square)
拟合优度检验(goodnessoffit):
利用样本信息来检验总体是否
符合某一分布。
独立性检验(independence):
检验某一分类结果是否受另一分类
影响。
更多一手备考资料/资讯加sat考试群:
168****34,小伙伴们都说你
来晚辣!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 资料 apstatistics 知识点 square9829