CFA一级总结数量统计部分.docx
- 文档编号:11580318
- 上传时间:2023-03-19
- 格式:DOCX
- 页数:14
- 大小:36.60KB
CFA一级总结数量统计部分.docx
《CFA一级总结数量统计部分.docx》由会员分享,可在线阅读,更多相关《CFA一级总结数量统计部分.docx(14页珍藏版)》请在冰豆网上搜索。
CFA一级总结数量统计部分
数量统计部分
设置计算器[2nd]P/Y1[ENTER][2nd][quit]
一、几个利率的概念
1.EAR—effectiveannualrate.
EAR=(1+periodicrate)^m-1,periodicrate=年利率/m,m=每年compound的次数
当m->无穷时,EAR=e^rate-1,rate[2nd][e^x]-1
Ordinaryannuities(现金流在期末)与annuitiesdue(现金流在期初),需将计算器调整成BGN模式,[2nd][BGN][2nd][set]
永久年金perpetuity,PV=PMT/IY
Uneven现金流的PV和FV
计算NPV
[CF][2nd][CLRWork]
Initialcashoutlay[Enter]
[↓]period1cashflow[+-][Enter]
[↓][↓]period2cashflow[+-][Enter]
……
[↓][↓]periodncashflow[+-][Enter]
[NPV]discountrate[Enter]
[↓][CPT]
FV要分别计算再累加
2.BDY--Bankdiscountyield银行贴现率(T-bill以此报价)
BDY=D/F*360/t其中D是折现额(facevalue-购买价格),F是面值!
转换也是采用360,不是复利,该指标缺陷很大
3.持有期收益Holdingperiodreturn
Holdingperiodyield-HPY=(P1-P0+Div)/P0顾名思义
4.Money-weightedreturnandtime-weightedreturn
计算Money-weightedreturn资金加权,统计每期cashflow,计算使PVinflow=PVoutflow的IRR计算器IRR
[CF][2nd][CLRWork]
Initialcashoutlay[Enter]
[↓]period1cashflow[+-][Enter]
[↓][↓]period2cashflow[+-][Enter]
……
[↓][↓]periodncashflow[+-][Enter]
[IRR][CPT]
time-weightedreturn时间加权:
先计算每期的HPR,在进行算几何平均数。
如果继续投资的收益率比前一期低,则时间加权的收益率高,如果继续投资的收益率高,则资金加权的收益率高。
5.Effectiveannualyield
EAY=(1+HPY)^(365/t)-1实际年收益率,基于365天进行复利计算!
6.Moneymarketyield(CDequivalentyield)
货币市场收益率rmm=HPY×360/t---基于360天进行计算!
是一个按照360天每年进行单利转换的收益率,相比而言,EAY则是一个按照365天每年进行复利转换(compounddaily)的收益率!
BDY是一个比较特殊的比率,因为它是基于面值计算的;货币市场收益率和BDY之间是可以相互转换的---他们之间的桥梁是HPY!
Rmm=360*Rbd/(360-t*Rbd)同时,EAY的计算也是要靠HPY的,所以HPY是非常重要的概念!
EAY和Rmm都是年化的HPY。
7.Bondequivalentyield
BEY债券等价收益率—这是一个单独的收益率!
因为美国的债券是每半年支付一次利息的,所以将任何一种债券转换成每半年支付利息的债券,计算收益率,再将结果乘以2,即可得到BEY
Corporatefinance中workingcapitalmanagement中BEY=HPR*365/t
二、统计概念和市场收益
descriptivestatistics描述性统计:
用于总结大量数据的重要特征,得到有用的信息。
inferentialstatistics推论性统计:
基于样本来对总体进行预测、估计或judgement。
1.Typesofmeasurementscales
Nominalscales:
包含最少信息,没有顺序。
Ordinalscales:
每个observation被归到一个类别中,而这些类别都是按一定特征排序的。
Intervalscales:
向Ordinalscales一样提供相对的ranking,且每个类的间隔是相等的。
Ratioscales:
除了向Ordinalscales一样提供相对的ranking,且每个类的间隔是相等的,还有truezeropoint作为原点。
2.频率分布frequencydistribution
Absolutefrequency,modalinterval:
出现频率最多的区间,cumulativeabsolutefrequency,cumulativerelativefrequency
3.均值mean
总体均值populationmean:
μ=∑Xi/N
样本均值samplemean:
X‾=∑Xi/n
Deviationfromthemean,到均值的离差一般为0
加权平均weightedmean
中位数median,中间一位或中间两个的平均数
众数mode:
出现频率最多的数
一组数如果一个数出现频率最多是unimodal(单峰),2个是bimodal,3个trimodal
几何平均geometricmean,调和平均harmonicmean=N/∑(1/Xi)一般用于计算一段时间购买股票的平均成本。
Harmonic 算术平均适合预测将来的singleperiodreturn,几何平均适合预测将来多期的futurecompoundreturn 分位数quantile: quartiles4,quintiles5,decile10,percentile100.当计算结果不是整数时,使用100分位数估计Ly=(n+1)y/100 4.dispersion离差 Range=最大值-最小值 Meanabsolutedeviation(MAD)=∑|Xi-X‾|/n Populationvariance: Samplevariance: 切比雪夫不等式chebyshev’sinequality 对于任意的样本或总体,无论是何种分布,|观察值-均值|落在K个标准差中间的数据的概率大于1-1/k^2(k>1)即observationsliewithinkstandarddeviationsofthemeanisatleast.. 差异系数coefficientofvariation(CV)=Sx(standarddeviationofx)/X‾(averagevalueofx) 衡量每单位E(回报)的风险,越小风险越低! 夏普比率Sharperatio=(Rp‾-Rf)/σp衡量每单位风险的超额回报,越大投资组合越好! 局限性: 1)当两个组合的夏普比率为负时,不一定高的那个表现好,2)对方差计算的不准确导致了夏普值偏高。 偏斜skewness: 最高点的数据用于是mode; Positiveskewed(right)右尾长,mode Negativeskewed(left)左尾长,mean Samplekurtosis=(1/n)*∑(Xi-X‾)^4/s^4 Negativeskewed(left)左尾长的风险较大! 峰度kurtosis---正态分布的峰度为3,常态峰mesokurtic! : leptokurtic尖峰>3,出现偏离均值小的数和偏离均值大的数的概率多morepeak,fattail;platykurtic低峰<3,lesspeak,thintail. Samplekurtosis=(1/n)*∑(Xi-X‾)^4/s^4 Excesskurtosis=samplekurtosis-3 投资收益成尖峰分布的风险较大 三、概率论 Mutuallyexclusiveevents互斥事件,不能同时发生 Exhaustiveevents全事件 Independentevents独立事件,一个事件的发生对其他事件的发生没有影响。 P(A|B)=P(A) Empiricalprobability经验概率: 基于过去的数据,prioriprobability先验概率: 使用推理和检验的方法得到的概率。 Subjectiveprobability主观概率,objectiveprobability Conditionalprobability条件概率,假定事件B发生的事件A发生的概率 Odds: 一个事件发生的概率/不发生的概率 乘法原理multiplicationruleofprobability: 条件概率计算P(AB)=P(AІB)*P(B) 加法原理additionruleofprobability: P(AUB)=P(A)+P(B)-P(AB) 全概率公式totalprobabilityrule: P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+……P(A|Bn)P(Bn),B1…Bn是exclusive&exhaustive 期望值expectedvalue: E(X)=∑P(Xi)Xi 方差 =∑P(Xi)(Xi-E(X))^2=E(X^2)-E(X)^2 协方差covariance: Cov(Ri,Rj)=E{[Ri-E(Ri)][Rj-E(Rj)]},股票和无风险资产的Cov=0 Cov(A,B)=E{[A-E(A)][B-E(B)]=E(AB)-E(A)E(B)这是原始计算公式,可以变形为概率下的两个变量对其ExpectedValue的离差! Correlationcoefficient相关系数=Cov(1,2)/(σ1*σ2) 相关系数永远在-1和+1之间;相关性的含义就是: 两个变量的变化关系,完全正相关,则说明一个变量增加10%,另一个变量也会增加10%,完全负相关则是,一个变量增加10%,另一个变量减少10%。 一般来说,相关性越低,则多元化的好处越大,因为两个股票完全向相反方向移动,多元化之后,则可以改变这个问题。 方差是表征单个股票或者股票组合的收益的离散程度(方差,标准差),而协方差仅仅是投资组合中任意两个变量(股票)之间的相关程度,每个变量都有其自身的离散程度(方差,标准差),但是协方差仅仅是表明两个变量之间的相关程度。 对单只股票的方差的计算有两种方法: 1.根据每种情况发生的概率; 2.根据历史数据进行分析计算 单只股票,因为其不同收益发生的概率不同,其方差为: =∑P(Xi)(Xi-E(X))^2 历史数据的方法是先求出其平均值,再计算其协方差 对于股票组合协方差也是两种方法: 1.根据每种情况发生的概率; 2.根据历史数据进行分析计算 投资组合期望和方差: Portfolioexpectedvalue: E(Rp)=∑wiE(Ri) Portfoliovariance: Var(Rp)=∑∑wiwjCov(Ri,Rj) 投资组合方差----牢记公式 2个股票的组合Var(Rp)=Wa^2 +Wb^2 +2 * 3个股票的组合Var(Rp)=Wa^2 +Wb^2 +Wc^2 +2ab+2ac+2bc 要牢记amortizationtable的计算原理! ---首先计算出PMT,以此数据为基础,计算每次PMT部分的interestcomponent和principalcomponent,根据他们可以计算出endingbalance! Bayes’formula贝叶斯公式: Updatedprobability=(probabilityofnewinformationforagivenevent)/(unconditionalprobabilityofnewinformation)*priorprobabilityofevent 新的信息条件下某事件的条件概率×先验事件的概率/新的信息条件下该事件的无条件概率 P(Bi|A)=P(A|Bi)P(Bi)/∑P(A|Bj)P(Bj),B1…Bn是exclusive&exhaustive Labeling就是我们常说的抽屉问题! 阶乘factorial,二项式combinationformulanCr=n! /r! (n-r)! ,permutationformula排序nPr=n! /(n-r)! 四、Commonprobabilitydistributions分布 Discreterandomvariableandcontinuousrandomvariable(某一点的概率为0) Probabilitydensityfunction---PDF概率密度函数,用于计算一个区间的概率 Cumulativedistributionfunction—CDF概率函数,小于或等于某个值得概率 1.discreteuniformdistribution离散型均匀分布 分布是离散的,每个值的概率相等。 2.binomial二项分布 贝努力Bernoulli分布---每次试验是独立实验,可以重复做! p(x)=nCr*P^r*(1-p)^(n-r) 其方差为σ^2=np(1-p) expectedvalue=E(X)=np 二项式交叉树---正是期权定价的时候学习的 Trackingerror: 一个组合的totalreturn和衡量它表现的benchmark的totalreturn的差。 3.Continuousuniformdistribution 连续性均匀分布---就是一种线性的均匀分布 f(x)=1/b-a,ifa F(X)=0,(xb E(x)=(a+b)/2σ^2=(b-a)^2/12 4.normaldistrbution正态分布 通过mean和方差进行衡量,偏度为0,峰度为3 线性组合的多个正态分布,仍然是正态分布.N个正太随机变量的相关系数个数n(n-1)/2 置信区间confidenceinterval i.对于68%的置信区间,X的取值在其均值的1s和-1s之间 ii.对于90%的置信区间,X的取值在其均值的1.65s和-1.65s之间 iii.对于95%的置信区间,X的取值在其均值的1.96s和-1.96s之间 iv.对于99%的置信区间,X的取值在其均值的2.58s和-2.58s之间 标准正态分布---z=observation-populationmean/standarddeviation=(x-μ)/σ Zvalue---representtheno.ofstandarddeviationagivenobservationisfromthepopulationmean---zvalue就是代表该数据偏离了样本多少个标准差 F(-Z)=1-F(Z) 一个股票分布类似正态分布,expectedreturn=10%,标准差=12%,那么其收益大于30%的概率多少? 30-10=20%---20/12=1.66个标准差---查表得到95.25%的概率小于30%----4.85%的可能性是大于30% Shortfallrisk不足风险---投资组合回报低于某个目标收益的概率 Roy‘ssafetyfirstcriteria罗依安全第一准则---最优组合的投资组合要最小化投资组合收益的概率要低于最低可接受的水平---该最低可接受的水平称为threshold---RL------SFRatio=[E(RP)-RL]/σp,这个比例和夏普比率非常相似---Sharpe=[E(RP)-Rf]/σp 注意SFRatio是小于mean的多少个standarddeviation! 所以SFR越大,则小于threshold的比例就越低----SFR越大越好! SFR和Z-value从概念上来讲是一样的 遇到题目分为两步进行计算: 1)计算SFR;---根据目标收益率或者threshold;2)选择SFR较大的一个 5.Lognormal分布 对数正态分布是向右偏的,对数正态分布永远是正的,所以比较适合建立模型进行资产分析.采用对数正态分布来model投资的pricerelative.Pricerelative就是S1/S0=1+theholdingperiodreturn,Pricerelative=0则说明投资是-100% 离散复利和连续复利 Effectiveannualrate=e^Rcc-1 HoldingperiodreturnHPR的计算公式---ln(S1/S0)=ln(1+HPR)=Rcc IfRcc=10%foroneyear,thentheeffectiveholdingperiodreturnover2years=e^(10%*2)=22.14% TheholdingperiodreturnafterTyearswhentheannualcontinuouslycompoundedrateisRcc----HPRT=(e^Rcc*T)-1,如果两年的连续复利的回报率为A%,则一年的连续复利回报率为A%/2 6.MonteCarlosimulation蒙特卡罗模拟,historicalsimulation历史模拟 蒙特卡洛: 多次重复一个或者多个可能会影响证券价格的riskfactor,来模拟证券价格的分析方法。 一般用于复杂证券定价,模拟交易策略损益,计算VAR,模拟pension与liability,对非正态分布资产组合定价。 步骤: 1对于每个riskfactor,必须定义其可能遵循的概率分布的参数(这里的参数是指mean,variance,possible,skewness等等)! 2随机产生股价和利率的值。 3对每对riskfactor计算期权价格4计算均值 蒙特卡罗模拟的缺陷是: 1)比较复杂;2)对假设非常敏感;3)仅仅是统计而不是分析 历史模拟: 使用历史数据进行分析。 但是缺点是历史数据可能不是未来的goodindication 五、样本和参数估计 样本和population的区别。 Simplerandomsampling和systematicsampling(等间隔抽样) 样本误差,即样本统计与总体参数的差,不可避免 Samplingerrorofthemean=samplemean-populationmean=X‾-μ 样本的分布: 从一个总体中多次抽取相同数量的样本,这些样本统计的概率分布就是Sampledistributionofthesamplestatistic. Sampledistributionofthemean---从一个population中多次抽取出一个个数为1000的sample,来作为对整个population的估计。 这1000个sample的每个sample的平均值构成的分布叫做sampledistributionofthemean 分层抽样stratifiedrandomsampling,将总体按一定特征分成小的group,在从每个group抽样。 时间序列和截面序列: Time-series时间序列---观察一段时间区间内的数据 Cross-sectionaldata---截面序列---在某个特定时间时点,每个股票的收益 中心极限定理: 1.当一个population的mean=μ,标准差为σ,那么当其样本的sizen足够大的时候,不论这个population是否正态分布,则从中抽取的sample的samplingdistributionofsamplemeans接近正态分布---而且其mean=μ,方差为σ^2/n 2.样本要足够大! n>=30样本均值符合正态分布 样本均值的标准误差 Standarderrorofthesamplemean=σ/ ---thestandarddivatinoofthedistributionofthesamplemeans---就是选出来的sample有很多个,每个sample的平均数构成的组合的standarddeviation Desirablepropertiesofanestimator: unbiasedness(估计量的期望=总体的均值),efficiency(方差最小),consistency(随着样本数增大精确性提高) 点估计---用单个样本算出的值来估计总体---pointestimate 1.点估计 2.Confidenceinterval---置信区间---就是一组数据落在一定区间,概率为1-a a.此处a叫做levelofsignificancefortheconfidencelevel b.Theprobability1-a叫做degreeofconfidence c.置信区间的构成----pointestimate±reliabilityfactor×standarderror 当整体population的标准差已知,则Standarderrorofthesamplemean=σ/n^0.5 实际上population的标准差一般都不知道的! Standarderrorofthesamplemean=s/n^0.5 其中s=[∑(xi-x‾)^2/(n-1)]^0.5----此处注意: 是n-1—原因是从正态分布总体中抽取的样本符合t分布! ! 注意三个概念: a.样本标准差s b.总体标准差σ c.样本平均数标准误差σx‾ T分布 1.当样本容量是小样本,属于正态分布或者接近正态分布,而且总体方差未知的情况 2.也适用于总体方差未知,样本容量比较大,从而根据中心极限定理,样本分布接近正态分布的情况 3.T分布的特点 a.对称; b.一个参数可以描述---degreeoffreedom—自由度df=n-1,n是样本数 c.自由度越大,其图形越苗条,越细高! d.注意不要把自由度和峰度搞混,自由度越大越接近正态分布,但是就峰度来讲,正态分布的峰度=3 e.所谓厚尾,是指两侧的尾巴偏离中心0的厚度! f.厚尾! fattertails---偏离平均值的概率比正态分布偏离均值的概率要大! ! g.厚尾意味着更多的数据偏离分布的中心---也就是有很多outlier! h.随着自由度的增加---也就是样本容量的增加,t分布越来越接近正态分布 i.当n大于30的时候,t分布已经接近正态分布了 j.T分布实际上更加扁平 4.置信区间confid
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CFA 一级 总结 数量 统计 部分