数据分析与R语言12_精品文档.pdf
- 文档编号:3210835
- 上传时间:2022-11-20
- 格式:PDF
- 页数:21
- 大小:780.33KB
数据分析与R语言12_精品文档.pdf
《数据分析与R语言12_精品文档.pdf》由会员分享,可在线阅读,更多相关《数据分析与R语言12_精品文档.pdf(21页珍藏版)》请在冰豆网上搜索。
DATAGURU专业数据分析网站2012.7.22数据分析与R语言第12周DATAGURU专业数据分析网站2012.7.22因子分析降维的一种方法,是主成分分析的推广和发展是用于分析隐藏在表面现象背后的因子作用的统计模型。
试图用最少个数的不可测的公共因子的线性函数与特殊因子之和来描述原来观测的每一分量例子:
各科学习成绩(数学能力,语言能力,运动能力等)例子:
生活满意度(工作满意度,家庭满意度)例子:
薛毅书P5222DATAGURU专业数据分析网站2012.7.22因子分析的主要用途减少分析变量个数通过对变量间相关关系的探测,将原始变量分组,即将相关性高的变量分为一组,用共性因子来代替该变量使问题背后的业务因素的意义更加清晰呈现3DATAGURU专业数据分析网站2012.7.22与主成分分析的区别主成分分析侧重“变异量”,通过转换原始变量为新的组合变量使到数据的“变异量”最大,从而能把样本个体之间的差异最大化,但得出来的主成分往往从业务场景的角度难以解释因子分析更重视相关变量的“共变异量”,组合的是相关性较强的原始变量,目的是找到在背后起作用的少量关键因子,因子分析的结果往往更容易用业务知识去加以解释4DATAGURU专业数据分析网站2012.7.22因子分析使用了复杂的数学手段比主成分分析更加复杂的数学模型求解模型的方法:
主成分法,主因子法,极大似然法结果还可以通过因子旋转,使到业务意义更加明显5DATAGURU专业数据分析网站2012.7.22数学模型6DATAGURU专业数据分析网站2012.7.22数学模型7DATAGURU专业数据分析网站2012.7.22因子模型性质8DATAGURU专业数据分析网站2012.7.22统计意义因子载荷的意义共同度特殊方差总方差贡献9DATAGURU专业数据分析网站2012.7.22因子载荷矩阵和特殊方差矩阵的估计主成分法主因子法极大似然法10DATAGURU专业数据分析网站2012.7.22主成分法通过样本估算期望和协方差阵求协方差阵的特征值和特征向量省去特征值较小的部分,求出A、D程序例子11DATAGURU专业数据分析网站2012.7.22主因子法首先对变量标准化给出m和特殊方差的估计(初始)值求出简约相关阵R*(p阶方阵)计算R*的特征值和特征向量,取其前m个,略去其它部分求出A*和D*,再迭代计算12DATAGURU专业数据分析网站2012.7.22极大似然法似然函数极大似然函数算法描述(薛毅书p533)13DATAGURU专业数据分析网站2012.7.22方差最大的正交旋转由于因子载荷矩阵不是唯一,有时因子的实际意义会变得难以解释。
因子载荷矩阵的正交旋转因子载荷方差载荷值趋于1或趋于0,公共因子具有简单化的结构varimax()函数14DATAGURU专业数据分析网站2012.7.22因子分析函数factanal()15DATAGURU专业数据分析网站2012.7.22因子得分薛毅书p54316DATAGURU专业数据分析网站2012.7.22知识点1数据分析体系的多层模型。
数据挖掘与统计分析有什么区别?
2ETL是什么?
ETL层负责哪些功能?
3OLAP是什么?
DW=ETL+OLAP4什么是BI?
BI系统主要由哪些部分构成?
5R语言的历史和特点6R中与向量和矩阵运算有关的函数和运算符7R中用于求基本统计量的函数8R中数据框的操作,及怎样从外部数据文件读入数据9R中产生各种分布随机数的函数10R中涉及下标操作及定位、筛选有关的函数和写法17DATAGURU专业数据分析网站2012.7.22知识点11直方图、散点图(多种)、箱型图、柱状图、饼图、星相图、脸谱图、茎叶图、向日葵散点图、热力图、密度图、三维图等常见统计图的画法和意义12熟悉R常用的内置数据集13R的条件判别语句与循环语句14R的判别函数15R的集合运算函数16协方差与相关系数的意义与计算17怎样使用R进行线性回归分析,及有关建模和计算函数18线性回归模型结果的解释,及各项指标的意义19多元线性回归应该怎样选择合适的变量?
20logistic回归模型18DATAGURU专业数据分析网站2012.7.22知识点21怎样用apriori算法做购物篮分析?
22线性分类法的原理及线性判别函数23距离判别法的原理。
有哪些距离(点与点之间,点集与点集之间)?
24贝叶斯分类器的原理25怎样利用决策树算法进行分类?
26knn分类算法的细节27层次聚类法的原理与有关实现函数28k-means聚类法的原理与实现函数29k中心聚类法的原理30dbscan聚类法的原理19DATAGURU专业数据分析网站2012.7.22知识点31主成分分析的原理和计算32因子分析的原理和计算20DATAGURU专业数据分析网站FAQ时间21
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 语言 12 精品 文档