CDA数据分析师认证试题库精选Word下载.docx
- 文档编号:21232740
- 上传时间:2023-01-28
- 格式:DOCX
- 页数:14
- 大小:77.43KB
CDA数据分析师认证试题库精选Word下载.docx
《CDA数据分析师认证试题库精选Word下载.docx》由会员分享,可在线阅读,更多相关《CDA数据分析师认证试题库精选Word下载.docx(14页珍藏版)》请在冰豆网上搜索。
单项选择题
1.调查城镇居民对政府服务的满意度,需要抽取足够的居民,这种方法称为()
A.随机抽样法
B.统计分组法
C.回归分析法
D.大量观察法
2.用部分数据推断总体数据的方法,属于()
A.理论统计学的容
B.应用统计学的容
C•推断统计学的容
D.描述统计学的容
3.构成一个统计总体,必须具有若干特征,下列不属于统计总体特征的是()
C.变异性D.大量性
4.下列不属于原始数据来源的是()
A.行政记录
B.统计调查
C.统计年鉴
D.实验
5.在进行普查时,必须要规定标准时间,其目的是为了()
A.避免登记的重复和遗漏
B.确定调查对象的围
C.确定调查单位
D.保证调查的及时性
6.某出口企业对其产品质量进行检验,采用的调查方式是()
A.普查B.随机抽样调查
C.判断抽样调查D.方便抽样调查
7.了解居民消费水平的变化状况,一般采用入户调查。
确定样本户的方式是()
A.系统抽样
B.分层抽样
C.整群抽样
D.多步抽样
8.抽样调查与普查的根本区别是()
A.作用不同B.灵活程度不同
C.选取观察值的方法不同D.精确度不同
9.在抽样调查中,()
A.不会出现登记性误差,只会出现代表性误差
B.会出现登记性误差,不会出现代表性误差
C.既会出现登记性误差,也会出现代表性误差
D•既不会出现登记性误差,也不会出现代表性误差
10.统计调查表中的调查项目就是()
A.统计指标B.统计数值
C.统计分组D.统计标志
11.街头拦截获得样本数据的方式属于()
A.普查B.方便抽样调查
C.判断抽样调查D.随机抽样调查
12.普查中的标志时间是指()
A.进行调查工作的时间B.调查数据所属时间
C.记录数据的时间D.数据上报的时间
13.某次调查收集了300名学生的性别、专业和月手机支出额的数据,这项调查的变量个数有()
A.1个B.2个C.3个D.300个
14.构成截面数据的两个要素是()
A组距和各组频数B组限和各组频数
C组中值和各组频数D分组标志和各组频数
15.在全距既定的情况下()
A.组数越多则组距越大
B.组数越多则组距越小
C.组数越少则组距越小
D.组数与组距无对应关系
16.适合编制单值数列的数据是()
A.连续型变量且数据变动围较小
B.离散型变量且数据变动围较小
C•连续型变量且数据变动围较大
D.离散型变量且数据变动围较大
17.在编制等距式分组数列时如果全距57,组数为7,为了计算方便,组距应当取()
A.8.1B.8C.7D.10
18.在平面直角坐标轴中,横轴刻度表示直方图的()
A.频数B.组中值
C.组距D.组限
19.对数据进行分组时,采用等距分组还是异组距分组,取决于()
A.变量值的多少
B.次数的多少
C.研究现象的特点
D.组数的多少
20.对工业企业按经济类型分组和按利润额分组()
A.都属于质别标志分组
B.都属于量别标志分组
C.前者属于质别标志分组,后者属于量别标志分组
D.前者属于量别标志分组,后者属于质别标志分组
21.集中趋势描述指标中最常用的是()
A.算术平均数B.几何平均数C.众数D.中位数
22.在离中趋势的描述指标中,最容易受极端值影响的是()
A变异系数B方差
C全距D标准
23.用组中值来计算均值时,假定各组变量()
A.次数相等
B.组限是封闭的
C.在组均匀分布或对称分布
D.组中值是整数
24.
两组数据的均值不等,但标准差相等,则(
25.已知甲班学生“统计学”的平均成绩为86分,标准差是12.8分,乙班学生“统计学”的平均成绩是90分,标准差是10.3分,下列表述正确的是()
乙班平均成绩的代表性高于甲班
甲班平均成绩的代表性高于乙班甲、乙两班平均成绩的代表性相同甲、乙两班平均成绩的代表性无法比较
26.对同一变量数列,以不同集中趋势指标为中心计算标准差,标准差数值最小的是()
A.以中位数为中心计算的标准差
B.以算术平均数为中心计算的标准差
C.以众数为中心计算的标准差
D.以几何平均数为中心计算的标准差
27.某地区城镇居民家庭年收入最多的是7.2万元,家庭年收入的平均数是8万元,该地区家庭年收入的分布为()
A.左偏分布B.右偏分布C.J型分布D.对称分布
28.权数对算术平均数的影响取决于()。
A权数的总和B权数的绝对值C权数的平均数D权数的相对数
29.某市有各类书店500家,其中大型50家,中型150家,小型300家。
为了调查该市图书销售情况,拟抽取30家书店进行调查。
如果采用分层等比例抽样法,下列在大型、中型、小型书店中样本的正确分配量为()
A.5、15、10B.7、10、13C.10、10、10D.3、9、18
30.抽样调查中,无法避免和消除的是()
A.登记误差B.系统性误差
C.随机误差D.测量工具误差
31.估计量的数学期望等于总体参数这一性质称为()
A.一致性B.无偏性
C.有效性D.随机性
32.总体均值的置信区间等于样本均值加减估计误差,其中的估计误差等于置信水平的临界值乘以()
A.样本均值的抽样标准差B.样本标志差
C.样本方差D.总体标志差
33.下列关于统计量的表述中,不正确的是()
A.统计量是样本的函数
B.估计同一总体参数可以用多个不同统计量
C.统计量是随机变量
D.统计量的数值是唯一的
34.某品牌袋装白糖每袋重量的标志是500±
5克。
为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。
下列说法中错误的是()
A.样本量为10B.抽样误差是2克
C.样本平均每袋重量是估计量D•点估计值为498克
35.对一部贺岁片收视率进行调查,随机抽取100人,其中有20人没有看过该部贺岁片,则看过该部贺岁片人数点估计值为()
20%B.20C.80D.80%
36.某企业根据对顾客随机抽样的信息得到对该企业产品表示满意的顾客比率的95%置信度
的置信区间是(56%,64%)。
下列正确的表述是()。
A.总体比率的95%置信度的置信区间为(56%64%
B.总体真实比率有95%勺可能落在(56%64%中
C.区间(56%64%)有95%勺概率包含了总体真实比率
D.由100次抽样构造的100个置信区间中,约有95个覆盖了总体真实比率
第三部分:
多项选择题
1.
统计学的容包括(
E.数据的整理方法
2.统计数据必须具有的特点是(
A.数量性B.客观性
C.具体性D.通用性
E.总和性
3.描述统计学的容包括()
A.收集数据的方法
B.整理数据的方法
C.用集中趋势量数描述数据
D.用离中趋势量数描述数据
E.用样本数据对总体数据进行推断
4.推断统计学的容包括()
B.怎样从总体中抽取样本
D.怎样控制样本对总体的代表性误差
5.统计数据的特点()
A.大量性
B.客观性
C.具体性
D.总合性
E.数量性
6.统计数据按来源分类,可以分为()
A.质别数据
B.次级数据
C.量别数据
D.初级数据
E.截面数据
7.在抽样调查中,产生非抽样误差的原因有()
A.错误地定义调查总体B.问卷设计的不合理
C.抽样方法不正确D.被调查人员的配合程度
E.调查人员的工作态度和业务水平
8.调查过程中产生登记误差的原因是()
A.调查者记录数据有误
B.调查者计算数据有误
C.调查者汇总数据有误
D.被调查者提供数据有误
E.调查样本分布不合理
9.对采集来的初级数据在整理之前应该进行()
A.相关性审核
B.完整性审核
C.时效性审核
D.适用性审核
E.准确性审核
10..统计调查方案包括的容有()
A.调查的目的B.确定调查的对象
C.确定调查项目和调查表D.确定调查时间和地点
E.确定调查的组织计划
11.对于次级数据,应该进行以下一些方面的审核()
A.完整性B.准确性
C.时效性D.适用性
E.合理性
12.统计分组应该遵循的基本原则是()
A.穷尽
B.适用
C.互斥
D.合理
E.随机
13.关于离散型变量,下列表述正确的是()
A.可以采用单值分组
B.可以采用组距分组
C.相邻组的上下限可以间断
D.相邻的上下限可以重叠
E.可按“上限不在组”原则处理上下限相同的变量
14.编制频数分布表的目的是()
A.显示数据的差异
B.显示数据的分布状况
C.显示数据的中心
D.显示数据的相互关系
E.显示数据的属性
15.编制组距数列时,对于组限的确定,()
A.最小组的下限应大于最小变量值
B.最小组的下限应略小于最小变量值
C.最大组的上限应小于最大变量值
D.最大组的上限应略大于最大变量值
E.最小组的下限和最大组的上限应分别等于最小和最大变量值
16.下列可以表示连续型变量的统计图有()
A.条型图B.直方图
C.折线图D.饼图
E.茎叶图
17.正确计算组中值的方法是()
A.(上限+下限)/2
B•上限+下限/2
C.上限-下限/2
D•上限-邻组组距/2
E.下限+邻组组距/2
18.计算变异系数是为了比较()
A.不同变量数列的相对集中趋势
B.不同变量数列的相对离中趋势
C.不同变量数列的绝对离中趋势
D.均值不同的变量数列的相对集中趋势
E.均值不同的变量数列的相对离中趋势
19.茎叶图包含如下信息()
A.变量的原始数据信息
B.变量的频数信息
C.累积频数信息
D.数据的分布形态信息
E.数据的众数信息
20.一组数据的标准差数值越小,说明该组数据的()
A分布远离集中趋势指标B集中趋势指标具有较高的代表性
C分布比较接近集中趋势指标D集中趋势指标具有较低的代表性
E分布呈均匀分布
21.
这五个统计量是()
箱索图是用一组数据的五个顺序统计量来描述数据的分布状况的,
A中位数
众数
四分位数
D极值
算术平均数
22.
变异系数抽象了(
23.
24.关于中位数,下列说法正确的有(
C.
E.是根据所有标志值计算出来的
)
是一组数据一般水平的代表值
D.当数据高度偏斜时更能描述集中趋势
25.关于众数,下列说法正确的有(
A.是数据中出现次数最多的标志值
B.不受极端数值的影响
C.是一组数据一般水平的代表值
D.对一个变量数列来说不一定存在
E.是根据所有观测值计算出来的
26.基本的随机抽样设计有()
A.整群抽样
C.简单随机抽样
D•系统抽样
E.多步抽样
27.下列哪些情况符合使用正态分布的条件?
()
A.从正态总体中抽取小样本,总体标志差已知
B.从正态总体中抽取大样本,总体标志差已知
C.从非正态总体中抽取小样本,总体标准差已知
D.从非正态总体中抽取大样本,总体标志差未知
E.从正态总体中抽取小样本,总体标准差未知
28.以下哪些属于优良估计量的评价标准(
A.一致性B.把握性
C.有效性D.无偏性
E.正态性
29.在对总体均值进行区间估计时,影响置信区间宽度的影响是()
A.总体中各个数据的差异程度
B.抽取样本的方式
C.样本容量的大小
D.估计的可靠性
E.总体数量的大小
30.要提高抽样判断的精度,可采用的方法有()
A.增加样本单位数目
B.减少样本单位数目
C.缩小观测值之间的差异程度
D.改善抽样的组织方式
E.改善抽样的方法
《SPSS部分》
(一)单选题
1.SPSS主要应用于以下哪种类型的数据()
A、横截面数据
B数据序列数据
C面板数据
D以上都不对
2.SPSS处理多选题格式在以下哪个菜单里进行()
A、设定表
B多响应集
C均值过程
D交叉表
3.检查异常值常用的统计图形()
A、条形图
B箱体图
C帕累托图
D线图
4.使用SPSS变换长形或宽形数据结构的过程是()
A、排列变量
B正交设计
C数据重组
D数据转置
5.线性回归里的残差分析不可能用于诊断()
A、残差独立性
B变量分布
C异常值侦察
D最大迭代次数
6.使用单尾还是双尾检验主要依据()
A、统计检验
B理论依据
C样本量大小
D偏度或峰度值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CDA 数据 分析 认证 试题库 精选