CDA题库.docx
- 文档编号:6316042
- 上传时间:2023-01-05
- 格式:DOCX
- 页数:54
- 大小:58.86KB
CDA题库.docx
《CDA题库.docx》由会员分享,可在线阅读,更多相关《CDA题库.docx(54页珍藏版)》请在冰豆网上搜索。
CDA题库
1 现有两个投资项目甲和乙,已知甲、乙方案的期望值分别为 10%、25%,标准离差分别为
20%、49%,那么(A)。
A、甲项目的风险程度大于乙项目的风险程度
B、甲项目的风险程度小于乙项目的风险程度
C、甲项目的风险程度等于乙项目的风险程度
D、不能确定
2 多个方案比较时,标准离差越小的方案,其风险(B)
A、越大B、越小C、两者无关D、无法判断
3 在 Excel2003 中,柱形图类型属于图表中的(B)
A、复合类型B、标准类型C、简单类型D、自定义类型
4n 个标准正态分布的平方和为(A)
A、卡方分布B、t 分布C、F 分布D、正态分布
5(B)是依据样本估计总体分布中所含的未知参数或未知参数的函数。
通常它们是总体的
某个特征值,如数学期望、方差和相关系数等。
A、区间估计B、点估计C、参数估计D、无偏估计
6(C)用于计算间隔不等的连续时点序列的评价发展水平。
A、算术平均数B、 几何平均数C、 加权平均数D、调和平均数
7 当置信水平一定时,置信区间的宽度(A)
A、随着样本量的增大而减小B、随着样本量的增大而增大
C、与样本量的大小无关D、与样本量的平方根成正比
8 下列不能描述变量离期望值大小的指标是( D)
A、变异系数B、标准差C、方差D、相关系数
9EXCEL 中,求标准差的函数是(D)
A、AVERAGEB、MEDIANC、MODED、STDEV
10 结构化数据根据连续性可分为(B)
A、品质数据和数值型数据B、连续型数据和离散型数据
C、截面数据、时间序列数据和面板数据D、一手数据和二手数据
11 结构化数据根据时间特点可分为(C)
A、品质数据和数值型数据B、连续型数据和离散型数据
C、截面数据、时间序列数据和面板数据D、一手数据和二手数据
12 某企业拟进行一项存在一定风险的完整工业项目投资,有甲、乙两个方案可供选择。
已
知甲方案净现值的期望值为 1000 万元,标准差为 300 万元;乙方案净现值的期望值为
1200 万元,标准差为 330 万元。
下列结论中正确的是(B)。
A、甲方案优于乙方案B、甲方案的风险大于乙方案
C、甲方案的风险小于乙方案D、无法评价甲、乙方案的风险大小
13 参数估计分为(A)
A、点估计和区间估计B、区间估计和无偏估计
C、点估计和无偏估计D、区间估计和一致估计
14 求 C5 和 H5 两单元格平均值的函数形式是(B)
A、AVERAGE(C5:
H5)B、AVERAGE(C5,H5)
C、SUM(C5:
H5)/2D、SUM(C5,H5)
15 下列四项中,不正确的提法是(C)
A、SQL 语言是关系数据库的国际标准语言
B、SQL 语言具有数据定义、查询、操纵和控制功能
C、SQL 语言可以自动实现关系数据库的规范化
D、SQL 语言称为结构查询语言
16 无量纲化后各变量的标准差为(B)
A、0B、1C、-1D、原标准差
17 在 Excel2003 中,数据源发生变化时,相应的图表(B)
A、手动跟随变化 B、 自动跟随变化 C、不跟随变化 D、不受任何影响
18 事件 A 的概率 P(A)必须满足 (C)
A、0<P(A)<1B、P(A)=1C、0≤P(A)≤1D、P(A)=0 或
1
19EXCEL 中,求中位数的函数是(B)
A、AVERAGEB、MEDIANC、MODED、STDEV
20 标准正态分布的均值为(A)
A、0B、1C、-1D、不能确定
21 启动 Excel 后自动建立的工作簿文件中自动带有电子工作表有(B)
A、4 个B、3 个C、2 个D、1 个
22 在 Excel 中,能够很好地通过矩形块反映每个对象中不同属性值大小的图表类型是(C)。
A、饼图B、折线图C、柱形图D、散点图
23 在 Excel 中,能反映出同一属性数据变化趋势的图表类型是(A)
A、折线图B、散点图C、饼图D、气泡图
24 生活中“最佳”、“最受欢迎”等与(C)有关
A、平均数B、中位数C、众数D、标准差
25 下列调查中,适合用全面调查方式的是(A)
A、了解某班学生“50 米跑”的成绩B、了解一批灯泡的使用寿命
C、了解一批炮弹的杀伤半径D、了解一批袋装食品是否含有防腐剂
26 估计量的含义是指(A)
A、用来估计总体参数的统计量的名称B、用来估计总体参数的统计量的具体数
值
C、总体参数的名称D、总体参数的具体取值
27 在 10 件同类产品中,其中 8 件为正品,2 件为次品从中任意抽出 3 件的必然事件是
(D)
A、3 件都是正品B、至少有 1 件是次品
C、3 件都是次品D、至少有 1 件是正品
28 指出下面的说法哪一个是正确的(A)
A、置信水平越大,估计的可靠性越大 B、置信水平越大,估计的可靠性越小
C、置信水平越小,估计的可靠性越大 D、 置信水平的大小与估计的可靠性无关
29 对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为(B )回
归方程可能是正确的。
A、y=125-10xB、y=-50+8xC、y=150-20xD、y=-15-6x
30 要了解一批电视机的使用寿命,从中任意抽取 30 台电视机进行试验,在这个问题中,
30 是(C)
A、个体B、总体C、样本容量D、总体的一个样本
1 根据数据量级别,数据可分为(AB)。
A、传统数据B、大数据C、结构化数据D、非结构化数据
2 下列关于统计量的表述中,正确的有(ABCD)
A、估计统一总体参数可以用多个不同统计量B、统计量是样本的函数
C、统计量不含有未知参数D、统计量的分布成为抽样分布
3 互联网生成的数据包括(ABC)
A、电子商务 B、 移动互联网 APP C、 网络游戏D、传感器数据
4 访问法包括(ABCD)
A、小组访谈法B、街头访问C、企业调研D、网上调查
5 数据库是一个(ABCD)数据集合
A、长期存储在计算机内的B、有组织的
C、可共享的D、统一管理的
6 数据转换的类型有(ABCD)
A、变量计算B、加权处理C、标准化D、分类汇总
7 描述数据离散趋势的统计量有(ABCD)
A、极差B、方差C、标准差D、变异系数
8 数据清洗工作主要包括处理(ABCD)
A、缺失数据清洗B、异常数据清洗
C、逻辑错误数据清洗D、重复数据清洗
9 字段合并是将多个单元格的文字或数字合并成一个单元格。
常用(BC)
A、VLOOKUPB、&C、CONCATENATED、MID
10 可采集到的网站访问数据包括(ABCD)
A、访问者属性B、访问者访问网站的频率
C、每次访问停留的时间D、访问者浏览路径
11 数据产生的主要来源有(ABCD)
A、局域网B、离线储存数据C、互联网D、物联网
12 下列可描述相关关系的图表类型有(AC)
A、散点图B、饼图C、气泡图D、瀑布图
13 描述数据集中趋势的统计量有(ABD)
A、平均数B、中位数C、标准差D、众数
14 如果参与分类的变量较多时(比如大于 1000),可以选用的方法是(BC)
A、层次聚类法B、K-均值聚类法
C、两步聚类法D、混合聚类法
15 下列可描述数据走势或趋势的图表类型有(ABC)
A、柱形图B、折线图C、面积图D、饼图
1VCD 连锁店各个商店的每月销售额(万元)和每月用在以上两种媒介的广告支出(见下表
所示数据)。
利用 SPSS 进行多元回归分析。
(1)在 SPSS 中,将销售额选入因变量。
(2)建立多元回归方程,其中电视广告支出的系数为 12.041.
(3)观察 SPSS 的回归结果输出,广播广告支出的系数是否通过检验。
是
(4)分别使用向前引入法和向后剔除法进行多元回归,两者输出的模型结果是否相同。
是
2 以下数据是某公司一年以来的销售额,试采用 EXCEL 数据分析描述统计功能,对成绩进
行分析汇总给出相关统计指标。
求平均销售额(保留两位小数)(93945.92)
求销售额中位数(75402.5)
求销售额的标准差(保留一位小数)(44667.3)
求销售额的最大值(174498)
3 以下数据是 20 个不同产品的两个参数,用 SPSS 软件按要求进行排序。
排序依据为 L1,要求升序排列时,排在第六位的产品编号为(12)。
排序依据为 L2,要求降序排列时,排在第十位的产品编号为(9)。
排序依据为 L1 和 L2,要求先按 L1 升序排列,后按 L2 降序排列,排在第 9 位的产品编
号为
(2)。
排序依据为 L1 和 L2,要求先按 L1 降序排列,后按 L2 升序排列,排在第 6 位的产品编
号为(15)。
4 某对外汉语培训中心对在该中心学习的外国留学生进行了一项汉语学习动机问卷调查。
使用李克特五级式量表。
第一级为最不喜欢,第五级为最喜欢。
随机抽取 18 人参加调查。
整理数据如下
(1)观察 Bartlett 球度检验的 P 值,说明应该(拒绝)原假设。
(答案填写“接受”或
“拒绝”)
(2)结果中,(成分得分系统矩阵)是将因子表示成变量的组合。
(答案填写“成分矩阵”,
“成分转换矩阵”,“成分得分系数矩阵”或“成分得分协方差矩阵”)
(3)观察结果中给出的各变量的信息被提取的比例,说明提取比例最低的是(汉语戏剧)。
(答案填写“兴趣”,“书法”,“汉语歌曲”或“汉语戏剧”)
(4)这里选取了(3)个因子。
(答案填写阿拉伯数字“1,2,3……”)
5 聚类分析在市场细分中应用广泛,可以帮助企业对市场上的产品进行分类,从而更准确
地指定营销策略。
例如,某饮料企业收集了市场上 16 种饮料的热量、咖啡因、钠含量和价
格 4 种变量数据,如下表所示。
(1)将处理过(消除量纲)的变量使用 K-means 聚成 3 类,从输出的方差分析表中看出,
在显著性水平为 0.05 条件下,聚类在“钠”这个指标上是否有显著差异?
(是)(填
“是”或“否”)
(2)将处理过(消除量纲)的变量使用 K-means 聚成 3 类,编号为 8 的饮料属于第
(1)
类。
(答案填写阿拉伯数字“1,2,3……”)
(3)将处理过(消除量纲)的变量使用系统聚类法聚成 2 至 4 类,从输出的结果看出编号
为 5 的饮料和编号为(6)的饮料距离最近。
(答案填写阿拉伯数字“1,2,3……”)
(4)使用系统聚类法,若分成 4 类,编号为 7 的饮料属于第(3)类。
(答案填写阿拉伯数
字“1,2,3……”)
6 某地 1983 年至 1993 年财政收入及棉花产量的资料如下:
(1)简单指数平滑方法能做
(1)期预测.(答案填写阿拉伯数字“1,2,3……”)
(2)棉花产量选用(简单指数平滑)方法做预测。
(答案填写“回归直线”,“简单指数平
滑”,“holt 指数平滑”或“Winter 指数平滑”)
(3)利用 SPSS 的 holt 指数平滑方法预测 1999 年该地区的财政收入为(157.46)元。
(保
留两位小数)
(4)财政收入除了可以选用 holt 指数平滑法预测,还可以选用(回归直线)方法做预测。
(答案填写“回归直线”,“简单指数平滑”,“哑变量回归法”或“Winter 指数平滑”)
7 某百货公司从 1995 年到 2001 年的季度收入情况如下:
单位:
百万美元用 SPSS 进行时间
序列季节分解预测注意:
本案例预测时使用的时间序列的乘积模型如下:
Y = T × S × I (即:
长期趋势 × 季节指数 × 不规则因素)
(1)计算出 1995 年第一季度的季节指数(0.9126)(保留四位小数)
(2)计算出 1995 年第一季度的非季节变化收入(10168.7458)(保留四位小数)
(3)第(4)个季节的季节指数最大.(答案填写阿拉伯数字“1,2,3……”)
(4)用趋势项对时间 t 做线性回归,建立的回归方程中的常数项系数为(8977.463)。
(保
留 3 位小数)
8 用 SPSS 软件对以下输入数据做异常值分析和处理。
对这些数据做异常值查找时,可选择“分析”->“描述统计”->(探索)。
(可填答案
“频率”、“描述”、“探索”、“交叉表”)
完成第一步操作后,我们只找异常值,则需要在统计量中选择(界外值)。
(可填答案
“描述性”、“M_估计量”、“界外值”、“百分位数”)
在输出结果中列出的五个最大值中排在第一的数值是(174498)
在输出结果中列出的五个最小值中排在第一的数值是(4765)
9 用 SPSS 软件做替换缺失值处理,完成下列题目。
1.用连续均值填补缺失值后,10 月销售额为(83.02)
2.用附近点的平均值填补缺失值后,10 月销售额为(116.48)
3.用线性插值填补缺失值后,10 月销售额为(115.1)
4.用点的线性趋势填补缺失值后,10 月销售额为(115.77)
10 用 SPSS 软件处理下列重复数据,完成下列题目。
需要给重复个案做标记,产生一个新标记变量的 SPSS 操作是选定“数据”选项下的
(标识重复个案)选项。
(可填答案“标识异常个案”、“标识重复个案”、“个案选择”
标记重复个案新生成的变量用(0)标记重复个案。
(可填答案为 0 或 1)
标记重复个案新生成的变量用
(1)标记基本个案。
(可填答案为 0 或 1)
删除重复数据时,需要选定数据->选择个案->选定如果条件满足框输入重复标记=1,输
出框选择(删除未选定个案)。
(可写答案:
“过滤掉未选个案”、“将选定个案复制到新数
据集”、“删除未选定个案”)
11 某班 20 名学生考试成绩如下表所示,采用 EXCEL 数据分析描述统计功能,对成绩进行
分析汇总给出相关统计指标。
求这 20 名学生的考试成绩均分(保留一位小数)(83.7)
求这 20 名学生的考试成绩的中位数(83)
求这 20 名学生的考试成绩的众数(83)
求这 20 名学生的考试成绩标准差(保留两位小数)(7.66)
12 某百货公司从 1995 年到 2001 年的季度收入情况如下:
单位:
(百万美元)
用 SPSS 进行季节哑变量多元回归预测
(1)协变量应放置(数值)类型的变量.(答案填“数值”,“字符”,“日期”,“二进制”)
(2)SPSS 选用的参照项是第(4)季度.(答案填写阿拉伯数字“1,2,3……”)
(3)虚拟变量 1 的参数估计值为(-4561.141)(保留三位小数)
(4)此案例建立的哑变量回归方程中有(3)个虚拟变量.(答案填写阿拉伯数字
“1,2,3……”)
13 我国钢材消费量(万吨)与国民收入(亿元)的资料如下。
利用 SPSS 进行一元回归分
析。
(1)令钢材消费量为(因变量)。
(答案填写“自变量”或“因变量”)
(2)建立回归方程,用最小二乘法进行参数估计,求出 a,b(a 为斜率,b 为截距)。
算
出 b 的值为(-460.5282)。
(结果保留 3 位小数)
(3)观察 SPSS 结果中的模型汇总表,回归直线对样本数据点是否拟合良好(是)(填
“是”或“否”)
(4)若 1981 年至 1985 年,国民收入以 4.5%的速度递增,则国民收入见下表。
利用 SPSS 预测 1981 年的钢材消费量为(3006.69)万吨。
(四舍五入保留两位小数)
14 以下数据是XX 2011 年-2014 年各季度的营业收入,试采用 EXCEL 数据分析描述统计功
能,对成绩进行分析汇总给出相关统计指标。
求营业收入的均值(保留两位小数)(69.18)
求营业收入的中位数(保留两位小数)(62.50)
求营业收入的标准差(保留整数)(32)
求营业收入的最大值(135.2)
15 下表是某单位年终奖金分配表,采用 EXCEL 数据分析描述统计功能,求解该单位年终奖
金分配中的最高金额、最低金额、平均金额、中间金额、众数金额等。
求该单位年终奖金分配中的最高金额(50000)
求该单位年终奖金分配中的最低金额(6000)
求该单位年终奖金分配中的平均金额(22750)
求该单位年终奖金分配中的众数金额(15000)
四、 判断题
1 中位数具有不唯一性(×)
2 聚类分析中,各变量的取值不应有数量级上的过大差异(√)
3 原假设是指研究者想收集证据予以反对的假设,通常指参数没有变化或变量之间没有关
系 。
(√)
4 分销网络的区位选择属于间接的短期刺激(×)
5 标准差越大,正态分布曲线越平坦,概率分布密度越低。
(√)
6 顾客要求提供的产品或服务比较优秀,但并不是“必须”的产品属性或服务行为是兴奋
型需求。
(×)
7 在多元线性回归模型中,解释变量可以有相关性(×)
8 描述数据成分关系时,若成分过多可使用复合饼图或复合条饼图。
(√)
9 标准差越大,正态曲线越高越陡峭。
(×)
10KANO 模型定义了四个层次的顾客需求。
(×)
11 客户获取通常发生在客户生命周期中的考察期(√)
12bigint 是 SQL 的数据类型。
(√)
13 拟合优度 R 方越大,回归直线的拟合程度越好(√)
14 正态分布曲线的两个尾端无限接近横轴且理论上不会与之相交。
(√)
15 异常值是指一批数据中的个别值,其数值明显偏离该批数据的其余值,也称离群值。
(√)
一、 单选题
1 无量纲化后各变量的标准差为(B)
A、0B、1C、-1D、原标准差
2 在 Excel 中,数据类型包括(D)
A、数值型数据B、字符型数据C、逻辑型数据D、以上
全部
3 下列调查中,适合用全面调查方式的是(A)
A、了解某班学生“50 米跑”的成绩B、了解一批灯泡的使用寿命C、
了解一批炮弹的杀伤半径D、了解一批袋装食品是否含有防腐剂
4 下列调查方式中适合的是(C)
A、要了解一批节能灯的使用寿命,采用普查方式
B、调查你所在班级同学的身高,采用抽样调查方式
C、环保部门调查某段水域的水质情况,采用抽样调查方式
D、调查全市中学生每天的就寝时间,采用普查方式
5 估计量的含义是指(A)
A、用来估计总体参数的统计量的名称B、用来估计总体参数的统计量的
具体数值C、总体参数的名称D、总体参数的具体取值
6 在 Excel 2010 的单元格中,输入函数=sum(10,25,13),得到的值为(B)
A、25B、48C、10D、28
7n 个标准正态分布的平方和为(A)
A、卡方分布B、t 分布C、F 分布D、正态分布
8 下列四项中,不属于数据库特点的是(C)
A、数据共享B、数据完整性C、数据冗余很高D、数据
独立性高
9 在 Excel 2010 的工作表中,假定 C3:
C6 区域内保存的数值依次为 10、15、20 和 45,则
函=AVERAGE(C3:
C6)的值为(B)
A、22B、22.5C、45D、90
10 已知甲、乙两班学生统计学考试成绩:
甲班平均分为 70 分,标准差为 7.5 分;乙班平
均分为 75 分,标准差为 7.5 分。
由此可知两个班考试成绩的离散程度(A )。
A、甲班较大B、乙班较大C、两班相同D、无法作比较
11Excel2003 工作簿文件的默认扩展名为(A)
A、xlsB、docC、mbdD、ppt
12(B)用于计算平均发展速度
A、算术平均数B、几何平均数C、加权平均数D、调和
平均数
13 在 SQL 中,用来显示数据库信息的系统存储过程是(D)
A、sp-dbhelpB、sp-dbC、sp-helpD、sp-helpdb
14(A)用于计算时期序列的平均发展水平或间隔相等的连续时点序列的平均发展水平。
A、算术平均数B、几何平均数C、加权平均数D、调和
平均数
15 在 Excel2003 中,柱形图类型属于图表中的(B)
A、复合类型B、标准类型C、简单类型D、自定义类型
16EXCEL 中,求中位数的函数是(B)
A、AVERAGEB、MEDIANC、MODED、STDEV
17 当向 Excel2003 工作簿文件中插入一张电子工作表时,默认的表标签中的英文单词为
(A)
A、SheetB、BookC、TableD、List
18 下列不能描述变量离期望值大小的指标是(D )
A、变异系数B、标准差C、方差D、相关系数
19 标准离差率是标准离差与(D)相比求出的相对数。
A、投资报酬B、风险报酬C、原始投资D、期望值
20 下列说法正确的为(C )
A、概率就是频率B、概率为 1 的事件可以不发生C、概率为 0 的
事件一定不会发生D、概率不可以是一个无理数
21 服从参数为 x 的泊松分布数学方差为(A)
A、xB、1/x
22 求 C5 和 H5 两单元格平均值的函数形式是(B)
A、AVERAGE(C5:
H5)B、AVERAGE(C5,H5)C、SUM(C5:
H5)/2
D、SUM(C5,H5)
23SQL 中基本查询语句是(A)
A、SELECTB、SELECT FROMC、WHERED、CREAT
24 变异系数越大,表示风险程度越(A)
A、大B、小C、不变D、等于零
25 任一随机事件出现的概率为(D)
A、在-1 到 1 之间B、小于 0C、不小于 1D、在 0 与 1
之间
26 在 Excel 2003 中,图表被建立在(A)
A、二维坐标系中B、一维坐标系中C、三维坐标系中D、
更高维坐标系中
27 目前,(A)数据库系统已经逐渐淘汰了网状数据库和层次数据库,成为当今最为流行的
商用数据库系统。
A、关系B、面向对象C、分布D、层次
28 一个 95%的置信区间是指(C)
A、总体参数有 95%的概率落在这一区间内
B、总体参数有 5%的概率未落在这一区间内
C、在用同样方法构造的总体参数的多个区间中,有 95%的区间包含该总体参数。
D、在用同样方法构造的总体参数的多个区间中,有 95%的区间不包含该总体参数。
29 结构化数据根据采集方式可分为(D)
A、品质数据和数值型数据B、连续型数据和离散型数据C、截面
数据、时间序列数据和面板数据D、一手数据和二手数据
30 计算平均数的基本要求是所要的平均数的总体单位应是(B )
A、大量的B、同质的C、差异的D、少量的
二、 多选题
1 访问法包括(ABCD)
A、小组访谈法B、街头访问C、企业调研D、网上调查
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- CDA 题库