AI应知应会小月题库98道Word文件下载.docx
- 文档编号:13994009
- 上传时间:2022-10-16
- 格式:DOCX
- 页数:24
- 大小:23.49KB
AI应知应会小月题库98道Word文件下载.docx
《AI应知应会小月题库98道Word文件下载.docx》由会员分享,可在线阅读,更多相关《AI应知应会小月题库98道Word文件下载.docx(24页珍藏版)》请在冰豆网上搜索。
4、将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?
A频繁模式挖掘
B分类和预测
C数据预处理
D数据流挖掘
C
5、当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?
A分类
C关联分析
D隐马尔可夫链
B
6、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?
A根据内容检索
B建模描述
C预测建模
D寻找模式和规则
7、下面哪种不属于数据预处理的方法?
A变量代换
B离散化
C聚集
D估计遗漏值
8、假设12个销售价格记录组已经排序如下:
5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。
等频()划分时,15在第几个箱子内?
A第一个
B第二个
C第三个
D第四个
9、下面哪个不属于数据的属性类型——[单选题]
A标称
B序数
C区间
D相异
10、只有非零值才重要的二元属性被称作——[单选题]
A计数属性
B离散属性
C非对称的二元属性
D对称属性
11、以下哪种方法不属于特征选择的标准方法:
A嵌入
B过滤
C包装
D抽样
12、下面不属于创建新属性的相关方法的是:
A特征提取
B特征修改
C映射数据到新的空间
D特征构造
13、下面哪个属于映射数据到新的空间的方法?
A傅立叶变换
B特征加权
C渐进抽样
D维归约
14、假设属性income的最大最小值分别是12000元和98000元。
利用最大最小规范化的方法将属性的值映射到0至1的范围内。
对属性income的73600元将被转化为:
A0.821
B1.224
C1.458
D0.716
15、一所大学内的各年纪人数分别为:
一年级200人,二年级160人,三年级130人,四年级110人。
则年级属性的众数是:
A一年级
B二年级
C三年级
D四年级
16、下列哪个不是专门用于可视化时间空间数据的技术——[单选题]
A等高线图
B饼图
C曲面图
D矢量场图
17、在抽样方法中,当合适的样本容量很难确定时,可以使用的抽样方法是——[单选题]
A有放回的简单随机抽样
B无放回的简单随机抽样
C分层抽样
DD
18、数据仓库是随着时间变化的,下面的描述不正确的是——[单选题]
A数据仓库随时间的变化不断增加新的数据内容
B捕捉到的新数据会覆盖原来的快照
C数据仓库随事件变化不断删去旧的数据内容
D数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合
19、下面关于数据粒度的描述不正确的是——[单选题]
A粒度是指数据仓库小数据单元的详细程度和级别
B数据越详细,粒度就越小,级别也就越高
C数据综合度越高,粒度也就越大,级别也就越高
D粒度的具体划分将直接影响数据仓库中的数据量以及查询质量
20、有关数据仓库的开发特点,不正确的描述是:
A数据仓库开发要从数据出发
B数据仓库使用的需求在开发出去就要明确
C数据仓库的开发是一个不断循环的过程,是启发式的开发
D在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式
21、关于OLAP的特性,下面正确的是——[单选题]
A
(1)
B
(2)
C
(1)
D
(1)
22、关于OLAP和OLTP的区别描述,不正确的是:
AOLAP主要是关于如何理解聚集的大量不同的数据.它与OTAP应用程序不同
B与OLAP应用程序不同,OLTP应用程序包含大量相对简单的事务
COLAP的特点在于事务量大,但事务内容比较简单且重复率高
DOLAP是以数据仓库为基础的,但其最终数据来源与OLTP一样均来自底层的数据库系统,两者面对的用户是相同的
23、关于OLAP和OLTP的说法,下列不正确的是:
()——[单选题]
AOLAP事务量大,但事务内容比较简单且重复率高
BOLAP的最终数据来源与OLTP不一样
COLTP面对的是决策人员和高层管理人员
DOLTP以应用为核心,是应用驱动的
24、设X={1,2,3}是频繁项集,则可由X产生()个关联规则。
A4
B5
C6
D7
25、考虑下面的频繁3-项集的集合:
{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含——[单选题]
A1,2,3,4
B1,2,3,5
C1,2,4,5
D1,3,4,5
26、在图集合中发现一组公共子结构,这样的任务称为——[单选题]
A频繁子集挖掘
B频繁子图挖掘
C频繁数据项挖掘
D频繁模式挖掘
27、下列度量不具有反演性的是——[单选题]
A系数
B几率
CCohen度量
D兴趣因子
28、下列()不是将主观信息加入到模式发现任务中的方法。
A与同一时期其他数据对比
B可视化
C基于模板的方法
D主观兴趣度量
29、以下哪些算法是分类算法——[单选题]
ADBSCAN
BC4.5
CK-Mean
DEM
30、以下哪种算法属于描述性分析方法——[单选题]
A决策树
B逻辑回归
C聚类
D随机森林
31、下列几种分类模型,哪个模型产生的结果相对于另外几个模型,更具有可解释性——[单选题]
B随机森林
C支持向量机
D神经网络
32、出现下列哪种情形,说明当前模型很可能过度拟合——[单选题]
A训练集准确度很低,测试集准确度很低
B训练集准确度很低,测试集准确度很高
C训练集准确度很高,测试集准确度很低
D训练集准确度很高,测试集准确度很高
33、Python中,有两个变量a='
1'
,b='
2'
,则执行c=a+b之后,c的值为——[单选题]
A'
12'
B'
3'
C12
D3
34、下面哪种数据结构中,不能出现重复的元素——[单选题]
Alist
Btuple
Cnumpy.ndarray
Dset
35、有两个tuple(),a=(),b=(),则执行c=a+b之——[单选题]
A(5,7,9)
B(1,2,3,4,5,6)
C21
D((1,2,3),(4,5,6))
36、有两个numpy数组,a=np.array(),b=np.array(),若执行c=np.dot(a,b),则c的值为——[单选题]
A[2,
B[6,
C20
D15
37、有以下的文本文件pm25.txt,想用pandas读取成数据框,以下哪种方法是正确的海门:
:
9:
121.15:
31.89鄂尔多斯:
12:
109.781327:
39.608266招远:
120.38:
37.35舟山:
122.207216:
29.985295齐齐哈尔:
14:
123.97:
47.33盐城:
15:
120.13:
33.38——[单选题]
Apd.read_csv('
pm25.txt'
Bpd.read_csv('
Cpd.read_csv('
Dpd.read_csv('
38、有两个pandas数据框df1与df2,想要以user_id为key,合并两张表,希望结果中只保留df1中出现过的user_id,下列语句中正确的是——[单选题]
Apd.merge(df1,
Bpd.merge(df1,
Cpd.merge(df1,
Dpd.merge(df1,
39、有一个数据框df,其中一列sex代表性别,另一列height代表身高,想要分别计算男生、女生的平均身高,下列方法中正常的是——[单选题]
Adf['
height'
].mean(axis='
sex'
)
Bdf.groupby('
)['
].mean()
Cdf.groupby('
Ddf.mean('
).groupby('
40、python可视化包matplotlib中,想将图片左右平分为两个子图,并且随后将在左边这张子图上做图,应该先执行以下哪个语句——[单选题]
Aplt.subplot(1,
Bplt.subplot(2,
Cplt.subplot(1,
Dplt.subplot(2,
41、某银行有一份贷款履约情况的数据,涉及10000条贷款记录,其中500条出现了违约情况。
以是否违约作为目标,把原始数据切分为80%作为训练集,20%作为测试集,用训练集数据建立了一个分类模型,该分类模型在训练集下的准确率为95%,在测试集下的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI 应知应会 小月 题库 98