大数据时代试题综合题库.docx
- 文档编号:4762982
- 上传时间:2022-12-08
- 格式:DOCX
- 页数:17
- 大小:29.51KB
大数据时代试题综合题库.docx
《大数据时代试题综合题库.docx》由会员分享,可在线阅读,更多相关《大数据时代试题综合题库.docx(17页珍藏版)》请在冰豆网上搜索。
大数据时代试题综合题库
《大数据》题目
一、单选题
1)大数据4V特点:
Volume、Velocity、Variety、Veracity,其中她们含义分别是(1DBCA)、
(2)、(3)、(4)。
A.价值密度低B.解决速度快C.数据类型繁多D.数据体量巨大
2)大数据技术战略意义不在于掌握庞大数据信息,而在于对这些具故意义数据进行(5B)。
A.数据信息B.专业化解决C.速度解决D.内容解决
3)随着google(6)和(7)发布,大数据不再仅用来描述大量数据,还涵盖了解决数据(8)。
DCB
6:
A.MapB.DocsC.YouTubeD.MapReduce
7:
A.GoogleMobileB.iGoogleC.GoogleFileSystemD.GoogleDocs
8:
A.质量B.速度C.精度D.进度
4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台2.5米口径望远镜进行红移巡天项目,4月发布关于Quasarspectra数据为(9)。
B
A.932,891,133B.228,468C.1,457,002D.668,054
5)下列哪一项不属于大数据治理:
(10)C
A.安全问题B.成本问题C.针对大顾客D.信息生命周期管理
6)IBM大数据战略以其在5月发布智慧分析洞察“3A5步”动态路线图作为基本,指是在(11)基本上(12)、,进而(13),优化决策策划可以救业务绩效。
CBA
A.采用行动(Act)B.获取洞察(Anticipate)
C.掌握信息(Align)D.应用管理(management)
7)在云生态环境中,顾客需求相称于(14),云数据中心相称于(15),云服务相称于(16)。
DCB
A.降水B.水滴C.水库D.阳光
8)尿布啤酒是大数据分析(17)C
A.A/B测试B.分类C.关联规则挖掘D.数据聚类
9)在GAPMINDERWealth&HealthofNations中,中华人民共和国在什么区域(18)B
A.黄色B.红色C.绿色D.蓝色
10)舆情研判,信息科学侧重(19),社会和管理科学侧重突发群体事件管理中群体心理行为及(20),新闻传播学侧重对(21)。
CBA
A.舆论本体进行规律性摸索和研究B.舆论控制研究C.互联网文本挖掘和分析技术
11)物联网是在计算机(22)基本上,运用(23)、(24)等技术,构造一种覆盖世界上万事万物“InternetofThings”。
在这个网络中,物品(商品)可以彼此进行“交流”,而无需人干预。
DCB
A.有线数据通信B.无线数据通信C.RFIDD.互联网
12)数据挖掘工作四个阶段,数据挖掘占总时间比例%(25),对于成功重要性比例%(26)CB
A.50B.20C.80D.60
13)MapReduceMap函数产生诸多(27)C
A.keyB.valueC.
14)PageRank是一种函数,它对Web中每个网页赋予一种实数值。
它意图在于网页PageRank越高,那么它就(28)。
D
A.有关性越高B.越不重要C.有关性越低D.越重要
15)购物篮模型(market-basketmodel):
用于描述两类对象之间一种常用形式(29)关系。
C
A.一对一B.一对多C.多对多D.多对一
16)AdWords是一种迅速简朴购买广告服务方式,这种广告服务针对性强,无论您预算是多少,它都按(30)。
B
A.每个广告计费B.每次点击计费
C.每显示一次计费D.每浏览一次计费
17)协同过滤分析顾客兴趣,在顾客群中找到指定顾客(31)顾客,综合这些顾客对某一信息评价,形成系统对该指定顾客对此信息喜好限度(32),并将这些顾客喜欢项推荐给有相似兴趣顾客。
AD
A.相似B.相似C.推荐D.预测
18)12月28日,全国人大三次会议通过(33)C
A.《互联网行业自律公约》B.《治安管理惩罚条例》
C.《关于加强网络信息保护决定》D.《信息安全保护条例》
19)Google收集信息不涉及(34)C
A.日记信息B.位置信息C.你家庭成员D.Cookie和匿名标记符
20)大数据取舍与(35)不有关。
B
A.易于提取B.家庭信息C.数字化D.便宜存储器
21)IBM智慧地球中SmartWork指(36)B
A.新锐洞察B.智慧运作C.动态架构D.绿色将来
22)依照IDC(国际数据公司)监测记录,全球数据总量已经达到1.8ZB,而这个数值还在以每两年翻一番速度增长,预测到全球将总共拥有数据量(37),增长近(38)倍。
CB
A.10B.20C.35ZBD.20ZB
23)3月29日奥巴马政府发布了(39)。
该筹划目的是改进既有人们从海量和复杂数据中获取知识能力,从而加速美国在科学与工程领域创造步伐,增强国家安全,转变既有教学和学习方式。
首批共有6个联邦部门宣布投资(40)美元,共同提高收集、储存、保存、管理、分析和共享海量数据所需核心技术先进性,并形成合力;扩大大数据技术开发和应用所需人才供应。
CD
A.全民健康筹划B.5亿C.大数据研发筹划D.2亿
24)大数据,或称巨量资料,指是所涉及资料量规模巨大到无法透过当前主流软件工具,在合理时间内达到撷取、管理、解决、并(41)成为协助公司经营决策更积极目信息。
B
A.收集B.整顿C.规划D.汇集
25)大数据工程指大数据(42)系统工程。
B
A.大数据网络发展和运营过程B.规划建设运营管理
C.规律和验证D.发现和验证
26)大数据科学关注大数据网络发展和运营过程中(43)大数据规律及其与自然和社会活动之间关系。
D
A.大数据网络发展和运营过程B.规划建设运营管理
C.规律和验证D.发现和验证
27)大数据价值是通过数据共享、(44)后获取最大数据价值D
A.算法共享B.共享应用C.数据互换D.交叉复用
28)社交网络产生了海量顾客以及实时和完整数据,同步社交网络也记录了顾客群体(45),通过进一步挖掘这些数据来理解顾客,然后将这些分析后数据信息推给需要品牌商家或是微博营销公司。
C
A.地址B.行为C.情绪D.来源
29)IBM“3A5步”除Align、Anticipate、Act外,还需要不断地(46)从每一次业务成果中获得反馈,改进基于信息决策流程,从而实现(47)。
CB
A.CreateB.TransformC.LearnD.Modify
30)IBM大数据平台和应用程序框架,(48)以经济高效方式分析PB级构造化和非构造化信息B
A.流计算B.HadoopC.数据仓库D.语境搜索
31)临床决策支持系统通过电子病历、医学指引比较等提高手术质量,减少错误治疗和(49)。
C
A.医疗事故B.病患投诉C.民事诉讼D.手术费用
32)《数据新闻学手册》作者们以为,通过数据使用,记者工作重点从“第一种报道者”转化成为对特定事件影响(50)。
D
A.拍摄者B.知情者C.记录者D.阐释者
33)通过(51)和展示数据背后(52),运用丰富、具备互动性可视化手段,数据新闻学成为新闻学作为一门新分支进入主流媒体,即用数据报道新闻。
BD
A.数据收集B.数据挖掘C.真相D.关联与模式
34)CRISP-DM模型中Evaluation表达对建立模型进行评估,重点详细考虑得出成果与否符合(53)商业目。
C
A.第二步B.第三步C.第一步D.最后一步
35)发现关联规则算法普通要通过如下三个环节:
连接数据,作数据准备;给定(54)和(55),运用数据挖掘工具提供算法发现关联规则;可视化显示、理解、评估关联规则CD
54:
A.最大兴趣度B.最小置信度C.最小支持度D.最大可信度
55:
A.最小兴趣度B.最小置信度C.最大支持度D.最小可信度
36)规则I->j,“有也许”,等于所有包括I购物篮中同步包括J购物篮比例,为(56)。
B
A.置信度B.可信度C.兴趣度D.支持度
37)如果一种匹配中,任何一种节点都不同步是两条或多条边端点,也称作(57)C
A.极大匹配B.二分匹配C完美匹配D.极小匹配
38)国防部高档研究筹划局(DARPA)网络内部威胁(CINDER)筹划,旨在开发新办法来检测军事计算机网络与(58)。
作为一种揭露隐藏操作手段,CINDER将合用于将对不同类型对手活动统一成“规范”内部网络活动,并旨在提高对网络威胁检测精确性、和速度。
B
A.内部网络活动B.网络间谍活动C.网络威胁检测D.网络漏洞检测
39)只要具备恰当政策推动,大数据使用将成为将来提高竞争力、生产力、创新能力以及(59)核心要素。
D
40)A.提高消费B.提高GDPC.提高生活水平D.创造消费者盈余
41)个性化推荐系统是建立在海量数据挖掘基本上一种高档商务智能平台,以协助(60)为其顾客购物提供完全个性化决策支持和信息服务。
D
A.公司B.各单位C.跨国公司D.电子商务网站
二、多选题
42)大数据治理涉及(1ABCD)
A.容量问题B.延迟问题C.安全问题D.成本问题
43)Hadoop项目涉及(2ABD)
A.HadoopDistributedFileSystem(HDFS)B.HadoopMapReduce编程模型
C.HadoopStreamingD.HadoopCommon
44)基于“3A5步”动态路线图,IBM提出了“大数据平台”架构。
该平台核心能力涉及(3ABCD)
A.Hadoop系统B.流计算(StreamComputing)
C.数据仓库(DataWarehouse)D.信息整合与治理(InformationIntegrationandGovernance)
45)大数据在医疗与健康临床应用涉及(4ABC)
A.疗效比较研究方案CERB.临床决策支持系统
C.远程患者监测系统D.患者家庭状况分析
46)《数据新闻学手册》为咱们提供了某些简朴搜索建议。
当前网络技术容许咱们进行精准搜索,例如(5ABCD)
A.电子数据表B.地理数据C.数据库抽取D.PDF文献
47)物联网,中华人民共和国政府工作报告把物联网定义为通过信息传感设备,按照商定合同,把任何物品与互联网连接起来,进行通信和信息互换,以实现智能化(6ABCD)
A.辨认B.定位C.跟踪D.监控和管理一种网络
48)数据挖掘挖掘办法涉及:
(7ABCD)
A.聚类分析B.回归分析C.神经网络D.决策树算法
49)Web内容挖掘实现技术(8ABCD)。
A.文本总结B.文本分类C.文本聚类D.关联规则
50)基于内容推荐生成推荐过程重要依托(9ACD)
A.内容分析器B.推荐系统C.文献学习器D.过滤部件
51)如下哪些管理规定对信息安全及个人隐私进行了保护(10ABC)
A.《互联网行业自律公约》B.《治安管理惩罚条例》
C.《关于加强网络信息保护决定》D.《信息安全保护条例》
52)大数据可提成(11ABD)、大数据应用等领域。
当前人们谈论最多是大数据技术和大数据应用。
A.大数据技术B.大数据工程C.大数据收集D.大数据科学
53)云计算服务方式有(12ACD)
A.IaaSB.RaasC.PaaSD.SaaS
54)大数据在社会管理能实现(13ABCD)
A.提高社会管理效能B.减少行政开支
C.创造新价值D.实现信息透明
55)产品设计研究和开发涉及(14BCD)
A.虚拟数字工厂B.产品生命周期管理C.评估设计D.开放创新
56)CRISP-DM模型为一种KDD工程提供了一种完整过程描述.该模型将一种KDD工程分为几种不同、但顺序并非完全不变阶段,涉及businessunderstanding、dataunderstanding、datapreperation、(15ACD)
A.deploymentB.designC.modelingD.evaluation
57)文本挖掘工具备(16BCD)
A.SPPTextMiningB.IBMDB2intelligentMiner
C.SAStextminerD.SPSSTextMining
58)数据和软件保护开放科学(DASPOS)第一次尝试建立一种来自大型强子对接机和费米实验室(17ABCD)专家之间正式合伙。
A.理学家B.数字保管C.异构存储系统D.大规模计算机系统方面
59)长尾效应,新竞争力从人们需求角度来看,大多数需求会集中在头部,而这某些咱们可以称之为流行,而分布在尾部需求是个性化,零散小量需求。
而这某些差别化,少量需求会在需求曲线上面形成一条长长“尾巴”,而所谓长尾效应就在于它(18D)上,将所有非流行市场累加起来就会形成一种比流行市场还大市场。
A.质量B.长度C.长期D.数量
60)为充分获取大数据潜力必要解决重要问题是数据政策、技术和技能以及(19ABC)
A.组织变革和人才B.数据访问权C.行业构造D.政府职能
61)推荐系统为客户推荐商品,自动完毕个性化选取商品过程,满足客户个性化需求,推荐基于网站最热卖商品、客户所处都市、(20D),推测客户将来也许购买行为。
A.客户朋友B.客户个人信息
C.客户兴趣兴趣D.客户过去购买行为和购买记录
一、单选题答案:
1-5
DBCAB
6-10
DCBBC
11-15
CBADC
16-20
BCBCB
21-25
ADCBC
26-30
BCDCB
31-35
ADCCB
36-40
BCBCD
41-45
BBDDC
46-50
CBBCD
51-55
BDCCD
56-60
BCBDD
二、多选题答案:
1
ABCD
2
ABD
3
ABCD
4
ABC
5
ABCD
6
ABCD
7
ABCD
8
ABCD
9
ACD
10
ABC
11
ABD
12
ACD
13
ABCD
14
BCD
15
ACD
16
BCD
17
ABCD
18
D
19
ABC
20
D
选取题
1.下列哪一项不是大数据提供顾客交互方式:
(C)
A.记录分析和数据挖掘
B.任意查询和分析
C.图形化展示
D.公司报表
2.与大数据密切有关技术是(B)
A蓝牙B,云计算C,博弈论D,wifi
3.大数据应用需依托新技术有(D)
A.大规模存储与计算
B.数据分析解决
C.智能化
D.三个选项都是
4.与大数据密切有关技术是(B)
A蓝牙B云计算C博弈论Dwifi
填空题
1.大数据最具潜能三大应用领域分别为商业智能,公共服务和市场营销.
2.1pb=(1024)tb=(2e20)gb=(2e30)mb=(2e40)kb
3.大数据特性是___、___、___、___。
答案:
大量化、多样化、迅速化、价值密度低。
4.大数据4v特性分别是大量化多样化迅速化价值密度低
判断题
1.大数据存储方案普通对一份数据在不同节点上存储三份副本,以提高系统容错性。
(√)
2.大数据思维,是指一种意识,以为公开数据一旦解决得当就能为千百万人急需解决问题提供答案。
(√)
3.数据可视化可以便于人们对数据理解(√)
4.大数据技术和云计算技术是两门完全不有关技术(X)
简答题
1.请简述大数据成果呈现方式。
答:
1)报表形式
基于数据挖掘得出数据报表,涉及数据表格、矩阵、图形和自定义格式报表等,使用以便、设计灵活。
2.图形化呈现
提供曲线、饼图、堆积图、仪表盘、鱼骨分析图等图形形式宏观呈现模型数据分布状况,从而便于进行决策。
2)KPI呈现
提供表格式绩效一览表并可自定义绩效查看方式,如数据表格或走势图,公司管理者可依照可度量目的迅速评估进度。
4.查询呈现
按数据查询条件和查询内容,以数据表格来汇总查询成果,提供明细查询功能,并可在查询数据表格基本上进行上钻、下钻、旋转等操作。
2.例举身边大数据。
答:
i.QQ,微博等社交软件产生数据
ii.天猫,京东等电子商务产生数据
iii.互联网上各种数据
3.简述大数据数据管理方式。
答:
对于图像、视频、URL、地理位置等类型多样数据,难以用老式构造化方式描述,因而需要使用由多维表构成面向列存储数据管理系统来组织和管理数据。
也就是说,将数据按行排序,按列存储,将相似字段数据作为一种列族来聚合存储。
不同列族相应数据不同属性,这些属性可以依照需求动态增长,通过这样分布式实时列式数据库对数据统一进行构造化存储和管理,避免了老式数据存储方式下关联查询。
4.什么是大数据?
答:
大数据是指无法在容许时间内用常规软件工具对其内容进行抓取、管理和解决数据。
《大数据时代》试题
单选题
1、大数据核心就是(B)【P26】
A、告知与允许
B、预测
C、匿名化
D、规模化
2、大数据不是要教机器像人同样思考。
相反,它是(A)【P26】
A、把数学算法运用到海量数据上来预测事情发生也许性。
B、被视为人工智能一某些。
C、被视为一种机器学习。
D、预测与惩罚。
3、采样分析精准性随着采样随机性增长而(C),但与样本数量增长关系不大。
【P32】
A、减少
B、不变
C、提高
D、无关
4、大数据是指不用随机分析法这样捷径,而采用(A)办法【P35】
A、所有数据
B、绝大某些数据
C、适量数据
D、少量数据
5、大数据简朴算法与小数据复杂算法相比(A)【P40】
A、更有效
B、相称
C、不具备可比性
D、无效
6、相比依赖于小数据和精准性时代,大数据由于更强调数据(D),协助咱们进一步接近事实真相。
【P46】
A、安全性
B、完整性
C、混杂性
D、完整性和混杂性
7、大数据发展,使信息技术变革重点从关注技术转向关注(A)【P61】
A、信息
B、数字
C、文字
D、方位
8、大数据时代,咱们是要让数据自己“发声”,没必要懂得为什么,只需要懂得(B)【P48】
A、因素
B、是什么
C、关联物
D、预测核心
9、建立在有关关系分析法基本上预测是大数据(C)【P51】
A、基本
B、前提
C、核心
D、条件
10、(C)下列说法对的是【P75-77】
A、有价值数据是附属于公司经营核心业务一某些数据;
B、数据挖掘它重要价值后就没有必要再进行分析了;
C、所有数据都是有价值;
D、在大数据时代,收集、存储和分析数据非常简朴;
11、关于数据创新,下列说法对的是(D)【P78-85】
A、各种数据集总和价值等于单个数据集价值相加;
B、由于数据再运用,数据应当永久保存下去;
C、相似数据多次用于相似或类似用途,其有效性会减少;
D、数据只有开放价值才干得到真正释放。
12、关于数据估值,下列说法错误是(B)【P113】
A、随着数据价值被注重,公司所持有和使用数据也徐徐纳入了无形资产范畴;
B、无论是向公众开放还是将其锁在公司保险库中,数据都是有价值;
C、数据价值可以通过授权第三方使用来实现
D、当前可以通过数据估值模型来精确评估数据价值评估
13、在大数据时代,下列说法对的是(B)。
【P116】
A、收集数据很简朴
B、数据是最核心某些
C、对数据分析技术和技能是最重要
D、数据非常重要,一定要较好保护起来,防止泄露
14、随着数据科学家崛起,(C)地位将发生动摇。
【P99】
A、国家领导人
B、大型公司
C、行业专家和技术专家
D、职业经理人
15、大数据公司多样性表白了(B)【P97】
A、数据作用体现
B、数据价值转移
C、数据技术发展
D、数据思维创新
16、如下哪种说法是错误(B)【P104-107】
A、将罪犯定罪权放在数据手中,借以表达对数据和分析成果崇尚,这事实上是一种滥用。
B、随着数据量和种类增多,大数据增进了数据内容交叉检查,匿名化数据不会威胁到任何人隐私。
C、采集个人数据工具就隐藏在咱们寻常生活所必备工具当中,例如网页和智能手机应用程序。
D、预测与惩罚,不是由于所做,而是由于将做。
17、只要得到了合理运用,而不单纯只是为了“数据”而“数据”,大数据就会变成(B)【P113】
A、强大威胁
B、强大武器
C、预测工具
D、分析工具
18、在大数据时代,咱们需要设立一种不同样隐私保护模式,这个模式应当更着重于(A)为其行为承担责任。
【P116】
A、数据使用者
B、数据提供者
C、个人允许
D、数据分析者
19、对大数据使用进行正规评测及对的引导,可觉得数据使用者带来什么切实好处(A)【P116】
A、她们不必再获得个人明确批准,就可以对个人数据进行二次运用。
B、数据使用者不需要为敷衍了事评测和不达原则保护办法承担法律责任。
C、数据使用者责任不需要强制力规范就能保证履行到位。
D、所有项目,管理者必要设立规章,规定数据使用者应如何评估风险、如何规避或减轻潜在伤害。
20、增进隐私保护一种创新途径是(D):
故意将数据模糊解决,促使对大数据库查询不能显示精准成果。
【P117】
A、匿名化
B、信息模糊化
C、个人隐私保护
D、差别隐私
多选题
1、大数据与三个重大思维转变关于,这三个转变是什么?
(ACD)。
【P30】
A、要分析与某事物有关所有数据,而不是依托分析少量数据样本。
B、咱们乐于接受数据纷繁复杂,而不再追求精准性。
C、在数字化时代,数据解决变得更加容易、更迅速,人们可以在瞬间解决成千上万数据。
D、咱们思想发生了转变,不再探求难以捉摸因果关系,转而关注事物有关关系。
2、下面关于大数据解说对的是(ABC)。
【P20】
A、大数据是人们在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 时代 试题 综合 题库