《大数据》题目教程文件.docx
- 文档编号:23076004
- 上传时间:2023-04-30
- 格式:DOCX
- 页数:10
- 大小:22.78KB
《大数据》题目教程文件.docx
《《大数据》题目教程文件.docx》由会员分享,可在线阅读,更多相关《《大数据》题目教程文件.docx(10页珍藏版)》请在冰豆网上搜索。
《大数据》题目教程文件
《大数据》题目
《大数据》题目
一、单选题
1)大数据的4V特点:
Volume、Velocity、Variety、Veracity,其中他们的含义分别是
(1)、
(2)、(3)、(4)。
A.价值密度低B.处理速度快C.数据类型繁多D.数据体量巨大
2)大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行(5)。
A.数据信息B.专业化处理C.速度处理D.内容处理
3)随着谷歌(6)和(7)的发布,大数据不再仅用来描述大量的数据,还涵盖了处理数据的(8)。
6:
A.MapB.DocsC.YouTubeD.MapReduce
7:
A.GoogleMobileB.iGoogleC.GoogleFileSystemD.GoogleDocs
8:
A.质量B.速度C.精度D.进度
4)斯隆数字巡天是使用位于新墨西哥州阿帕奇山顶天文台的2.5米口径望远镜进行的红移巡天项目,2012年4月发布的关于Quasarspectra的数据为(9)。
A.932,891,133B.228,468C.1,457,002D.668,054
5)下列哪一项不属于大数据的治理:
(10)
A.安全问题B.成本问题C.针对大用户D.信息生命周期管理
6)IBM的大数据战略以其在2012年5月发布智慧分析洞察“3A5步”动态路线图作为基础,指的是在(11)的基础上(12)、,进而(13),优化决策策划能够救业务绩效。
A.采取行动(Act)B.获取洞察(Anticipate)
C.掌握信息(Align)D.应用管理(management)
7)在云生态环境中,用户需求相当于(14),云数据中心相当于(15),云服务相当于(16)。
A.降水B.水滴C.水库D.阳光
8)尿布啤酒是大数据分析的(17)
A.A/B测试B.分类C.关联规则挖掘D.数据聚类
9)在GAPMINDER的Wealth&HealthofNations中,中国在什么区域(18)
A.黄色B.红色C.绿色D.蓝色
10)舆情研判,信息科学侧重(19),社会和管理科学侧重突发群体事件管理中的群体心理行为及(20),新闻传播学侧重对(21)。
A.舆论的本体进行规律性的探索和研究B.舆论控制研究C.互联网文本挖掘和分析技术
11)物联网是在计算机的(22)基础上,利用(23)、(24)等技术,构造一个覆盖世界上万事万物的“InternetofThings”。
在这个网络中,物品(商品)能够彼此进行“交流”,而无需人的干预。
A.有线数据通信B.无线数据通信C.RFIDD.互联网
12)数据挖掘工作的四个阶段,数据挖掘占总时间的百分比%(25),对于成功重要性的百分比%(26)
A.50B.20C.80D.60
13)MapReduce的Map函数产生很多的(27)
A.keyB.valueC.
14)PageRank是一个函数,它对Web中的每个网页赋予一个实数值。
它的意图在于网页的PageRank越高,那么它就(28)。
A.相关性越高B.越不重要C.相关性越低D.越重要
15)购物篮模型(market-basketmodel):
用于描述两类对象之间的一种常见形式的(29)关系。
A.一对一B.一对多C.多对多D.多对一
16)AdWords是一种快速简单的购买广告服务的方式,这种广告服务的针对性强,无论您的预算是多少,它都按(30)。
A.每个广告计费B.每次点击计费
C.每显示一次计费D.每浏览一次计费
17)协同过滤分析用户兴趣,在用户群中找到指定用户的(31)用户,综合这些用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度(32),并将这些用户喜欢的项推荐给有相似兴趣的用户。
A.相似B.相同C.推荐D.预测
18)2012年12月28日,全国人大三次会议通过的(33)
A.《互联网行业的自律公约》B.《治安管理处罚条例》
C.《关于加强网络信息保护的决定》D.《信息安全保护条例》
19)Google收集的信息不包括(34)
A.日志信息B.位置信息C.你的家庭成员D.Cookie和匿名标识符
20)大数据的取舍与(35)不相关。
A.易于提取B.家庭信息C.数字化D.廉价的存储器
21)IBM智慧地球中SmartWork指(36)
A.新锐洞察B.智慧运作C.动态架构D.绿色未来
22)根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到1.8ZB,而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有的数据量(37),增长近(38)倍。
A.10B.20C.35ZBD.20ZB
23)2012年3月29日奥巴马政府公布了(39)。
该计划的目标是改进现有人们从海量和复杂的数据中获取知识的能力,从而加速美国在科学与工程领域发明的步伐,增强国家安全,转变现有的教学和学习方式。
首批共有6个联邦部门宣布投资(40)美元,共同提高收集、储存、保留、管理、分析和共享海量数据所需核心技术的先进性,并形成合力;扩大大数据技术开发和应用所需人才的供给。
A.全民健康计划B.5亿C.大数据研发计划D.2亿
24)大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并(41)成为帮助企业经营决策更积极目的的信息。
A.收集B.整理C.规划D.聚集
25)大数据工程指大数据的(42)的系统工程。
A.大数据网络发展和运营过程B.规划建设运营管理
C.规律和验证D.发现和验证
26)大数据科学关注大数据网络发展和运营过程中(43)大数据的规律及其与自然和社会活动之间的关系。
A.大数据网络发展和运营过程B.规划建设运营管理
C.规律和验证D.发现和验证
27)大数据的价值是通过数据共享、(44)后获取最大的数据价值
A.算法共享B.共享应用C.数据交换D.交叉复用
28)社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的(45),通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。
A.地址B.行为C.情绪D.来源
29)IBM的“3A5步”除Align、Anticipate、Act外,还需要不断地(46)从每一次业务结果中获得反馈,改善基于信息的决策流程,从而实现(47)。
A.CreateB.TransformC.LearnD.Modify
30)IBM大数据平台和应用程序框架,(48)以经济高效的方式分析PB级的结构化和非结构化信息
A.流计算B.HadoopC.数据仓库D.语境搜索
31)临床决策支持系统通过电子病历、医学指导的比较等提高手术质量,降低错误治疗和(49)。
A.医疗事故B.病患投诉C.民事诉讼D.手术费用
32)《数据新闻学手册》的作者们认为,通过数据的使用,记者工作的重点从“第一个报道者”转化成为对特定事件的影响的(50)。
A.拍摄者B.知情者C.记录者D.阐释者
33)通过(51)和展示数据背后的(52),运用丰富的、具有互动性的可视化手段,数据新闻学成为新闻学作为一门新的分支进入主流媒体,即用数据报道新闻。
A.数据收集B.数据挖掘C.真相D.关联与模式
34)CRISP-DM模型中Evaluation表示对建立的模型进行评估,重点具体考虑得出的结果是否符合(53)的商业目的。
A.第二步B.第三步C.第一步D.最后一步
35)发现关联规则的算法通常要经过以下三个步骤:
连接数据,作数据准备;给定(54)和(55),利用数据挖掘工具提供的算法发现关联规则;可视化显示、理解、评估关联规则
54:
A.最大兴趣度B.最小置信度C.最小支持度D.最大可信度
55:
A.最小兴趣度B.最小置信度C.最大支持度D.最小可信度
36)规则I->j,“有可能”,等于所有包含I的购物篮中同时包含J的购物篮的比例,为(56)。
A.置信度B.可信度C.兴趣度D.支持度
37)如果一个匹配中,任何一个节点都不同时是两条或多条边的端点,也称作(57)
A.极大匹配B.二分匹配C完美匹配D.极小匹配
38)国防部高级研究计划局(DARPA)的网络内部威胁(CINDER)计划,旨在开发新的方法来检测军事计算机网络与(58)。
作为一种揭露隐藏操作的手段,CINDER将适用于将对不同类型对手的活动统一成“规范”的内部网络活动,并旨在提高对网络威胁检测的准确性、和速度。
A.内部网络活动B.网络间谍活动C.网络威胁检测D.网络漏洞检测
39)只要具有适当的政策推动,大数据的使用将成为未来提高竞争力、生产力、创新能力以及(59)的关键要素。
A.提高消费B.提高GDPC.提高生活水平D.创造消费者盈余
40)个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助(60)为其顾客购物提供完全个性化的决策支持和信息服务。
A.公司B.各单位C.跨国企业D.电子商务网站
二、多选题
41)大数据的治理包括
(1)
A.容量问题B.延迟问题C.安全问题D.成本问题
42)Hadoop项目包括
(2)
A.HadoopDistributedFileSystem(HDFS)B.HadoopMapReduce编程模型
C.HadoopStreamingD.HadoopCommon
43)基于“3A5步”动态路线图,IBM提出了“大数据平台”架构。
该平台的核心能力包括(3)
A.Hadoop系统B.流计算(StreamComputing)
C.数据仓库(DataWarehouse)D.信息整合与治理(InformationIntegrationandGovernance)
44)大数据在医疗与健康的临床应用包括(4)
A.疗效比较研究方案CERB.临床决策支持系统
C.远程患者监测系统D.患者家庭情况分析
45)《数据新闻学手册》为我们提供了一些简单的搜索建议。
现在的网络技术允许我们进行精准搜索,比如(5)
A.电子数据表B.地理数据C.数据库抽取D.PDF文件
46)物联网,2010年中国政府工作报告把物联网定义为通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行通信和信息交换,以实现智能化(6)
A.识别B.定位C.跟踪D.监控和管理的一种网络
47)数据挖掘的挖掘方法包括:
(7)
A.聚类分析B.回归分析C.神经网络D.决策树算法
48)Web内容挖掘实现技术(8)。
A.文本总结B.文本分类C.文本聚类D.关联规则
49)基于内容的推荐生成推荐的过程主要依靠(9)
A.内容分析器B.推荐系统C.文件学习器D.过滤部件
50)以下哪些管理规定对信息安全及个人隐私进行了保护(10)
A.《互联网行业的自律公约》B.《治安管理处罚条例》
C.《关于加强网络信息保护的决定》D.《信息安全保护条例》
51)大数据可分成(11)、大数据应用等领域。
目前人们谈论最多的是大数据技术和大数据应用。
A.大数据技术B.大数据工程C.大数据收集D.大数据科学
52)云计算的服务方式有(12)
A.IaaSB.RaasC.PaaSD.SaaS
53)大数据在社会管理能实现(13)
A.提高社会管理的效能B.减少行政开支
C.创造新的价值D.实现信息透明
54)产品设计的研究和开发包括(14)
A.虚拟数字工厂B.产品生命周期管理C.评估设计D.开放创新
55)CRISP-DM模型为一个KDD工程提供了一个完整的过程描述.该模型将一个KDD工程分为几个不同的、但顺序并非完全不变的阶段,包括businessunderstanding、dataunderstanding、datapreperation、(15)
A.deploymentB.designC.modelingD.evaluation
56)文本挖掘的工具有(16)
A.SPPTextMiningB.IBMDB2intelligentMiner
C.SAStextminerD.SPSSTextMining
57)数据和软件保护的开放科学(DASPOS)第一次尝试建立一个来自大型强子对接机和费米实验室的(17)专家之间的正式合作。
A.理学家B.数字保管C.异构存储系统D.大规模计算机系统方面
58)长尾效应,新竞争力从人们需求的角度来看,大多数的需求会集中在头部,而这部分我们可以称之为流行,而分布在尾部的需求是个性化的,零散的小量的需求。
而这部分差异化的,少量的需求会在需求曲线上面形成一条长长的“尾巴”,而所谓长尾效应就在于它的(18)上,将所有非流行的市场累加起来就会形成一个比流行市场还大的市场。
A.质量B.长度C.长期D.数量
59)为充分获取大数据潜力必须解决的主要问题是数据政策、技术和技能以及(19)
A.组织变革和人才B.数据访问权C.行业结构D.政府职能
60)推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(20),推测客户将来可能的购买行为。
A.客户的朋友B.客户的个人信息
C.客户的兴趣爱好D.客户过去的购买行为和购买记录
一、单选题答案:
1-5
DBCAB
6-10
DCBBC
11-15
CBADC
16-20
BCBCB
21-25
ADCBC
26-30
BCDCB
31-35
ADCCB
36-40
BCBCD
41-45
BBDDC
46-50
CBBCD
51-55
BDCCD
56-60
BCBDD
二、多选题答案:
1
ABCD
2
ABD
3
ABCD
4
ABC
5
ABCD
6
ABCD
7
ABCD
8
ABCD
9
ACD
10
ABC
11
ABD
12
ACD
13
ABCD
14
BCD
15
ACD
16
BCD
17
ABCD
18
D
19
ABC
20
D
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大数据 数据 题目 教程 文件