hadoop考试试题.docx
- 文档编号:9312006
- 上传时间:2023-02-04
- 格式:DOCX
- 页数:50
- 大小:42.70KB
hadoop考试试题.docx
《hadoop考试试题.docx》由会员分享,可在线阅读,更多相关《hadoop考试试题.docx(50页珍藏版)》请在冰豆网上搜索。
hadoop考试试题
hadoop考试试题
您的姓名:
[填空题]
I.Spark是用一下哪种编程语言实现的?
()[单选题]*
A.C
B.C++;
C.JAVA;(正确答案)
D.Scala
2.
[单选题]
FusionlnsightManager对服务的管理操作,下面说法错误的是?
()
A.可对服务进行启停重启操作;
B.可以添加和卸载服务;
C.可设置不常用的服务隐藏或显示;(正确答案)
D.可以查看服务的当前状态;
3.FusionlnsightHD集群升级,一下描述正确的是?
()*
A.升级过程中不可以操作准备OMS倒换;(正确答案)
B.集群内所有主机的root账户密码要保持一致;(正确答案)
C.保持网络通畅,避免网络问题导致升级异常;(正确答案)
D.观察期不能做扩容;(正确答案)
4.
()[单选
FusionlnsightHDLoader在创建作业时,连接器(Connector有什么用?
A.确定有哪些转化步骤;
B.提供优化参数,提高数据导出性能
C.配置数据如何与外部数据进行连接;(正确答案)
D.配置数据如何与内部数据进行连接;
5.下列哪个HDFS命令可用于检测数据块的完整性?
()[单选题]*
A.hdfsfsck/;(正确答案)
B.hdfsfsck/-delete;
C.hdfsdfsadmin-report;
D.hdfsbalancer-threshold1;
6.
[单选题]
[单选题]
YARN中设置队列QueueA最大使用资源里,需要配置哪个参数?
()
A.yarnschedulercapactyrootQueueAuser-limit-factor;
B.yarnschedulercapactyrootQueueAminimum-user-limit-percent;
C.yarnschedulercapactyrootQueueAstate;
D.yarnschedulercapactyrootQueueAmaximum-capacity正确答案)
7.Flume的数据流可以根据headers的信息发送到不同的channel中
*
A.正确;(正确答案)
B.错误;
8.FusionlnsightManager与外部管理平台对接时,支持哪些接口?
()
A.SNMP;(正确答案)
B.VPN;
C.BGP;
D.Syslog;(正确答案)9.HBase的数据文件HFile中一个KeyValue格式包含哪些信息?
()
A.Key;(正确答案)
B.Value;(正确答案)
C.TimeStamp;(正确答案)
D.KeyType;(正确答案)
10.FusionlnsightHG集群规划设计时,集群有150个节点,并采用双面组网部署,
对于该集群网络宽带要求的描述,下面描述正确的有?
()*
A.业务平面所有节点都使用10GE网络;(正确答案)
B.管理平面中控制节点使用10GE网络;
C.管理平面中数据节点使用1GE网络(正确答案)
D.业务平面中控制节点使用1GE网络;
E.管理平面管理节点使用10GE网络;(正确答案)
11.Fusionlnsight系统中Hive支持的储存格式包括?
()*
A.HFile;
B.TextFile;(正确答案)
C.SequenceFile;正确答案)
D.RCFile;(正确答案)
12.Spark任务的每个stage可划分为job,划分的标记是shuffle0()[单选题]*
A.正确;
B.错误。
(正确答案)
13.FusionlnsightManager对服务的配置功能说法不正确的是?
()[单选题]*
A.服务级别的配置对所有实例生效;
B.实例级别的配置只针对本实例生效;
C.实例级别的配置对其他实例也生效;(正确答案)
D.配置保存后需要重启服务才能生效;
14.FusionlnsightHD部署Solr时,如果选择索引放在本地磁盘,建议给每个
SolrServer实例的数据目录单独挂载磁盘,并且磁盘配置为RAIDO或RAID5.()
[单选题]*
A.正确;(正确答案)
B.错误;
15.关于FusionlnsightHD安装流程正确的是?
()[单选题]*
A.安装Manager->执行preinstall->LLD工具进行配置->安装集群->安装后检查->安装后配置;
LLD工具进行配置->执行preinstall->安装Manager->安装集群->安装后检查-
>安装后配置;(正确答案)
C.安装Manager->LLD工具进行配置->执行preinstall->安装集群->安装后检查->安装后配置;
D丄LD工具进行配置->执行preinstall->安装集群->安装Manager->安装后检查->安装后配置;
16.关于kerberos部署,描述正确的是?
()[单选题]*
A.Kerberos仅有一个角色;
B.Kerberos服务在同一个节点上有两个实例;(正确答案)
C.Kerberos服务采用主备模式部署;
D.Kerberos服务必须和LDAP服务部署在同一个节点上;
17.某银行规划FusionlnsightHD集群有90个节点,如果控制节点规划了3个,那
集群中数据节点规划推荐规划多少最为合适?
()[单选题]*
A.87;(正确答案)
B.85;
C.90;
D.86;
18.安装FusionlnsightHD软件包前,必须在本节点/etc/hosts文件中配置所有节点的主机名与业务ip的映射关系。
()[单选题]*
A.正确;(正确答案)
B.错误;
19.客户IT系统中FusionlnsightHD集群有150个节点,每个节点12块硬盘(不做raid,不包括os盘),每块磁盘大小1T,只安装HDFS,按照默认配置最大存储多少数据?
()[单选题]*
A.1764TB;
B.1800TB;
C.600TB;
D.588TB;(正确答案)
20.FusionlnsightHD节点不支持哪种主机操作系统?
()[单选题]*
A.Suse11.1;
B.RedHat6.5;
C.Centos6.4;
D.Ubuntu11.04;(正确答案)
21.FusionlnsightHD中,如果需要查看当前登录HBase的用户和权限组,可以在
HBaseshell中执行什么命令?
()[单选题]*
A.use_permission;
B.whoami;(正确答案)
C.who;
D.get_user;
22.FusionlnsightHD产品在部署Kerbers和LDAP服务时,以下描述正确的是?
()*
A.部署Kerberoe服务之前,必须先部署LDAP服务;(正确答案)
LDAP服务必须和Kerberos服务部署在同一个节点;
C.Kerberos服务和LDAP服务部署到同一个节点利于数据访问,有助于性能提
升;(正确答案)
D.LDAP服务可以多个集群共享;
23.FusionlnsightHDManager界面Hive日志收集,哪个选项不正确?
()[单选题]
*
A.可指定实例进行日志收集,比如指定单独收集MateStore的日志;
B.可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志;
C.可指定节点IP进行日志收集,例如下载某个ip的日志;
D.可指定特定用户进行日志收集,例如仅下载userA用户产生的日志;(正确答案)
24.华为FusionInsightHD集群中,Spark服务可以从以下哪些服务读取数据?
()
*
A.YARN;
B.HDFS;(正确答案)
C.Hive;(正确答案)
D.HBase;(正确答案)
25.如果YARN集群中只有Default、QueueA、QueueB子队列,那么允许将他们
的容量分别设置为60%、25%和22%。
()[单选题]*
A.正确;
B.错误;(正确答案)
26.FusionInsightHD系统中,关于Solr索引的存储部署一下说法正确的有()*
A.利用HDFS数据存储可靠性和易于扩容的特点优先选择索引存储与HDFS。
;(正
确答案)
B.不论Solr索引存储在HDFS上还是存储在本地磁盘,在同一个节点上都必须要部署5个Solr实例,根据ip和不同的端口号来区分不同的实例;
C.当对实例索引录入速度要求较高时,可选择索引存放于本地磁盘;(正确答案)
D.当索引数据存放在HDFS上时,SolrServer实例与DataNode实例部署在同一个节点上;(正确答案)
27.FusionlnsightHD三层组网络适合多少节点的集群规模?
()[单选题]*
A.30节点以下;
B.100节点以上;
C.100-200节点;
D.200节点以上;(正确答案)
28.FusionlnsightHD系统中,Kerberos仅用于组建间服务安全认证。
()[单选题]
*
A.正确;
B.错误;(正确答案)
29.FusionInsightManage支持大规模集群的安装部署、监控、告警、用户管理、权
限管理、审计、服务管理、健康检查、问题定位、升级和补丁。
()[单选题]*
A.正确;(正确答案)
B.错误;
30.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?
()[单
选题]*
A.客户端的文件数据经过NameNode传递给DataNode;
B.客户将文件分为多个Block,根据Database的地址信息,按顺序写入每一个DataNode中;(正确答案)
C.客户端根据DatabNode的地址信息,按顺序将整个文件写入每一个Database
中,然后由DataNode将文件划分为多个Block;
D.客户端只上传数据到一个DatabNode,然后由NameNode负责Block复制;
31.FusionlnsightHD系统中HBase的最小处理单元是Region,UserRegion和
RegionService之间的路由信息是保存在哪?
()[单选题]*
A.Zookeeper;
B.HDFS;
C.Master;
D.meta表;(正确答案)
32.HBase集群定时执行Compaction的目的是什么?
()*
A.减少同一个Region,同一个ColumnFamily下的文件目录;(正确答案)
B.提升数据读取性能;(正确答案)
C.减少同一个ColumnFamily的文件数据;
D.减少同一个Region的文件目录;
33.FusionlnsightManage会定时备份哪些数据?
()*
A.NameNode;(正确答案)
LDAP;(正确答案)
C.OMs;(正确答案)
D.DBService;(正确答案)
ABCD[填空题]
案:
undefined)
34通过FusionlnsightManage不能完成以下哪个操作?
()[单选题]*
A.安装部署;
B.性能监控;
C.权限管理;
D.虚拟机分配;(正确答案)
35.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,并不会保持
信息。
()[单选题]*
A.正确;
B.错误;(正确答案)
36.以下哪些是Spark服务的常驻进程?
()*
A.JobHistory;(正确答案)
B.JDBService;(正确答案)
C.SparkResource;
D.NodeManage;
37.FusionlnsightHD的Streaming是基于开源ApacheStorm是一个分布式的离线计
算框架。
()[单选题]*
A.正确;
B.错误;(正确答案)
38.FusionlnsightHD系统中一个集群可以管理多个服务,每个服务可以管理多个角
色,每个角色只能管理一个实例。
()[单选题]*
A.正确;
B.错误;(正确答案)
39.关于HBase的Region分裂流程Split的描述不正确的是?
()[单选题]*
A.Split过程中并没有真正将文件分开,仅仅是创建了引用文件;
B.Split为了减少Region中数据大小,从而将一个Region分裂成两个Region;
C.Split过程中该表会暂停服务;(正确答案)
D.Split过程中被分裂的Region会暂停服务;
40.Hadoop的HDFS是一种分布式文件系统,适合以下哪种场景的数据存储和管
理?
()*
A.大量小文件存储;
B.高容错、高吞吐量;(正确答案)
C.低延迟读取;
D.流式数据访问;(正确答案)
41.如果FusionlnsightHD集群节点数不足以使数据节点单独部署的情况下,可以采
用管理节点&控制节点合一部署方案,但性能会受限制。
()[单选题]*
A.正确;(正确答案)
B.错误;
42.Hadoop的NameNode用于存储文件系统的元素据。
()[单选题]*
A.正确;(正确答案)
B.错误;
43.关于Fusionlnsight关键特性或操作说法正确的是?
()[单选题]*
A.能够针对整个集群或者某个服务进行监控检查,不能够针对某个节点进行健康检
查;
B.Manage引入角色的概念,采用RBAC的方式对系统进行权限管理;(正确答案)
C.整个系统使用Kerberos管理用户,使用LDAP进行用户认证,通过CAS实现单点登录;
D.对于健康检查结果,不能够导出检查报告,只能在线查看;
44查看Kafk某个Topic的Partition相信信息时,使用以下哪个命令?
()[单选题]
A.bin/kafka-topics.sh--create;
B.bin/kafka-topics.sh--list;
C.bin/kafka-topics.sh--describe(正确答案)
D.bin/kafka-topics--delete;
45.FusionlnsightHadoop集群中,在某个节点通过df-hT查询,看到的分区包含以下几个:
[单选题]*
/var/log(正确答案)
/srv/BigData
/srv/BigData/hadoop/data/5
/srv/BigData/slor/solrserver3
/srv/BigData/dbdata_om
这些分区所对应磁盘最佳Raid级别的规划组合是?
(B)
A.RaidORaid1RaidONon-RaidRaid1;
B.Raid1Raid1Non-RaidNon-RaidRaid1;
C.Raid0Raid0Raid0Raid0Raid0;
D.Non-RaidNon-RaidNon-RaidNon-RaidRaid1;
46.FusionlnsightHD系统中HDFS默认BlockSize是多少?
()[单选题]*
A.32MB;
B.64MB;
C.128MB;(正确答案)
D.256MB;
47.FusionlnsightHD部署时,同一个集群内的FlumeServer节点建议至少部署几
个?
()[单选题]*
A.1;
B.2;(正确答案)
C.3;
D.4;
48.FusionlnsightHD系统审计日志不可以记录下面哪些操作?
()[单选题]
A.手动清除警告;
B.启停服务实例;
C.删除服务实例;
D.查询历史监控;(正确答案)
49.基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下分布式存储组件的有?
(多)()*
A.MR;
B.Spark;
C.HDFS;(正确答案)
D.HBase;(正确答案)
50.Hadoop的HBase不适合哪些数据类型的应用场所?
()[单选题]*
A.大文件应用场所;(正确答案)
B.海量数据应用场所;
C.高吞吐应用场所;
D.半结构化数据应用场所;
51.Fusionlnsight集群组网设计中,二层网指集群内二层交换,集群节点在一个子网里,适合节点小于200的集群场景。
()[单选题]*
A.正确;(正确答案)
B.错误;
52.FusionlnsightHD中Loader作业提交到Yarn后,作业不能手工停止。
()[单选题]*
A.正确;
B.错误;(正确答案)
53.安装FusionlnsightHD的Streaming组件时,Nimbus角色要求安装几个节点?
()[单选题]*
A.1;
B.2;(正确答案)
C.3;
D.4;
54.关于FusionlnsightHD中Loader作业描述正确的是?
()[单选题]*
A.Loader将作业提交到YARN执行后,如果此时Loader服务出现异常,则此作业执行失败;
B.Loader将作业提交到YARN执行后,如果某个Mapper任务执行失败,能够自动进行重试。
;(正确答案)
C.Loader作业执行失败后将会产生垃圾数据,需要用户手动清除;
D.Loader将作业提交到YARN执行后,该作业执行完成前,不能再提交其他作业。
;
55.关于大数据的主要特征理解和描述正确的有?
()
A.来源多,格式多;(正确答案)
B.增长速度快,处理数据快;(正确答案)
C.存储量大,计算量大;(正确答案)
D.数据的价值密度低;(正确答案)
56.Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什
么命令?
()[单选题]*
A.container;
B.applicationattempt;
C.jar;
D.application;(正确答案)
57.在Fusionlnsight集群规划部署时,建议管理节点最好部署()个,控制节点最少部署()个,数据节点最少部署()个?
()[单选题]*
A.1,2,2;
B.1,3,2;
C.2,3,1;
D.2,3,3;(正确答案)
58.FusionlnsightManager界面上,当收到Kakfa盘容量不足告警,且该告警的原因
已经排除硬盘硬件故障时,系统管理员需要考虑扩容解决。
()[单选题]*
A.正确;(正确答案)
B.错误;
59.FusionInsightHD安装过程中,执行preinstall不能完成哪项功能?
()[单选题]
*
A.修改os配置,确保os满足FusionlnsightHD的安装要求;
B.安装Manager;(正确答案)
C.格式化分区;
D.安装os缺失的rpm包;
60.SolrCloud模式是集群模式,在此模式下Solr服务强依赖于以下哪个服务?
()
[单选题]*
A.HBase;
B.HDFS;
C.Zookeeper(正确答案)
D.YARN;
61.SparkYarn模式下的driver只能运行在客户端。
()[单选题]
A.正确;
B.错误;(正确答案)
62.Hadoop中MapReduce组建擅长处理哪种应用场景的计算?
()[单选题]*
A.迭代计算;
B.离线计算;(正确答案)
C.实时交互计算;
D.流式计算;
63.某高校的FusionlnsightHD集群中有230个节点,在进行集群规划时,下列哪些
进程应该部署在数据节点上?
()*
A.DatabNode;(正确答案)
B.NameNode;
C.NodeManage(正确答案)
D.RegionService;(正确答案)
E.DBService
F.Solrserver(正确答案)
64.FusionlnsightHD集群中的节点只安装了一款网卡,也可以采用双平面隔离组网络方案。
()[单选题]*
A.正确;
B.错误;(正确答案)
65.Hadoop系统中,如果文件系统的备份因子是3,那么每次MapReduce任务运行的task所需要的文件都要从3个副本的机器上传输需要处理的文件。
()[单选题]
A.正确;
B.错误;(正确答案)
66.YARN上有两个同济队列Q1与Q2,容量都是50,Q1上已经有10个任务共占用了40的容量,Q2上有2个任务占用了30的容量,那么由于Q1的任务数多,调用器会优先将资源分配给Q1.()[单选题]*
A.正确;
B.错误;(正确答案)
67.以下哪类数据不属于半结构化数据?
()[单选题]*
A.HTML;
B.XML;
C.二维表;(正确答案)
D.JSON;
68.关于FusionlnsightHD的Streaming描述正确的是?
()[单选题]*
A.Supervisor负责资源分配和任务调度;
B.Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的worker进
程;(正确答案)
C.Supervisor是运行具体处理逻辑的进程;
D.Supervisor是一个Topology中接收数据然后执行处理的组件;
69.HDFS的Client写入文件时,数据的第一副本写入位置是由NameNode确定,其
他副本的写入位置由DataNode确定。
()[单选题]*
A.正确;
B.错误;(正确答案)
70.关于FusionlnsightManager说法错误的是?
()[单选题]*
A.NTPServerClient负责集群内各节点的时钟同步;
B.通过FusionlnsightManager可以对HDFS进行启停控制、配置参数;
C.FusionlnsightManager所有维护操作只能通过WebUI来完成,没有提供shell维护命令;(正确答案)
D.通过FusionInsightManager可以向导式安装集群,缩短集群部署时间;
71.RDD可以从Hadoop兼容文件系统生成,生成之后可以通过调用RDD的算子对
RDD的数据进行部分更新。
()[单选题]*
A.正确;
B.错误;(正确答案)
72.HDFS支持大文件存储,同事支持多个用户对同一个文件的写操作,以及在文
件任意位置进行修改。
()[单选题]*
A.正确;
B.错误;(正确答案)
73.以下哪些OS版本被推荐用来搭建FusionlnsightV1R2C60集群(对选)?
()*
A.SUSE11SP1/SP2/SP3forAMD64&Intel64;(正确答案)
B.Centos6.6(正确答案)
C.RedNat-6.4-86_64(正确答案)
D.RedNat-6.5-86_64;(正确答案)
E.RedNat-6.7-86_64(正确答案)
F.Ubuntu6.3
74.FusionlnsightHD系统如果修改了服务的配置项,不进行服务重启,该服务的配
置状态是什么状态?
()[单选题]*
A.SYNCHRONIZED;
B.EXPIRED;(正确答案)
C.CONFIGURING;
D.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- hadoop 考试 试题