大数据分布并行处理试题及答案Word文件下载.docx
- 文档编号:22817369
- 上传时间:2023-02-05
- 格式:DOCX
- 页数:28
- 大小:25.65KB
大数据分布并行处理试题及答案Word文件下载.docx
《大数据分布并行处理试题及答案Word文件下载.docx》由会员分享,可在线阅读,更多相关《大数据分布并行处理试题及答案Word文件下载.docx(28页珍藏版)》请在冰豆网上搜索。
4
HRegionServer包含了HLog和?
HRegion(正确答案)
HMaster
HDFS
Data
HStore包含两部分:
StoreFile和?
HFile
HRegion
MemStore(正确答案)
minor合并时会忽略之前标记为删除状态的数据。
HBase中,若MemStore中的数据有丢失,则可以从HLog上恢复。
HBase中一张表中包含以下几个Region:
[10,20],[20,30],[30,+∞],那么222将属于Region[30,+∞]。
()[单选题]*
A、对
B、错(正确答案)
下列哪个不是大数据的特征?
[单选题]*
A:
数据量大
B:
数据类型多
C:
价值密度低
D:
安全性要求高(正确答案)
E:
处理速度快
大数据带来的主要挑战不包括哪一个:
对现有数据库的挑战
对实时性的技术挑战
对数据中心和运维团队的挑战
对成本的挑战(正确答案)
下列关于hadoop的描述哪个是正确的:
Hadoop的图标是一个黄色小鸭子;
Hadoop是由韩国人研发的;
CDH是hadoop的其中一个发行版本;
所有的Hadoop发行版本都是免费的。
以下哪个不属于hadoop的核心构成[单选题]*
A:
B:
MapReduce
C:
Spark(正确答案)
D:
YARN
以下哪个不属于hadoop生态圈内?
HBase
Zookeeper
Flume
Storm(正确答案)
下列哪个不属于linux的发型版本?
RedHat
CentOs
IOS(正确答案)
Ubuntu
linux执行vi进入编辑器,编辑完成之后需要保存并退出编辑模式,请问需要输入什么命令?
:
q
:
wq(正确答案)
q!
Esc
启动YARN后,默认的web访问端口是多少?
8000
9000
8080
8088(正确答案)
下列哪个不属于Hadoop支持的文件系统[单选题]*
HTTP(正确答案)
HDFS
HFTP
FTP
E:
Local
HDFS的优点不包含哪个?
处理超大文件
运行于廉价机器上
高效存储大量小文件(正确答案)
流式的访问数据
HDFS的设计目标不包括哪个?
硬件错误
大规模数据集
移动计算
移动数据(正确答案)
HDFS默认的最基本的储存单位是?
数据块(正确答案)
元数据节点
数据节点
从元数据节点
HDFS创建文件夹的命令是什么?
$hadoopfs-mkdirfilename(正确答案)
$hadoopfs-textfilename
$hadoopfs-putfilename
$hadoopfs-rmfilename
HDFS寻求帮助的命令格式是什么?
$hadoopfs-h命令名
$hadoopfs-help命令名(正确答案)
$hadoopfsh命令名
$hadoopfshelp命令名
HDFS配置数据文件存储路径(dfs.datanode.data.dir)的文件是哪一个?
hadoop-env.sh
core-site.xml
hdfs-site.xml(正确答案)
yarn-site.xml
下列关于HDFS的负载均衡服务(Balancer)的参数说法哪一个是不正确的?
-threshold默认值10,参数范围0-100
-threshold取值越大越平衡(正确答案)
dfs.balance.bandwitdhPerSec运行时允许占用的带宽
dfs.balance.bandwitdhPerSec默认值为1M/s
下列关于HDFS机架感知中两个DataNode之间的距离说法哪个不正确?
同一个DataNode之间的distance为0;
同一个rack下的不同的DataNode之间的distance为2;
同一个IDC下的不同的DataNode之间的distance为4;
不同的IDC下的DataNode之间的distance为8;
下列关于HDFS中的说法哪个是不正确的?
序列化的目的是将对象转化为字节流以便进行传输和存储;
Hadoop用过writable接口实现序列化机制;
SequenceFile是Hadoop提供的一种对十进制文件的支持;
MapFile是排序过的SequenceFile,由data和index组成。
下面哪个是Hadoop进程()[单选题]*
A.NameNode
B.Nodemanager
C.DataNode
D.以上均是(正确答案)
Hadoop框架是用下面哪个语言写的()[单选题]*
A.Pytyon
B.Java(正确答案)
C.C++
D.Scala
下面哪个是Hadoop组件()[单选题]*
A.YARN
B.HDFS
C.MapReduce
Hadoop工程文件使用哪个扩展名()[单选题]*
A..hrh
B..har(正确答案)
C..hrc
D..hraf
使用下面哪个命令来检查HDFS所有进程的状态()[单选题]*
A.jps(正确答案)
B.fsck
C.distcp
D.以上均不对
ApacheHadoop是使用哪个协议发布的()[单选题]*
A.ApacheLicense2.0(正确答案)
B.Shareware
C.MozillaPublicLicense
D.Commercial
ApacheHadoop运行在哪个平台上()[单选题]*
A.Ubuntu
B.Debian
C.Windows
D.跨平台(正确答案)
ApacheHadoop通过在多个主机上复制数据来达到可用性,因此不需要在主机上进行()存储[单选题]*
A.标准RAID级别
B.RAID(正确答案)
C.ZFS
D.操作系统
下面哪个陈述是正确的()[单选题]*
A.数据本地性是指将计算移向数据而不是数据移向计算(正确答案)
B.数据本地性是指将数据移向计算而不是计算移向数据
C.以上全正确
D.以上全不正确
Hadoop工作在()风格下[单选题]*
A.master-worker
B.worker/salve
C.master-slave(正确答案)
D.以上都是
Hadoop可以处理哪种类型的数据()[单选题]*
A.结构化
B.半结构化
C.非结构化
D.以上全是(正确答案)
有关Hadoop的陈述哪个是错误的()[单选题]*
A.它运行在通用硬件上
B.它是Apache软件基金会(ASF)下的项目
C.它是最好的实时流式数据处理框架(正确答案)
D.Hadoop对数据的处理是由延迟的
下面哪个配置是在mapred-site.xml中配置的()[单选题]*
A.复制因子
B.Java环境变量
C.存储hdfs文件的目录名
D.运行MapReduce作业的主机和端口(正确答案)
下面哪个Apache系统可以向Hadoop提供流式数据()[单选题]*
A.Oozie
B.Flume(正确答案)
C.Hive
D.Kafka
15和RDBMS相比,ApacheHadoop:
A.具有更高的数据完整性
B.支持ACID事物
C.适合多次读写
D.对非结构化和半结构化数据支持更好(正确答案)
你的名字是[填空题]*
_________________________________(答案:
请设置答案)
hadoop集群搭建,控制集群节点数量的是哪个配置文件?
slaves(正确答案)
hdfs-site.xml
core-site.xml
mapred-site.xml
指定MR运行在yarn的配置文件是[单选题]*
yarn-site.xml
mapred-site.xml(正确答案)
查看yarn集群的默认端口号是[单选题]*
8088(正确答案)
50070
50090
9000
配置集群历史服务器在哪个配置文件配置?
在hadoop集群开启日志聚集功能,应该在配置文件配置?
yarn-site.xml(正确答案)
HDFS进行文件存储时,默认的块大小是[单选题]*
64m
128m(正确答案)
64k
128k
HDFS块的设置大小取决于[单选题]*
磁盘传输速率(正确答案)
磁盘大小
集群规模
实际需求
MapReduce执行Map任务时,其并行度的大小一般如何确定?
集群节点
blocksize(正确答案)
数据大小
运算速度
ZooKeeper集群最少需要几台机器?
1
3(正确答案)
取决于节点数量
kafka集群正常工作,需要安装哪个组件支持?
Oozie
yarn
zookeeper(正确答案)
flume
hadoop2.x包括哪些组件?
*
hdfs(正确答案)
mapreduce(正确答案)
yarn(正确答案)
zookeeper
hdfs集群启动,会启动哪些进程?
ResourceManager
NameNode(正确答案)
DataNode(正确答案)
SecondaryNameNode(正确答案)
HDFS组成架构包含*
namenode(正确答案)
datanode(正确答案)
client(正确答案)
secondarynamenode(正确答案)
ZooKeeper集群中的角色有哪些?
leader(正确答案)
follower(正确答案)
master
slave
Zookeeper集群中leader如何产生?
配置文件配置决定
选举机制(正确答案)
半数以上原则(正确答案)
集群节点数量决定
yarn启动,会启动哪些进程?
每个进程分别起什么作用?
[填空题]*
_________________________________
对hadoop格式化Namenode时,需要注意什么?
MapReduce计算的核心过程包括哪些环节?
请简述说明每一个环节的基本功能。
Flume架构中,包括哪几个核心组件?
在kafka集群中、topic的作用是什么?
kafka中定义了一些拦截器,其主要作用是什么?
hadoop运行的部署模式有:
______、______、______[填空题]*
空1答案:
单机模式
空2答案:
伪分布式
空3答案:
完全分布式
Hadoop集群搭建中常用的4个配置文件为:
______、______、______、______[填空题]*
hadoop-env.sh
空4答案:
一个HDFS集群包括两大部分,即______与______[填空题]*
NameNode
DataNode
启动hdfs的shell脚本的命令______[填空题]*
start-dfs.sh
启动yarn的shell脚本命令______[填空题]*
start-yarn.sh
Hadoop将作业分成若干个task来执行,其中包括______、______[填空题]*
maptak
reducetask
格式化HDFS系统的命令______[填空题]*
hdfsnamenode-format
HDFS中的block默认保存______份[填空题]*
NameNode默认的web访问端口为______[填空题]*
通过Zookeeper管理两个或者多个______,使其中一个为______状态,并且同步每个NN的______,如果______状态的NN宕机后马上启用状态为______状态的______节点[填空题]*
active
元数据
空5答案:
standby
空6答案:
备份
默认______周期性从DataNode接收心跳信号的时间间隔为______s[填空题]*
______负责HDFS数据存储[填空题]*
Datanode
ResourceManager默认的Web访问端口号位:
______[填空题]*
8088
关闭hdfs的shell脚本的命令______[填空题]*
stop-dfs.sh
Hadoop将作业分成若干个task来执行,其中包括:
______、______[填空题]*
maptask
Zookeeper的核心思想是______[填空题]*
读写分离
HBase可以实现数据的______[填空题]*
随机读写
随着计算机技术的发展,数据处理量也不断增加,于是就产生了数据管理技术,而数据管理技术也先后经历了。
A、数据库阶段、人工管理阶段、文件系统阶段和高级数据库技术阶段
B、人工管理阶段、文件系统阶段、数据库阶段和高级数据库技术阶段(正确答案)
C、文件系统阶段、人工管理阶段、数据库阶段和高级数据库技术阶段
D、数据库阶段、高级数据库技术阶段、文件系统阶段和人工管理阶段
我们这个学期学习的HBase、MongoDB分别属于那种类型的NoSQL数据库?
A、键值数据库、图形数据库
B、文档数据库、文档数据库
C、列族数据库、文档数据库(正确答案)
D、文档数据库、列族数据库
CAP理论是NoSQL数据库的基础,三者不可兼得,以下不是CAP特性的是?
A、一致性
B、可用性
C、容灾性(正确答案)
D、分区容错性
HBaseRowkey设计的原则,下列哪个选项的描述是不正确的?
A尽量保证越短越好
B可以使用汉字
C可以使用字符串
D本身是无序的(正确答案)
HFile数据格式中的KeyValue数据格式,下列选项描述正确的是()。
A是数不字格式
B没有固定的结构
C数据的大小是定长的
D有固定的结构(正确答案)
HBase依赖()提供消息通信机制[单选题]*
AZookeeper
BChubby
CRPC(正确答案)
DSocket
HBase依赖()提供强大的计算能力[单选题]*
CRPC
DMapReduce(正确答案)
HBase来源于哪篇博文?
ATheGoogleFileSystem
BMapReduce
CBigTable(正确答案)
DChubby
下面对HBase的描述哪个不是正确的?
()[单选题]*
A不是开源的(正确答案)
B是面向列的
C是分布式的
D是一种NoSQL数据库
HFile数据格式中的KeyValue数据格式中Value部分是()。
A拥有复杂结构的字符串
B字符串
C二进制数据(正确答案)
D压缩数据
以下哪些选项不正确描写叙述了HBase的特性?
A高可靠性
B高性能
C面向列
D不可伸缩(正确答案)
HBase依靠()存储底层数据[单选题]*
AHDFS(正确答案)
BHadoop
CMemory
DMapReduce
RegionServer包含有多个()。
AServer
BHDFS
CRegion(正确答案)
DHbase
StoreFile在底层文件系统中是由()实现。
AData
BHfile(正确答案)
CMemStore
DRegion
Region的负载均衡是由()来完成。
AMaster(正确答案)
BZookeeper
CRegionServer
下列是HBase数据导出工具的是()。
AExport(正确答案)
BImport
CCopyTable
Dhbck
下列是HBase数据导入工具的是()。
AExport
BImport(正确答案)
下列是HBase数据迁移工具的是()。
BInport
CCopyTable(正确答案)
下列是HBase文件检测修复工具的是()。
Dhbck(正确答案)
下列是HBase文件查看工具的是()。
Ahfile(正确答案)
Hbase基于java编程中,能实现删除表功能的接口是()。
ATable接口
BAdmin接口(正确答案)
CHbaseConfiguration类
DHTableDescriptor类
MongoDB属于什么类型的数据库?
A列族数据库
B键值对数据库
C文档数据库(正确答案)
D图数据库
下面对MongoDB的描述哪个不是正确的?
A是关系型的(正确答案)
B是面向文档的
MongoDB中主键的默认格式是哪个?
AUUID
B序列sequence
C自增auto_increment
DObjectId(正确答案)
MongoDB采用哪种语言编写?
AJava
BGo
CPyhon
DC++(正确答案)
MongoDB中查询操作,以下说法错误的是?
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 并行 处理 试题 答案