Hadoop试题

发布时间:2020-07-11 09:09:26   来源:文档文库   
字号:

一 单选题

1.以下哪一项不属于Hadoop可以运行的模式?( )

A:单机模式

B:伪分布式模式

C:互联模式

D:分布式模式

分值:0 参考答案:C

2.下列哪项通常是集群的最主要瓶颈?( )

A:CPU

B:网络

C:磁盘IO

D:内存 

分值:0 参考答案:C

3.关于Hadoop SSH的使用方法错误的是( )

A:ssh 192.168.0.2

B:ssh -l root 192.168.0.2

C:ssh root@192.168.0.2 -p 1234

D:ssh root 192.168.0.2

分值:0 参考答案:D

4.下面有关NameNode和DataNode之间的heartbeat说法错误的是()

A、DataNode通过发送Heartbeat告诉NameNode自己还“活着”,并且工作正常

B、HeartBeat包含DataNode状态相关信息

C、如果NameNode在某一固定时间内没有收到DataNode的Heartbeat,那么它会要求DataNode发送Heartbeat

D、NameNode回复Heartbeat回复一些FataNode Command

A:A

B:B

C:C

D:D

分值:0 参考答案:C

5.关于服务启动正确的是( )

A:sbin/start-hdfs.sh

B:sbin/hadoop-daemon.sh start resourcemanager

C:sbin/hadoop-daemon.sh start-yarn.sh

D:sbin/hadoop-daemon.sh namenode start

分值:0 参考答案:B

6.下列( )不属于NameNode的功能。

A:提供名称查询服务

B:保存Block信息,汇报Block信息

C:保存metadata信息

分值:0 参考答案:B

7.HDFS文件系统中一个gzip文件大小75MB,客户端设置Block的大小为默认,请问此文件占用几个Block?( )

A:1

B:2

C:3

D:4

分值:0 参考答案:B

8.关于HDFS Shell操作正确的是( )

A、hadoop fs - moveFromLocal /a.txt /aaa/ 从本地剪切粘贴到hdfs

B、bin/hdfs dfs –ls –R / 表示只查看hdfs上根目录下的目录与文件

C、Hadoop fs -rm URI [URI …] 递归删除HDFS上的文件

D、hadoop fs -mv /aaa/jdk.tar.gz / 将hdfs目录中的文件移动到本地文件夹中

A:A

B:B

C:C

D:D

分值:0 参考答案:A

9.关于HDFS Shell操作描述错误的是( )A、Hadoop fs -cat /iflytek/text.txt | tail -5 返回前几行的样本数据B、Hadoop fs -cat /iflytek/text.txt | shuf -n 5 随机返回指定行数的样本数据C、[-moveFromLocal ... ] 与put相同,但是文件上传之后会从本地文件系统中移除D、[-copyFromLocal ... ] 与put相同,从本地文件系统上传文件到HDFS中

A:A

B:B

C:C

D:D

分值:0 参考答案:A

10.hadoop中,下面关于向文件系统中添加一个文件的过程,错误的是( )

A:需要创建路径的父目录

B:需要创建一个新的INode文件

C:将新的INode文件加入到name space中去

D:将所有操作记录到EditLog中去

分值:0 参考答案:D

11.下列不是FileSystem类的常见方法的是( )

A:getStatus()

B:getScheme()

C:Path()

D:getDefaultPort()

分值:0 参考答案:C

12.关于HDFS API的使用说法不正确的是( )

A:如果要访问HDFS,HDFS客户端必须有一份HDFS的配置文件

B:每个应用程序必须拥有访问Hadoop程序的jar文件

C:操作HDFS,也就是HDFS的读和写,最常用的类File

D:FileStatus对象存储文件和目录的元数据

分值:0 参考答案:C

13.下列关于MapReduce说法不正确的是()

A:MapReduce是一种计算框架

B:MapReduce来源于google的学术论文

C:MapReduce程序只能用java语言编写

D:MapReduce隐藏了并行计算的细节,方便使用

分值:0 参考答案:C

14.下面关于MapReduce的描述中正确的是( )

A:MapReduce程序必须包含Mapper和Reducer

B:MapReduce程序的MapTask可以任意指定

C:MapReduce程序的ReduceTask可以任意指定

D:MapReduce程序的默认数据读取组件是TextInputFormat

分值:0 参考答案:C

15.MapReduce 是一个分布式计算框架,它经历了两个版本MRv1和MRv2。 MRv2重用了MRv1的编程模型和数据处理引擎,运行时环境则完全重写,改为由yarn提供服务,yarn将TaskTrack分解为ResourceManager、ApplicationMaster。MapReduce是一个分布式计算框架,它的第二个版本记为MRv2,以下描述组成部分错误的是( )

A:编程模型(Map和Reduce)

B:数据处理引擎(MapTask和ReduceTastk)

C:运行时环境(JobTrack和TaskTrack)

D:运行时环境(JobTrack和ResourceManager、ApplicationMaster)

分值:0 参考答案:C

16.有关MapReduce的输入输出,说法错误的是( )

A:链接多个MapReduce作业时,序列文件是首选格式

B:把输入数据划分为分片,分片数目和大小任意定义

C:想完全禁止输出,可以使用Null Output Format

D:每个reduce需将它的输出写入自己的文件中,输出无需分片

分值:0 参考答案:B

17.为销售报表展示开发一个MapReduce作业,Mapper输入数据的Key是年份(IntWritable), Value表示商品标识(Text)。下列哪一项决定该Mapper的数据类型?( )A、JobConf.setMapInputKeyClass与JobConf.setMapInputValuesClassB、HADOOP_MAP_DA TA TYPES环境变量C、随作业一起提交的mapper-specification.xml文件D、InputFormat格式类

A:A

B:B

C:C

D:D

分值:0 参考答案:D

18.以下哪个组件可以指定对key进行Reduce分发的策略?( )

A:RecordReader

B:Combiner

C:Partitioner

D:FileInputFormat

分值:0 参考答案:C

19.关于Partitioner的说法不正确的是( )A、Partitioner是partitioner的基类, 如果需要定制partitioner也需要继承该类。B、Partitioner的作用是对Mapper产生的中间结果进行分片C、Parttitioner间接影响Reducer阶段的复杂均衡D、Partitioner只提供了一个方法getPartition(Text key,Text value,int numPartitions)

A:A

B:B

C:C

D:D

分值:0 参考答案:C

20.下列哪种业务场景中,不能直接使用Reducer充当Combiner使用?( )

A:sum求和

B:max求最大值

C:count求计数

D:avg求平均

分值:0 参考答案:D

21.MapReduce适用于( )

A:任意应用程序

B:任意可在Windows server 2008上运行的程序

C:可以串行处理的应用程序

D:可以并行处理的应用程序 ​

本文来源:https://www.2haoxitong.net/k/doc/2a4ab37b846fb84ae45c3b3567ec102de2bddffa.html

《Hadoop试题.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式