文档文库

手机版

投诉建议

首页 > Hadoop试题

Hadoop试题

发布时间：2020-07-11 09:09:26 来源：文档文库

小中大

字号：

手机查看

一单选题

1.以下哪一项不属于Hadoop可以运行的模式？（）

A：单机模式

B：伪分布式模式

C：互联模式

D：分布式模式

分值：0 参考答案：C

2.下列哪项通常是集群的最主要瓶颈？（）

A：CPU

B：网络

C：磁盘IO

D：内存

分值：0 参考答案：C

3.关于Hadoop SSH的使用方法错误的是（）

A：ssh 192.168.0.2

B：ssh -l root 192.168.0.2

C：ssh root@192.168.0.2 -p 1234

D：ssh root 192.168.0.2

分值：0 参考答案：D

4.下面有关NameNode和DataNode之间的heartbeat说法错误的是（）

A、DataNode通过发送Heartbeat告诉NameNode自己还“活着”，并且工作正常

B、HeartBeat包含DataNode状态相关信息

C、如果NameNode在某一固定时间内没有收到DataNode的Heartbeat，那么它会要求DataNode发送Heartbeat

D、NameNode回复Heartbeat回复一些FataNode Command

A：A

B：B

C：C

D：D

分值：0 参考答案：C

5.关于服务启动正确的是（）

A：sbin/start-hdfs.sh

B：sbin/hadoop-daemon.sh start resourcemanager

C：sbin/hadoop-daemon.sh start-yarn.sh

D：sbin/hadoop-daemon.sh namenode start

分值：0 参考答案：B

6.下列（）不属于NameNode的功能。

A：提供名称查询服务

B：保存Block信息，汇报Block信息

C：保存metadata信息

分值：0 参考答案：B

7.HDFS文件系统中一个gzip文件大小75MB，客户端设置Block的大小为默认,请问此文件占用几个Block？（）

A：1

B：2

C：3

D：4

分值：0 参考答案：B

8.关于HDFS Shell操作正确的是（）

A、hadoop fs - moveFromLocal /a.txt /aaa/ 从本地剪切粘贴到hdfs

B、bin/hdfs dfs –ls –R / 表示只查看hdfs上根目录下的目录与文件

C、Hadoop fs -rm URI [URI …] 递归删除HDFS上的文件

D、hadoop fs -mv /aaa/jdk.tar.gz / 将hdfs目录中的文件移动到本地文件夹中

A：A

B：B

C：C

D：D

分值：0 参考答案：A

9.关于HDFS Shell操作描述错误的是（）A、Hadoop fs -cat /iflytek/text.txt | tail -5 返回前几行的样本数据B、Hadoop fs -cat /iflytek/text.txt | shuf -n 5 随机返回指定行数的样本数据C、[-moveFromLocal ... ] 与put相同，但是文件上传之后会从本地文件系统中移除D、[-copyFromLocal ... ] 与put相同，从本地文件系统上传文件到HDFS中

A：A

B：B

C：C

D：D

分值：0 参考答案：A

10.hadoop中，下面关于向文件系统中添加一个文件的过程，错误的是（）

A：需要创建路径的父目录

B：需要创建一个新的INode文件

C：将新的INode文件加入到name space中去

D：将所有操作记录到EditLog中去

分值：0 参考答案：D

11.下列不是FileSystem类的常见方法的是（）

A：getStatus()

B：getScheme()

C：Path()

D：getDefaultPort()

分值：0 参考答案：C

12.关于HDFS API的使用说法不正确的是（）

A：如果要访问HDFS,HDFS客户端必须有一份HDFS的配置文件

B：每个应用程序必须拥有访问Hadoop程序的jar文件

C：操作HDFS,也就是HDFS的读和写，最常用的类File

D：FileStatus对象存储文件和目录的元数据

分值：0 参考答案：C

13.下列关于MapReduce说法不正确的是（）

A：MapReduce是一种计算框架

B：MapReduce来源于google的学术论文

C：MapReduce程序只能用java语言编写

D：MapReduce隐藏了并行计算的细节，方便使用

分值：0 参考答案：C

14.下面关于MapReduce的描述中正确的是（）

A：MapReduce程序必须包含Mapper和Reducer

B：MapReduce程序的MapTask可以任意指定

C：MapReduce程序的ReduceTask可以任意指定

D：MapReduce程序的默认数据读取组件是TextInputFormat

分值：0 参考答案：C

15.MapReduce 是一个分布式计算框架，它经历了两个版本MRv1和MRv2。 MRv2重用了MRv1的编程模型和数据处理引擎，运行时环境则完全重写，改为由yarn提供服务，yarn将TaskTrack分解为ResourceManager、ApplicationMaster。MapReduce是一个分布式计算框架，它的第二个版本记为MRv2，以下描述组成部分错误的是（）

A：编程模型(Map和Reduce)

B：数据处理引擎（MapTask和ReduceTastk）

C：运行时环境(JobTrack和TaskTrack)

D：运行时环境(JobTrack和ResourceManager、ApplicationMaster)

分值：0 参考答案：C

16.有关MapReduce的输入输出，说法错误的是（）

A：链接多个MapReduce作业时，序列文件是首选格式

B：把输入数据划分为分片，分片数目和大小任意定义

C：想完全禁止输出，可以使用Null Output Format

D：每个reduce需将它的输出写入自己的文件中，输出无需分片

分值：0 参考答案：B

17.为销售报表展示开发一个MapReduce作业,Mapper输入数据的Key是年份(IntWritable), Value表示商品标识(Text)。下列哪一项决定该Mapper的数据类型?( )A、JobConf.setMapInputKeyClass与JobConf.setMapInputValuesClassB、HADOOP_MAP_DA TA TYPES环境变量C、随作业一起提交的mapper-specification.xml文件D、InputFormat格式类

A：A

B：B

C：C

D：D

分值：0 参考答案：D

18.以下哪个组件可以指定对key进行Reduce分发的策略？（）

A：RecordReader

B：Combiner

C：Partitioner

D：FileInputFormat

分值：0 参考答案：C

19.关于Partitioner的说法不正确的是（）A、Partitioner是partitioner的基类, 如果需要定制partitioner也需要继承该类。B、Partitioner的作用是对Mapper产生的中间结果进行分片C、Parttitioner间接影响Reducer阶段的复杂均衡D、Partitioner只提供了一个方法getPartition(Text key,Text value,int numPartitions)

A：A

B：B

C：C

D：D

分值：0 参考答案：C

20.下列哪种业务场景中，不能直接使用Reducer充当Combiner使用？（）

A：sum求和

B：max求最大值

C：count求计数

D：avg求平均

分值：0 参考答案：D

21.MapReduce适用于（）