一 单选题 |
1.以下哪一项不属于Hadoop可以运行的模式?( ) |
A:单机模式 |
B:伪分布式模式 |
C:互联模式 |
D:分布式模式 |
分值:0 参考答案:C |
2.下列哪项通常是集群的最主要瓶颈?( ) |
A:CPU |
B:网络 |
C:磁盘IO |
D:内存 |
分值:0 参考答案:C |
3.关于Hadoop SSH的使用方法错误的是( ) |
A:ssh 192.168.0.2 |
B:ssh -l root 192.168.0.2 |
C:ssh root@192.168.0.2 -p 1234 |
D:ssh root 192.168.0.2 |
分值:0 参考答案:D |
4.下面有关NameNode和DataNode之间的heartbeat说法错误的是() A、DataNode通过发送Heartbeat告诉NameNode自己还“活着”,并且工作正常 B、HeartBeat包含DataNode状态相关信息 C、如果NameNode在某一固定时间内没有收到DataNode的Heartbeat,那么它会要求DataNode发送Heartbeat D、NameNode回复Heartbeat回复一些FataNode Command |
A:A |
B:B |
C:C |
D:D |
分值:0 参考答案:C |
5.关于服务启动正确的是( ) |
A:sbin/start-hdfs.sh |
B:sbin/hadoop-daemon.sh start resourcemanager |
C:sbin/hadoop-daemon.sh start-yarn.sh |
D:sbin/hadoop-daemon.sh namenode start |
分值:0 参考答案:B |
6.下列( )不属于NameNode的功能。 |
A:提供名称查询服务 |
B:保存Block信息,汇报Block信息 |
C:保存metadata信息 |
分值:0 参考答案:B |
7.HDFS文件系统中一个gzip文件大小75MB,客户端设置Block的大小为默认,请问此文件占用几个Block?( ) |
A:1 |
B:2 |
C:3 |
D:4 |
分值:0 参考答案:B |
8.关于HDFS Shell操作正确的是( ) A、hadoop fs - moveFromLocal /a.txt /aaa/ 从本地剪切粘贴到hdfs B、bin/hdfs dfs –ls –R / 表示只查看hdfs上根目录下的目录与文件 C、Hadoop fs -rm URI [URI …] 递归删除HDFS上的文件 D、hadoop fs -mv /aaa/jdk.tar.gz / 将hdfs目录中的文件移动到本地文件夹中 |
A:A |
B:B |
C:C |
D:D |
分值:0 参考答案:A |
9.关于HDFS Shell操作描述错误的是( )A、Hadoop fs -cat /iflytek/text.txt | tail -5 返回前几行的样本数据B、Hadoop fs -cat /iflytek/text.txt | shuf -n 5 随机返回指定行数的样本数据C、[-moveFromLocal |
A:A |
B:B |
C:C |
D:D |
分值:0 参考答案:A |
10.hadoop中,下面关于向文件系统中添加一个文件的过程,错误的是( ) |
A:需要创建路径的父目录 |
B:需要创建一个新的INode文件 |
C:将新的INode文件加入到name space中去 |
D:将所有操作记录到EditLog中去 |
分值:0 参考答案:D |
11.下列不是FileSystem类的常见方法的是( ) |
A:getStatus() |
B:getScheme() |
C:Path() |
D:getDefaultPort() |
分值:0 参考答案:C |
12.关于HDFS API的使用说法不正确的是( ) |
A:如果要访问HDFS,HDFS客户端必须有一份HDFS的配置文件 |
B:每个应用程序必须拥有访问Hadoop程序的jar文件 |
C:操作HDFS,也就是HDFS的读和写,最常用的类File |
D:FileStatus对象存储文件和目录的元数据 |
分值:0 参考答案:C |
13.下列关于MapReduce说法不正确的是() |
A:MapReduce是一种计算框架 |
B:MapReduce来源于google的学术论文 |
C:MapReduce程序只能用java语言编写 |
D:MapReduce隐藏了并行计算的细节,方便使用 |
分值:0 参考答案:C |
14.下面关于MapReduce的描述中正确的是( ) |
A:MapReduce程序必须包含Mapper和Reducer |
B:MapReduce程序的MapTask可以任意指定 |
C:MapReduce程序的ReduceTask可以任意指定 |
D:MapReduce程序的默认数据读取组件是TextInputFormat |
分值:0 参考答案:C |
15.MapReduce 是一个分布式计算框架,它经历了两个版本MRv1和MRv2。 MRv2重用了MRv1的编程模型和数据处理引擎,运行时环境则完全重写,改为由yarn提供服务,yarn将TaskTrack分解为ResourceManager、ApplicationMaster。MapReduce是一个分布式计算框架,它的第二个版本记为MRv2,以下描述组成部分错误的是( ) |
A:编程模型(Map和Reduce) |
B:数据处理引擎(MapTask和ReduceTastk) |
C:运行时环境(JobTrack和TaskTrack) |
D:运行时环境(JobTrack和ResourceManager、ApplicationMaster) |
分值:0 参考答案:C |
16.有关MapReduce的输入输出,说法错误的是( ) |
A:链接多个MapReduce作业时,序列文件是首选格式 |
B:把输入数据划分为分片,分片数目和大小任意定义 |
C:想完全禁止输出,可以使用Null Output Format |
D:每个reduce需将它的输出写入自己的文件中,输出无需分片 |
分值:0 参考答案:B |
17.为销售报表展示开发一个MapReduce作业,Mapper输入数据的Key是年份(IntWritable), Value表示商品标识(Text)。下列哪一项决定该Mapper的数据类型?( )A、JobConf.setMapInputKeyClass与JobConf.setMapInputValuesClassB、HADOOP_MAP_DA TA TYPES环境变量C、随作业一起提交的mapper-specification.xml文件D、InputFormat格式类 |
A:A |
B:B |
C:C |
D:D |
分值:0 参考答案:D |
18.以下哪个组件可以指定对key进行Reduce分发的策略?( ) |
A:RecordReader |
B:Combiner |
C:Partitioner |
D:FileInputFormat |
分值:0 参考答案:C |
19.关于Partitioner的说法不正确的是( )A、Partitioner是partitioner的基类, 如果需要定制partitioner也需要继承该类。B、Partitioner的作用是对Mapper产生的中间结果进行分片C、Parttitioner间接影响Reducer阶段的复杂均衡D、Partitioner只提供了一个方法getPartition(Text key,Text value,int numPartitions) |
A:A |
B:B |
C:C |
D:D |
分值:0 参考答案:C |
20.下列哪种业务场景中,不能直接使用Reducer充当Combiner使用?( ) |
A:sum求和 |
B:max求最大值 |
C:count求计数 |
D:avg求平均 |
分值:0 参考答案:D |
21.MapReduce适用于( ) |
A:任意应用程序 |
B:任意可在Windows server 2008上运行的程序 |
C:可以串行处理的应用程序 |
D:可以并行处理的应用程序 |
本文来源:https://www.2haoxitong.net/k/doc/2a4ab37b846fb84ae45c3b3567ec102de2bddffa.html
文档为doc格式