1+x大数据测试试题及答案

佚名 · 0905

试题，答案

文件大小54.6 KB

文件格式docx

分享时间2023-04-11

更多此类文档

立即下载

还剩45页未读，继续阅读

本资源只提供10页预览，全部文档请下载后查看！喜欢就下载吧，查找使用更方便

立即下载

文本内容:

1+x大数据测试试题及答案

1、数据节点（DataNode）负责存储数据，一个数据块会在多个DataNode中进行冗余备份，那么HDFS默认存储几份？（）A、1B、2C、3D、5答案C

2、下列哪项通常是集群的最主要瓶颈（）A、CPUB、网络C、磁盘10D、内存（由于大数据面临海量数据，读写数据都需要i，然后还要冗余数据，hadoop一般备3份数据，所以10就会打折扣）答案C

3、以下（）文件中主要用来配置ResourceManagerNodeManager的通信端口，web监控端口等A、core-sitexmlB、mapred-site.xmlC、hdfs-site.xmlD、yarn-sitexml答案D

4、查看当前yarn运行任务列表采用（）命令yarnapplication-logB、HDFSapplication-listC、yarnapplication-killDsyarnapplication-list答案D

5、关于ZooKeeper的说法错误的是？（）A、ZooKeeper是一个高可用的分布式数据管理和协调框架B、能够很好的保证分布式环境中数据的一致性C^越来越多的分布式系统（Hadoop、HBaseKafka）中使用ZooKeeperD^Hadoop的高可用不需要用到ZooKccpcr答案D

6、下列关于MapReduce说法不正确的是（）B、作业初始化一作业提交一任务分配一任务的执行一任务进度和状态的更新一任务结束C、任务分配一作业提交一作业初始化一任务的执行一任务进度和状态的更新一任务结束D、任务执行-作业提交一作业初始化一任务的分配一任务进度和状态的更新一任务结束答案A

48、下面哪个选项不属于DataNode的职责？A、保存数据块B、启动DataNode线程，向NameNode定期汇报数据块信息C、管理数据块D、定期向NameNode发送心跳信息保持联系答案C49IIMaster的主要作用是A、用于启动任务管理多个HRegionServerB、负责响应用户I/O请求，向HDFS文件系统读写数据C、负责协调集群中的分布式组件D、最终保存HBase数据行的文件答案A

50、ZooKeeper的特点不包括A、顺序一致性B、原子性C、可靠性D、复合系统映像答案D

51、YARN哪种调度器采用的是单队列？CapacitySchedulerFairSchedulerC^FIFOSchedulerD、以上都不是答案C

52、Hadoop的安装部署的模式属于本地模式A、默认的模式，无需运行任何守护进程daemon所有程序都在单个JVM上执行B、在一台主机模拟多主机即，Hadoop的守护程序在本地计算机上运行模拟集群环境，并且是相互独立的Java进程C、完全分布模式的守护进程运行在由多台主机搭建的集群上，是真正的生产环境D、高容错全分布模式的守护进程运行在多台主机搭建的集群上答案A

53、名称节点NameNode是HDFS的管理者，它的职责有3个方面，下面哪个选项不是NamdeNode的职责？A、负责管理和维护HDFS的命名空间NameSpaceB、管理DataNode上的数据块BlockC、接收客户端的请求D、负责保存数据块答案D

54、下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是A、FSDatalnputStream扩展了DatalnputStream以支持随机读B、为实现细粒度并行，输入分片InputSplit.应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割答案B

55、单选.下面关于分布式文件系统I1DFS的描述正确的是A、分布式文件系统HDFS是谷歌分布式文件系统GFSGoogleFileSystem的一种开源实现B、分布式文件系统HDFS比较适合存储大量零碎的小文件C、分布式文件系统HDFS是GoogleBigtable的一种开源实现D、分布式文件系统HDFS是一种关系型数据库答案A

56、flume中那种source类型支持Unix的命令标准在生产数据A^AvrOSourceThriftSourceExecSourceDsJMSSource答案C57Hbase的主要作用是A、是一个分布式的、面向列的开源数据库B、是一种编程模型，用于大规模数据集大于1TB的并行运算C、是Hadoop集群当中的资源管理系统模块D、将要储存的文件分散在不同的硬盘上，并记录他们的位置答案A

58、大数据分析平台的实施流程顺序是A与甲方确定总体计划B组建项目团队C部署环境准备D应用集成及数据集成E系统安装和调试BACEDCABEDADCBEDABCE答案A

59、Hadoop环境设置配置中需要配置哪些文件？Ihadoop-env.sh2core-site.xml3hdfs-site.xml4mapred-site.xml5mapred-site.xml.template6yarn-site.xmlA、

1.、

2.、

3.、

4.、

6.B、

2.、

3.、

4.、

5.、

6.C、

3.、

4.、

5.、

6.D、

1.、

2.、

3.、

4.、

5.答案A

60、哪个不是HDFS默认BlockSize32MB64MBC、128MB旧版本用64M当前新版本用128M答案A61UBase依赖_存储底层数据HDFSHadoopC^MemoryD^MapReduce答案A

62、报告hdfs使用情况采用命令A^hdfsdfsadmin-setSpaccQuota500g/path/xxx/hdfsdfsadmin-reportC^hdfsdfsadmin-clrSpaccQuota/user/testnameD、hdfsdfs-getfacl/user/testname答案B

63、HDFS能够在出错的情况下保证数据存储的可靠性，常见的出错情况不包括？A、数据节点DataNode出错B、名称节点NameNode出错C、数据本身出错D、以上选项都不包括答案D

64、下面哪个程序负责HDFS数据存储NameNodeJobtrackerDatanodesecondaryNameNodetasktracker答案C

65、以下选项哪个是YARN中动态创建的资源容器ResourceManagerNodeManagerC^ApplicationMasterD、Container答案D

66、如没有配置hadoop.tmp.dir参数此时系统默认的临时目录为/tmp/hadoop-hadoop/usr/hadoop-hadoop/usr/local/hadoop-hadoop/usr/local/src/hadoop-hadoop答案A

67、HDfS中的block默认保存几份A、3份B、2份C、1份D、不确定答案A

68、大数据的特点不包括下面哪一项A、巨大的数据量B、多结构化数据C、增长速度快D、价值密度高答案D

69、HBase依赖提供消息通信机制ZookeeperChubbyC、RPCD、Socket答案A

70、关于SecondaryNameNode哪项是正确的？A、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编相日志，减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点答案C

71、关于UDIS的文件写入，正确的是A、支持多用户对同一文件的写操作B、用户可以在文件任意位置进行修改C、默认将文件块复制成三份存放D、复制的文件块默认都存在同一机架上答案C

72、下列有关flume的描述不正确的是flume是Apache的一个子项目B、flume主要是一个日志采集，传输系统C、flume和sqoop功能相似，因此可以相互替代D、flume可以同时采集集群内部和集群外部的日志数据答案C

73、多用户的情况下，哪个YARN调度器可以最大化集群的吞吐利利用率？IA^CapacitySchedulerFIFOSchedulerC^FairSchedulerD、以上都不是答案A

74、以下选项哪个命令是用贝到slavel节点上A、scp^/.ssh/id_rsa.pubhadoop@s1ave2:/B、scpV.ssh/id_rsa.pubroot@slavel:VC、scp^/.ssh/id_rsa.pubhadoop@slavelC/D、scp^/.ssh/id_rsa.pubslavel@root:V答案C

75、配置Hadoop环境变量修改文件A^vi/etc/profilevi/etc/profilesvi/etc/hostsD、viVinput/data答案A

76、【单选题】Hadoop的生态系统组件之一Sqoop的功能是？A、提供高可靠性、高可用、分布式的海量日志采集B、用来存储非结构化和半结构化的松散数据C、负责集群资源调度管理的组件D、用来在Hadoop和关系数据库之间的交换数据，改进数据的互操作性答案D77aHadoop安装在一台计算机上，需修改相应的配置文件，用一台计算机模拟多台主机的集群是模式A、全分布模式B、伪分布模式C、单机模式D、全分布11A模式答案B

78、整个大数据平台按其职能划分为五个模块层次，运行环境层是A、运行环境层为基础设施层提供运行时环境，它由2部分构成，即操作系统和运行时环境B、基础设施层由2部分组成Zookeeper集群和Hadoop集群它为基础平台层提供基础设施服务C、基础平台层由3个部分组成任务调度控制台、HBase和Hive它为用户网关层提供基础服务调用接口D、用户网关层用于为终端客户提供个性化的调用接口以及用户的身份认证是用户唯一可见的大数据平台操作入口答案A

79、对Sqoop描述不正确的是？（）A、Sqoop的底层实现是MapReduceB、Sqoop主要采集关系型数据库中数据，常用于离线计算批量处理C、Sqoop只支持从关系型数据库导入到HDFS不支持从HDFS导入到关系型数据库D、Sqoop脚本最终会变成提交到YARN上的一个个map任务答案C

80、（单选.以下对数据节点理解错误的是（.A、数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作B、数据节点通常只有一个C、数据节点用来存储具体的文件内容D、数据节点的数据保存在磁盘中答案B

81、tar命令用于对文件进行打包压缩或解压，-t参数含义（）A、创建压缩文件B、解开压缩文件C、查看压缩包内有哪些文件D、向压缩归档末尾追加文件答案C

82、关于Flume的三大组件以下说法正确的是（）A、channel可以和任意数量的source和sink链接B、channel只能链接单一的source和sinkC、sink在三大组件之间起着桥梁的作用D、sink从channel消费数据并将其传递给目标地，目标地只能是hdfso答案A

83、在本次项目实施中，需求调研前的准备不包括（）oA、充分了解客户的要求，客户的业务，客户的关注重点B、接到调研任务，将计划写好，立即就开始和用户沟通C、编制确定客户需求调研计划和调研提纲D、和客户负责人沟通，确定客户需求小组成员答案B

84、下列选项哪个不是ZooKeeper的应用场景？（）A、Master选举B、分布式锁C、分布式协调/通知D、存储非关系型数据答案D

85、一个gzip文件大小75MB客户端设置Block大小为64MB请我其占用几个BlockA、1B、2C、3D、4答案B

86、Hadoop的配置目录在哪里？（）/etc/hosts/etc/hadoop$HAD00PJ10ME/conf$HAD00PJ10ME/etc/hadoop答案D

87、Sqoop是Hadoop和关系数据库服务器之间传送数据的工具，下列哪种数据库是不支持使用Sqoop直接进行数据传送（）PostgresOracleMySQLRedis答案D

88、关于Hadoop单机模式和伪分布式模式的说法，正确的是（）A、两者都起守护进程，且守护进程运行在一台机器上B、单机模式不使用HDFS但加载守护进程C、两者都不与守护进程交互，避免复杂性D、后者比前者增加了HDFS输入输出以及可检查内存使用情况答案D89Sqoop的作用是（）A、用于传统关系型数据库和Hadoop之间传输数据B、提供对日志数据进行简单处理的能力C、是Hadoop体系中数据存储管理的基础D、是一个建立在HDFS之上，面向列的针对结构化和半结构化数据的动态数据库答案A

90、在HDFS分布式文件系统中，一般采用冗余存储，冗余因子通常设置为A、1B、2C、3D、4答案C

91、【单选题】下列选项中，正确描述flume对数据源的支持是？A、只能使用HDFS数据源B、可以配置数据源C、不能使用文件系统D、不能使用目录方式答案B

92、大数据解决方案确认需求分析准备工作不包括A、充分了解客户的要求，客户的业务，客户的关注重点B、和客户负责人沟通，确定客户需求小组成员C、编制确定客户实施计划D、根据事先了解的初步用户需求，列出这些难点答案C

93、下列不属于NameNode的功能A、提供名称查询服务B、保存Block信息汇报Block信息C、保存metadata信息D、metadata信息在启动后会加载到内存答案B

94、下列哪项通常是集群的最主要的性能瓶颈A、CPUB、网络C、磁盘D、内存答案C

95、关于HDFS回收站描述正确的是？（）A、HDFS回收站默认开启B、HDFS回收站中的文件文件像Windows回收站一样，如果不清空回收站文件会一直保留在回收站C、HDFS为每一个用户都创建了回收站，这个类似操作系统的回收站位置是/user/用户名/.Trash/D、用户不能手动清空回收站中的内容答案C

96、Zookeeper服务端默认的对外服务端口是？（）8088388821812888答案C

97、Sqoop将导入或导出命令翻译成什么程序来实现导入导出（）SparkStormC^MapReduceD、Tez答案C

98、当NameNode出错时，下面哪个方案描述正确，且是最佳故障恢复和容错方案？（）A、采用SecondaryName定时备份NameNode的fsimage和editsB、采用NameNodeHA当一个NameNode出错时，另一个NameNode接管它的工作C、采用NameNodeFedaration多个Namenode一起工作D、多增加DataNode答案B

99、以下哪个不是HDFS的进程（）A^SecondaryNodeB、NameNodeC^ResourceManagerDsDataNode答案CA、MapReduce是一种计算框架B、MapReduce来源于google的学术论文C、MapReduce程序只能用java语言编写D、MapReduce隐藏了并行计算的细节，方便使用答案C

7、YARN中，任务进度监控是向哪个组件汇报的？（）ResourceManagerNodeManagerApplicationMasterContainer答案C

8、大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析，从中发现新知识、创造新价值、提升新能力的（）A、新一代技术平台B、新一代信息技术和服务业态C、新一代服务业态D、新一代信息技术答案B

9、对于HDFS文件读取过程，描述不正确的是？（）A、UDIS客户端通过Configuration对象的open.方法打开要读取的文件DistributedFileSystem负责向远程的名称节点（NameNode）发起RPC调用，得到文件的数据块信息，返回数据块列表C、通过对数据流反复调用read.方法，把数据从数据节点传输到客户端D、当客户端读取完数据时，调用FSDatalnputStream对象的close.方法关闭输入流答案A

10、关于YARN的说法错误的是？（）A、YARN可以支持除了MapReduce之外的其他计算框架YARN是YetAnotherResourceNegotiator的缩写C、YARN可以为上层应用提供统一的资源管理和调度D、YARN不是通用的资源管理器答案D

11、下而哪个选项不属于DataNode的职责？（）A、保存数据块B、启动DataNode线程，向NameNode定期汇报数据块信息

100、考虑到安全和效率，Hadoop设计了机架感知（rack-aware）功能，下面关于机架感知说法正确的是？（）A、三个冗余备份可在同一个机架上B、三个冗余备份在不同的机架上C、三个冗余备份其中有两个在同一个架构上，另外一个备份在不同的机架上D、上述说法都不对答案C10kHadoop类库中最终面向用户提供的接口类是o该类是个抽象类只能通过类的get方法得到具体类？（）ConfigurationFileSystem类Path类URI类答案B

102、【单选题】以下关于日志采集工具Flume的说法不正确的是？A、Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的日志收集系统B、Flume的数据源和目标都是可定制、可扩展的C.Flume支持多级级联和多路复制D、Flume适用于大量数据的实时数据采集答案C

103、狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台，不包括下面哪个组件？（）HDFSMapReduceYarnDsHBase答案D

104、下列关于调度器的描述不正确的是？（）A、先进先出调度器可以是多队列B、容器调度器其实是多个FIFO队列C、公平调度器不允许管理员为每个队列单独设置调度策略D、先进先出调度器以集群资源独占的方式运行作业答案A

105、下面就Zookeeper的配置文件zoo.cfg的一部分，请问initLimit表示的含义是？TickTime=2000InitLimit=10SyncLimit=5A、Leader-Follower初始通信时限B、Leader-Follower同步通信时限C、Client-Server通信心跳时间D、Client-Server初始通信时限答案A

106、在HDFS文件操作中，上传文件的命令是putinputgetup答案A

107、日志消息的级别中那个是不会影响系统但值得注意ALEKKTCR1TNOTICEDEBUG答案C

108、Hive适合环境A、Hive适合用于联机online事务处理B、提供实时查询功能C、适合应用在大量不可变数据的批处理作业D、Hive适合关系型数据环境答案C

109、将数据从关系型数据库中导出到HDFS上，应当使用命令importexportC^listD、以上都不对答案A

110、Namenode在启动时自动进入安全模式，在安全模式阶段，说法错误的是A、安全模式目的是在系统启动时检查各个DataNode上数据块的有效性B、根据策略对数据块进行必要的复制或删除C、当数据块最小百分比数满足的最小副本数条件时，会自动退出安全模式D、文件系统允许有修改答案D11k【单选题】关于Sqoop数据的导入导出描述不正确的是？A、实现从MySQL到Hive的导入导出B、实现从MySQL到Oracle的导入导出C、实现从HDFS到Oracle的导入导出D、实现从HDFS到MySQL的导入导出答案B

112、在hive中已知表testname的记录如下tomTom_greentomlyLily代码select*fromtestwherenamerliketom.*的结果有条记录A、1B、2C、3D、0答案C

113、下列描述中，哪项不属于Sqoop的缺点A、无法控制任务的并发度B、格式紧耦合C、安全机制不够完善D、connector必须符合JDBC模型答案A

114、下面哪个选项不是HDFS架构的组成部分？NameNodeDataNodeSecondaryNameNodeD、GFS答案D

115、测试Sqoop是否能够正常连接MySQL数据库命令是A、sqooplist-database-connectjdbc:mysql://

127.

0.1:3306/—usernameroot-Psqooplist-databases-connectionjdbc:mysql://

127.

0.1:3306/一usernameroot-PC、sqoop1ist-databases-connectjdbc:mysql://

127.

0.1:3306/—usernameroot-LD、sqooplist-databases-connectjdbc:mysql://

127.

0.1:3306/—usernameroot-P答案D

116、下面哪个选项不属于Google的三驾马车？（）HDFSMapReduceBigTableD、GFS答案A

117、【单选题】Flume在什么地方将事件转换为数据输出？A、源B、通道C、槽D、拦截器答案B118＞关于SecondaryNameNode哪项是正确的？（）A、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间D、它是NameNode的热备，对内存有严格要求答案C119amap/reduce参数监控metricsshuffle成功的次数（）A、mapped.ShuffleMetrics.Shuff1eConnectionsB、mapred.ShuffleMetrics.ShuffleOutputBytesC、mapred.ShuffleMetrics.Shuff1eOutputsFailedDsmapred.ShuffleMetrics.Shuff1eOutputsOK答案D

120、ZooKccper树中节点叫做什么？（）ZnodeZknodeinodeZxid答案A12K把公钥追加到授权文件的命令是？（）ssh-copy-idssh-addC、sshD、ssh-keygen答案A

122、下面哪个目录保存了Hadoop集群的命令（比如启动Hadoop）（）A、binsbinC^etcD、share答案B

123、HDFS是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是（）A、一次写入，少次读B、多次写入，少次读C、多次写入，多次读D、一次写入，多次读答案D

124、下面的配置项配置在hadoop哪个配置文件？（）namehadoop.tmp.dir/namevalue/home/hadoop/hadoop/tmp/value/propertyA、core-sitexmlB、hdfs-site.xmlC、mapred-site.xmlD、yarn-sitexml答案A

125、大数据平台项目实施计划不包括（）A、基础平台部署B、用户环境准备C、完成大数据平台的安装调试D、完成大数据平台操作开发答案D

126、在配置好Hadoop集群之后，通过浏览器登录查看Hadoop状态，以下是查看的URL（）A、http://master:8088B、http://

192.

168.

1.6:50070http://master:16010http://master:9999答案B

127、hadoop

2.0与hadoopl.0区别A、增加MapReduce2B、增加YARNC、增加11DI-S2D、增加容错机制答案B128HBase分布式模式最好需要个节点A、1B、2C、3D、4答案C

129、【单选题】Sqoop的底层实现是0HDFSMapReduceHbaseHadoop答案B

130、大数据平台操作演示不包括A、在大数据平台操作演示前需要做好准备工作B、分析本次演示的目的和听众群体C、实现呈现技巧提升D、准备好演示环境答案C13k哪种调度器是YARN中默认的资源调度器？FIFOSchedulerCapacitySchedulerC^FairSchedulerD、以上都不是答案B

132、ResourceManager对web服务提供地址，用户可通过ip地址（）在浏览器中查看集群各类信息8088803380808032答案A

133、【单选题】Flume用于收集数据，其传输的数据基本单位是？SplitBlockEventPacket答案C

134、典型的NoSQL数据库是（）HiveMySQLHbaseOracle答案C135＞关于ZooKeeper的说法错误的是？（）A、ZooKeeper不存在单点故障的情况ZooKeeper服务端有两种重要的角色是Leader和FollowerC、ZooKeeperLeader挂掉之后会自动在其他机器选出新的LeaderD、客户端可以连接到ZooKeeper集群中任一台机器答案A

136.Hive默认的元存储是保存在内嵌的（）数据库中MySQLDerbyC^OracleDsSqlServer答案B

137、向HDFS上传文件，正确的shell命令是？（）A^hdfsdfs-gethdfsdfs-putC^hdfsdfs-appcndToFileD、hdfsdfs-copyToLocal答案B

138、Hadoop完全分布模式配置免密登录是要？A、实现主节点到其他节点免密登录B、实现从节点到主节点的免密登录C、主节点和从节点任意两个节点之间免密登录D、以上都不是答案C

139、单选.采用多副本冗余存储的优势不包含.A、加快数据传输速度B、容易检查数据错误C、保证数据可靠性D、节约存储空间答案D

140、HDFS启动成功的标识是A、jps显示NameNodeB、jps显示DataNodejps显示SecondaryNameNodeD、jps显示NameNode\DataNode\SecondaryNameNode答案D14k大数据处理中数据处理层不包括A、数据清洗B、数据规约C、数据提取D、数据分析答案D

142、以下选项哪个是HDFS的名称节点A^DataNodeSecondaryNodeNodeNameNode答案D

143、以下选项哪个命令可以查看主机信息A^nmclidevnmcliconshifupteamOteamdctlteamOst答案A

144、下列哪一种命令格式是不正确的（）A、get表行健列族B、scan表时间戳起始行健结束行健C、alter表列族D、put表行键列族列值答案B

145、下面哪个YARN的描述不正确的是？（）A、YARN指YetAnotherResourceNegotiator是另一种资源协调者YARN只支持MapReduce一种分布式计算模式C.YARN最初是为了改善MapReduce的实现D、YARN的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处答案B

146、大数据的数据量现在己经达到了哪个级别？（C）A、GBB、TBC、PBD、ZB答案C

147、若不针对MapReduce编程模型中的key和value值进行特别设置下列哪一项是MapReduce不适宜的运算（）A、MaxB、MinC、CountDsAverage答案D

148、以下选项哪个是YARN的组成部分？（）A、Container^ResourceManagerNodeManager^ApplicationMasterB、Container^ResourceManagerNodeManager^App1icationManagerC^Container^ResourceManagerScheduler、ApplicationMasterD^ContaincrApplicationManagerNodeManagcrApp1icationMaster答案A

149、端口50070默认是Hadoop哪个服务的端口NameNodeDataNodeSecondaryNameNodeYarn答案A150sHadoop作者MartinFowlerKentBeckC^Dougcutting答案C151＞使用root用户解压Flume安装包到“/usr/local/src”路径，以下哪条是正确的命令oA、root@masterzxvf/opt/software/apache-flume-

6.0-bin.tar.gz/usr/local/srcB、hadoop@masterzxvf/opt/software/apache-flume-

6.0-bin.tar.gz-C/usr/local/srcC、root@masterzxvf/opt/software/apache-flume-

6.0-bin.tar.gz-C/usr/local/srcD、root@masterSunzip/opt/software/apache-flume-

6.0-bin.tar.gz-C/usr/local/src答案C

152、有关使用sqoop抽取数据的原理的描述不正确的是A、sqoop在抽取数据的时候可以指定map的个数，map的个数决定在hdfs生成的B、sqoop抽取数据是个多节点并行抽取的过程，因此map的个数设置的越多性越好C、sqoop任务的切分是根据split字段的最大值-最小值/map数D、sqoop抽取数据的时候需要保证执行当前用户有权限执行相应的操作答案B

153、HDFS有一个LZOwithindex文件大小75MB客户端设置Block大小为64MB当运行mapreduce任务读取该文件时inputsplit大小为？64MB75MBC^一个map读取64MB另外一个map读取11MBC、管理数据块D、定期向NameNode发送心跳信息保持联系答案C

12、【单选题】列出mysql数据库中的所有数据库sqoop命令是？A、sqooplist-databases-connectB、sqooplist-tables-connectC、sqoopcreate-hive-table-connectD、sqoopimport-connect答案A

13、下列sink中哪些是flume不支持的sinkHDFSsinkkafkasinkmemorysinkfilerollsink答案CFlume支持的sinks类型有HDFSSinkHiveSink^LoggerSink、AvroSinkThriftSinkIRCSinkFileRollSink^NullSink、HBaseSink、KafkaSink^HTTPSink、CustomSink^ElasticSearchSinkMorph1ineSolrSink

14、建立在Hadoop文件系统之上的分布式的列式数据库？（）A、HBascBHiveYARNMahout答案A

15、以下选项哪个命令可以生成公钥（）ssh-keygenifupteamOC^nmclidevD、nmcliconsh答案A

16、对于GFS架构，下面哪个说法是错误的？（）A、GFSMaster节点管理所有的文件系统所有数据块B、GFS存储的文件都被分割成固定大小的块，每个块都会被复制到多个块服务器上（可靠性）块的冗余度默认为3答案c154＞在hadoop配置中core-sitexml的配置是参数A、集群全局参数B、HDFS参数C、Mapreduce参数D、集群资源管理系统参数答案A

155、从Vi编辑模式下保存配置返回到Centos7系统使用A、按“shift”+“”组合B、按“Esc”键，然后按“shift”+“”组合C、按“Esc”键，然后按“shift+“”，输入wq回车D、直接输入“exit”答案C

156、配置SSH服务需配置文件vi/etc/ssh/sshdB、vi/etc/ssh/sshd_configC^vi/etc/sysconfig/network-scripts/ifcfg-ethOD、vi^/.bash_profile答案B

157、下列哪个程序通常与NameNode在一个节点启动？SecondaryNameNodeDataNodeTaskTrackerJobtracker答案D

158、MySQL数据库驱动文件放置于hive哪个目录下A、jarB、libC^binDssbin答案B

159、HBase与下列哪个选项属于同一种类型的数据库A^MongoDBMariaDBMySQLOracle答案A

160、下面哪个程序负责HDFS数据存储？（）NameNodeJobtrackerDatanodesecondaryNameNodetasktracker答案C

161、关于ZooKeeper顺序节点的说法正确的是？（）A、创建顺序节点的命令为create/testvaluelB、创建顺序节点时不能连续执行创建命令，否者报错节点已存在通过顺序节点，可以创建分布式系统唯一1DD、顺序节点的序号能无限增加答案C

162、在导入开始之前Sqoop检索出表中所有的列以及列的SQL数据类型这些SQL类型被映射什么类型（C）A、CB、C++JavaPython答案C

163、HDFS首先把大数据文件切分成若干个小的数据块，再把这些数据块分别写入不同的节点，这些负责保存文件数据的节点被称为？（）NameNodeDataNodeSecondaryNameNodeDsBlock答案B

164、下列哪些不是ZooKeepcr的特点（）A、顺序一致性B、原子性C、多样系统映像D、可靠性答案C

165、（单选.下列分区方式哪个不是采用的Hash方式分区（.A、BinaryPartitionerB、TotalOrderPartitionerHashPartitionerKeyFieldBasedPartitioner答案B

166、flume有哪个组件用于采集数据（）sourcechannelC^sinkD、webserver答案A

167、日志消息的级别中哪个是比较严重的情况（）ALEKKTCRITC、ERRD、DEBUG答案B

168、大数据平台架构设计（）的思想A、分层模块化设计B、高集合化设计C、统一结构化设计D、全分布设计答案A

169、关于SecondaryNameNode下面哪项是正确的OA、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点答案C

170、以下选项哪个可以修改文件或目录的访问权限（）A^passwdB、suC^chmodDsuseradd答案c

171、YARN哪种调度器采用的是单队列？（）FIFOSchedulerCapacitySchedulerFairSchedulerResourceManager答案A

172、下面哪个不属于YARN的架构的组成部分？（）JobTrackerResourceManagerNodeManagerApplicationMaster答案A173启动Iladoop和HBase之后，执行jps命令，已经看到有HMaster的进程，但是进入到监控界面查看，没有节点信息最有可能原因（）HAD00P服务未启动HBase服务未启动CaHBase处于安全模式D.HBase服务未安装答案C

174、MapReduce编程模型，键值对〈keyvalue）的key必须实现哪个接口？（）A、Writab1eComparab1eComparableWritableLongWritable答案A

175、以下选项哪个是MapReduce正确的运行模型（）A、Reduce-Map-ShuffieB、Shuff1e-Map-RcduceCx.Map-Shuffle-ReduceD^Map-Reduce-Shuffle答案C176大数据系统出现“java.net.NoRoutcToHostException:Noroutetohost解决方案（）A、zookeeper的TP要配对B、关掉防火墙serviceiptablesstopC、master和slave配置成同一个IP导致的，要配成不同IPD、SSH配置错误导致，主机名一定要严格匹配，重新配置ssh免密码登录答案B

177、关于SecondaryNameNode的描述，哪项是正确的？（）A、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编辑日志，减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点答案C

178、大数据平台实施方案流程中，建议整个项目过程顺序是（）A与客户确认实施方案B确认客户需求C系统测试D编写实施方案E用户培训F执行实施方案G项目验收BDAFCEGABDFCEGDEABCFGBDAFEGC答案A

179、大数据处理中数据应用层不包括（）A、数据挖掘B、数据建模C、数据可视化D、数据分析答案C

180、2004年，Google公司发表了主要讲解海量数据的高效计算方法的论文是？（）A^TheGoogleFileSystem”uMapReduce:SimplifiedDataProcessingonLargeClustersw“Bigtable:ADistributedStorageSystemforStructuredData”“TheHadoopFileSystem”答案B181＞在ZooKcepcr中有三种角色，下列选项中不属于ZooKeeper中的角色（）ObserverLeaderObeyerFollower答案C

182、在进行Hive组件配置时，JAR包冲突导致异常，出现以下错误信息FailedtosetsetXIncludeAwaretrueforparsermkdir:input:NosuchfileordirectoryC^E45:4readonlyJoptionissetadd!tooverrideD、ERRORtool.ImportTool:ImportedFailedCharacter8216isanout-of-rangedelimiter答案A

183、【单选题】对Sqoop描述不正确的是？A、Sqoop的底层实现是MapReduceB、Sqoop主要采集关系型数据库中数据，常用于离线计算批量处理C、Sqoop只支持从关系型数据库导入到HDFS不支持从HDFS导入到关系型数据库D、Sqoop脚本最终会变成提交到YARN上的一个个map任务答案C184在hadoop配置中yarn-sitexml作用是A、用于定义系统级别的参数B、用于名称节点和数据节点的存放位置C、用于配置JobHistoryServer和应用程序参数D、配置ResourceManagerNodeManager的通信端口答案D

185、下列关于YARN的描述错误的是？A、ResourceManager负责整个系统的资源分配和管理，是一个全局的资源管理器B、NodeManager是每个节点上的资源和任务管理器C、ApplicationManager是一个详细的框架库，它结合从ResourceManager获得的资源和NodeManager协同工作来运行和监控任务ApplicationMasterD、调度器根据资源情况为应用程序分配封装在Container中的资源答案C

186、与Hadoop

1.x相比，Hadoop

2.x采用全新的架构，最明显的变化就是增加了哪个组件？（）A、MapReduceB、PigHBaseYarn答案D

187、hadoop平台下检查h3cu目录的健康状态采用（）命令hdfsfsck/h3cufind/h3culist/h3cuhadoopfs-Isr/h3cu答案A

188、在Centos7系统中，查看和修改IP信息需要用到（）文件/etc/sysconfig/network/ifcfg-ensO/etc/sysconfig/network-script/ifcfg-ensO/etc/sysconfig/ifcfg-ensOD、/etc/resolv.conf答案B189＞在MapReduce中Shuffle的主要作用是（）A、将数据进行拆分B、对映射后的数据进行排序，然后输入到ReducerC、经过映射后的输出数据会被排序，然后每个映射器会进行分区D、通过实现自定义的Partitioner来指定哪些数据进入哪个Reducer答案B

190、关于ZooKeeper的特性说法错误的是？（）A、能改变ZooKeeper服务器状态的操作称为事务操作B、是版本机制有效避免了数据更新时出现的先后顺序问题C、当节点发生变化时，通过watcher机制，可以让客户端得到通知D^watch能触发多次答案D

191、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是（）A、一次写入，少次读写B、多次写入，少次读写C、一次写入，多次读写D、多次写入，多次读写答案C

192、2006年，Google公司发表了用来处理海量数据的一种非关系型数据库的论文是？A、“TheGoogleFileSystem“MapReduce:SimplifiedDataProcessingonLargeClustersw“Bigtable:ADistributedStorageSystemforStructuredData”“TheHadoopFileSystem”答案C

193、下列哪个属性是hdfs-site.xml中的配置？A、fs.defaultFSB、dfs.replicationC、mapreduce.frameworknameD、yarnresourcemanageraddress答案B194Hadoop官方真正支持的操作系统是A、UNIXB、WindowsC、DOSD、Linux答案D

195、Hadoop的安装部署的模式属于伪分布模式A、默认的模式，无需运行任何守护进程daemon所有程序都在单个JVM上执行B、在一台主机模拟多主机即，Hadoop的守护程序在本地计算机上运行模拟集群环境，并且是相互独立的Java进程C、完全分布模式的守护进程运行在由多台主机搭建的集群上，是真正的生产环境D、高容错全分布模式的守护进程运行在多台主机搭建的集群上答案B

196、YARN有哪几种资源调度器？FIFOSchedulerCapacitySchedulerC^FairSchedulerD、ResourceScheduler答案ABC197Hadoop集群验证步骤包括（）A、初始化集群，使用Hadoop命令启动集群B、使用Hadoop命令，创建HDFS文件夹C、使用HDFS命令查看文件系统路径下是否存在文件D、用Hadoop自带的WordCount程序去测试MapReduce答案ABCD

198、下面描述正确的是（）A、IIDFS将数量众多的廉价机器使得硬件错误成为常态B、HDFS支持多种软硬件平台中的可移植性C、HDFS上的一个文件大小是G或T数量级的，支持的文件数量达到千万数量级D、UDIS上的文件可以任意修改答案ABC

199、以下选项中哪些是SS1I涉及到的两个验证方式（）A、主机验证B、用户身份验证C、文件系统验证D、操作系统验证答案AB

200、验证SS11无密码登录需要（）步骤A、修改Master节点authorized_keys文件B、修改Slave节点authorized_keys文件C、验证Master到每个Slave节点无密码登录D、验证两个Slave节点到Master节点无密码登录答案ABCD

201、大数据运维中的FI志分类为（）A、内核及系统日志由系统服务syslog统一进行管理，日志格式基本相似B、用户日志记录系统用户登录及退出系统的相关信息C、程序日志由各种应用程序抽立管理的日志文件，记录格式不统一D、错误日志由各种错误信息组成的日志信息答案ABC

202、下列选项哪些是ZooKcepcr的应用场景？（）A、Master选举B、分布式锁C、数据发布与订阅D、心跳检测答案ABCD

203、下面属于HDFS的优点的是A、处理超大文件HDFS能够处理TB级甚至PB级的数据B、支持流式数据访问C、低成本运行HDFS可运行在低廉的商用硬件集群上D、适合处理低延迟的数据访问E、适合处理大量的小文件F、支持多用户写入及任意修改文件答案ABC

204、大数据培训形式分A、集中培训B、现场培训C、针对性培训D、专业性培训答案ABC

205、HDFS保障可靠性的措施A、数据冗余机制B、数据节点心跳包C、数据节点块报告D、数据完整性检测答案ABD

206、启动HDFS后，jps能看到哪些守护进程A、DataNodeNameNodeC、NodeManagerD^SecondaryNameNodc答案ABD

207、启动HDFS至少需要启动进程A^NameNodeResourccManagerSecondaryNameNodcC、GFSMaster还管理着系统范围内的活动，比如块服务器之间的数据迁移等D、GFSMaster与每个块服务器通信（发送心跳包），发送指令，获取状态答案A

17、大数据平台Hadoop的组件中，提供分布式协作服务的组件是（）HBaseZooKeeperSqoopDsHive答案B

18、安装Hadoop时，发现50070对应的页面无法打开，可以通过下面哪个命令查看某个端口（TCP或UDP）是否在监听？（）A、psnetstatpingifconfig答案B

19、

20、sqoop抽取数据时需要做一些数据转换的工作，下面说法不正确的是（A、一fields-terminated-by101用来设置在hdfs生成的文件的分割符B、—hive-drop-import-delims用来设置在hdfs生成的文件的存储形式为列存储C、-null-stringIN用来把所有的String类型的空值转换成hive的NULL值D、一null-non-stringIN用来把非String类型的空值转换成hive的NULL值C答案C

20、以前在传统数据库与Hadoop之间，数据传输没有专门的工具，两者数据的互导是比较困难的，的出现解决了这个问题？（）HiveFlumeC^SqoopDsZookeeperD、DataNode答案ABD

208、Hive优点是（）A、提供了类SQL的查询语言HQLOB、可扩展强C、提供统一的元数据管理D、容错行强答案ABCD

209、下列属于hadoop的发行版本的是（）ApacheClouderaRedhatCentos答案ABC

210、ZooKeeper的节点类型有？（）A、临时节点B、持久节点C、顺序节点D、监控节点答案ABC211core-site.xml文件核心参数是（）A、mapreduce.frameworknameB、mapreduce.jobhistory.addressC、yarnresourcemanageraddressD、mapreduce.jobhistory.webapp.address答案ABD

212、Hadoop能够使用户轻松开发和运行处理大数据的应用程序，那它主要有下面哪些特点（）A、高可靠性B、高扩展性C、高效性D、高容错性答案ABCD

213、启动YARN后，jps能看到哪些守护进程？（）DataNodeNodeManagerResourceManagerNameNode答案BC

214、Client端上传文件的时候下列哪项正确A、数据经过NameNode传递给DataNodeB、Client端将文件以Block为单位，管道方式依次传到DataNodeC、Client只上传数据到一台DataNode然后由NameNode负责Block复制工作D、当某个DataNode失败，客户端会继续传给其它DataNode答案BD

215、Flume将采集到的数据输出到A、11DFSllbaseHiveKafka答案ABCD

216、以下选项中哪些是常用的ss命令A、scpsftpssh-copy-idifconfig答案ABC

217、查询获取Hadoop全部的配置信息官方网址是A、http://hadoop.apacheorg/docs/current/hadoop-project-dist/hadoop-common/core-defauIt.xmlB、http://hadoop.apacheorg/docs/current/hadoop-project-dist/hadoop-hdfs/hdfs-defauIt.xmlC^http://hadoop.apacheorg/docs/current/hadoop-mapreduce-client/hadoop-maprcduce-client-corc/mapred-default.xmlD、http://hadoop.apacheorg/docs/current/hadoop-yarn/hadoop-yarn-common/yarn-defau

11.xml答案ABCD218MapReduce是Hadoop中集群数据处理的核心分为A、分为映射，映射为Map阶段B、分为减速，减速为Reduce阶段C、分为映射，映射为Reduce阶段D、分为减速，减速为Map阶段答案AB

219、YARN服务组件包括NameManagerApplicationMasterContainerResourceManager答案BCD

220、多选.下列关于HDFS对文件分块存储的作用描述正确的是A、有利于负载均衡B、便于并行处理C、最小化寻址开销D、支持大规模文件存储答案ABCD

221、下面的命令描述正确的是A、创建一个名称为test组的命令groupaddtestB、改用户Tom设置密码命令passwdTomC^删除用户名为Tom的命令userdelTomD、切换当前用户帐户为admin的命令suadmin答案ABC

222.MapReduce不合适对哪些场景的使用A、MapReduce不适合做低延迟数据访问场景的使用B、MapReduce不适合存储大量小文件C、MapReduce不支持多用户写入及任意修改文件D、MapReduce不支持大文件存储答案ABC

223、大数据平台安装部署步骤包括A、服务器上架B、服务器操作系统安装C、网络环境分配D、Hadoop平台安装答案ABCD

224、多选.下列关于压缩在MapReduce中的使用描述正确的是A、可以对Map任务输出进行压缩B、可以对整个作业的输出进行压缩C、可以对输入文件进行压缩D、如果输入文件是压缩的，MapReduce会在读取文件时自动解压缩答案ABCD

225、Linux的特点是以下方面A、开放源代码的程序软件，可自由修改B、与Unix系统不兼容，具备几乎所有Unix的优秀特性C、可自由传播，免费使用，无任何商业化版权制约D、适合Intel等x86CPU系列架构的计算机答案ACD

226、YARN架构的几个组成部分有哪些？ContainerResourceManagerNodeManagerApplicationMaster答案ABCD

227、下列哪个是Hadoop运行的模式A、单机版B、伪分布式C、分布式答案ABC

228.master启动Hadoop相关进程包含A、jpsNameNodeSecondaryNameNodeResourceManager答案BCD

229、Hive作为大数据分析的重要组件，常用在对数据进行分析HDFSMysqlHbaseDsHadoop答案ABC

230、主流虚拟化软件包括A、VMware系列虚拟化软件B、KVM二次开发虚拟化软件C、微软Hyper-V虚拟化软件D、Ctrix虚拟化软件答案ABCD

231、下面哪些是大数据的基本特征？A、数据体量大B、数据类型多C、处理速度快D、价值密度低答案ABCD

232、多选.下列关于Mapper的描述正确的是A、一个MapReduce程序只能设置一个Mapper类B、一个MapReduce程序可以设置多个Mapper类C、Mapper任务的个数取决于分片的个数D、Mapper输出的键值类型与Reducer输入的键值类型要保持一致答案BCD

233、ZooKeeper角色选举角色包括A、领导者leaderB、观察者observerC^客户端clientD、跟随者follower答案ABCD

234、以下哪些是Linux的特点A、开放源代码的程序软件，可自由修改B、与Unix系统兼容，具备儿乎所有Unix的优秀特性C、可自由传播，收费使用，无任何商业化版权制约D、适合Intel等x86CPU系列架构的计算机答案ABD

235、Hadoop核心主要由部分组成A、HDFSB、DFSC^MapReduceD、RDD答案AC

236、以下哪些是Linux操作系统组成部分（）A、Linux内核B、GNU软件及系统软件C、必要的应用程序D、CPU答案ABC

237、Hbase组件部分包括（）hbase-clientZookeeperC^HMasterD、HRegionServer答案ABCD

238、Linux版本分为以下哪几类（）A、发行版B、测试版C、内核版D、开发版答案AC

239、Hadoop大数据有哪两大核心技术？（）A、分布式存储B、数据采集C、可视化D、分布式处理答案AD

240、以下哪些是yarn-sitexml配置文件主要参数（）A、yarnresourcemanageraddressB、yarnresourcemanagerscheduleraddressC、yarnresourcemanageradminaddressD、yarnnodemanager.oux-services答案ABC

241、（多选.HDFS只设置一个名称节点带来的局限性包括（）A、隔离问题B、命名空间的限制C、性能的瓶颈D、集群的可用性答案ABCD

242、以下哪些组件属于Hadoop生态圈MySQLHiveHDFSSqoop答案BCD

243.Hadoop的运行模式分为以下种A、单机模式B、伪分布模式C、全分布模式D、主备模式答案ABC

244、对NodeManager服务描述正确的是A、整个集群有多个NodeManagerNodeManager负责单节点资源管理和使用B、NodeManager管理当前节点的Container资源抽象C、通过心跳机制定时地向ResourceManager汇报本节点上的资源使用情况D、NodeManager服务器跟ResourceManager毫无关系答案ABC

245、Hive有哪些方式保存元数据singleusermodemultiusermoderemoteusermodetelnetusermode答案ABC

246、以下哪条命令能退出mysql状态A^quitexitCtrl+cDsCtrl+z答案AB

247、Hadoop的优点有哪些A、扩容能力强B、成本低C、高效率D、高可靠性答案ABCD

248、Hadoop优点是以下（）种A、扩容能力强B、成本低C、高效率D、高可靠性答案ABCD249^Hadoop平台的主要配置文件是（）A、core-sitexmlB、hdfs-site.xmlC、mapred-site.xmlD、slavesxml答案ABC

250、大数据业务处理系统包含（）A、数据源层B、数据处理层C、数据应用层D、数据访问层答案ABCD答案c

21、通过浏览器界面监控Hive的状态，以下是查看的端口（）http://master:8088B、http://

192.

168.

1.6:50070http://master:16010http://master:9999答案D

22、使用java-api访问hdfs时，数据块副本数由下面那个决定（）clientdatanodenamenodesecondarynode答案A

23、采用用户userl安装hadoop伪分布式时，解压hadoop安装包采用下面命令Sudotar-zxvfhadoop-

3.tar.gz-C~运行Is-al命令显示Drwxr-xr-x11rootroot4096Aug301:06hadoop-

7.3如果要修改hadoop-

7.3目录的权限，采用下面哪个命令才有效而且最佳？（）A、chownuserl:userlhadoop-

7.3B、chown-Ruserl:userlhadoop-

7.3C、sudochmod-R777hadoop-

7.3D、sudochown-Ruserl:userlhadoop-

7.3答案D

24、关于ZooKeeper临时节点的说法正确的是？（）A、创建临时节点的命令为create-s/tmpmyvalueB、一旦会话结束，临时节点将被自动删除C、临时节点不能手动删除D、临时节点允许有子节点答案B

25、显示当前所在目录的命令是（）A^pwdB、IsC、cdD^mkdir答案A

26、在项目实施人员中，适时与客户沟通，确立项目目标，建立组织机构编制计划，负责项目全面管理的角色是oA、实施工程师B、项目经理C、产品经理D、财务人员答案B

27、关于Sqoop数据的导入导出描述不正确的是？A、实现从MySQL到Hive的导入导出B、实现从MySQL到Oracle的导入导出C、实现从HDFS到Oracle的导入导出D、实现从HDFS到MySQL的导入导出答案B

28、在确认客户需求，进行确认需求调研的时候，以下说法正确的是oA、按计划有步骤的确定客户需求调研B、先了解细节需求，再了解宏观需求C、将客户的想法记录下来，就能解决客户的实际问题D、确定客户需求调研的过程中，不可避免的会出现客户提出一些现有条件下根本无法实现或者即使实现也非常困难的要求，我们要无条件去满足客户的需求答案A

29、Sqoop的底层实现是HDFSMapReduceHBaseHadoop答案B

30、关于MapReduce1和YARN的对比错误的是？A、MapReduce1由JobTracker负责作业调度与任务监控B、YARN的作业调度和任务监控都是由RcsourceManagcr组件完成C、MapReducel的任务节点叫做TaskTracker而Yarn的任务节点为NodeManagerD^MapReducel的资源调配单元为Slot而Yarn的资源调配单元为Container答案B

31、列出mysql数据库中的所有数据库sqoop命令是？A、sqooplist-databases-connectB、sqooplist-tables-connectC、sqoopcreate-hive-tab1e-connectD、sqoopimport-connect答案A

32、Centos中修改文件或目录的访问权限命令chownpasswdC^chmodD、clear答案C

33、YARNWeb界面默认占用哪个端口500708088500909000答案B

34、在文件属性中，文件的权限用第列字符表示1-52-10C、3-9D、1-8答案B35＞下列是关于flume和sqoop对比的描述，不正确的是A、flume主要用来采集口志而sqoop主要用来做数据迁移B、flume主要采集流式数据而sqoop主要用来迁移规范化数据C、flume和sqoop都是分布式处理任务D、flume主要用于采集多数据源小数据而sqoop用来迁移单数据源数据答案C

36、下列命令中在zookeeper安装文件夹的bin目录下执行，哪项是停止ZooKeeper的正确命令A、start-all.shstart-stop.shC^zkServer.shstopD、zkServer.shstart答案C

37、2003年，Google公司发表了主要讲解海量数据的可靠存储方法的论文是？“TheGoogleFileSystem”B、MapReduce:SimplifiedDataProcessingonLargeClustersw“Bigtable:ADistributedStorageSystemforStructuredData”“TheHadoopFileSystem”答案A

38、Zookeeper生产环境一般采用多少台机器组成集群？DA、1B、3C、5D、奇数台且大于1E、偶数台且大于1答案D

39、用于检查节点自身的健康状态的进程是ResourceManagerNodeManagerNameNodeDataNode答案B

40、在HBase的组件中，哪一个负责口志记录AsHRegionHFileMemStoreD、WAL答案D

41、ZooKeeper是一个典型的分布式数据一致性解决方案，下列哪项是不属于它实现的功能OA、分布式锁B、数据发布/订阅C、响应用户I/O请求D、负载均衡答案C

42、HDFS默认BlockSize的大小是32MB64MB128MB256M答案C

43、查看HDFS的报告命令是bin/hdfsdfsadmin-reportbin/hdfs-reportC^bin/hdfsdeadmin-reportD、bin/hdfsdfs-report答案A

44、在Hadoop配置文件中，以下属于core-sitexml文件主要内容的是A、用于定义系统级别的参数如HDFSURL、Hadoop的临时目录等B、名称节点和数据节点的存放位置、文件副本的个数、文件读取权限等C、配置ResourceManagerNodeManager的通信端口，web监控端口等D、包括JobllistoryServer和应用程序参数两部分，如reduce任务的默认个数、任务所能够使用内存的默认上下限等答案A

45、下列哪些不是HBase的特点A、高可靠性B、高性能C、面向列D、紧密性答案D

46、安装Hadoop集群时，在哪个文件指定从机是哪些机器？A^datanodeB、slavesC^yarn-sitexmlD、core-sitexml答案B

47、关于Hadoop的运行机制过程顺序说法正确的是A、作业提交一作也初始化一任务分配一任务的执行一任务进度和状态的更新一任务结束。

更多此类文档

关于文档

个人认证

优秀文档

获得点赞 0

文件大小54.6 KB

文件格式docx

分享时间2023-04-11

更多此类文档

立即下载