还剩17页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据模拟考试题HCIA
1、HBase中数据存储的文件格式是什么?A、HFileB、HLogC、TextFileD SequenceFile答案A
2、创建loader作业中,可以在以下哪个步骤中设置过滤器类型?A、基本信息B、转换C、输出D、输入设置答案D
3、FusionlnsightHD中HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个RegionA、3B、4C、5D、6答案c
4、Hadoop平台中HBase的Region是由哪个服务进程来管理?A、HMasterB、DataNodeC、RegionServerD、ZooKeeper答案c
5、为了保证流应用的快照存储的可靠性,快照主要存储在?A、HDFS中B、可靠性高的单机数据库中C、jobManager的内存中D、本地文件系统中答案A
6、下列选项中无法通过大数据技术实现的是?、运营分析AB、商业模式发现D备NameNode应与主NameNode部署到一个节点答案AC49FusionlnsightHD系统中使用Streaming客户端Shell命令查看拓扑或提交拓扑失败,以下哪些定位手段是正确的?A、查看客户端异常堆栈,判断是否客户端使用问题B、查看主Nimbus的运行日志,判断是否Nimbus服务端异常C、查看Supervisor运行日志,判断是否Supervisor异常D、查看Worker运行日志答案AB
50、“Hive中的这条命令”“SELECTa.salary,b.addressFROMemployeeaJOINSELECTaddressFROMemployee_infowhereprovince=,zhejiang,bONa.name=b.name;“是一个什么类型的操作?”A、JOIN查询B、创建表C、导入数据D、子查询答案AD
51、在华为大数据解决方案中,hadoop底层包含以下那些组件?A、minerB、hiveC、sparkD、fink答案BCD
52、Flink可以基于以下哪些窗口进行统计?A、时间窗口B、滑动窗口C、会话窗口E、countWindow答案ABCD
53、下列关于Flink中TransFormation的说法正确的是?A、filter操作是对每个元素执行boolean函数B、keyBy是将源头数据按照key进行分组,以保证同一个key的源数据分到同样的组中C、可以通过windows设定时间窗口D、flatMap可以对文本进行切分答案:ABCD
54、Zookeeper可以为FusionlnsightHD中哪些组件提供分布式管理支持A、HBase
8、LoaderC HiveDSpark答案ABCD
55、关于Flume,下列说话错误的是?多选A、Source到Channel到Sink等进程内部有加密的必要B、Flume级联节点之间的数据传输支持加密C、Flume支持多级级联和多路复制D、Flume级联节点之间的数据传输不支持压缩答案AD
56、Flink支持的时间操作类型包括以下哪些选项?A、结束时间B、处理时间C、采集时间D、事件时间答案BD
57、Spark有哪些特点?A、快B、轻C、巧D、灵答案ABCD
58、根据数据流如何在两个Transformation之间传输数据,数据流可以分为哪些类型?A、一对一流B、distributing流C、一对多流D、redistributing流答案AC
59、以下关于Ka珠aLogs中segmentfile的说法正确的有?A、通过索引信息可以快速定位messageB、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储C、使index元数据全部映射到memory,可以避免segmentfile的index数据10磁盘操作D、索引文件稀疏存储,可以大幅度降低index文件元数据占用空间大小答案ABCD
60、Zookeeper中的数据节点znode分为哪几种类型?A、temporaryB、persistentC、ephemeralD semi-persistent答案BC61FusionlnsightHD集群中包含多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?A、HDFSB、NameNodeC、DataNodeD、HBase答案BC
62、MapReduce过程中,以下属于shuffle机制的是?A、combineB、copyC、partitionD、sort/merge答案BD
63、传统数据处理的性能瓶颈有?A、流式数据处理性能不足B、批量数据处理缺失C、扩展能力有限D、数据存储成本高答案ABCD
64、以下关于Hadoop分布式文件系统HDFS联邦描述正确的有?、一个Namespace使用一个blockpool管理数据块AB、一个Namespace可使用多个blockpool管理数据块C、每个blockpool的磁盘空间是物理共享的,逻辑空间是隔离的D、支持NameNode/Namespace水平扩展答案ACD
65、YARN容量调度器的主要特点有哪些?、容量保证AB、灵活比C、多重租赁D、动态更新配置文件答案ABCD
66、下面哪些关键词是Kafka的特点A、消息持久化B、分布式C、支持消息随机读取D、高吞吐答案ABD
67、StructuredStreaming在OutPut阶段可以定义不同的数据写入方式,包括下列哪些方式?A、CompleteModeB、UpdateModeC、AppendModeD、GeneralMode答案ABC
68、HDFS的基本系统构架中包含下列哪些节点?A、ResourceManagerB、NameNodeC、NodeManagerDs DataNode答案BD
69、FusionlnsightHD系统中使用Streaming客户端Shell命令提交了拓扑之后,使用StormUI查看发现该拓扑长时间没有处理数据,可能原因有?A、拓扑结构过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间B、Supervisor的slots资源被耗尽,拓扑提交上去后分不到slot去启动Worker进程C、拓扑业务存在逻辑错误,提交之后无法正常运行D、当数据量较大时,拓扑处理速度较慢答案ABC
70、Nimbus在Streaming架构中的功能包括?A、任务调度B、启动/关闭工作进程C、监控任务执行状态D、资源分配答案AD
71、FusionlnsightHD平台中,HBase暂不支持二级索引A、正确B、错误答案B
72、Hive不支持超时重试机制、正确AB、错误答案B
73、Spark任务的一个Executor同时可以运行多个taskA、正确B、错误答案A
74、大数据需要传统行业思维方式的转变,要把数据收集、分析作为业务流程的重要组成部分,数据驱动业务流程优化,实现智能化和自动化,并依托数据资产实现跨界拓展A、正确B、错误答案A
75、二级索引为hbase提供了按照某些列的值进行索引的能力,二级索引先查索引表,再定位到数据表中的位置,不用全表扫描A、正确B、错误答案A
76、FusionlnsightHD的Loader中,一个连接器只可以分配给一个作业使用A、正确B、错误答案A
77、华为在金融、公安、铁路、政务等多行业拥有丰富的大数据解决方案经验A、正确B、错误答案A78Zookeeper所有节点都可以处理请求A、正确B、错误答案A
79、kafkaProducer读数据总体流程是,Producer连接任意存活的Broker,请求指定topic、partition的leader元数据信息,然后直接与对应的Broker直接连接,发布数据A、正确B、错误答案A
80、Hive中的“Groupby”指的是通过一定规则将一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理、正确AB、错误答案A
81、HDFS的Client写入文件时,数据的第一副本写入位置是由NameNode确定,其他副本的写入位置由DataNode确定A、正确B、错误答案A82FusioninsightHD产品中,一个典型的kafka集群包含若干个producer若干个Consummer和一个zookeeper集群?A、正确B、错误答案B83kafka是一个高吞吐、分布式、基于发布订阅的消息系统,利用kafka技术可在廉价PCServer上搭建起大规模消息系统A、正确B、错误答案A
84、Fusioninsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点数小于200的集群场景A、正确B、错误答案A
85、对高价值高聚合的信息和知识的批式处理是大数据行业主要商业诉求A、正确B、错误答案A
86、FusionlnisghtHD集群安装成功后,不允许修改服务、角色和实例的配置A、正确B、错误答案B
87、SparkSOL表中,经常会存在很多小文件(大小远小于DFS块大小),在这种情况下,Spark会启动更多的Task来处理这些小文件,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,从而严重影响性能()、正确AB、错误答案A
88、Spark是基于内存的计算,所有Spark程序运行过程中的数据只能存储在内存中A、正确B、错误答案B
89、Kafka作为一个分布式消息系统,支持在线和离线消息处理,并提供TJAVAAPI以便其他组件对接使用在Funsionlnsight解决方案中,Kafka属于FusionlnsightHD模块、正确AB、错误答案A90Hive中“Groupby”指的是通过一定的规则将每一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理A、正确B、错误答案A
91、Hadoop系统中,如果IIDFS文件系统的备份因子是3,那么MapReduce每次运行Task都要从3个有副本的机器上传输需要处理的文件段A、正确B、错误答案B
92、topology在任务完成后会自动结束运行A、正确B、错误答案B
93、YARN上有两个同级队列Q1与Q2,容量都是50%,Q1上已经有10个任务共占用了40的容量,Q2上有两个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1A、正确B、错误答案B
94、HBase中M0B数据直接HFile的格式存储在HDFS上,然后把这个文件的地址信息及大小信息作为value存储在管理HBase的store上,通过工具集中管理这些文件这样就可以大大降低HBase的compation和split频率,提升性能A、正确B、错误答案A
95、Kerberos只能对集群内的服务提供安全认证A、正确B、错误答案B
96、KafkaConsumer写数据总体流程是,Consumer连接指定TopicPartition所在的LeaderBroker,用主动获取的方式从Kafka中获取消息?A、正确B、错误答案A
97、kafkaConsumer写数据总体流程是,Consumer连接指定TopicPartition所在的LeaderBroker,用于主动获取方式从kafka中获取消息A、正确B、错误答案A
98、对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求A、正确B、错误答案A
99、Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中、正确AB、错误答案A
100、HBase的数据文件HFile中一个KeyValue格式包含Key,Value,TimeStamp,KeyType等内容A、正确B、错误答案AC、商品推荐D、信用评估答案B
7、FusionlnsightHD系统中,下面哪个方法不能查看到Loader作业执行的结果?、通过Yarn任务管理查看AB、通过LoaderUI界面查看C、通过Manager的告警查看D、通过NodeManager查看答案D
8、Hadoop中MapReduce组件擅长处理哪种场景的计算任务?A、迭代计算B、离线计算C、实时交互计算D、流式计算答案B
9、FusionlnsightHD系统中HBase元数据Metaregion路由信息保存在哪A、Root表B、ZooKeeperC、HMasterD Meta表答案B
10、Flume支持监控并传输目录下新增的文件,可实现数据传输,以上描述的是哪一类sourceA、spoolingdirectorysourceB、httpsourceC、execsourceD syslogsource答案A
11、Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?A、containerB、applicationattemptC、jarD application答案D
12、FusionlnsightHD系统中如果修改了服务的配置项,不进行服务重启,该服务的配置状态是什么状态?A、SYNCHRONIZEDB、EXPIREDC、CONFIGURINGD、UNKNOWN答案B
13、哪一项不属于FusionlnsightHD中Hive的流控特性的描述?A、支持对已经建立的总连接数做阈值控制B、支持对每个用户已经建立的连接数做阈值控制C、支持对某个特定用户已经建立的连接数做阈值控制D、支持对单位时间内所建立的连接数做阈值控制答案C
14、以下关于Kafka的描述错误的有?A、具有消息持久化,高吞吐,实时等特性B、用作活动流和运营数据处理管道的基础C、由Apachelladoop开发,并于2011年开源D、使用Scala,Java语言实现答案C
15、有关普通表和外部表的描述,下面哪句是错误的?A、删除普通表时会删除数据和元数据;B、外部表实际上是将HDFS中已有路径的文件与表联系起来;C、删除外部表时只删除数据,不删除元数据;D、缺省创建时为普通表;答案C
16、Hive是基于Hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据以下关于Hive特性的描述不正确的是?、可直接访问HDFS文件以及HBaseAB、灵活方便的ETL extract/transform/loadC>仅支持MapReduce计算引擎D、易用易编程答案C
17、关于RDD,下列说法错误的是A、RDD只是一个只读的,可分区的分布式数据集B、RDD是Spark对基础数据的抽象C、RDD具有血统机制LineageD、RDD默认存储在磁盘答案D
18、HBase的Region是有那个服务进程来管理的?A、HRegionServerB、HMasterC、DataNodeD ZooKeeper答案A
19、Hadoop平台中启用Yam组件的日志聚集功能,需要配置哪个参数?A、yarn,nodemanager,local-dirsB、yarn,nodemanager,log-dirsC、yarn.acl.enableD yarn,log-aggregation-enable答案D
20、下列关于Flinkbarrier描述错误的是?、barrier是Flink快照的核心AB、barrier周期性插入到数据流中,并作为数据流的一部分随之流动C、在插入barrier的时候,会暂时阻断数据流D、一个barrier将本周起快照的数据与下一个周期快照的数据分隔开来答案C
21、通过FusioninsightManager不能完成以下哪个操作?、安装部署AB、性能监控C、权限管理D、虚拟机分配答案D
22、以下关于Zookeeper的Leader节点在收到数据变更请求后的读写流程说法正确的是?A、同时写入磁盘和内存B、仅写入内存C、先写内存再写磁盘D、先写磁盘再写内存答案D
23、在规划FusionlsightHD集群时,如果客户用于功能测试,对性能没有要求,节约成本的情况下可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、6D、8答案B
24、Kafka集群中,Kafka服务端的角色是?A、BrokerB、ProducerC、ConsumerD ZooKeeper答案A
25、Flink中的接口用于流数据处理,接口用于批处理A、StreamAPL BatchAPIB、DataStreamAPI,DataSetAPIC、DataBatchAPI,DataStreamAPID BatchAPI,StreamAPI答案B
26、查看Kafka某Topic的Partition详细信息时,使用如下哪个命令?A、bin/kafka-topics.sh--describeB、bin/kafka-topics.sh-deleteC、bin/kafka-topics.sh--listD bin/kafka-topics.sh-create答案A
27、在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能Fusioninsight中,针对小文件的场景通常采用算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?A、groupbyB、coalesceC、connectD join答案D
28、华为FusionlnsightHD是国内首家符合国家金融等级保护的大数据平台,其安全性现在以下哪些方面?、系统安全AB、权限认证C、数据安全D、以上全都正确答案D
29、FusioninsightManager用户权限管理不支持哪个配置?、给用户配置角色AB、给角色配置权限C、给用户组配置角色D、给用户组配置权限答案D
30、FusionlnsightHD系统中HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪?A、ZooKeeperB、IIDFSC、MasterD、meta表答案D
31、FusionlnsightHD系统中,以下选项哪一个不是HBase写数据流程涉及的角色或服务?A、ZooKeeperB、HDFSC、HMasterD、RegionServer答案C
32、FusionlnsightHD的HBase中保存一张用户信息表meg_table,Rowkey为用户id,其中一列为用户昵称,现在按先后顺序往这列写入三个KeyValue:001:Li,001:Mary,001:Lily,请问scan meg_table,,VERSI0N=2会返回哪几条数据?A、001:LilyB、001:LiC、001:Mary,001:LilyD、001:Li,001:Mary,001:Lily答案A
33、安装FusionlnsightHD的Streaming组件时,Nimbus角色要求安装几个节点?A、1B、2C、3D、4答案B
34、关于Hive建表的基本操作,描述正确的是?、创建外部表的时需要指定external关键字AB、一旦表创建好,不可再修改表名C、一旦表创建好,不可再修改列名D、一旦表创建好,不可再增加新列答案A
35、部署FusionlnsightHD时,同一集群内的FlumeServer节点建议至少部署几个?A、1B、2C、3D、4答案B
36、FusionlnsightHD的Manager界面对Loader的操作不包括下列哪个?A、启动Loader实例B、查看Loader服务状态C、配置Loader参数D、查看Loader运行日志答案D37>在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务?、申请和领取资源AB、启动Map或Reduce任务C、为任务设置好运行环境D、分配Container答案A
38、FusionlnsightHD系统中HDFS默认BlockSize是多少A、32MBB、64MBC、128MBD、256MB答案c
39、可以通过以下哪个命令创建节点数据?A、Ls/nodeB、get/nodeC、set/nodedataD Create/node答案D
40、HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个RegionA、3B、4C、5D、6答案c
41、以下关于Fusioninsight多租户管理的描述正确的有?A、基于容器机制的租户资源隔离,为租户SLA保驾护航B、与企业组织结构相匹配的多级的租户模型,不同部门对应不同的租户,按需动态增删租户C、可视化的多级租户管理,与企业组织结构相匹配,简化系统资源分配与管理D、一站式管理租户资源,计算资源CPU/内存/I0,存储资源HDFS,服务资源HBase..・答案ABCD
42、Loader可以实现以下哪些转换规则?多选A、拼接转换B、空值转换C、增量转换D、长整形时间转换答案ABD
43、以下哪些是Spark服务的常驻进程?A、JDBCServerB、NodeManaaerC、SparkResourceD JobHistory答案AD
44、StructuredStreamming在OutPut阶段可以定义不同的数据写入方式,包括下列哪些方式?A、CompleteModeB、UpdateModeC、GeneralModeD、AppendMode答案ABD
45、以下关于Zookeeper的leader选举说法正确的是A、当实例数n为奇数时,假定n=2x+l,则成为leader节点需要x票B、当实例数为8时,则成为leader节点需要5票,容灾能力为4C、Zookeeper选举leader时,需要半数以上的票数D、当实例数n为奇数时,假定n=2x+l,则成为leader节点需要x+1票答案CD
46、FusionlnsightHD支持哪些日志下载方式?多选A、下载已安装的所有组件的日志B、下载单个组件某个模块的日志C、下载指定主机的日志D、下载指定时间段的日志答案ABCD
47、YARN容量调度器的主要特点有哪些A、灵活性B、多重租赁C、动态更新配置文件D、容量保证答案ABCD
48、以下选项中,对华为FusionlnsightHD系统中备用NameNode的作用描述准确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode启动时间。