还剩11页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
南开大学23春学期(高起本1709-2103专升本/高起专1903-2103)《大数据开发技术
(一)》在线作业关于Storm中Topology说法错误的是0选项A Topology可视为流转换图选项B Topology可以被提交到Storm集群执行选项C在Topology里面可以指定每个组件的并行度,Storm会在集群里面分配那么多的线程来同时计算选项D Topology里面的每一个组件都是串行运行的参考答案DLeaflet是哪种可视化工具()选项A信息图表选项B地图工具选项C时间线工具选项D分析工具参考答案BGoogleChartAPI是哪种可视化工具()选项A信息图表选项B地图工具选项C时间线工具选项D分析工具参考答案AWeka是哪种可视化工具()选项A信息图表选项B地图工具选项C时间线工具选项D分析工具参考答案D选项A Zookeeper服务器选项B客户端选项C Master服务器选项D Region服务器参考答案ABCDHadoop配置文件中说法错误的是()ocore-sitexml中hadoop.tmp.dir表示存放临时数据的目录,仅为NameNode的数据选项B core-sitexml中fs.defaultFS表示HDFS路径的逻辑名称选项C hdfs-site.xml中dfs.namenode.name.dir表示存储fsimage文件的地方选项D hdfs-site.xml中dfs.replication表示副本的数量,伪分布式要设置为0选项E hdfs-site.xml中dfs.datanode.datadir表示HDFS数据存放block的地方参考答案ACHDFS只允许一个文件有一个写入者,不允许多个用户对同一个文件执行写操作选项A对选项B错参考答案AStorm中Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作选项A对选项B错参考答案AHbase中每个Region使用一个Hlog选项A对选项B错参考答案BHbase和传统数据库一样都是列式数据库选项A对选项B错参考答案BMapReduce和Spark都属于大数据批处理计算的产品选项A对选项B错参考答案AYahoo!S4和TwitterStorm开发实时应用时既要关注处理逻辑,还要解决实时数据获取、传输、存储选项A对选项B错参考答案BHDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性选项A对选项B错参考答案Ahadoopdfs和hdfsdfs两条命令都只是用于HDFS文件系统选项A对选项B错参考答案A大数据开发的两大核心技术是Hadoop和MapReduce选项A对选项B错参考答案B阿里云RDS中一个实例可以创建多个数据库,在实例内数据库命名唯一,所有数据库都会共享该实例下的资源,如CPU、内存、磁盘容量等选项A对选项B错参考答案AHbase中Zookeeper文件记录了的位置选项A.META.表选项B-ROOT-表选项C Region选项D Master参考答案B优点是查找速度快,可扩展性强,容易进行分布式扩展,复杂性低的数据库是选项A列族数据库选项B键值数据库选项C图数据库选项D文档数据库参考答案ASQLAzure体系结构层中哪层相当于网关,相当于普通Web系统的逻辑层选项A ClientLayer选项B ServicesLayer选项C PlatformLayer选项D InfrastructureLayer参考答案BNoSQL中的CAP理论中的P代表选项A一致性选项B可用性选项C分区容忍性选项D可扩展性参考答案CUMP系统中面对分库分表用户如何进行资源调度选项A可以共享同一个MySQL实例选项B每个用户独占一个MySQL实例选项C会占用多个独立的MySQL实例选项D随机分配MySQL实例参考答案C信息技术发展史上的第三次信息化浪潮解决的问题是什么0选项A信息处理选项B信息增长选项C信息爆炸选项D信息传输参考答案Chadoopfs-()命令可以将指定的文件的内容输出到标准输出选项A cat选项B append选项C add选项D write参考答案AHadoop中执行MapReduce任务不含哪种方式()选项A Mahout选项B Hadoopjar选项C Shell脚本选项D Python参考答案A应用于涉及频繁读写、拥有简单数据模型的应用,内容缓存,比如会话的数据库是哪种()选项A列族数据库选项B键值数据库选项C图数据库选项D文档数据库参考答案BEcharts是哪种可视化工具选项A信息图表选项B地图工具选项C时间线工具选项D分析工具参考答案AMapReduce中最优的Reduce任务个数取决于集群中可用的的数目选项A Split选项B Slot选项C Map选项D Shuffle参考答案B优点是扩展性好,灵活性好,大量写操作时性能高的数据库是选项A列族数据库选项B键值数据库选项C图数据库选项D文档数据库参考答案BUMP系统借助于来实现高效和可靠的协同工作选项A Mnesia选项B LVS选项C RabbitMQ选项D Zookeeper参考答案D对于不同顶点之间的信息交换Pregel采用了选项A远程数据读取选项B共享内存选项C纯消息传递模型选项D共享消息参考答案CHbase中客户端包含访问HBase的接口,同时在缓存中维护着已经访问过的位置信息,用来加快后续数据访问过程选项A Master选项B Slaver选项C Region选项D客户端参考答案C流数据采取计算模式选项A批量选项B实时选项C大数据选项D动态参考答案B应用于存储、索引并管理面向文档的数据或者类似的半结构化数据比如,用于后台具有大量读写操作的网站的数据库是哪种选项A列族数据库选项B键值数据库选项C图数据库选项D文档数据库参考答案DAmazonRDS属于()选项A关系数据库选项B键值数据库选项C NoSQL数据库选项D数据仓库参考答案A优点是灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱的数据库是()选项A列族数据库选项B键值数据库选项C图数据库选项D文档数据库参考答案CHbase中采用()保证系统出错时及时恢复选项A MemStore选项B Hlog选项C StoreFile选项D客户端参考答案BGoogleCloudSQL是谷歌公司推出的基于()的云数据库选项A MySQL选项B SQLServer选项C Hbase选项D Oracle参考答案A针对流数据,“量子恒道”开发了海量数据实时流计算框架0选项A TimeTunnel选项B Spark选项C SuperMario选项D Storm参考答案CHDFS中当一些数据节点不可用时,会导致一些数据块的副本数量冗余因子选项A大于选项B小于选项C等于选项D大于等于参考答案BNoSQL中的CAP理论中的A代表0选项A一致性选项B可用性选项C分区容忍性选项D可扩展性参考答案BPregel计算模型以作为输入选项A有向图选项B无向图选项C矢量图选项D树参考答案AHBase的目标是处理非常庞大的表,可以通过方式,利用廉价计算机集群处理由超过10亿行数据和数百万列元素组成的数据表选项A垂直扩展选项B水平扩展选项C拓扑扩展选项D叠加参考答案B以下哪些是云计算关键技术选项A虚拟化选项B分布式计算选项C分布式存储选项D物联网选项E单租户参考答案:ABC以下哪种数据库适合于小批量的数据处理0选项A MySQL选项B Oracle选项C Hbase选项D NosSQL参考答案ABHDFS要实现的目标选项A流数据读写选项B大数据集的操作选项C复杂的文件模型选项D强大的跨平台兼容性参考答案:ABD以下哪个是HDFS的局限性选项A延迟高选项B只允许对文件执行追加操作,不能执行随机写操作选项C用MapReduce处理大量小文件时,会产生过多的Map任务线程管理开销会大大增加选项D拥有复杂的数据模型参考答案:ABCHbase中Zookeeper提供了选项A分布式同步选项B组服务选项C域名服务选项D配置维护参考答案ABCD以下属于Hadoop的安装方式的有选项A单机模式选项B多机模式选项C分布式模式选项D并行模式选项E伪分布式模式参考答案ACE关系数据库与NoSQL数据库相比有哪些优势选项A支持事务ACID四性选项B可以支持超大规模数据存储选项C以完善的关系代数理论作为基础选项D具有强大的横向扩展能力参考答案AC以下亚马逊的产品中哪个属于计算部分选项A EC2选项B EBS选项C S3选项D ELB参考答案ADHbase系统结构中包括。