还剩9页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
南开大学23春学期高起本1709-2103专升本/高起专1903-2103《大数据开发技术二》在线作业SparkGraphX中类Graph的mask方法可以选项A反转图中所有边的方向选项B按照设定条件取出子图选项C取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性选项D合并边相同的属性参考答案CDstream输出操作中print方法在Driver中打印出DStream中数据的元素选项A第一个选项B所有选项C前10个选项D前100个参考答案CGraph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用方法选项A GraphverticesedgesdefaultVertexAttr选项B Graph.fromEdgesRDD[Edge[ED]]defaultValue选项C Graph.fromEdgeTuplesrawEdges RDD[VertexldVertexld]defaultValue选项D GraphLoader.edgeListFilescfilename参考答案BMllib中metrics.recallByThreshold表示指标选项A准确度Scala函数组合器中foreach和map类似,有返回值选项A对选项B错参考答案BRDD的sortBy函数包含参数numPartitions该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.sizeo选项A对选项B错参考答案ASpark在同一个应用中不能同时使用SparkSQL和Mllib选项A对选项B错参考答案BScala可以通过“var”来定义变量,通过“val”关键字来定义常量选项A对选项B错参考答案ASpark是Apache基金会的顶级项目选项A对选项B错参考答案AScala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处理嵌套列表的函数,然后把返回结果连接起来选项A对选项B错参考答案AScala是ScalableLanguage的简写,是一门多范式的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性选项A对选项B错参考答案ASpark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗选项A对选项B错参考答案BRDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算选项A对选项B错参考答案B图(Graph)是一种复杂的非线性结构选项A对选项B错参考答案A键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD选项A对选项B错参考答案A选项B召回率选项C F值选项D ROC曲线参考答案BScala列表方法中获取列表的第一个元素的方法是选项A drop选项B head选项C filter选项D init参考答案B可以解决图计算问题选项A SparkCore选项B BlinkDB选项C GraphX选项D Mllib参考答案cMllib中metrics.precisionByThreshold表示指标选项A准确度选项B召回率选项C F值选项D ROC曲线参考答案Aspark-submit配置项中表示Driver程序使用的内存大小选项A--driver-memoryMEM选项B--executor-memoryMEM选项C--total-executor-coresNUM选项D一一executor-couresNUM参考答案ASparkStreming中函数可以对源DStream的每个元素通过函数func被映射出0或者更多的输出元素选项A map选项B flatMap选项C filter选项D union参考答案BDstream输出操作中方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存选项A print选项B saveAsTextFiles选项C saveAsObjectFiles选项D saveAsHadoopFiles参考答案DScala中方法返回一个列表,包含除了第一个元素之外的其他元素选项A head选项B init选项C tail选项D last参考答案CMllib中metrics.roc表示指标选项A准确度选项B召回率选项C F值选项D ROC曲线参考答案DScala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是选项A filter选项B foreach选项C map选项D mkString参考答案DScala列表方法中通过给定的方法将所有元素重新计算的方法是选项A filter选项B foreach选项C map选项D mkString参考答案CScala中哪个函数可以创建区间数组选项A concat选项B ofDim选项C fill选项D range参考答案D图的结构通常表示为GVE其中,V是图G中选项A顶点选项B顶点的集合选项C边选项D边的集合参考答案BPairRDD中函数可以合并具有相同键的值选项A mapValues选项B groupBy选项C groupByKey选项D reduceByKey参考答案AGraphX中方法可以查询边信息选项A numVertices选项B numEdges选项C vertices选项D edges参考答案D以下哪个函数可以对两个RDD进行合并选项A union选项B substract选项C intersection选项D cartesian参考答案A以下算法中属于聚类算法的是选项A KNN算法选项B逻辑回归选项C随机森林选项D Kmeans参考答案DDstream窗口操作中方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream选项A window选项B countByWindow选项C reduceByWindow选项D reduceByKeyAndWindow参考答案cGraphX中方法可以释放顶点缓存选项A cache选项B presist选项C unpersistVertices选项D edgesunpersist参考答案CSparkStreming中函数当被调用的两个DStream分别含有KV和KW键值对时,返回一个KSeq[V]Seq[W]类型的新的DStreamo选项A union选项B reduce选项C join选项D cogroup参考答案CScala列表方法中返回所有元素,除了最后一个的方法是选项A drop选项B head选项C filter选项D init参考答案DScala中重写一个非抽象方法必须使用修饰符选项A extends选项B override选项C extend选项D overrides参考答案BSparkSQL可以处理()选项A RDD选项B Parquet文件选项C JSON文件选项D Hive表参考答案ABCDSpark的RDD持久化操作有()方式选项A cache选项B presist选项C storage选项D long参考答案ABScala中使用()方法来连接两个集合选项A append选项B++选项C concat选项D Set.++()参考答案BDSparkDataFrame中()方法可以返回一个List选项A collect选项B take选项C takeAsList选项D collectAsList参考答案CDSpark是一个计算框架选项A快速选项B分布式选项C可扩展选项D容错参考答案ABCDScala中可以用方法来连接两个或多个列表选项A选项B#选项C List.选项D Listconcat参考答案BCDSpark可以从分布式文件系统中读取数据选项A HDFS选项B Hbase选项C Hive选项D Tachyon参考答案ABCD以下哪个是Scala的数据类型选项A Any选项B NULL选项C Nothing选项D AnyRef参考答案:ABCDSparkStreaming能够处理来自的数据选项A Kafka选项B Flume选项C Twitter选项D ZeroMQ参考答案:ABCD以下哪个方法可以实现SparkSQL对数据的查询选项A SqlContext选项B MySQLContext选项C HiveContext选项D context参考答案ACScala可以通过“val”来定义变量,通过“var”关键字来定义常量选项A对选项B错参考答案BRDD的map操作不会改变RDD的分区数目选项A对选项B错参考答案AScala中++i和i++表示变量i自增1选项A对选项B错参考答案BScala是ScalableLanguage的简写,是一门多范式的编程语言,设计初衷是不包括函数式编程的特性选项A对选项B错参考答案B。