书签分享收藏举报版权申诉 / 12

立即下载加入VIP,免费下载

当前位置：首页 > IT计算机 > 计算机软件及应用 > 奥鹏远程南开大学本部20春学期《大数据开发技术二》在线作业参考答案Word文档下载推荐.docx

奥鹏远程南开大学本部20春学期《大数据开发技术二》在线作业参考答案Word文档下载推荐.docx

文档编号：14071613
上传时间：2022-10-18
格式：DOCX
页数：12
大小：17.37KB

《奥鹏远程南开大学本部20春学期《大数据开发技术二》在线作业参考答案Word文档下载推荐.docx》由会员分享，可在线阅读，更多相关《奥鹏远程南开大学本部20春学期《大数据开发技术二》在线作业参考答案Word文档下载推荐.docx（12页珍藏版）》请在冰豆网上搜索。

奥鹏远程南开大学本部20春学期《大数据开发技术二》在线作业参考答案Word文档下载推荐.docx

3.Scala元组的值是通过将单个的值包含在（）中构成的

A小括号

B中括号

C大括号

D尖括号

4.当需要将一个普通的RDD转化为一个PairRDD时可以使用（）函数来进行操作

Atransfer

Bchange

Cmap

Dbuild

C

5.以下哪个函数可以求两个RDD交集（）

Aunion

Bsubstract

Cintersection

Dcartesian

6.以下哪个函数可以求两个RDD差集（）

B

7.spark-submit配置项中（）表示executor使用的总核数

A--num-executorsNUM

B--executor-memoryMEM

C--total-executor-coresNUM

D--executor-couresNUM

8.GraphX中（）方法可以释放顶点缓存

Acache

Bpresist

CunpersistVertices

Dedges.unpersist

9.以下哪个方法可以从外部存储中创建RDD（）

Aparallelize

BmakeRDD

CtextFile

DloadFile

10.Scala可以使用（）关键字实现单例模式

Aobject

Bstatic

Cprivate

Dpublic

11.以下哪个不是Scala的数据类型（）

AInt

BShortInt

CLong

DAny

12.Mllib中metrics.precisionByThreshold表示（）指标

A准确度

B召回率

CF值

DROC曲线

13.图的结构通常表示为：

G（V,E），其中，E是图G中（）

A顶点

B顶点的集合

C边

D边的集合

14.请问RDD的（）操作用于将相同键的数据聚合

Ajoin

Bzip

CcombineByKey

Dcollect

15.Mllib中metrics.recallByThreshold

表示（）指标

16.GraphX中EdgeRDD继承自（）

AEdgeRDD

BRDD[Edge]

CVertexRDD[VD]

DRDD[（VertexId，VD）]

17.Dstream输出操作中（）方法将DStream中的内容以文本的形式保存为文本文件

Aprint

BsaveAsTextFiles

CsaveAsObjectFiles

DsaveAsHadoopFiles

18.GraphX中（）方法可以查询顶点信息

AnumVertices

BnumEdges

Cvertices

Dedges

19.Scala通过（）来定义变量

Aval

Bval

Cdefine

Ddef

20.Mllib中线性会馆算法中的参数reParam表示（）

A要运行的迭代次数

B梯度下降的步长

C是否给数据加干扰特征或者偏差特征

DLasso和ridge的正规化参数

21.Scala中（）方法返回Map所有的value

Akey

Bkeys

Cvalue

Dvalues

D

22.Scala列表方法中返回所有元素，除了最后一个的方法是（）

Adrop

Bhead

Cfilter

Dinit

23.SparkStreming中（）函数可以使用func将源DStream中的每个元素进行聚合操作，返回一个内部所包含的RDD只有一个元素的新DStream

Breduce

Cjoin

Dcogroup

24.PairRDD可以通过（）获得仅包含键的RDD

25.Scala中（）方法返回Map所有的key

26.以下哪个是Scala的数据类型（）

AAny

BNULL

CNothing

DAnyRef

A.B.C.D

27.以下算法中属于分类算法的是（）

AKNN算法

B逻辑回归

C随机森林

DKmeans

28.Spark的RDD持久化操作有（）方式

Cstorage

Dlong

29.SparkStreaming的特点有（）

A单极性

B可伸缩

C高吞吐量

D容错能力强

B.C.D

30.SparkStreaming能够和（）无缝集成

AHadoop

BSparkSQL

CMllib

DGraphX

31.Scala系统支持（）作为对象成员

A通用类

B内部类

C抽象类

D复合类

32.Scala中可以用（）方法来连接两个或多个列表

A:

:

B#:

CList.:

（）

DList.concat（）

33.SparkDataFrame中（）方法可以返回一个List

Acollect

Btake

CtakeAsList

DcollectAsList

34.SparkDataFrame中（）方法可以返回一个Array对象

35.Spark可以通过哪些外部存储创建RDD（）

A文本文件

B目录

C压缩文件

D通配符匹配的文件

36.Spark只有键值对类型的RDD才能设置分区方式

T对

F错

37.Scala中列表是可变的

38.RDD的转换操作是用于触发转换操作的操作，这个时候才会真正开始进行计算。

39.Spark取代Hadoop仅仅是取代MapReduce这种计算框架，Spark可以取代HDFS吗

40.Spark在同一个应用中不能同时使用SparkSQL和Mllib

41.val如同Java里面的非final变量，可以在它的声明周期中被多次赋值。

42.Scala配备了一种表现型的系统，它以静态的方式进行抽象，以安全和连贯的方式进行使用。

43.RDD的mapPartitions操作会导致Partitions数量的变化

44.RDD的flatMap操作是将函数应用于RDD之中的每一个元素，将返回的迭代器（数组、列表等）中的所有元素构成新的RDD。

45.RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除

46.MLlib中StandardScaler处理的对象是每一列，也就是每一维特征，将特征标准化为单位标准差或是0均值，或是0均值单位标准差。

47.RDD的filter函数返回一个存储符合过滤条件的所有元素的新RDD

48.用户可以在ApacheMesos上运行Spark

49.RDD中join操作根据键对两个RDD进行内连接，将两个RDD中键相同的数据的值相加。

50.PairRDD中groupByKey是对具有相同键的值进行分组

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 大数据开发技术二远程南开大学本部 20 学期数据开发技术在线作业参考答案

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：奥鹏远程南开大学本部20春学期《大数据开发技术二》在线作业参考答案Word文档下载推荐.docx
链接地址：https://www.bdocx.com/doc/14071613.html

奥鹏远程南开大学本部20春学期《大数据开发技术二》在线作业参考答案Word文档下载推荐.docx

热门标签