书签分享收藏举报版权申诉 / 11

立即下载加入VIP,免费下载

当前位置：首页 > 幼儿教育 > 少儿英语 > 20秋学期1909《并行程序设计》在线作业 3Word格式文档下载.docx

20秋学期1909《并行程序设计》在线作业 3Word格式文档下载.docx

文档编号：13333856
上传时间：2022-10-09
格式：DOCX
页数：11
大小：17.82KB

《20秋学期1909《并行程序设计》在线作业 3Word格式文档下载.docx》由会员分享，可在线阅读，更多相关《20秋学期1909《并行程序设计》在线作业 3Word格式文档下载.docx（11页珍藏版）》请在冰豆网上搜索。

20秋学期1909《并行程序设计》在线作业 3Word格式文档下载.docx

A1A2B3B4

B1B2A3A4

A1B2A3B4

B1A2B3A4

以下哪条不是推动并行计算发展的因素?

存储是系统瓶颈

单CPU发展已能满足应用需求

利用标准硬件构造并行机令升级容易

编程环境标准化逐步发展

B

在使用互斥量之前必须对其进行____。

初始化

加锁

解锁

销毁

A

全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。

特殊硬件

通用硬件

非公开硬件

廉价硬件

有大量分支指令的程序不适合下面哪种体系结构上进行并行化?

SISD

SIMD

SPMD

MIMD

Pthread不支持____。

创建并发执行线程

同步

非显式通信

自动并行化

在超市的顾客购买商品记录中统计一些商品组合的购买频率,将购买频率（商品组合）划分给不同进程,这是一种划分____的数据并行策略。

输入数据

中间结果

输出数据

临时数据

当处理器数量不变时,随着问题规模增大,加速比____。

所有算法都增大

所有算法都减小

代价最优算法都增大

代价最优算法都减小

两个矩阵相乘,若矩阵总规模小于cache大小,则优化访存的最佳方法是____。

先将两个矩阵读入cache再进行乘法

先转置第一个矩阵再进行乘法

先转置第二个矩阵再进行乘法

以上皆错

关于消息传递编程的特点,以下说法正确的是____。

与共享内存一样有竞争条件

编程简单

需程序员考虑局部性

无需考虑进程间通信

编译器编译OpenMP并行循环时,会自动生成一些代码,其中不包括____。

创建和管理线程代码

循环划分给线程的代码

找出数据依赖的代码

线程同步的代码

n个数求和的问题,使用n个处理器的并行算法达到了logn的运行时间,则算法____。

肯定不是代价最优

肯定是代价最优

不确定是否代价最优

任务依赖图中权重之和最长的路径称为____。

最大任务

关键路径

平均并发度

最短路径

将起泡排序程序改写为奇偶转置排序,关于其两层循环是否存在数据依赖,下面说法正确的是____。

外层存在，内层不存在

外层不存在，内层存在

两层都不存在

两层都存在

在下面问题中,SIMD并行最不适合____。

向量加法

向量中元素排序

矩阵向量乘法

矩阵加法

OpenMP编译指示是以____开头的。

"

#include"

#ifdef"

#pragam"

#else"

一个SSE寄存器可容纳____个短整型数。

2

4

8

16

当前并行软件面临的主要挑战不包括____。

能耗

伸缩性

研发周期

可靠性

创建线程时,我们通过____将线程号分别传递给每个线程。

全局变量

局部变量

动态分配变量

pthread_create的“线程函数参数”参数

利用cacheline一次读取多个数据字的机制优化程序访存性能,其机理是____。

降低了访存延迟

隐藏了访存延迟

利用了cache空间局部性

利用了cache时间局部性

R*=1.3;

G+=1.8;

B+=1.2;

X*=1.1,此程序片段可进行SIMD并行化吗?

不可以

可以

不确定

SSEintrinsics_mm_loadu_ps命令的功能是____。

对齐向量读取单精度浮点数

未对齐向量读取单精度浮点数

对齐向量读取双精度浮点数

未对齐向量读取双精度浮点数

互斥量是一种____同步机制。

一元状态

二元状态

多元状态

AVX是____平台的SIMD架构。

x86

POWER

SPARC

ARM

除了用于解决竞争条件外,互斥量还可用于____。

解决共享资源竞争的问题

解决并发度低的问题

解决通信开销大的问题

解决负载不均的问题

在分布式内存架构编程中,进程间不能____。

进行通信

进行同步

发送和接收消息

通过读写变量交换数据

关于OpenMP循环并行程序的编写,下列说法中不正确的是____。

程序员无需编写线程创建和管理代码

程序员无需编写循环划分代码

程序员需指出哪个循环应并行

程序员需编写线程同步代码

限制CPU内流水线深度的因素包括_____。

指令复杂程度

分支预测性能

CPU核心数

CPUcache大小

SSE数据移动指令分类不包括____。

对齐传输

未对齐传输

标量传输

缓存传输

将t个线程的局部结果汇总,可采用递归分解并行进行,即,两两汇总,中间结果继续两两汇总,直到剩下唯一的最终结果,其时间复杂度为____。

Θ

（1）

Θ（logt）

Θ（t）

Θ（tlogt）

一个SSE寄存器可容纳____个双精度浮点数。

对这样的循环for（i=0;

i<

100;

i+=1）A[i+0]=A[i+0]+B[i+0];

进行向量化,基本技术手段是____。

循环划分

循环消除

循环展开

在128位的SIMD寄存器中,我们不能保存____。

16个8位整数

8个16位短整型

4个32位整型

16个字符的字符串

floata[64];

for（i=0;

60;

i+=4）Va=a[i+2:

i+5];

系统向量化访存是按16字节对齐的,则此向量化程序每个循环步产生____个内存访问操作。

1

3

两个n*n的矩阵相乘,将所有n^2个乘法计算划分给不同进程,再将对应某行某列的n个乘法结果累加得到结果矩阵对应元素,这是一种划分____的数据并行。

忙等待方法解决竞争条件的思路是____。

令CPU一直处于忙碌状态无法产生竞争条件

令存在数据依赖的内存操作充分并行

强制多线程进入临界区的顺序来将存在数据依赖内存操作串行化

SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:

7],若imm8[j]=0则表示___。

将第一个源寄存器的第j个元素放在目标寄存器位置0

将第二个源寄存器的第j个元素放在目标寄存器位置0

将第一个源寄存器的第j个元素放在目标寄存器位置j

将第二个源寄存器的第j个元素放在目标寄存器位置j

CUDA线程层次中不包括____。

Kernel

Grid

Block

Thread

将寄存器设置为4个单精度浮点数0.0的SSEintrinsics指令是____。

_mm_set_ps

_mm_set1_ss

_mm_setzero_ss

_mm_setzero_ps

64;

i+=4）Va=a[i:

i+3];

此向量化程序内存访问完全对齐,每个循环步恰好是一次对齐的内存访问,则该系统向量化访存是按____字节对齐。

32

64

对单精度浮点计算,AVX最高实现____路并行。

MPI默认点对点通信模式是____。

阻塞的

非阻塞的

对等的

主从的

以下____是MPI基本原语。

MPI_barrier

MPI_Comm_numprocs

MPI_Comm_rank

MPI_Comm_Send

在SSEintrinsics程序中双精度浮点数数据类型是____。

__m128

__m128f

__m128d

__m128i

在对互斥量进行解锁时,还会执行____操作。

互斥量初始化

互斥量销毁

唤醒阻塞线程

SSEintrinsics_mm_load_ss命令的功能是____。

对齐标量读取单精度浮点数

未对齐标量读取单精度浮点数

求解同一个问题的4个并行算法的等效率函数分析结果如下,其中____的可扩展性最优。

Θ（plogp）

Θ（p^2）

Θ（p^2logp）

Θ（p^3）

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 并行程序设计 20秋学期1909并行程序设计在线作业 20 学期 1909 并行程序设计在线作业

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：20秋学期1909《并行程序设计》在线作业 3Word格式文档下载.docx
链接地址：https://www.bdocx.com/doc/13333856.html

20秋学期1909《并行程序设计》在线作业 3Word格式文档下载.docx

热门标签