总浏览量:539.52万
南开23秋学期(仅限-高起专1909、专升本1909)《并行程序设计》在线作业

时间:2023-11-13 16:28来源:本站作者:点击: 304 次

可做奥鹏院校所有作业、毕业论文咨询请添加 QQ:3082882699
微信:jd958787

23秋学期(仅限-高起专1909、专升本1909)《并行程序设计》在线作业-00003

试卷总分:100  得分:100

一、单选题 (共 50 道试题,共 100 分)

1.OpenMP是___的一个常见替代。

A.SSE

B.MPI

C.Pthread

D.CUDA

 

2.为了解决CPU内流水线深度限制,主要的技术手段是____。

A.降低指令复杂度

B.去掉分支预测功能

C.增大核心数

D.超标量技术

 

3.SSE intrinsics _mm_hadd_ps命令的功能是____。

A.寄存器间单精度浮点数向量加法

B.寄存器间双精度浮点数向量加法

C.寄存器内单精度浮点数加法

D.寄存器内双精度浮点数加法

 

4.采用划分子矩阵(大小b*b)的方法实现n*n矩阵乘法,一次乘—加运算涉及的子矩阵可全部放入cache,则整个计算过程中,两个输入矩阵的每个元素会产生____次访存。

A.n

B.t

C.n-t

D.n/t

 

5.程序访存更多在____中命中,可最大程度提高性能、降低功耗

A.本CPU cache

B.本CPU主存

C.本结点其他CPU主存

D.远端结点主存

 

6.动态任务划分相对于静态任务划分的缺点是____。

A.可能导致负载不均

B.通信开销高

C.任务粒度粗

D.计算复杂度高

 

7.对于向线程函数传递参数,下列说法错误的是____。

A.线程函数并非用户程序调用,因此无法直接传递

B.线程函数必须接受void *参数,因此只能传递大小不超过指针的数据对象

C.线程通常通过此途径获取线程号

D.不同线程间的参数传递相互无关,即使它们具有相同的线程函数

 

8.FORTRAN语言存储二维数组采取____。

A.行主次序存储

B.列主次序存储

C.交错式存储

D.对角线存储

 

9.用GCC编译器编译SSE intrinsics程序,需使用编译选项

A.-march=corei7

B.-g

C.-O

D.-O2

 

10.____不是SIMD架构。

A.SSE

B.超线程

C.AltiVec

D.Neon

 

11.关于MPI_recv对源地址的标识,下列说法正确的是____。

A.只能使用进程编号

B.可以使用IP地址

C.可以使用IPV6地址

D.可以使用MPI_ANY_SOURCE

 

12.记并行时间为T,串行时间为T',处理器数量为p,并行代价的定义是____。

A.pT

B.T'+T

C.p(T'-T)

D.pT-T'

 

13.Pthread不支持____。

A.创建并发执行线程

B.同步

C.非显式通信

D.自动并行化

 

14.主线程创建了4个线程,它们打印各自的线程号(0-3),未使用任何同步,则输出顺序____。

A.必然是0 1 2 3

B.必然是4 3 2 1

C.不可能是4 3 2 1

D.以上皆错

 

15.新一代GPU重点提供的新特性不包括____。

A.新型高速显存

B.GPU间直接高速互联

C.自动并行化

D.人工智能计算专门优化

 

16.对于科学仿真并行计算的一般方法,哪个步骤的描述是错误的?

A.将空间离散化为网格

B.在网络上进行局部计算

C.局部计算结果完全独立

D.重复若干时间步

 

17.对矩阵乘法串行程序主体三重循环的最内层循环进行向量化,则该循环执行完毕后,就计算出了结果矩阵的一个元素,这种说法是____。

A.正确的

B.错误的

 

18.我们在小规模系统和小规模输入下测试了几个并行算法,应选择哪个应用在实际系统中?

A.选择性能测试并行时间最少者

B.选择性能测试加速比最大者

C.选择性能测试效率最高者

D.应结合可扩展性分析做出选择

 

19.对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____。

A.声明语句

B.条件分支语句

C.循环语句

D.输入输出语句

 

20.OpenMP并行模型是一种____编程模型。

A.静态线程

B.动态线程

C.混合线程

D.众核

 

21.和一对多广播对应的组通信操作是____。

A.多对一收集

B.多对多收集

C.多对一归约

D.多对多归约

 

22.天河1号、天河2号、神威.太湖之光总体上都是____架构

A.单核

B.多核

C.众核

D.集群

 

23.MPI程序中发送和接收消息的两个进程必须____。

A.在同一个网段中

B.连接在同一个路由器上

C.在同一个通信域中

D.以上皆错

 

24.SSE的blend指令的8位二进制整数参数被用做8个掩码imm8[0:7],若imm8[j]=0则表示___。

A.将第一个源寄存器的第j个元素放在目标寄存器位置0

B.将第二个源寄存器的第j个元素放在目标寄存器位置0

C.将第一个源寄存器的第j个元素放在目标寄存器位置j

D.将第二个源寄存器的第j个元素放在目标寄存器位置j

 

25.OpenMP循环并行指令是____。

A.omp parallel

B.omp single

C.omp parallel for

D.omp master

 

26.SIMD架构未见于_____中。

A.多媒体扩展

B.图形和游戏处理器

C.计算机集群

D.协处理器

 

27.如果运算对象是独立无关的变量,则在向量运算之前需____。

A.将变量拷贝到连续区域

B.将变量地址拷贝到连续区域

C.将变量逐个传输到向量寄存器

D.以上皆错

 

28.OpenMP编译指示中说明共享变量是用____子句。

A.private

B.shared

C.schedule

D.nowait

 

29.主线程通过____函数获取特定线程的返回结果。

A.pthread_create

B.pthread_join

C.pthread_cancel

D.pthread_get

 

30.以下哪条不是推动并行计算发展的因素?

A.存储是系统瓶颈

B.单CPU发展已能满足应用需求

C.利用标准硬件构造并行机令升级容易

D.编程环境标准化逐步发展

 

31.数据依赖是指必须保持两个内存操作的____才能保证程序结果正确。

A.大小

B.时序

C.时长

D.cache局部性

 

32.CPU cache大小为32KB,如希望(单精度浮点数)矩阵乘法计算过程中所有数据都驻留cache中,则矩阵大小最大为

A.16*16

B.32*32

C.64*64

D.128*128

 

33.全球500强超算在CPU、网络等硬件上越来越体现出采用____的趋势。

A.特殊硬件

B.通用硬件

C.非公开硬件

D.廉价硬件

 

34.采用MPI主从模型解决矩阵每行排序问题,主进程不断向每个从进程发送任务、接收结果,则它从从进程接收结果时,以下哪种方式更好____。

A.按编号顺序依次从从进程接收结果

B.按编号逆序依次从从进程接收结果

C.按编号顺序、逆序交替从从进程接收结果

D.使用MPI_ANY_SOURCE和MPI_ANY_TAG

 

35.Flynn分类法中,下面哪种体系结构在实际中几乎没有意义?

A.SISD

B.SIMD

C.MISD

D.MIMD

 

36.我国首次获得戈登?贝尔奖是在____年。

A.2015

B.2016

C.2017

D.2018

 

37.多线程是____架构下的并行模式。

A.MIMD

B.共享内存

C.分布式内存

D.分离式地址空间

 

38.OpenMP循环划分策略不包括____。

A.static

B.fixed

C.dynamic

D.guided

 

39.SSE intrinsics _mm_store_sd命令的功能是____。

A.对齐向量存单精度浮点数

B.未对齐向量存单精度浮点数

C.对齐标量存双精度浮点数

D.未对齐标量存双精度浮点数

 

40.关于消息传递编程的特点,以下说法正确的是____。

A.与共享内存一样有竞争条件

B.编程简单

C.需程序员考虑局部性

D.无需考虑进程间通信

 

41.经典冯诺依曼架构执行一条指令的过程中不包括哪个操作?

A.取指令

B.解码

C.安全性检查

D.执行指令

 

42.MPI程序中默认的通信域是____。

A.MPI_ANY_SOURCE

B.MPI_ANY_TAG

C.MPI_ANY_COMM

D.MPI_COMM_WORLD

 

43.矩阵每行排序的问题更适合使用MPI的____编程模型。

A.阻塞的

B.非阻塞的

C.对等的

D.主从的

 

44.对于加速比S和处理器数量p,下列说法正确的是____。

A.有可能S>p

B.必然S<p

C.不可能S=p

D.两者无关联

 

45.对于向量化,以下说法错误的是____。

A.总会有打包/解包开销

B.若运算对象连续存储,可消除打包开销

C.若运算结果连续存储,可消除解包开销

D.打包/解包开销由数据存储决定

 

46.记并行时间为T,串行时间为T',处理器数量为p,效率为E,则代价最优的定义是____。

A.pT'=T

B.E=Θ(1)

C.E=pT/T'

D.E=T'/pT

 

47.在用pthread_mutex_lock对互斥量进行加锁时,若其已上锁,则线程进入____状态。

A.初始化

B.阻塞

C.继续执行

D.销毁

 

48.并行算法设计所做的事情不包括____。

A.分解计算工作分配给多个处理器

B.保持数据依赖保证结果正确

C.确保不能产生重复计算

D.尽量降低通信等额外开销

 

49.MPI基本原语不包括____。

A.MPI_Barrier

B.MPI_Comm_rank

C.MPI_Comm_size

D.MPI_Init

 

50.下面矩阵运算中,哪个进行简单的数据并行效果不佳____。

A.矩阵求和

B.矩阵相乘

C.矩阵向量相乘

D.高斯消去


需要奥鹏作业答案请扫二维码,加我QQ

添加微信二维码,了解更多学习技巧,平台作业、毕业论文完成时间友情提醒。不再错过任何作业论文。