OpenMP的同步结构(Synchronization Constructs)指令包master、critical、barrier、atomic、flush、ordered等
运行结果如下,可见只有主线程0执行了master区域代码。
其语法格式如下
#pragma omp critical [ name ] newline structured_block其中有一个可选名称选项,该选项允许存在多个不同的critical区域,其特性如下:
该名称充当critical区域全局标识符,相同名称的不同临界区域被视为同一区域。所有未命名的critical区域均视为同一区域。 critical用法很简单,下面演示下命名critical的特性代码示例如下:
#pragma omp parallel sections { #pragma omp section { #pragma omp critical (critical1) { for (int i=0; i < 5; i++) { printf("section1 thread %d excute i = %d\n", omp_get_thread_num(), i); Sleep(200); } } } #pragma omp section { #pragma omp critical (critical2) { for (int j=0; j < 5; j++) { printf("section2 thread %d excute j = %d\n", omp_get_thread_num(), j); Sleep(200); } } } }运行结果如下,由于两个section中采用了不同名字的critical,所以两个线程能分别同时运行各自的临界区代码。
代码示例如下:
#pragma omp parallel sections { #pragma omp section { #pragma omp critical (critical1) { for (int i=0; i < 5; i++) { printf("section1 thread %d excute i = %d\n", omp_get_thread_num(), i); Sleep(200); } } } #pragma omp section { #pragma omp critical (critical1) { for (int j=0; j < 5; j++) { printf("section2 thread %d excute j = %d\n", omp_get_thread_num(), j); Sleep(200); } } } }运行结果如下,两个section本来是两个线程并行处理的,但由于采用了相同名字的critical将两个区域的代码包围,根据前面所说的相同名字的不同临界区属于同一区域,只有一个线程能进入,因此两个section线程是串行的。 尤其要注意如果多个临界区未命名,则也属于同一区域,那么只有一个线程能进入其中一个临界区。
当无barrier和有barrier时,运行结果分别如下。可见,有barrier时,各线程在完成第一条打印后,会在barrier后同步后,在执行第二条打印。
本来有6个线程,每个执行100000次循环,则x的预期值是600000,但实际结果小于该值,原因如下: x++的汇编指令如下三条: LOAD A, (x address) ADD A, 1 STORE A, (x address) 当两个线程都在执行该指令时,可能会出现如下情况: 线程1将x内存值加载到寄存器A中。 线程2将x内存值加载到寄存器A中。 线程1对寄存器A增加1 线程2对寄存器A增加1 线程1将寄存器A存储到x内存 线程2将寄存器A存储到x内存 则运行完毕后,x不是增加2,而是增加1。 如何高效避免该问题,可以按如下采用atomic指令(当然采用critical也可以,只不过atomic效率更高)
int x=0; #pragma omp parallel num_threads(6) { for(int i=0; i<100000; ++i) #pragma omp atomic x++; } printf("%d", x);该程序运行后,x值为600000。
运行结果如下,可以看出因为增加了ordered指令,for循环是按照i从小到大顺序执行的。