上节的向量相加是一维数组的并行运算,比较好理解。这节我们来看个4 X 4二维数组并行运算:矩阵转置。 4X4矩阵我们采用二维数组进行存储,在程序设计上,转置过程是16个数同时转置完成。注意这里的OpenCL的工作维数是二维。

1、transposition.cl代码

codeblock断点调试在哪看变量值(用Codeblocks进行OpenCL编程5)(1)

2、main.cpp代码

codeblock断点调试在哪看变量值(用Codeblocks进行OpenCL编程5)(2)

codeblock断点调试在哪看变量值(用Codeblocks进行OpenCL编程5)(3)

codeblock断点调试在哪看变量值(用Codeblocks进行OpenCL编程5)(4)

codeblock断点调试在哪看变量值(用Codeblocks进行OpenCL编程5)(5)

运行结果:

codeblock断点调试在哪看变量值(用Codeblocks进行OpenCL编程5)(6)

,