上节的向量相加是一维数组的并行运算,比较好理解。这节我们来看个4 X 4二维数组并行运算:矩阵转置。 4X4矩阵我们采用二维数组进行存储,在程序设计上,转置过程是16个数同时转置完成。注意这里的OpenCL的工作维数是二维。
1、transposition.cl代码2、main.cpp代码
运行结果:
,
上节的向量相加是一维数组的并行运算,比较好理解。这节我们来看个4 X 4二维数组并行运算:矩阵转置。 4X4矩阵我们采用二维数组进行存储,在程序设计上,转置过程是16个数同时转置完成。注意这里的OpenCL的工作维数是二维。
1、transposition.cl代码2、main.cpp代码
运行结果:
,