出于对并行计算的兴趣,我尝试了CPU、GPU CUDA、GPU CUDA CUBLAS这三种方式进行矩阵乘法的计算。 一、CPU
#include
#include
#include
//#pragma GCC optimize(3)
#define R_SIZE 256*8
int main(){
int* a=(int*)malloc(R_SIZE*R_SIZE*sizeof(int));
int* b=(int*)malloc(R_SIZE*R_SIZE*sizeof(int));
int* c=(int*)malloc(R_SIZE*R_SIZE*sizeof(int));
int i,j,k;
clock_t start,end;
for(i=0;i
关注
打赏