博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
cuda 在GPU和CPU之间复制数组
阅读量:4210 次
发布时间:2019-05-26

本文共 1006 字,大约阅读时间需要 3 分钟。

#define CUDACHECK(cmd) do {                         \  cudaError_t e = cmd;                              \  if( e != cudaSuccess ) {                          \    printf("Failed: Cuda error %s:%d '%s'\n",             \        __FILE__,__LINE__,cudaGetErrorString(e));   \    exit(1);                             \  }                                                 \} while(0)int nDev=2;  float** sendbuff = (float**)malloc(nDev * sizeof(float*));  float** recvbuff = (float**)malloc(nDev * sizeof(float*));  cudaStream_t* s = (cudaStream_t*)malloc(sizeof(cudaStream_t)*nDev); int size=4; for (int i = 0; i < nDev; ++i) {    CUDACHECK(cudaSetDevice(localRank*nDev + i));    CUDACHECK(cudaMalloc(sendbuff + i, size * sizeof(float)));    CUDACHECK(cudaMalloc(recvbuff + i, size * sizeof(float)));    CUDACHECK(cudaMemset(sendbuff[i], 1, size * sizeof(float)));    CUDACHECK(cudaMemset(recvbuff[i], 0, size * sizeof(float)));    float *h_arr;    h_arr = (float *)malloc(size*sizeof(float));    for (int i=0; i

转载地址:http://nzwmi.baihongyu.com/

你可能感兴趣的文章
c中const和c++中const的学习总结
查看>>
const char *,char * ,string,char []之间的关系和转换
查看>>
c的预处理器
查看>>
c预处理器中的语法详解
查看>>
纯c中char*[]的处理
查看>>
c/c++生成不重复的字符串(6个字符组成,可表示的个数可以扩充),简易版数据库主键
查看>>
c编程题目详解
查看>>
linux下c开发工具详解
查看>>
虚拟机中centos联网
查看>>
centos中g++编译c++II标准的程序
查看>>
linux下各种服务的安装和解析
查看>>
c++boost中的asio介绍
查看>>
UNIX网络编程卷1:套接字联网API-第一部分:简介
查看>>
UNIX网络编程卷1:套接字联网API-第一部分:下载unpv13e编译运行
查看>>
UNIX网络编程卷1:套接字联网API-第2章:传输层 TCP/UDP和SCTP
查看>>
使用netstat调试TCP应用
查看>>
UNIX网络编程卷1:套接字联网API-第2章:端口号和查看linux常用服务对应端口号
查看>>
UNIX网络编程卷1:应用进程写数据到一个TCP套接字中发生的事情
查看>>
UNIX网络编程卷1:套接字联网-第3章:套接字编程-套接字地址结构和值结果参数
查看>>
UNIX网络编程卷1:套接字联网-第3章:套接字编程-常用函数
查看>>