cgmb · April 18, 2025 01:57 · jcao-ai · May 11, 2023 · cgmb · May 11, 2023
diff --git a/README.md b/README.md
diff --git a/CMakeLists.txt b/CMakeLists.txt
 cmake_minimum_required(VERSION 3.16)
 project(example LANGUAGES CXX)
 find_package(hip REQUIRED)
 add_executable(example main.cpp)
 target_link_libraries(example PRIVATE hip::device)
diff --git a/main.cpp b/main.cpp
 #include <stdio.h>
 #include <stdlib.h>
 #include <hip/hip_runtime.h>

 #define CHECK_HIP(expr) do {              \
  hipError_t result = (expr);             \
  if (result != hipSuccess) {             \
    fprintf(stderr, "%s:%d: %s (%d)\n",   \
      __FILE__, __LINE__,                 \
      hipGetErrorString(result), result); \
    exit(EXIT_FAILURE);                   \
  }                                       \
 } while(0)

 __global__ void sq_arr(float *arr, int n) {
  int tid = blockDim.x*blockIdx.x + threadIdx.x;
  if (tid < n) {
    arr[tid] = arr[tid] * arr[tid];
  }
 }

 int main() {
  enum { N = 5 };
  float hArr[N] = { 1, 2, 3, 4, 5 };
  float *dArr;
  CHECK_HIP(hipMalloc(&dArr, sizeof(float) * N));
  CHECK_HIP(hipMemcpy(dArr, hArr, sizeof(float) * N, hipMemcpyHostToDevice));
  sq_arr<<<dim3(1), dim3(32,1,1), 0, 0>>>(dArr, N);
  CHECK_HIP(hipMemcpy(hArr, dArr, sizeof(float) * N, hipMemcpyDeviceToHost));
  for (int i = 0; i < N; ++i) {
    printf("%f\n", hArr[i]);
  }
  CHECK_HIP(hipFree(dArr));
  return 0;
 }
	cmake_minimum_required(VERSION 3.16)
	project(example LANGUAGES CXX)
	find_package(hip REQUIRED)
	add_executable(example main.cpp)
	target_link_libraries(example PRIVATE hip::device)
	#include <stdio.h>
	#include <stdlib.h>
	#include <hip/hip_runtime.h>

	#define CHECK_HIP(expr) do { \
	hipError_t result = (expr); \
	if (result != hipSuccess) { \
	fprintf(stderr, "%s:%d: %s (%d)\n", \
	__FILE__, __LINE__, \
	hipGetErrorString(result), result); \
	exit(EXIT_FAILURE); \
	} \
	} while(0)

	__global__ void sq_arr(float *arr, int n) {
	int tid = blockDim.x*blockIdx.x + threadIdx.x;
	if (tid < n) {
	arr[tid] = arr[tid] * arr[tid];
	}
	}

	int main() {
	enum { N = 5 };
	float hArr[N] = { 1, 2, 3, 4, 5 };
	float *dArr;
	CHECK_HIP(hipMalloc(&dArr, sizeof(float) * N));
	CHECK_HIP(hipMemcpy(dArr, hArr, sizeof(float) * N, hipMemcpyHostToDevice));
	sq_arr<<<dim3(1), dim3(32,1,1), 0, 0>>>(dArr, N);
	CHECK_HIP(hipMemcpy(hArr, dArr, sizeof(float) * N, hipMemcpyDeviceToHost));
	for (int i = 0; i < N; ++i) {
	printf("%f\n", hArr[i]);
	}
	CHECK_HIP(hipFree(dArr));
	return 0;
	}