dmikushin · January 27, 2025 12:01
diff --git a/README.md b/README.md
diff --git a/Makefile b/Makefile
 LLVM_VERSION=19
 ifeq ($(LLVM_VERSION),19)
 	CC=LIBRARY_PATH=/usr/lib/llvm-$(LLVM_VERSION)/lib clang-$(LLVM_VERSION)
 else
 	CC=clang-$(LLVM_VERSION)
 endif

 .PHONY: test

 all: multi_sm_test

 multi_sm_test: multi_sm_test.c
 	$(CC) -fopenmp -fopenmp-targets=nvptx64-nvidia-cuda \
 		-Xopenmp-target=nvptx64-nvidia-cuda --offload-arch=sm_90 \
 		-Xopenmp-target=nvptx64-nvidia-cuda --offload-arch=sm_80 \
 		-fuse-ld=lld $< -o $@

 clean:
 	rm -rf multi_sm_test

 test: multi_sm_test
 	strings ./$< | grep "sm_80" && strings ./$< | grep "sm_90"
diff --git a/multi_sm_test.c b/multi_sm_test.c
 #include <stdio.h>
 #include <omp.h>
 
 #define N 1000
 
 void saxpy(float a, float *x, float *y, float *result, int n) {
    #pragma omp target teams distribute parallel for map(to: x[0:n], y[0:n]) map(from: result[0:n])
    for (int i = 0; i < n; i++) {
        result[i] = a * x[i] + y[i];
    }
 }
 
 int main() {
    float a = 2.0f;
    float x[N], y[N], result[N];
     
    // Initialize arrays
    for (int i = 0; i < N; i++) {
        x[i] = i * 1.0f;
        y[i] = i * 2.0f;
    }
 
    // Perform SAXPY
    saxpy(a, x, y, result, N);
 
    // Print some results for verification
    for (int i = 0; i < 10; i++) {
        printf("result[%d] = %f\n", i, result[i]);
    }
 
    return 0;
 }
	LLVM_VERSION=19
	ifeq ($(LLVM_VERSION),19)
	CC=LIBRARY_PATH=/usr/lib/llvm-$(LLVM_VERSION)/lib clang-$(LLVM_VERSION)
	else
	CC=clang-$(LLVM_VERSION)
	endif

	.PHONY: test

	all: multi_sm_test

	multi_sm_test: multi_sm_test.c
	$(CC) -fopenmp -fopenmp-targets=nvptx64-nvidia-cuda \
	-Xopenmp-target=nvptx64-nvidia-cuda --offload-arch=sm_90 \
	-Xopenmp-target=nvptx64-nvidia-cuda --offload-arch=sm_80 \
	-fuse-ld=lld $< -o $@

	clean:
	rm -rf multi_sm_test

	test: multi_sm_test
	strings ./$< \| grep "sm_80" && strings ./$< \| grep "sm_90"
	#include <stdio.h>
	#include <omp.h>

	#define N 1000

	void saxpy(float a, float x, float y, float *result, int n) {
	#pragma omp target teams distribute parallel for map(to: x[0:n], y[0:n]) map(from: result[0:n])
	for (int i = 0; i < n; i++) {
	result[i] = a * x[i] + y[i];
	}
	}

	int main() {
	float a = 2.0f;
	float x[N], y[N], result[N];

	// Initialize arrays
	for (int i = 0; i < N; i++) {
	x[i] = i * 1.0f;
	y[i] = i * 2.0f;
	}

	// Perform SAXPY
	saxpy(a, x, y, result, N);

	// Print some results for verification
	for (int i = 0; i < 10; i++) {
	printf("result[%d] = %f\n", i, result[i]);
	}

	return 0;
	}