horitaku1124 · September 22, 2019 02:12
diff --git a/avx512readme.md b/avx512readme.md
diff --git a/test3.c b/test3.c
 #include<stdio.h>
 #include<x86intrin.h>
 #include "vector.h"



 int main(void)
 {
 	float a[] = {1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
 	float b[] = {1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f, 1.0f, 2.0f, 3.0f, 4.0f, 5.0f, 6.0f, 7.0f, 8.0f};
 	printf("%f\n", sumProduct(a, b, 16));
 	return 0;
 }
diff --git a/vector.c b/vector.c
 #include "vector.h"
 #include <immintrin.h>

 float sumProduct(float* vec1, float* vec2, int num)
 {
 	__m512 avx_sum = _mm512_setzero_ps();
 	for (int i = 0;i < num;i += 16) {
 		const __m512 a512 = _mm512_loadu_ps((double*)&vec1[i]);
 		const __m512 b512 = _mm512_loadu_ps((double*)&vec2[i]);
 		avx_sum = _mm512_fmadd_ps(a512, b512, avx_sum);
 	}

  	float __attribute__((aligned(32))) out[16] = {};
    _mm512_storeu_ps(out, avx_sum);
 	float sum = 0;
 	for (int i = 0;i < 16;i++) {
 		sum += out[i];
 	}
 	return sum;
 }
diff --git a/vector.h b/vector.h
 float sumProduct(float* vec1, float* vec2, int num);
	#include "vector.h"
	#include <immintrin.h>

	float sumProduct(float* vec1, float* vec2, int num)
	{
	__m512 avx_sum = _mm512_setzero_ps();
	for (int i = 0;i < num;i += 16) {
	const __m512 a512 = _mm512_loadu_ps((double*)&vec1[i]);
	const __m512 b512 = _mm512_loadu_ps((double*)&vec2[i]);
	avx_sum = _mm512_fmadd_ps(a512, b512, avx_sum);
	}

	float __attribute__((aligned(32))) out[16] = {};
	_mm512_storeu_ps(out, avx_sum);
	float sum = 0;
	for (int i = 0;i < 16;i++) {
	sum += out[i];
	}
	return sum;
	}