2012-12-27 12 views
5
float a[4] = {1,2,3,4}, b[4] = {4,3,2,1}; 
uint32_t c[4]; 

int main() { 

    __m128 pa = _mm_loadu_ps(a); 

    __m128 pb = _mm_loadu_ps(b); 
    __m128 pc = _mm_cmpgt_ps(pa, pb); 
    _mm_storeu_ps((float*)c, pc); 
    for (int i = 0;i < 4; ++i) printf("%u\n", c[i]); 
    return 0; 
} 

qual è l'istruzione corretta di _mm_storeu_ps((float*)c, pc)? qui, c è un array intero ... Non penso che questo sia buono, meglio?come invertire __m128 negli interi

+0

I miei occhi ... fanno male ... l'ultima volta che ho controllato, l'abominio di '__m128' non era nello standard C++. –

risposta

7

ci sono due istruzioni per convertire __m128 (float vettore) in __m128i (int32_t vettore) in SSE2: _mm_cvtps_epi32 (con arrotondamento) e _mm_cvttps_epi32 (con troncamento).

__m128i vi = _mm_cvttps_epi32(pc); 
_mm_storeu_si128((__m128i *)c, vi); 

Se non è possibile utilizzare SSE2, è necessario convertire float array per int matrice dopo la memorizzazione pc in float array.

float d[4]; 
_mm_storeu_ps(d, pc); 
c[0] = (int)d[0]; c[1] = (int)d[1]; c[2] = (int)d[2]; c[3] = (int)d[3];