Ho un vettore di colonna A che è lungo 10 elementi. Ho una matrice B che è 10 per 10. La memoria per B è la colonna maggiore. Desidero sovrascrivere il primo fila in B con il vettore colonna A.Esiste una versione standard, striata di memcpy?
Chiaramente, posso fare:
for (int i=0; i < 10; i++)
{
B[0 + 10 * i] = A[i];
}
dove ho lasciato lo zero in 0 + 10 * i
evidenziare che B utilizza colonna -maggior memoria (zero è l'indice di riga).
Dopo alcuni imbrogli in CUDA-land stasera, ho pensato che potrebbe esserci una funzione CPU per eseguire una memepia stridulo ?? Suppongo che a un livello basso, le prestazioni dipenderebbero dall'esistenza di un'istruzione di carico/immagazzinamento stridente, che non ricordo che ci sia nell'assemblaggio x86?
forse dovresti prendere in considerazione la possibilità di cambiare strategia di archiviazione per questa matrice o di memorizzarne la trasposizione. –