È thare una guida rapida per i programmatori per la scrittura di app DSP-accelerate per TMS320C64x?TMS320C64x Riferimento di avvio rapido per i programmatori
Ho un programma con algoritmo personalizzato (non il fft o il filtro usial) e voglio accelerarlo utilizzando il coprocessore multi-DSP. Quindi, come dovrei modificare il sorgente per spostare il calcolo dalla CPU principale ai DSP? Quali limitazioni ci sono per il codice in esecuzione DSP?
Ho una certa esperienza con CUDA. In CUDA dovrei contrassegnare ogni funzione come host, dispositivo o punto di ingresso per dispositivo (kernel). Ci sono anche funzioni per avviare i kernel e caricare/scaricare dati da/per GPU. Esistono anche alcune limitazioni, per il codice del dispositivo, descritte nel manuale di riferimento CUDA. Spero, ci sia un'interfaccia simile e una documentazione per DSP.