Non voglio software sound-to-text. Quello che mi serve è il seguente:Libreria/codice riconoscimento campioni audio
- sarò registrare più (diciamo 50+) flussi audio (registrazioni di stazioni radio)
- da quella registrazioni, io ti segnano interessanti clip audio - la loro lunghezza varia da Da 2 a 60 secondi - ci saranno poche migliaia di tali clip audio
- la libreria dovrebbe essere in grado di trovare altre istanze delle stesse clip audio da flussi audio registrati
- il fattore di confidenza deve essere segnalato per l'utilizzo e l'input aggiuntivo fornito in modo che il riconoscimento potrebbe migliorare la prossima volta
Conosci questa libreria di software? La LGPL sarebbe molto preziosa per me, ma posso anche ottenere la licenza commerciale.
I clip audio conterranno sia musica, testo, effetti o qualsiasi combinazione di questi. Quindi, il riconoscimento del TESTO è fuori questione.
Architettura: C++, C# per colla, CUDA se possibile.
Le clip audio contengono parlato, suoni, musica, tutto questo? – mdma
Hai in mente un linguaggio specifico o un'architettura di processore? –
BTW, ho creato la mia implementazione, dopo 2 anni di sviluppo, ed è disponibile per lo sfruttamento commerciale :) http://www.videophill.com/index.php?page=playkontrol –