Utilizzo l'API Zemanta, che accetta fino a 8 KB di testo per chiamata. Sto estraendo il testo da inviare a Zemanta dalle pagine Web utilizzando JavaScript, quindi sto cercando una funzione che troncherà il mio testo esattamente a 8 KB.Utilizzo di JavaScript per troncare il testo a una determinata dimensione (8 KB)
Zemanta dovrebbe eseguire questo troncamento da solo (cioè, se si invia una stringa più grande), ma ho bisogno di spostare questo testo un po 'prima di effettuare la chiamata API, quindi voglio mantenere il carico utile piccolo come possibile.
È sicuro assumere che 8 KB di testo siano 8.192 caratteri e troncare di conseguenza? (1 byte per carattere, 1.024 caratteri per KB, 8 KB = 8,192 byte/caratteri) Oppure, è impreciso o vero solo in determinate circostanze?
Esiste un modo più elegante per troncare una stringa in base alle dimensioni effettive del file?
Si potrebbe voler controllare se il testo di cui si ha a che fare è di certa codifica, ad es. UTF-8, ASCII ecc.? Se si è certi che il testo contenga solo caratteri a byte singolo, il troncamento sarà più semplice. Scambieresti un po 'di flessibilità. Per quanto riguarda il fatto che Zemanta tratti 8KB come 8192 byte o 8000 byte, perché non provi tu stesso? –
Grazie, o.k.w.Penso che Dominic abbia ragione nel dire che questo testo (probabilmente UTF-8) prenderà potenzialmente più byte per carattere, quindi la misurazione su base di quantità di caratteri non sarà possibile. – Bungle