La libreria text
uses utf-16 internally. utf-8 è una codifica più comunemente usata, specialmente nelle librerie C. Inoltre, utf-8 utilizza meno memoria la maggior parte del tempo. Perché lo text
utilizza utf-16?Perché il testo utf-16 in contrapposizione a utf-8
12
A
risposta
21
C'era un progetto per convertire text
in utf8 internamente, perché questo è irrilevante per l'API che fornisce. Dopo aver completato abbastanza punti di riferimento, il progetto non è stato considerato un miglioramento e non è stato integrato con la linea principale in questo momento. C'è una possibilità che sarà in futuro, se può diventare un miglioramento sufficiente. Ecco la storia completa: http://jaspervdj.be/posts/2011-08-19-text-utf8-the-aftermath.html
Problemi correlati
- 1. Conversione da UTF8 a UTF16 tramite iconv
- 2. perché Xdocument mi fornisce una dichiarazione utf16?
- 3. Qual è la differenza tra UTF8/UTF16 e Base64 in termini di codifica
- 4. Come convertire un array ushort utf16 in un utf8 std :: string?
- 5. grepping file binari e UTF16
- 6. Come leggere il file di testo utf16 su string in golang?
- 7. Quando si salva un XmlDocument, ignora la codifica nel XmlDeclaration (UTF8) e utilizza UTF16
- 8. Rileva gcc in contrapposizione a msvc/clang con macro
- 9. Come faccio a garantire che il testo codificato in un modulo sia utf8
- 10. Come forzare XPath a utilizzare UTF8?
- 11. Posso forzare i browser Web a inviare il testo del modulo come UTF8?
- 12. Perché chiamare mb_convert_encoding per disinfettare il testo?
- 13. stampa utf8 in glib
- 14. Decodifica la posta da utf8 a ISO-8859-1 sottoposta a testo nel file .procmailrc
- 15. Come stampare un file con codifica UTF16 come ascii (o UTF8) dal prompt di comando di PowerShell?
- 16. Converti latin1 in UTF8
- 17. Conversione del problema da ANSI a UTF8 C#
- 18. modulo php invia utf8?
- 19. come posso assicurarmi che emacs salvi sempre il testo in chiaro/modificato come utf8?
- 20. Come far funzionare SWIG con le stringhe utf8 in C#?
- 21. UTF8 in elaborazione in C
- 22. PHP preg_split utf8 caratteri
- 23. allineare il testo a destra in UIPickerView
- 24. Navigazione con caret a larghezza zero UTF8 carattere
- 25. text to pdf con codifica utf8 (alternativa a a2ps)
- 26. Jquery durante l'aggiunta di testo a html charset utf8 non funzionante
- 27. bug Java? Perché extra zero byte nella codifica utf8?
- 28. PHP Utf8 decodifica Problema
- 29. Converti unicode codepoint a UTF8 esadecimale in python
- 30. Perché alcuni siti web hanno? Utf8 = ✓ nel loro titolo?
TL; DR: negli anni '90 UCS-2 sembrava una buona idea poiché era una codifica a lunghezza fissa, Unicode troppo male espanso, UCS-2 diventato UTF-16 e ora siamo bloccati la peggiore codifica di sempre in molti software. –
Unicode 2.0, la versione che ha introdotto le coppie surrogate, è del 1996, e secondo https://hackage.haskell.org/package/text-0.1, la prima versione del testo è stata rilasciata nel 2009 ... questo esclude l'idea che il testo sia iniziato come ucs-2 ... a meno che non sbagli e la libreria di testo abbia una storia precedente a quella in hackage (ancora, ho usato Haskell solo dopo il 2009, quindi non ho idea di come erano allora) – berdario
'text' potrebbe essere esistito, ma non ancora ospitato su Hackage. –