Esiste un modo standard, preferibilmente Pythonic, per convertire la notazione &#xxxx;
in una stringa Unicode corretta?Convertire la notazione di riferimento di caratteri numerici nella stringa unicode
Per esempio,
מפגשי
devono essere convertiti in:
מפגשי
Si può fare - abbastanza facilmente - con manipolazioni di stringhe, ma mi chiedo se c'è una libreria standard per questo.
Suggerimento: che la notazione è chiamata [ "riferimento carattere numerico"] (https: // en. wikipedia.org/wiki/Numeric_character_reference). –
+1 @JoachimSauer, grazie, aggiornato il titolo. –
Correlati: http://stackoverflow.com/questions/3894564/replace-numeric-character-references-in-xml-document-using-python –