Sto lavorando alla decodifica del testo. Sto cercando di trovare il codice carattere per il carattere —
, da non confondere con -
, in ASCII. Ho provato senza successo. Qualcuno sa come convertirlo?Qual è il codice carattere ASCII per '-'?
risposta
Citazione dal wiki (Em dash)
Quando una lineetta reale non è disponibile, come nel set di caratteri ASCII-doppia ("-") o triplo trattino-meno ("---") si usa. In Unicode, il trattino è U + 2014 (decimale 8212).
Il carattere di trattino basso non fa parte del set di caratteri ASCII.
Quindi quando lo faccio: 'char check = s.charAt (0)', quando s = '-', cosa otterrò? Dici che se farò 'int check = s.charAt (0)', otterrò 8212? –
@AdamSh Dipende da cosa si sta utilizzando per eseguire la decodifica. Non hai pubblicato alcun codice, quindi è difficile dirlo. Comunemente quando un decodificatore incontra qualcosa che non può decodificarlo, lo sostituisce con un punto interrogativo. – vcsjones
Dovresti lanciare un'eccezione o iniziare a usare numeri interi più grandi e restituire 8212. – Li0liQ
—
è noto come Em Dash. Il suo codice carattere è \u2014
. Non è un carattere ASCII, quindi non è possibile decodificarlo con il set di caratteri ASCII perché non è nella tabella dei caratteri ASCII. Probabilmente vorrai usare UTF8.
Le stringhe JavaScript sono abilitate per Unicode ma usano UCS-2, non UTF-8, internamente. In entrambi i casi, non è necessario conoscere la codifica per rappresentarlo, poiché è possibile verificarlo con il punto di codice Unicode nel formato '\ u2014', come hai detto. – thomasrutter
Questo carattere non esiste in ASCII, ma solo in Unicode, solitamente codificato da UTF-8.
In UTF-8, i caratteri sono codificati da sequenze a 2 o 3 byte (o occasionalmente più lunghi), dove nessuno dei due o tre byte è un codice ASCII valido, in cui tutti sono al di fuori dell'intervallo ASCII di Da 0 a 127.
Si sospetta che quanto sopra risponda solo in parte alla domanda, ma in tal caso, probabilmente, perché la domanda è, inavvertitamente, solo parzialmente richiesta. Per ulteriori dettagli, puoi estendere la tua domanda con più dettagli.
- 1. qual è il codice ASCII del tasto Windows?
- 2. AS3: Come convertire il codice ASCII in actioncript del carattere
- 3. Restituisce il carattere associato al codice Ascii specificato nella R
- 4. Qual è il ** carattere glob?
- 5. Tcl per ottenere il codice ASCII per ogni carattere in una stringa
- 6. SyntaxError di carattere non-ASCII
- 7. Qual è il carattere che viene visualizzato sulle password nascoste?
- 8. Qual è il carattere unicode della posizione?
- 9. Converti caratteri accentati nel carattere ascii
- 10. Come convertire un carattere ASCII nel suo valore int ASCII?
- 11. In C#, come posso rilevare se un carattere è un carattere non ASCII?
- 12. JQuery: come inserire testo carattere HTML ascii?
- 13. codice carattere HTML per sottolineare il carattere successivo
- 14. Qual è il modo migliore per documentare il codice f #?
- 15. Come convertire il codice ASCII (0-255) in una stringa del carattere associato?
- 16. UnicodeEncodeError: codec 'ascii' non può codificare il carattere [...]
- 17. Sostituire carattere non ASCII da stringa
- 18. Come ottenere il valore ASCII del carattere in haskell?
- 19. UnicodeEncodeError: codec 'ascii' non può codificare il carattere u '\ XE4'
- 20. Qual è il punto di questo codice?
- 21. Qual è l'equivalente Java per il seguente codice C#?
- 22. Qual è il modo più efficiente per eseguire questo codice?
- 23. Qual è un buon strumento per annotare il codice?
- 24. Qual è il codice dietro per datagridtemplatecolumn e come usarlo?
- 25. Qual è il modo migliore per eseguire codice Java sandboxed?
- 26. Qual è il modo corretto per bloccare zone di codice
- 27. Qual è il modo migliore per visualizzare ASCII in una griglia con pannelli usando Java?
- 28. Qual è il carattere predefinito in visual studio 2013
- 29. Qual è il significato del carattere "&" nel valore restituito?
- 30. Charset.for.Java ("ASCII") o Charset.forName ("US-ASCII")
Cosa intendi per "decodificare questo carattere"? Quale codifica è usata nel testo sorgente e quale codifica dovrebbe essere usata nel risultato? – raina77ow
@ raina77ow: Provo a trovare il numero di questo carattere nel tavolo Ascii –
Non c'è; pertanto, il suo codice dipende da quale codifica viene utilizzata. Ad esempio, nei testi Latin-1 'mdash' è rappresentato con il numero 151. – raina77ow