Penso che sia 'cp1252', alias 'windows-1252'.
Dopo aver letto la risposta di Jörg, sono tornato sulla pagina Encoding su ruby-doc.org cercando di trovare i riferimenti alle codifiche specifiche da lui menzionate e in quel momento ho individuato il metodo Encodings.aliases
.
Quindi ho aggiunto il metodo alla fine di questa risposta.
poi ho guardato l'output in Notepad ++, considerandola sia 'ANSI' e UTF-8, e rispetto che per l'output in IRB ...
ho potuto trovare solo due posti nell'output IRB dove il file utf-8 era confuso nello stesso identico modo in cui appariva nel blocco note ++ quando veniva visualizzato come "ANSI", e quei posti erano per cp1252 e cp1254.
cp1252 è apparentemente la mia codifica 'filesystem', quindi vado con quello.
Ho scritto uno script per effettuare copie di tutti i file convertiti in UTF-8, provando sia dal 1252 e 1254.
utf-8 espressioni regolari sembrano funzionare con entrambi i set di file finora.
Ora devo cercare di ricordare cosa stavo effettivamente cercando di compire prima di incappare in tutti questi mal di testa di codifica. xD
def compare_encodings file1, file2
file1_probs = []
file2_probs = []
txt = File.open('encoding_test_output.txt','w')
Encoding.aliases.sort.each do |k,v|
Encoding.default_external=k
ename = [k.downcase, v.downcase].join " --- "
s = ""
begin
s << "#{File.read(file1)}"
rescue
s << "nope nope nope"
file1_probs << ename
end
s << "\t| #{ename} |\t"
begin
s << "#{File.read(file2)}"
rescue
s << "nope nope nope"
file2_probs << ename
end
Encoding.default_external= 'utf-8'
txt.puts s.center(58)
puts s.center(58)
end
puts
puts "file1, \"#{file1}\" exceptions from trying to convert to:\n\n"
puts file1_probs
puts
puts "file2, \"#{file2}\" exceptions from trying to convert to:\n\n"
puts file2_probs
txt.close
end
compare_encodings "utf-8.txt", "np++'ANSI'.txt"
fonte
2013-04-19 05:04:35
dipende dal vostro sistema operativo locale. Per il tedesco o l'inglese, è Windows-1252. Anche se Notepad ++ potrebbe non seguirlo e utilizzarlo come alias per Windows-1252. Sicuramente non è una codifica ISO. Vedi http://en.wikipedia.org/wiki/Windows_ANSI_code_page#ANSI_code_page – Esailija
Grazie, penso che fosse cp1252, sì. –