KISSmetrics genera stringhe JSON non valide che è necessario analizzare. Ricevo tonnellate di errori comeCorrezione di JSON escape non valida
ERROR 2013-03-04 04:31:12,253 Invalid \escape: line 1 column 132 (char 132): {"search engine":"Google","_n":"search engine hit","_p":"z392cpdpnm6silblq5mac8kiugq=","search terms":"happy new year animation 1920\303\2271080 hd","_t":1356390128}
ERROR 2013-03-04 04:34:19,153 Invalid \escape: line 1 column 101 (char 101): {"search engine":"Google","_n":"ad campaign hit","_p":"byskpczsw6sorbmzqi0tk1uimgw=","search terms":"\331\203\330\261\330\252\331\207 \331\201\331\212\330\257\331\212\330\244\331\211 \330\256\331\212\331\204\330\247\330\255\331\211 \331\203\331\210\330\261\330\257\331\211","_t":1356483052}
Il mio codice è:
for line in lines:
try:
data = self.clean_data(json.loads(line))
except ValueError, e:
logger.error('%s: %s' % (e.message, line))
Esempio dati grezzi:
{"search engine":"Google","_n":"search engine hit","_p":"kvceh84hzbhywcnlivv+hdztizw=","search terms":"military sound effects programs","_t":1356034177}
c'è qualche possibilità per ripulire questo JSON disordinato e analizzarlo? Grazie per l'aiuto.
Come si analizza il JSON? Qual è il 'repr()' del valore prima della decodifica? –
Ah, i dati di input hanno * escape ottale *, a quanto pare. Quelli sarebbero davvero JSON non validi. –