Il problema: un sito Web che sto cercando di raccogliere i dati dagli usi Javascript per produrre un grafico. Mi piacerebbe essere in grado di estrarre i dati che vengono utilizzati nel grafico, ma non sono sicuro da dove iniziare. Ad esempio, i dati potrebbero essere i seguenti:Come posso analizzare le variabili Javascript usando python?
var line1=
[["Wed, 12 Jun 2013 01:00:00 +0000",22.4916114807,"2 sold"],
["Fri, 14 Jun 2013 01:00:00 +0000",27.4950008392,"2 sold"],
["Sun, 16 Jun 2013 01:00:00 +0000",19.5499992371,"1 sold"],
["Tue, 18 Jun 2013 01:00:00 +0000",17.25,"1 sold"],
["Sun, 23 Jun 2013 01:00:00 +0000",15.5420341492,"2 sold"],
["Thu, 27 Jun 2013 01:00:00 +0000",8.79045295715,"3 sold"],
["Fri, 28 Jun 2013 01:00:00 +0000",10,"1 sold"]];
Dati di prezzo (Data, Prezzo, Volume). Ho trovato un'altra domanda qui - Parsing variable data out of a js tag using python - che suggerisce di utilizzare JSON e BeautifulSoup, ma non sono sicuro di come applicarlo a questo particolare problema perché la formattazione è leggermente diversa. In effetti, in questo problema il codice sembra più simile a qualsiasi tipo di formato di dizionario JSON.
Suppongo che potrei leggerlo come una stringa, quindi utilizzare XPATH e alcune stringhe funky per convertirlo, ma questo sembra troppo lavoro per qualcosa che è già formattato come variabile Javascript.
Quindi, cosa posso fare qui per estrarre questo tipo di dati organizzati da questa variabile durante l'utilizzo di python? (Mi è più familiare con pitone e BS4)
tranne l'interruzione di riga dopo '=' e la parola chiave 'var', il resto è valida in python –
è che il codice vero e proprio? o è una variabile chiamata 'line1' che è una lista di liste? Se è quest'ultimo, si può 'per la lista in linea1: do_something_with (lista [0], lista [1], lista2])' – IPDGino
È una variabile chiamata linea1, che è parte del contenuto della pagina in caricamento, ed è una lista di liste. –