2015-09-16 18 views
10

Sto cercando di tracciare le date con valori come questo csv.è possibile tracciare timeline con matplotlib?

Tue 2 Jun 16:55:51 CEST 2015,3 
Wed 3 Jun 14:51:49 CEST 2015,3 
Fri 5 Jun 10:31:59 CEST 2015,3 
Sat 6 Jun 20:47:31 CEST 2015,3 
Sun 7 Jun 13:58:23 CEST 2015,3 
Mon 8 Jun 14:56:49 CEST 2015,2 
Tue 9 Jun 23:39:11 CEST 2015,1 
Sat 13 Jun 16:55:26 CEST 2015,2 
Sun 14 Jun 15:52:34 CEST 2015,3 
Sun 14 Jun 16:17:24 CEST 2015,3 
Mon 15 Jun 13:23:18 CEST 2015,1 
... 

sto facendo qualcosa di molto simile alla prima risposta qui: Matplotlib timelines

Ma è davvero difficile ottenere una buona conoscenza dei dati in cerca di quel tipo di visualizzazione. Poi mi rendo conto che nel tentativo di tracciare i periodi e che non ho bisogno di un significativo asse y, asse X solo con le date ed i valori possono essere colori

Qualcosa di simile a questo:

---===-===---**** 
DDDDDDDDDDDDDDDDD 

-=* = type of values (using colors for example, but any representation would do) 
D = dates 

I dont sembra di vedere qualcosa di simile guardando gli esempi matplotlib

colorbars sembra che potrebbe funzionare, ma non del tutto, dal momento che l'asse devono essere data intervalli http://matplotlib.org/examples/api/colorbar_only.html

risposta

12

ad esempio, è dati qualitativi in ​​modo da non vuoi usare un asse y spaziale?

enter image description here

da:

import matplotlib.pyplot as plt 
import pandas as pd 

dates = ["Tue 2 Jun 16:55:51 CEST 2015", 
"Wed 3 Jun 14:51:49 CEST 2015", 
"Fri 5 Jun 10:31:59 CEST 2015", 
"Sat 6 Jun 20:47:31 CEST 2015", 
"Sun 7 Jun 13:58:23 CEST 2015", 
"Mon 8 Jun 14:56:49 CEST 2015", 
"Tue 9 Jun 23:39:11 CEST 2015", 
"Sat 13 Jun 16:55:26 CEST 2015", 
"Sun 14 Jun 15:52:34 CEST 2015", 
"Sun 14 Jun 16:17:24 CEST 2015", 
"Mon 15 Jun 13:23:18 CEST 2015"] 

values = [3,3,3,3,3,2,1,2,3,3,1] 

X = pd.to_datetime(dates) 
fig, ax = plt.subplots(figsize=(6,1)) 
ax.scatter(X, [1]*len(X), c=values, 
      marker='s', s=100) 
fig.autofmt_xdate() 

# everything after this is turning off stuff that's plotted by default 

ax.yaxis.set_visible(False) 
ax.spines['right'].set_visible(False) 
ax.spines['left'].set_visible(False) 
ax.spines['top'].set_visible(False) 
ax.xaxis.set_ticks_position('bottom') 

ax.get_yaxis().set_ticklabels([]) 
day = pd.to_timedelta("1", unit='D') 
plt.xlim(X[0] - day, X[-1] + day) 
plt.show() 
+0

Ho aggiunto una risposta con quello che stavo cercando ... Ho ancora accettato il tuo perché questo è un esempio molto accurato e non ho trovato nulla di simile per le date nell'asse. Sarebbe bello se potesse essere cotto usando una libreria invece di disegnare tutto da solo :) –

+0

Se le biblioteche avessero tutto ciò che chiunque potrebbe volere, sarebbero comunque incredibilmente enormi. Se stai usando questo tipo di trama più di una volta, crea una funzione - passa args a 'scatter' (o le funzioni' draw' nella tua versione PIL). – cphlewis

11

EDIT: Dal momento che ho apprezzato ogni soluzione là fuori, ho cuocere il mio con PIL:

questo è il risultato:

Resulting visualisation

Questo è il codice:

#!/usr/bin/env python3 
from datetime import datetime, timedelta 
from dateutil.relativedelta import relativedelta 
import csv 
import matplotlib.pyplot as plt 
import matplotlib.dates as pltdate 
from PIL import Image, ImageDraw 

lines = [] 
with open('date') as f: 
    lines = list(csv.reader(f)) 
    frmt = '%a %d %b %X %Z %Y' 
    dates = [datetime.strptime(line[0], frmt) for line in lines] 
    data = [line[1] for line in lines] 

#datesnum = pltdate.date2num(dates) 
#fig, ax = plt.subplots() 
#ax.plot_date(datesnum, data, 'o') 

#plt.show() 

#generate image 
WIDTH, HEIGHT = 4000, 400 
BORDER = 70 
W = WIDTH - (2 * BORDER) 
H = HEIGHT - (2 * BORDER) 


colors = { '0': "lime", '1' : (255,200,200), '2' : (255,100,100), '3' : (255,0,0) } 

image = Image.new("RGB", (WIDTH, HEIGHT), "white") 
min_date = dates[0] 
max_date = datetime.now() 
#print(min_date) 
#print(max_date) 
interval = max_date - min_date 
#print(interval.days) 

#draw frame 
draw = ImageDraw.Draw(image) 
draw.rectangle((BORDER, BORDER, WIDTH-BORDER, HEIGHT-BORDER), fill=(128,128,128), outline=(0,0,0)) 

#draw circles 
circle_w = 10 
range_secs = W/interval.total_seconds() 
#print(range_secs) 
for i in range(len(dates)): 
    wat = dates[i] - min_date 
    offset_sec = (dates[i] - min_date).total_seconds() 
    offset = range_secs * offset_sec 
    x = BORDER + offset 
    draw.ellipse((x, BORDER + 50, x + circle_w, BORDER + 50 + circle_w), outline=colors[data[i]]) 
    #draw.text((x, BORDER + 75), str(i), fill=colors[data[i]]) 

#draw rectangles 
range_days = W/(interval.days + 1) 
#print("range_days",range_days) 
current_date = min_date 
date_month = min_date + relativedelta(months=1) 
current_index = 0 
for i in range(interval.days + 1): 
    max_color = '0' 
    while dates[current_index].date() == current_date.date(): 
     if int(data[current_index]) > int(max_color): 
      max_color = data[current_index] 
     current_index += 1 
     if current_index > len(dates) - 1: 
      current_index = 0 
    x = BORDER + range_days * i 
    draw.rectangle((x, BORDER + 100, x+range_days, BORDER + 100 + 50), fill=colors[max_color], outline=(0,0,0)) 
    if current_date == date_month: 
     draw.line((x, BORDER + 100 +50, x, H + BORDER + 20), fill="black") 
     draw.text((x, H + BORDER + 20), str(date_month.date()), fill="black") 
     date_month = date_month + relativedelta(months=1) 
    #draw.text((x, BORDER + 175), str(i), fill=colors[max_color]) 
    current_date = current_date + timedelta(days=1) 

#draw start and end dates 
draw.text((BORDER, H + BORDER + 20), str(min_date.date()), fill="black") 
draw.text((BORDER + W, H + BORDER + 20), str(max_date.date()), fill="black") 

image.save("date.png") 
Problemi correlati