Al fine di risparmiare larghezza di banda e in modo da non avere generare immagini/Grafico noi stessi Ho intenzione di utilizzare Google API di creazione di grafici:Grafico tracciato: mantenere solo i dati più rilevanti
http://code.google.com/apis/chart/
che funziona con la semplice emissione un (potenzialmente lungo) GET (o un POST) e poi Google genera e fornisce il grafico stesso.
A partire da ora ho grafici composti da circa duemila voci e vorrei ridurlo a un numero arbitrario di voci (ad esempio mantenendo solo il 50% delle voci originali o il 10% del voci originali).
Come posso decidere quali voci dovrei conservare in modo da avere il mio nuovo grafico il più vicino al grafico originale?
Si tratta di un problema di adattamento alla curva?
Nota che so che posso fare POST per Chart API di Google con fino a 16K di dati e di questo può essere sufficiente per le mie esigenze, ma io sono ancora curioso
No, questo non mantiene il nuovo grafico più vicino all'originale. In effetti, potresti perdere tutti i dati rilevanti (che possono essere solo un segmento di punti X). Se l'OP significa fare seri "dati rilevanti", questa non è la soluzione. –
A quale delle due soluzioni sopra menzionate fa riferimento? Intervallo di sottocampionamento/decimazione o di tracciamento? –
In entrambi si sta semplicemente modificando i dati, che, almeno per gli statistici, è sempre un no-no, perché i punti "non sono veri e propri punti di dati". Se vuoi mantenere lo "spirito" del grafico, questi metodi non lo faranno, hai bisogno di un approccio più intelligente. Se, tuttavia, la fedeltà dei dati non è importante per l'OP, allora sì, questo semplice metodo farà. –