semplificata Struttura della tabella:Mysql GROUP BY e contano più le clausole WHERE
CREATE TABLE IF NOT EXISTS `hpa` (
`id` bigint(15) NOT NULL auto_increment,
`core` varchar(50) NOT NULL,
`hostname` varchar(50) NOT NULL,
`status` varchar(255) NOT NULL,
`entered_date` int(11) NOT NULL,
`active_date` int(11) NOT NULL,
PRIMARY KEY (`id`),
KEY `hostname` (`hostname`),
KEY `status` (`status`),
KEY `entered_date` (`entered_date`),
KEY `core` (`core`),
KEY `active_date` (`active_date`)
)
Per questo, ho la seguente query SQL che ammonta semplicemente tutti i record con lo stato definito.
SELECT core,COUNT(hostname) AS hostname_count, MAX(active_date) AS last_active
FROM `hpa`
WHERE
status != 'OK' AND status != 'Repaired'
GROUP BY core
ORDER BY core
Questa interrogazione è stata semplificata per rimuovere l'inner join ai dati non correlati e le colonne in più che non dovrebbe pregiudicare la questione.
MAX (giorno_attivo) è uguale per tutti i record di un particolare giorno e deve sempre selezionare il giorno più recente oppure consentire un offset da ORA(). (Si tratta di un campo unixtime)
voglio sia il conteggio di: (!! Status = stato 'OK' E = 'riparare')
e l'inverso ... conteggio di: (status = 'OK 'o status = 'riparare')
e la prima risposta diviso per il secondo, per 'percentage_dead'(probabilmente altrettanto veloce per fare in post processing)
della più recente giorno o un offset (- 86400 per ieri, ecc.)
La tabella contiene circa 500k di record e cresce di circa 5000 al giorno quindi una singola query SQL anziché il looping sarebbe davvero bella ..
Immagino che qualche IF creativo possa fare questo. La tua competenza è apprezzata.
EDIT: Sono aperto all'utilizzo di una query SQL diversa per i dati di oggi o per i dati di un offset.
MODIFICA: la query funziona, è abbastanza veloce, ma al momento non posso permettere agli utenti di ordinare sulla colonna percentuale (quella derivante da conteggi positivi e negativi). Questo non è uno stopper, ma permetto loro di ordinare tutto il resto. ORDER BY di questo:
SELECT h1.core, MAX(h1.entered_date) AS last_active,
SUM(CASE WHEN h1.status IN ('OK', 'Repaired') THEN 1 ELSE 0 END) AS good_host_count,
SUM(CASE WHEN h1.status IN ('OK', 'Repaired') THEN 0 ELSE 1 END) AS bad_host_count
FROM `hpa` h1
LEFT OUTER JOIN `hpa` h2 ON (h1.hostname = h2.hostname AND h1.active_date < h2.active_date)
WHERE h2.hostname IS NULL
GROUP BY h1.core
ORDER BY (bad_host_count/(bad_host_count + good_host_count)) DESC,h1.core
Mi dà: # 1247 - Riferimento 'bad_host_count' non supportato (riferimento alla funzione di gruppo)
EDIT: risolto per una diversa sezione. I seguenti lavori e mi permette di ORDER BY percentage_dead
SELECT c.core, c.last_active,
SUM(CASE WHEN d.dead = 1 THEN 0 ELSE 1 END) AS good_host_count,
SUM(CASE WHEN d.dead = 1 THEN 1 ELSE 0 END) AS bad_host_count,
(SUM(CASE WHEN d.dead = 1 THEN 1 ELSE 0 END) * 100/
((SUM(CASE WHEN d.dead = 1 THEN 0 ELSE 1 END))+(SUM(CASE WHEN d.dead = 1 THEN 1 ELSE 0 END)))) AS percentage_dead
FROM `agent_cores` c
LEFT JOIN `dead_agents` d ON c.core = d.core
WHERE d.active = 1
GROUP BY c.core
ORDER BY percentage_dead
Grazie Bill! Non posso testarlo subito, come ho fatto per il giorno. La prima parte che ottengo. Dovrò studiare il secondo per un po 'penso. :) –
In realtà è un tempo di memorizzazione storico int, non DATETIME. Fare la differenza? –
Ok, cambia il modo in cui si calcola l'offset, ma non la logica generale. Aggiungerò un esempio. –