Eseguiamo un gruppo di script di test Python su un gruppo di stazioni di test. Gli script di test si interfacciano con unità hardware su queste stazioni di test, quindi siamo bloccati a eseguire uno script di test alla volta per stazione (non possiamo virtualizzare tutto). Abbiamo creato uno strumento per assegnare test a diverse stazioni e riportare i risultati dei test: questo ci consente di mettere in coda migliaia di test e lasciarli funzionare durante la notte, o per un periodo di tempo qualsiasi.Test del selenio per selenio in Python che causano "un errore grave" durante l'esecuzione in grandi lotti su Windows XP
Occasionalmente, ciò che abbiamo scoperto è che le stazioni di test abbandoneranno il cluster. Quando accedo in remoto a loro, ottengo uno schermo nero, quindi si riavviano, quindi al momento dell'accesso mi viene comunicato che Windows XP ha avuto un "errore grave". Il registro eventi contiene un record di questo errore, che indica Category: (102)
e Event ID: 1003
.
In precedenza, abbiamo scoperto che questo era causato dalla creazione di centinaia di profili temporanei di Firefox: i nostri test utilizzavano il selenio per automatizzare le interazioni con i siti Web e ogni volta che avviavamo un nuovo browser, veniva creato un profilo temporaneo di Firefox. Abbiamo aggiunto un passaggio nella pulizia tra ogni test che svuota questi profili temporanei di Firefox, ma stiamo ancora scoprendo che le stazioni abbandonano qualche volta, e sempre con questo grave errore e registrano nel registro eventi.
Vorrei trovare la causa principale di questo problema, ma non so come procedere. Ho provato a cercare informazioni su come leggere le voci del registro degli eventi, ma non ho trovato nulla che aiuti. Sono aperto a qualsiasi suggerimento su come risolvere il problema.
1003 significa semplicemente la macchina BSODed, almeno in base a ciò che ho trovato. Il primo parametro è il codice di errore, che dovrebbe iniziare per aiutarti a restringere cosa sta succedendo. Cerca anche eventi di accompagnamento 1001, in quanto i documenti suggeriscono che ulteriori informazioni pertinenti possono essere trovate lì frequentemente. –
Grazie. Ok, ho trovato gli eventi 1001, che sono i dump di salvataggio. Ho scaricato, installato ed eseguito il programma dumpchk.exe che stampa su una pagina di "Analisi Dump Mini kernel a 32 bit" con sezioni DUMP_HEADER32, TRIAGE_DUMP32, informazioni sul kernel e moduli Scaricati. Sfortunatamente non ha senso per me. – Nathan
Puoi pubblicare un dump di esempio su pastebin o qualcosa del genere? Inoltre, in che modo esattamente la radice ha causato i profili temporali? Stavi compilando l'HDD? Colpire un errore di I/O o un settore di unità danneggiati o qualcosa del genere? A corto di memoria? –