2013-02-07 14 views
6

Eseguiamo un gruppo di script di test Python su un gruppo di stazioni di test. Gli script di test si interfacciano con unità hardware su queste stazioni di test, quindi siamo bloccati a eseguire uno script di test alla volta per stazione (non possiamo virtualizzare tutto). Abbiamo creato uno strumento per assegnare test a diverse stazioni e riportare i risultati dei test: questo ci consente di mettere in coda migliaia di test e lasciarli funzionare durante la notte, o per un periodo di tempo qualsiasi.Test del selenio per selenio in Python che causano "un errore grave" durante l'esecuzione in grandi lotti su Windows XP

Occasionalmente, ciò che abbiamo scoperto è che le stazioni di test abbandoneranno il cluster. Quando accedo in remoto a loro, ottengo uno schermo nero, quindi si riavviano, quindi al momento dell'accesso mi viene comunicato che Windows XP ha avuto un "errore grave". Il registro eventi contiene un record di questo errore, che indica Category: (102) e Event ID: 1003.

In precedenza, abbiamo scoperto che questo era causato dalla creazione di centinaia di profili temporanei di Firefox: i nostri test utilizzavano il selenio per automatizzare le interazioni con i siti Web e ogni volta che avviavamo un nuovo browser, veniva creato un profilo temporaneo di Firefox. Abbiamo aggiunto un passaggio nella pulizia tra ogni test che svuota questi profili temporanei di Firefox, ma stiamo ancora scoprendo che le stazioni abbandonano qualche volta, e sempre con questo grave errore e registrano nel registro eventi.

Vorrei trovare la causa principale di questo problema, ma non so come procedere. Ho provato a cercare informazioni su come leggere le voci del registro degli eventi, ma non ho trovato nulla che aiuti. Sono aperto a qualsiasi suggerimento su come risolvere il problema.

+0

1003 significa semplicemente la macchina BSODed, almeno in base a ciò che ho trovato. Il primo parametro è il codice di errore, che dovrebbe iniziare per aiutarti a restringere cosa sta succedendo. Cerca anche eventi di accompagnamento 1001, in quanto i documenti suggeriscono che ulteriori informazioni pertinenti possono essere trovate lì frequentemente. –

+0

Grazie. Ok, ho trovato gli eventi 1001, che sono i dump di salvataggio. Ho scaricato, installato ed eseguito il programma dumpchk.exe che stampa su una pagina di "Analisi Dump Mini kernel a 32 bit" con sezioni DUMP_HEADER32, TRIAGE_DUMP32, informazioni sul kernel e moduli Scaricati. Sfortunatamente non ha senso per me. – Nathan

+0

Puoi pubblicare un dump di esempio su pastebin o qualcosa del genere? Inoltre, in che modo esattamente la radice ha causato i profili temporali? Stavi compilando l'HDD? Colpire un errore di I/O o un settore di unità danneggiati o qualcosa del genere? A corto di memoria? –

risposta

0

Ho riscontrato problemi simili prima con Firefox. Le rare volte in cui siamo riusciti a catturare una macchina in flagrante non era solo la chiusura delle sessioni del browser. Da qui il BSOD alla fine. Ovviamente questo era un bug in entrambi i webdriver, firefox o XP (che stavamo usando anche). L'abbiamo risolto uccidendo in modo aggressivo ogni processo firefox tra ogni singolo test. Questo ha funzionato per noi. E poiché non esegui test in parallelo, potrebbe funzionare anche per te. Con aggressività intendo metterci un'ascia. L'equivalente di Windows di killall -9 firefox. Perché queste sessioni non rispondevano.

Per quanto riguarda la causa principale? Il problema non si è verificato con versioni specifiche di Firefox. Ma non siamo mai riusciti a eseguirne il debug in modo corretto. Il debugging è stato molto difficile perché non era riproducibile in brevi sessioni di test e una volta che il problema si è verificato, ha causato un arresto anomalo.

Problemi correlati