Si basa su this question. Sono state proposte diverse risposte che generano distribuzioni non uniformi e ho iniziato a chiedermi come quantificare la non uniformità dell'output. Non sto cercando problemi di modellatura, solo aspetti a valore singolo.Come quantificare la qualità di un generatore di numeri pseudocasuali?
Quali sono le procedure accettate?
Il mio pensiero attuale è quella di computer media Shannon entropy per chiamata calcolando l'entropia di ogni valore e prendendo una media ponderata. Questo può quindi essere compilato al valore previsto.
Le mie preoccupazioni sono
- È corretto?
- Come calcolare questi valori senza perdere la precisione?
Per # 1 Mi chiedo se ho corretto.
Per il n. 2 la preoccupazione è che elaborerei numeri con grandezze come 1/7 +/- 1e-18 e sono preoccupato che gli errori in virgola mobile mi uccidano per qualsiasi problema tranne i più piccoli. La forma esatta del calcolo potrebbe comportare alcune importanti differenze qui e mi sembra di ricordare che ci sono alcune opzioni ASM per alcuni casi di log speciali ma non riesco a trovare i documenti su questo.
In questo caso l'uso è prendere un PRNG "buono" per la gamma [1,n]
e generare uno SRNG per la gamma [1,m]
. La domanda è quanto peggio sono i risultati rispetto all'input?
Quello che ho è previsto tassi di occorrenza per ogni valore di uscita.
non quantificabile e se ottengo 0,25000000001 percento in un secchio l'occhio non lo vedrà mai. – BCS