Lasciate che vi faccia un esempio:"Top 20% delle persone che guadagnano l'80% dei soldi" ... questo tipo di risultato utilizzando R
person | salary
----------------
1 | 30'000
2 | 10'000
3 | 15'000
4 | 25'000
5 | 80'000
6 | 56'000
... | ...
I passi da compiere per arrivare a questo risultato sarebbe essere per ordinare i salari e quindi creare una nuova tabella dando la condivisione di righe/persone dall'inizio fino alla riga rispettiva e la quota della somma degli stipendi dall'inizio fino alla riga corrispondente (dei salari totali).
Quindi basta prendere la riga più vicina al 20% per le persone e sappiamo quanto guadagnano.
Questa è una domanda piuttosto standard - ma poiché non so come fare riferimento ad esso verbalmente non posso google.
Quindi mi piacerebbe se qualcuno potesse dirmi cosa "chiamare questo" e come calcolare e tracciare questo in R il più semplice - quindi niente loop e roba. La mia intuizione mi dice che ci sono almeno 5 pacchetti e 10 funzioni che affrontano questo scenario. Forse qualcosa di simile a summary() con quantili fissi.
Quindi supponiamo che la tabella qui sopra per essere disponibile come un frame di dati:
salaries <- data.frame(person = c(1,2,3,...), salary = c(30000,...))
Si noti che il 20% delle persone in genere guadagna il 20% del denaro. È il * top * 20% che probabilmente ne fa di più. Il tuo corpo di domande sembra chiedere il 20% in più, ma il titolo della tua domanda è un po 'fuorviante. –
La cosiddetta regola "80-20" è un'istanza specifica di una [distribuzione della legge di alimentazione] (https://en.wikipedia.org/wiki/Power_law). [Questo post] (http://tuvalu.santafe.edu/~aaronc/powerlaws/) ha alcune informazioni interessanti su diverse lingue, tra cui R. C'è anche un pacchetto R, [poweRlaw] (http: //cran.r -project.org/web/packages/poweRlaw/index.html), che non mi è familiare, ma è evidentemente scritto dall'utente CV @csgillespie. – gung