2015-01-29 12 views
7

Devo scoprire per ogni modo (valore per una riga, non una colonna) valore ottenuto, quante volte appare nella sua riga dai miei dati.Numero conteggio R di volte in cui compare un valore in ciascuna riga

Questo è il mio dati

> head(TiposMotivA) 
    Q1 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10 Q11 Q12 Q13 Q14 Q15 Q16 Q17 Q18 Q19 Q20 Q21 
1 5 4 4 4 6 6 7 6 4 6 6 6 4 4 4 4 6 7 4 4 6 
2 5 4 4 5 5 5 5 5 5 5 7 5 4 3 1 6 6 5 6 7 7 
3 4 5 4 4 5 4 5 4 5 4 5 4 5 4 5 4 5 4 5 4 5 
4 5 5 7 7 4 6 6 6 7 7 6 7 7 6 6 7 4 7 6 6 7 
5 6 1 7 6 7 7 7 7 7 7 6 7 2 2 3 6 3 7 7 7 7 
6 4 4 3 3 4 5 4 3 4 7 6 6 4 4 6 4 5 7 6 6 7 

dput da questo dataset

dput(head(TiposMotivA)) 
    structure(list(Q1 = c(5L, 5L, 4L, 5L, 6L, 4L), Q2 = c(4L, 4L, 
    5L, 5L, 1L, 4L), Q3 = c(4L, 4L, 4L, 7L, 7L, 3L), Q4 = c(4L, 5L, 
    4L, 7L, 6L, 3L), Q5 = c(6L, 5L, 5L, 4L, 7L, 4L), Q6 = c(6L, 5L, 
    4L, 6L, 7L, 5L), Q7 = c(7L, 5L, 5L, 6L, 7L, 4L), Q8 = c(6L, 5L, 
    4L, 6L, 7L, 3L), Q9 = c(4L, 5L, 5L, 7L, 7L, 4L), Q10 = c(6L, 
    5L, 4L, 7L, 7L, 7L), Q11 = c(6L, 7L, 5L, 6L, 6L, 6L), Q12 = c(6L, 
    5L, 4L, 7L, 7L, 6L), Q13 = c(4L, 4L, 5L, 7L, 2L, 4L), Q14 = c(4L, 
    3L, 4L, 6L, 2L, 4L), Q15 = c(4L, 1L, 5L, 6L, 3L, 6L), Q16 = c(4L, 
    6L, 4L, 7L, 6L, 4L), Q17 = c(6L, 6L, 5L, 4L, 3L, 5L), Q18 = c(7L, 
    5L, 4L, 7L, 7L, 7L), Q19 = c(4L, 6L, 5L, 6L, 7L, 6L), Q20 = c(4L, 
    7L, 4L, 6L, 7L, 6L), Q21 = c(6L, 7L, 5L, 7L, 7L, 7L)), .Names = c("Q1", 
    "Q2", "Q3", "Q4", "Q5", "Q6", "Q7", "Q8", "Q9", "Q10", "Q11", 
    "Q12", "Q13", "Q14", "Q15", "Q16", "Q17", "Q18", "Q19", "Q20", 
    "Q21"), row.names = c(NA, 6L), class = "data.frame") 

Queste sono le modalità per ogni riga

[1] "4" "5" "4" "7" "7" "4" "7" "6" "7" "7" "7" "7" "7" 
    [14] "5" "7" "6" "7" "6" "7" "7" "7" "7" "7" "7" "7" "7" 
    [27] "7" "7" "7" "5" "2" "7" "7" "7" "7" "7" "6" "6" "7" 
    [40] "4" "3" "4" "7" "5" "6" "7" "7" "6" "7" "6" "7" "7" 
    [53] "7" "6" "7" "7" "5" "7" "7" "7" "7" "7" 


> 

dput per questo uno

dput (ModaLinhaA) c ("4", "5", "4", "7", "7", "4", "7", "6", "7", "7", " 7 "," 7 ", " 7 "," 5 "," 7 "," 6 "," 7 "," 6 "," 7 "," 7 "," 7 "," 7 "," 7 "," 7 "," 7 ", " 7 "," 7 "," 7 "," 7 "," 5 "," 2 "," 7 "," 7 "," 7 "," 7 " , "7", "6", "6", "7", "4", "3", "4", "7", "5", "6", "7", "7", "6", "7", "6", "7", "7", "7", "6", "7", "7", "5", "7", "7", " 7 "," 7 "," 7 ")

Ora ho bisogno di contare quante volte ciascuna modalità appare in ogni riga. La risposta dovrebbe essere qualcosa di simile:

Row Mode Qt 
    1  4 10 
    2  5 10 
    3  4 11 

risposta

5

assumendo che TiposMotivA e ModaLinhaA avere la stessa lunghezza (che credo sia il caso nella vostra piena set di dati):

data.frame(Row = 1:nrow(TiposMotivA), 
      Mode = ModaLinhaA, 
      Qt = rowSums(TiposMotivA == rep(ModaLinhaA,ncol(TiposMotivA)))) 
+0

Perfect RockScience, molte grazie! –

+0

@RockScience Penso che potresti semplificarlo con 'TiposMotivA == ModaLinhaA [row (TiposMotivA)]' o 'TiposMotivA == rep (ModaLinhaA, ncol (TiposMotivA))' – akrun

+0

@akrun infatti, ho modificato la risposta per il tuo suggerimento (anche se rende un po 'più confuso per qualcuno che non sa come la matrice sia costruita in R) – RockScience

3

È possibile scrivere una semplice funzione per contare il numero più comune in un vettore e poi applicarlo a ogni riga con apply().

Nota: ho utilizzato @Ken_William awesome function for determining the mode of a vector nel seguente codice.

Mode <- function(x) { # @Ken_Williams's formula for mode 
    ux <- unique(x) 
    ux[which.max(tabulate(match(x, ux)))] 
} 

TiposMotivA$Qt <- apply(TiposMotivA, 1, function(x) sum(x == Mode(x))) 

sum(x == Mode(x)) sta prendendo la somma del vettore logica restituito da x == Mode(x). I valori TRUE contano come 1 e i valori FALSE contano come zero, quindi la somma del vettore sarà il conteggio della voce modale.

+0

Perfetto Ribo, molte grazie! Ha fatto il trucco. –

+0

Siete i benvenuti. –

Problemi correlati