So che esiste un modo semplice per farlo ... ma non riesco a capirlo.Dati aggregati in una colonna in base ai valori in un'altra colonna
Ho un dataframe nel mio script R che sembra qualcosa di simile:
A B C
1.2 4 8
2.3 4 9
2.3 6 0
1.2 3 3
3.4 2 1
1.2 5 1
Nota che A, B, e C sono i nomi delle colonne. E sto cercando di ottenere variabili come questa:
sum1 <- [the sum of all B values such that A is 1.2]
num1 <- [the number of times A is 1.2]
Qualsiasi modo semplice per fare questo? Io fondamentalmente voglio finire con un frame di dati che assomiglia a questo:
A num totalB
1.2 3 12
etc etc etc
Dove "num" è il numero di volte in quel particolare Un valore apparso, e "totalB" è la somma dei valori B dato il valore A
nel complesso, semplicemente usa tutte le righe nel mio frame di dati. e se volessi dire di aggregare solo per una particolare riga con una particolare condizione (es. quando c == 1) – CodeGuy
@CodeGuy: Semplicemente 'sottoinsieme ', ad es. 'Aggregata (B ~ A, sottoinsieme (df, C == 1), sum)' – NPE