Ho bisogno di riorganizzare i dati da un file CSV che contiene per lo più dati ripetuti. Ho i dati importati in R in un dataframe ma sto avendo problemi con il seguente:Riorganizzazione dei dati da 3 righe a 1
ID Language Author Keyword
12 eng Rob COLOR=Red
12 eng Rob SIZE=Large
12 eng Rob DD=1
15 eng John COLOR=Red
15 eng John SIZE=Medium
15 eng John DD=2
Che cosa devo fare è trasformare questo in una riga con ogni parola chiave in una colonna separata
ID Language Author COLOR SIZE DD
12 eng Rob Red Large 1
Qualche idea?
Sono in grado di farlo funzionare ma dopo l'esecuzione di dcast() viene visualizzato un errore che dice: Funzione di aggregazione mancante: default alla lunghezza. Quindi ottengo un 1 in ognuna delle nuove variabili. Immagino che nel set di dati reale ci debba essere qualcosa che non è giusto in quanto funziona bene con questo set di dati semplificato. Qualche idea? – Ray
Sembra che abbia numeri ineguali da qualche parte. Hai bisogno di capire come trovare l'ID con più di 3 righe e pulirlo. – Ray
Si otterrebbe questo avviso se c'è una combinazione di 'ID',' Lingua', 'Autore' e' Nome' che appare più di una volta. Puoi dire quale è/quelli che sono cercando un valore diverso da 1 nel risultato (in sostanza, quando ci sono più valori per una combinazione, la risagoma li aggregherà in un singolo valore in qualche modo, e per impostazione predefinita, che in qualche modo sta contando quanti ce ne sono). –