Ho un file csv di grandi dimensioni in un frame di dati. I dati nel file csv provengono da più siti Web che rappresentano le informazioni dell'utente. Ad esempio, ecco la struttura del frame dei dati.Aggiungere una colonna dell'indice (ID numerico) al riquadro dati grande
user_id, number_of_logins, number_of_images, web
001, 34, 3, aa.com
002, 4, 4, aa.com
034, 3, 3, aa.com
001, 12, 4, bb.com
002, 1, 3, bb.com
034, 2, 2, cc.com
come si può vedere, una volta mi mettono i dati nella cornice di dati user_id non è un ID univoco, e questo fa sì che tutte le analisi. Sto cercando di aggiungere altre colonne prima di user_id
che è qualcosa come "generated_uid"
e praticamente uso l'indice dello data.frame
da riempire da quella colonna. Qual è il modo migliore per farlo.
un approccio semplice consiste nell'aggiungere nuova colonna con numeri crescenti: 'data.frame $ generated_uid <- 1: nrow (data.frame)' –