Ok, così ho cercato un sacco e si desidera eseguire arules sui dati di vendita. Ho solo bisogno di ottenere correttamente i dati nel formato giusto e impostare con i "fattori" o "variabili" corretti e in forma di cesto.Come per preparare i dati delle transazioni in cestino per arules
In questo momento ho i dati di vendita con l'Ordine # e poi gli elementi all'interno che. Ogni ordine è unico (ogni nuovo ordine, un nuovo # viene creato e include la parte #), ma gli stessi articoli possono ovviamente apparire in molti ordini.
Al momento, la mia tecnica è impostata in questo modo:
Order# Part# PartDescription
1 A PartA 1 B PartB 1 G PartG 2 R PartR 3 A PartA 3 B PartB 4 E PartE 5 Y PartY 6 A PartA 6 B PartB 6 F PartF 6 V PartV
Quindi, R non piace in questa forma, e devo farlo nella forma che arules e analisi dei dati accetterà.
Sì, lo salvi come un file di testo e ho provato un file .csv, ma se riesco a ottenere istruzioni passo passo su come prepararlo o manipolarlo in RStudio sarebbe fantastico.
ho letto che si supponga di essere in una forma cestino come ..
1 (A, B, G)
2 (R)
3 (A, B)
4 (E)
5 (Y)
6 (A, B, F, V)
Se questo non è accurata per favore correggetemi. Ho un'idea ma ho solo bisogno di istruzioni passo passo che non riesco a trovare da nessuna parte. Ho provato a usare dplyr e tidyr. Ho una buona conoscenza dell'analisi dei dati, ma ho bisogno di un aiuto più diretto su RStudio, quindi se potessi farlo passo dopo passo lo capirò ulteriormente.
Ho anche il plugin di data mining per Excel, quindi se posso fare qualsiasi preparazione in là fammi sapere. Grazie. – V1k1
Suppongo che tu abbia almeno i dati caricati in r come data.frame? In caso contrario, provare a 'data <- read.csv ("myfile.csv", comment.char = "")' – jeremycg
ho semplicemente cliccato su "Importa set di dati" e la risposta di seguito fino ad ora sta mettendo i miei dati nel formato corretto cestino. Devo caricarlo in r come data.frame per evitare ulteriori problemi? In quale modo preciso dovrei caricarlo in r? È un file di testo di Excel, dovrebbe essere .csv? Mio padre appare nelle colonne/righe corrette.Quali impostazioni di importazione dovrei selezionare? Grazie! – V1k1