Ho familiarità con i titolari di dati R come vettori, dataframe, ecc. Ma ho bisogno di fare qualche analisi del testo e sembra che Python abbia delle buone impostazioni per farlo. La mia domanda è dove posso trovare una spiegazione di come Python trattiene i dati.Passando a Python da R, qual è l'equivalente python di un frame di dati?
In particolare, ho un set di dati in un file separato da tabulazioni in cui il testo si trova nella terza colonna e il punteggio dei dati di cui ho bisogno si trova nella quarta colonna.
id1 id2 text score
123 889 "This is the text I need to read..." 88
234 778 "This is the text I need to read..." 78
345 667 "This is the text I need to read..." 91
In R avevo appena caricarlo in una cornice di dati denominato df1
e quando ho voluto chiamare una colonna userei df1 $ testo o df1[,3]
e se volevo una cella specifica che potevo usare df1[1,3]
.
Mi viene un'idea di come leggere i dati in python ma non come gestire strutture simili a tabelle.
Come suggeriresti di lavorare con questo per un principiante di Python?
Python non ha equivalenti al il frame dati –
@DavidHeffernan Che dire di quello [panda] (http://pandas.pydata.org/) roba? Non è questo (destinato a essere) vicino? – joran
@joran Questa è la terza parte. Suppongo che volevo dire che non c'è nulla di integrato nel modo in cui il frame di dati R è integrato. –