Esiste una funzione panda per trasformare questi dati in modo che mostri le colonne come a, b, c, d, e o qualsiasi cosa si trovi all'interno del campo dati e le righe contano quante lettere ci sono.Transforming Pandas Dataframe
import pandas as pd
trans = pd.read_table('output.txt', header=None, index_col=0)
print trans
>>>
1 2 3 4
0
11 a b c NaN
666 a d e NaN
10101 b c d NaN
1010 a b c d
414147 b c NaN NaN
10101 a b d NaN
1242 d e NaN NaN
101 a b c d
411 c d e NaN
444 a b c NaN
invece voglio l'uscita per essere come questo:
a b c d e
0
11 1 1 1 NaN NaN
666 1 NaN NaN 1 1
La funzione .STACK() ottiene quasi fatto, ma nel formato sbagliato.
Bella. Molto meglio del mio tentativo (ora cancellato) di far funzionare get_dummies su un DataFrame. Mi piace molto l'idioma '' unstack(). Dropna() ''. –
Ho notato che avresti potuto lasciarlo, nessun danno nell'avere alcune opzioni. Sono ancora d'accordo con il tuo precedente commento che è meno bello (e leggibile) della soluzione 'pivot' da Roman. Il concetto di pivot è anche più noto, quindi ... 'get_dummies'. :) –