Il mio obiettivo è il confronto tra due colonne e aggiungere la colonna del risultato. R usa ifelse ma ho bisogno di conoscere la strada di Pandas.Equivalente di R/ifelse in Python/Pandas? Confronta le colonne di stringhe?
R
> head(mau.payment)
log_month user_id install_month payment
1 2013-06 1 2013-04 0
2 2013-06 2 2013-04 0
3 2013-06 3 2013-04 14994
> mau.payment$user.type <-ifelse(mau.payment$install_month == mau.payment$log_month, "install", "existing")
> head(mau.payment)
log_month user_id install_month payment user.type
1 2013-06 1 2013-04 0 existing
2 2013-06 2 2013-04 0 existing
3 2013-06 3 2013-04 14994 existing
4 2013-06 4 2013-04 0 existing
5 2013-06 6 2013-04 0 existing
6 2013-06 7 2013-04 0 existing
Pandas
>>> maupayment
user_id log_month install_month
1 2013-06 2013-04 0
2013-07 2013-04 0
2 2013-06 2013-04 0
3 2013-06 2013-04 14994
ho provato alcuni casi, ma non ha funzionato. Sembra che il confronto tra stringhe non funzioni.
>>>np.where(maupayment['log_month'] == maupayment['install_month'], 'install', 'existing')
TypeError: 'str' object cannot be interpreted as an integer
Potrebbe aiutarmi per favore?
Panda e versione numpy.
>>> pd.version.version
'0.16.2'
>>> np.version.full_version
'1.9.2'
Dopo l'aggiornamento delle versioni, ha funzionato!
>>> np.where(maupayment['log_month'] == maupayment['install_month'], 'install', 'existing')
array(['existing', 'install', 'existing', ..., 'install', 'install',
'install'],
dtype='<U8')