Devo scaricare i dati dai set di dati SAS. Ho trovato un modulo Python chiamato sas7bdat.py che dice che può leggere i dataset SAS .sas7bdat, e penso che sarebbe più semplice e più semplice fare il progetto in Python piuttosto che SAS a causa delle altre funzionalità richieste. Tuttavia, l'aiuto (sas7bdat) in Python interattivo non è molto utile e l'unico esempio sono stato in grado di trovare il dump di un insieme di dati è la seguente:Utilizzo del modulo Python sas7bdat
import sas7bdat
from sas7bdat import *
# following line is sas dataset to convert
foo = SAS7BDAT('/support/sas/locked_data.sas7bdat')
#following line is txt file to create
foo.convertFile('/support/textfiles/locked_data.txt','\t')
Questo non fa quello che voglio perché a) usa i nomi delle variabili SAS come intestazioni di colonna e ho bisogno di usare le etichette delle variabili, e b) usa "nan" per indicare valori numerici mancanti dove preferisco lasciare il valore vuoto.
Qualcuno può indicarmi qualche documentazione utile sui metodi inclusi in sas7bdat.py? Ho cercato su Google ogni permutazione di parole chiave a cui avrei potuto pensare, senza fortuna. In caso contrario, qualcuno può darmi un esempio o due di utilizzo di readColumnAttributes(), readColumnLabels() e/o readColumnNames()?
Grazie, tutto.
Non tutti hanno accesso a SAS - è sufficiente sborsare diverse migliaia di dollari per utente per questa soluzione. Ahia! Se si stanno elaborando i dati in Python comunque, l'uso di una libreria python per caricare i dati minimizza anche le dipendenze del software e rende possibile automatizzare l'elaborazione su molti set di dati SAS. – user48956