Scrittura di pandi DataFrame in Excel con diversi formati per diverse colonne

Sto provando a scrivere un panda DataFrame in un file .xlsx in cui diverse colonne numeriche avrebbero formati diversi. Ad esempio, alcuni mostrerebbero solo due cifre decimali, alcuni non mostrerebbero nessuno, alcuni sarebbero formattati come percentuali con un simbolo "%", ecc.Scrittura di pandi DataFrame in Excel con diversi formati per diverse colonne

Ho notato che DataFrame.to_html() ha un parametro formatters che consente di fare proprio questo , mappando diversi formati a diverse colonne. Tuttavia, non esiste un parametro simile nel metodo DataFrame.to_excel(). Il massimo che abbiamo è un float_format globale per tutti i numeri.

Ho letto molti SO messaggi che sono almeno in parte legati alla mia domanda, per esempio:

Use the older openpyxl engine to apply formats one cell at a time. Questo è l'approccio con il quale ho avuto il maggior successo. Ma significa scrivere loop per applicare formati cella per cella, ricordare offset, ecc.
Render percentages by changing the table data itself into strings. Il percorso di modifica dei dati effettivi mi ha spinto a provare a gestire la formattazione delle cifre decimali chiamando round() in ogni colonna prima di scrivere in Excel, anche se questo funziona, ma vorrei evitare di alterare i dati.
altri assortiti, per lo più su formati di data

Ci sono altri più conveniente funzioni di Excel correlate/proprietà nella API di panda che possono aiutare qui, o qualcosa di simile su openpyxl, o forse qualche modo per specificare il formato di output metadati direttamente su ogni colonna nello DataFrame che sarebbero poi interpretati a valle da diversi outputter?

fonte

2015-04-30 sparc_spread

E la rimozione di TUTTI i formati? Qualcuno sa se c'è un modo rapido per farlo? – Lisle

Si può fare questo con i panda 0,16 e il motore XlsxWriter accedendo la cartella di lavoro e del foglio di lavoro oggetti sottostanti:

import pandas as pd 

# Create a Pandas dataframe from some data. 
df = pd.DataFrame(zip(
    [1010, 2020, 3030, 2020, 1515, 3030, 4545], 
    [.1, .2, .33, .25, .5, .75, .45], 
    [.1, .2, .33, .25, .5, .75, .45], 
)) 

# Create a Pandas Excel writer using XlsxWriter as the engine. 
writer = pd.ExcelWriter('test.xlsx', engine='xlsxwriter') 
df.to_excel(writer, sheet_name='Sheet1') 

# Get the xlsxwriter objects from the dataframe writer object. 
workbook = writer.book 
worksheet = writer.sheets['Sheet1'] 

# Add some cell formats. 
format1 = workbook.add_format({'num_format': '#,##0.00'}) 
format2 = workbook.add_format({'num_format': '0%'}) 
format3 = workbook.add_format({'num_format': 'h:mm:ss AM/PM'}) 

# Set the column width and format. 
worksheet.set_column('B:B', 18, format1) 

# Set the format but not the column width. 
worksheet.set_column('C:C', None, format2) 

worksheet.set_column('D:D', 16, format3) 

# Close the Pandas Excel writer and output the Excel file. 
writer.save()

uscita:

enter image description here