Attualmente sto interrogando i dati in dataframe tramite il comando pandas.io.sql.read_sql()
. Volevo parallelizzare le chiamate simile a quello che questi ragazzi è a favore: (Embarrassingly parallel database calls with Python (PyData Paris 2015))Parallelizzazione chiamate database database Pyodbc pandas
Qualcosa di simile (molto generale):
pools = [ThreadedConnectionPool(1,20,dsn=d) for d in dsns]
connections = [pool.getconn() for pool in pools]
parallel_connection = ParallelConnection(connections)
pandas_cursor = parallel_connection.cursor()
pandas_cursor.execute(my_query)
è qualcosa di simile possibile?
qual è il tipo di database SQL e il driver, e supportano le chiamate multi-thread? – denfromufa
utilizza MS sql server, supporta le chiamate multi-thread – user1129988
non è sicuro di pyodbc, ma dal 2013 pymssql sembra essere thread-safe per multi-threading: http://pymssql.org/en/latest/changelog.html? evidenziare = filettatura – denfromufa