2012-06-19 10 views
8

Il messaggio di errore ho ottenuto è statodati troncati per la colonna 'url' a riga 1 - Errore con la programmazione con Python Django

Traceback (most recent call last): 
    File "./test.py", line 416, in <module> 
    startup() 
    File "./test.py", line 275, in startup 
    writer.save(r,data) 
    File "/home/user/project/test/output.py", line 91, in save 
    self.save_doc(r, data, pid) 
    File "/home/user/project/test/output.py", line 130, in save_doc 
    cursor.execute(dbquery) 
    File "/usr/local/lib/python2.6/site-packages/django/db/backends/util.py", line 34, in execute 
    return self.cursor.execute(sql, params) 
    File "/usr/local/lib/python2.6/site-packages/django/db/backends/mysql/base.py", line 86, in execute 
    return self.cursor.execute(query, args) 
    File "/usr/local/lib/python2.6/site-packages/MySQL_python-1.2.3c1-py2.6-linux-x86_64.egg/MySQLdb/cursors.py", line 175, in execute 
    File "/usr/local/lib/python2.6/site-packages/MySQL_python-1.2.3c1-py2.6-linux-x86_64.egg/MySQLdb/cursors.py", line 89, in _warning_check 
_mysql_exceptions.Warning: Data truncated for column 'url' at row 1 

La prima cosa che avrei fatto il check è che se la stringa URL è più lunga della lunghezza del campo , ma in realtà è molto più breve. Database Design

+----------+-------------------------------------------------------------------+ 
| Database | Create Database             | 
+----------+-------------------------------------------------------------------+ 
| myurlcol | CREATE DATABASE `myurlcol` /*!40100 DEFAULT CHARACTER SET utf8 */ | 
+----------+-------------------------------------------------------------------+ 

Struttura tabella

CREATE TABLE `document` (
    `id` int(11) NOT NULL auto_increment, 
    `url` varchar(255) collate utf8_bin NOT NULL, 
    `md5` varchar(32) collate utf8_bin NOT NULL, 
    `host` varchar(255) collate utf8_bin default NULL, 
    `content_sha1` varchar(40) collate utf8_bin NOT NULL, 
    `add_date` datetime NOT NULL, 
    PRIMARY KEY (`id`), 
    UNIQUE KEY `url` (`url`), 
    UNIQUE KEY `md5` (`md5`), 
    KEY `main_crawl_document_content_sha1` (`content_sha1`), 
    KEY `main_crawl_document_discover_date` (`add_date`), 
    KEY `main_crawl_document_host` (`host`), 
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE=utf8_bin; 

stampo le lunghezze dei dati che sto cercando di inserire nella tabella (sto testando utilizzando un solo URL):

len(url) = 89 
len(md5) = 32 
len(host) = 20 
len(content_sha1) = 40 
len(add_date) = 19 

Stavo usando un cursore creato da Django.db.connection. Per essere più informativo, incollo il comando completo query di database sono passato a cursor.execute()

INSERT INTO main_document SET url='ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/0a/39/Arthritis_Res_2000_Jun_5_2%284%29_315-326.tar.gz',md5='b6ba3adde8de87e4dc255092b04d07ea',host='ftp.ncbi.nlm.nih.gov',content_sha1='9aeab4412cc9b1add84a6d2bca574664e193b56e',add_date='2012-05-15 00:00:00'; 

La cosa divertente è che, il comando sopra funziona quando copio e incollato alla riga di comando di MySQL. Nessun messaggio di errore e i dati sono stati inseriti correttamente.

Cosa non va?

+0

È un avviso, non un errore. –

+0

@Secator potrebbe essere un avviso MySQL, ma restituisce un errore Python. Immagino che non potresti vederlo fino alla modifica, che lo cancella. – Jordan

+2

Grazie per aver lasciato commenti, ma qui ci sono le mie domande: (1) come rimuovere questi avvisi. (2) se devo tenerli, come ignorarli e lasciare che i dati vengano scritti nel database. In questo momento, i dati non sono scritti nel database. – fanchyna

risposta

0

Si consiglia di provare urllib.unquote(url) per unquote la stringa di URL prima di inserirla nel db. L'indicatore di carattere preventivo%, che si verifica nella stringa, è un special character per MySQL e potrebbe manipolare la transazione.

vostro inserto dovrebbe leggere:

INSERT INTO main_document SET url='ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/0a/39/Arthritis_Res_2000_Jun_5_2(4)_315-326.tar.gz',md5='b6ba3adde8de87e4dc255092b04d07ea',host='ftp.ncbi.nlm.nih.gov',content_sha1='9aeab4412cc9b1add84a6d2bca574664e193b56e',add_date='2012-05-15 00:00:00'; 

Nota che MySQL tratta% solo come speciale nel modello di corrispondenza contesti. Quindi potrebbe esserci qualcosa di sbagliato con Django ORM qui alla fine.

+0

Se fanchyna sta usando cursor.execute() il carattere '%' non dovrebbe essere un problema, perché% s verrebbe sostituito prima, non è vero? – madtyn

1

cursor.execute gestisce l'escaping di MySQL se lo si utilizza correttamente. Some Examples Here

L'idea di base è quella di utilizzare %s nella stringa SQL prime in cui attualmente si includono i valori grezzi, e poi passare un secondo argomento di cursor.execute() che è una tupla (o matrice) dei valori in ordine. Nel tuo caso, questo sarebbe:

url = 'ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/0a/39/Arthritis_Res_2000_Jun_5_2%284%29_315-326.tar.gz' 
md5 = 'b6ba3adde8de87e4dc255092b04d07ea' 
host = 'ftp.ncbi.nlm.nih.gov' 
content_sha1 = '9aeab4412cc9b1add84a6d2bca574664e193b56e' 
add_date = '2012-05-15 00:00:00' 
sql = "INSERT INTO main_document SET url = %s, md5 = %s, host = %s, content_sha1 = %s, add_date = %s" 
cursor.execute(sql, (url, md5, host, content_sha1, add_date)) 
+0

Non vedo il valore "md5" specificato nella sintassi dell'istruzione execute. È un errore di battitura? – daemon12

+0

Sì, l'ho appena corretto per includere md5, grazie! –

Problemi correlati