2012-08-28 10 views
8

Utilizzo la google drive api per archiviare e recuperare i file pdf. Vorrei interrogare questi file usando i parametri di ricerca.Google Drive è il limite per l'indicizzazione di file di grandi dimensioni?

Ma prima di iniziare a implementarlo. Mi piacerebbe sapere come Google gestisce l'indicizzazione di file PDF di grandi dimensioni. (600 + pagine 25Mb +) Mi piacerebbe sapere per il pdf basato su testo. (Non hanno bisogno di ocr)

Ho provato alcune ricerche sul sito web del disco e non sempre funziona.

Mi piacerebbe sapere se ci sono dei limiti e quali sono.

risposta

3

Secondo this page per i PDF con OCR:

La dimensione massima per le immagini (.jpg, .gif, .png) e file PDF (.pdf) è di 2 MB. Per i file PDF, guardiamo solo le prime 10 pagine quando cerchiamo il testo da estrarre.

E this page per i PDF con testo:

È possibile cercare testo in file PDF e immagini da:

  • Digitando una query nella casella di ricerca in Google Drive sul Web.
  • Apertura del visualizzatore di Google Drive e utilizzo della casella di ricerca in alto a destra.

In teoria dovresti riuscire a cercare le prime 100 pagine di qualsiasi documento di testo o PDF basato su testo che hai caricato. Sarai anche in grado di cercare il testo trovato nelle prime dieci pagine di qualsiasi PDF di immagini sul tuo Drive.

+0

Questo è solo per pdf con ocr. Mi piacerebbe sapere per pdf basati su testo. – DavidVdd

+0

Buon punto, penso di aver trovato la risposta anche a quello ora nella mia risposta aggiornata. –

+0

Penso che quelle 100 pagine siano solo per la ricerca di visualizzatori di pdf. – DavidVdd

Problemi correlati