2010-03-28 18 views

risposta

3

reddit proverà a estrarre un'anteprima da qualsiasi fonte, non solo un URL dell'immagine. Ciò viene fatto innanzitutto impostando regole per siti specifici e in secondo luogo disponendo di un processo generico per il recupero di miniature per URL sconosciuti - ed è un automatizzato periodic task.

Uno dei (molti) vantaggi di reddit è quello the source code is open e, se si conosce Python, è necessario controllare /r2/lib/scraper.py per una vista più dettagliata su come funziona questo processo.

Inoltre, mentre StackOverflow è un ottimo posto per rispondere alle domande relative alla programmazione, si potrebbe anche voler controllare il proprio /r/redditdev di reddit per informazioni sullo sviluppo reddit.

Hey there redditor!

0

È possibile verificare il contenuto del tag <img>.

+0

Intendi il contenuto del tag su Reddit? Sembra che comprimano e riducono l'immagine e la salvano come immagine di dimensioni ridotte sul loro server. – vette982

1
  1. In effetti, se l'URL contiene .jpg, .png, ecc, usare quella.
  2. Se il sito è un popolare dominio (flickr.com, youtube.com, amazon.com, ecc), hanno un insieme di regole predefinite per estrarre qualcosa che si sa sarà rilevante (può essere l'immagine in primo piano, la miniatura di YouTube , l'immagine del prodotto Amazon, ecc.)
  3. Altrimenti, se tutto ciò che devi fare con è un po 'di codice HTML, dovrai scavarlo tu stesso. Puoi scegliere il primo nella pagina, il più grande in base alle dimensioni, o anche quello che hai algoritmicamente determinato per essere il più pertinente (ad esempio relativamente grande, all'interno di quello che pensi sia il contenuto principale del corpo.)

Se si deve ricorrere all'ultima opzione, una tecnica che consiglierei è di estrarre più immagini e A/B testarle per trovare quella che ha la migliore percentuale di click-through. In questo modo puoi quasi sempre ottenere il migliore.

Problemi correlati