6

Ho un numero di .jpeg dai siti web dei musicisti. Queste immagini sono composte da poster per i prossimi spettacoli e foto di gruppo (foto della band nella vita reale).Come posso rilevare se una foto è un poster (non realistico)?

Ecco un manifesto esempio:

enter image description here

Io non sono ben versato in tutte le tecniche moderne o algoritmi (? Se esistono), ma questo è quello che ho pensato che avrei potuto cercare:

  • Il testo nell'immagine di solito è un omaggio scarno di un poster.
  • Forse le foto realistiche (ad esempio i non poster) seguono una diversa distribuzione dei colori?
  • I poster hanno probabilmente meno probabilità di avere volti in essi, ma questa è un'affermazione piuttosto debole.

Esiste un algoritmo di classificazione in grado di rilevare se un'immagine è un poster?

risposta

11

La tua domanda è molto ampia. Poster o foto non è un oggetto ben definito. Cos'è un poster? Nella vita reale, i poster sono spesso foto, o una combinazione di foto o foto un po 'corrette.

Se ci si limita a fare riferimento alla prima parte della domanda: le foto della band e gli imminenti mostrano i poster, la risposta è - probabilmente sì (anche se non ho mai visto nessuno farlo). Dato che stai cercando un classificatore binario, ti suggerirei di adottare un modello di apprendimento automatico (Naive Bayes dovrebbe essere sufficiente, ma se vuoi utilizzare funzioni più complesse, prova SVM, ELM o alcune foreste/albero delle decisioni casuali) e applicalo per i dati codificati in vettori contenenti:

caratteristiche binarie:

  • "c'è qualche parola su l'immagine?" - avrete bisogno di algoritmo di rilevamento di testo esterno
  • "c'è un certo numero sull'immagine" - eventi dovrebbero avere date
  • "c'è una data sull'immagine"
  • "c'è qualche volto sull'immagine"

Utilizzando Naive Bayes avrebbe costruito probabilità ad essi condizionali P(poster|there is a word), P(poster|there is a number) ecc che non solo vi darà un classificatore, ma anche alcune intuizioni di quanto sia importante sono i tuoi featuers (probabilità vicino al 0.5 sono un suggerimento, che una caratteristica particolare, è inutili).

Non userei gli istogrammi ecc. A causa della vasta gamma di possibili foto, stili di sessione di foto ecc. A meno che non si sia disposti a creare un set di allenamento davvero grande.

Se ciò non è sufficiente, è possibile cambiarli in funzioni più complesse e utilizzare un classificatore più potente di Naive Bayes.

caratteristiche complesse:

  • Quante parole ci sono sull'immagine?
  • Quanti numeri ci sono sull'immagine?
  • Quante date ci sono sull'immagine?
  • Quanti volti ci sono sull'immagine?
  • Immagine istogramma

E un ultima opzione, se tutto fallisce, si potrebbe tentare di formare un certo modello moderno, come profonda rete di credenze sulle immagini crude. Richiederebbe un notevole potere computazionale, ma i risultati sarebbero molto preziosi anche per la comunità scientifica.

Problemi correlati