2011-01-16 19 views

risposta

20

Se siete alla ricerca di un caso nel mondo reale controlla questo quello che automatically assigns priority to bugs.

Ho anche creato un paio di progetti di test per avere un'idea di come potrei usarlo in produzione.

Uno di questi suggests tags per domande StackOverflow. Il modello per questo è stato addestrato con domande (dal dump dei dati) che avevano solo 1 tag. Questo aiuta a riconoscere particolari di un tag specifico. Il codice e la prosa sono stati suddivisi in funzioni separate, in quanto uno di essi potrebbe avere un impatto maggiore sul risultato. Quando viene fornita una domanda, restituisce i primi 10 suggerimenti di tag; i tag effettivi sono inclusi per il confronto.

struttura era un file CSV:

"tag","code blocks(200 chars)","body text(200 chars)" 

Alcuni personaggi sono stati filtrati da code che ha causato gli errori di formazione: []^|~. Non sono sicuro quale di questi causasse problemi.

Se desideri vedere una determinata domanda aggiunta all'elenco dei test, fammi sapere. Ovviamente, domande che prevedono un codice migliore.

L'altro progetto prevede movie ratings basato su dati IMDB e regista/attori. A differenza del tag suggester, questo è live in modo da poter sperimentare con diverse combinazioni per vedere cosa potrebbe prevedere.

Struttura qui è stato:

rating,"directorId","actorId actorId actorId" 

Entrambi sono in esecuzione su Google App Engine in modo pitone è il back-end. Non sto usando una particolare API; Ho appena seguito alcuni degli example code di Nick Johnson.

+0

Fantastico! Esattamente quello che volevo vedere! – user94154

+4

Purtroppo i link nella risposta non sono più online. Qualcuno ha qualche esempio aggiornato? –

3

Non ho usato questa API. Ma le loro website lists i casi d'uso sotto

  • sistemi di raccomandazione (codice demo)
  • rilevamento spam (codice demo)
  • sentiment analysis clienti
  • Upsell analisi opportunità
  • decisioni del routing dei messaggi
  • Diagnostica
  • Classificazione documento e e-mail
  • Sospetto di identificazione attività
  • analisi churn
  • identificazione Lingua
+0

Grazie per la risposta, ma sono principalmente interessato a ciò che i non googler hanno utilizzato per/come hanno fatto (ovvero, quale lingua/libreria, come hanno gestito la raccolta dati, come hanno strutturato i dati, ecc.). – user94154