Molti siti di lavoro hanno ricerche interrotte che non consentono di limitare i lavori per livello di esperienza. Anche quando lo fanno, di solito è sbagliato. Ciò richiede che guadagni attraverso centinaia di post che non puoi richiedere prima di trovarne uno rilevante, piuttosto noioso. Dal momento che preferirei concentrarmi sulla scrittura di lettere di copertura ecc., Voglio scrivere un programma per esaminare un gran numero di post e salvare gli URL di quei lavori che non richiedono anni di esperienza.La ricerca di lavoro online è noiosa. Aiutami ad automatizzarlo
Non ho bisogno di aiuto per scrivere il raschietto per ottenere i corpi html di post di lavoro possibilmente rilevanti. Il problema sta rilevando con precisione il livello di esperienza richiesto per il lavoro. Questo non dovrebbe essere troppo difficile in quanto i posti di lavoro sono generalmente molto espliciti ("deve avere 5 anni di esperienza in ..."), ma ci possono essere alcuni problemi con soluzioni troppo semplici.
Nel mio caso, sto cercando le posizioni entry-level. Spesso non dicono "entry-level", ma l'inclusione delle parole probabilmente significa che il lavoro dovrebbe essere salvato.
Successivamente, posso tranquillamente escludere un lavoro dicendo che richiede "5 anni" di esperienza in qualsiasi cosa, quindi una espressione regolare come/\ d \ syears/sembra ragionevole escludere i lavori. Ma poi, ho capito che alcuni lavori dicono che ci vorranno 0-2 anni di esperienza, corrisponde all'espressione regolare, ma è chiaramente un lavoro che voglio dare un'occhiata. Hmmm, posso gestirlo con un'altra regex. Ma alcuni dicono "meno di 2 anni" o "meno di 2 anni". Posso gestirlo anche io, ma mi chiedo quali altri schemi non sto pensando, ed eventualmente escludendo molti lavori. Questo è quello che mi porta qui, per trovare un modo migliore per farlo rispetto alle regex, se ce n'è una.
Mi piacerebbe ridurre al minimo il tasso di falsi negativi e salvare tutti i lavori che sembrano non richiedere molti anni di esperienza. Escludere qualsiasi cosa che corrisponda a/[3-9] \ syears | 1 \ d \ syears/sembra ragionevole? O c'è un modo migliore? Allenare un filtro bayesiano forse?
Modifica: C'è un problema simile, ma più difficile, che sarebbe probabilmente più utile da risolvere. Ci sono molti lavori che richiedono solo una "laurea in ingegneria", come devi capire solo alcune cose tecniche. Ma la ricerca di "ingegneria" ti offre migliaia di posti di lavoro, per lo più irrilevanti.
Come faccio a restringere questo campo solo a quei lavori che richiedono una laurea in ingegneria, piuttosto che determinati gradi, senza guardarli da soli?
Se l'esperienza è il fattore principale, o uno di una coppia, non perderei tempo a cercare di perfezionare l'algoritmo e quindi mi chiedo cosa possa o non possa mancare. Formattare l'output per mostrare il contesto attorno a qualsiasi istanza di "esperienza" in una colonna di sinistra e darmi un collegamento nella colonna di destra. Sono più fiducioso nella mia capacità di scansionare rapidamente l'elenco e scegliere quelli giusti. Se vedi ripetutamente un paio di formati ben definiti e vuoi escluderli, puoi affinare progressivamente i risultati finché non sei soddisfatto del set di risultati. Spero che troverai il lavoro prima che tu abbia finito. – Jay
Il problema dell'esclusione dei pattern che vedo spesso è che la regex potrebbe corrispondere a lavori per i quali potrei effettivamente candidarmi. E dal momento che non guarderò a ciò che è escluso, è difficile sapere cosa mi manchi. Posso solo usare il trial-and-error, suppongo, ma speravo solo che ci fosse un modo migliore. Forse no! – ehsanul
Fai attenzione ai luoghi che richiedono 2 ** 25 secondi di esperienza con qualcosa ... –