La mia applicazione riceve email dagli utenti. Una risposta da Gmail, ad esempio, viene in questo modo:Estrarre il messaggio originale da una risposta via email
This is some new text
On Sun, Apr 1, 2012 at 3:32 AM, My app <
[email protected]> wrote:
> Original...
> message..
Naturalmente, questo trattamento varia da cliente a cliente.
In questo momento sto identificando il '4f77ed3860c258a567aeabf8' e buttando fuori tutto dopo, perché so a quale indirizzo email hanno inviato. Questa non è una soluzione generale ma funziona per i miei scopi, eccetto per quando c'è un'interruzione di riga nella riga "Messaggio originale", come nell'esempio precedente.
Esiste un modo migliore e standard per eliminare i messaggi precedenti dalla risposta dell'utente a un'email?
il problema di questo è che un diff non correttamente segnerà "On Sun, Apr 1 ... XX ha scritto: "come parte del nuovo messaggio. Sembra che l'unica soluzione potrebbe essere semplicemente imparare come ogni cliente (gmail, outlook, ecc.) Risponde. –
Direi che la maggior parte dei provider lo metterebbe sempre su una nuova riga. Non riesci a fare la differenza che cancellare la linea tra l'ultima interruzione di riga e la penultima? quindi, il tuo esempio, è in realtà un multi-linea o semplicemente come è stato incollato? – FlavorScape
In realtà è multilinea nell'esempio che ho postato. I miei utenti hanno anche l'abitudine di non conservare la nuova riga tra il loro messaggio e la linea del provider. Penso di poter inventare un paio di euristiche mentre raccolgo le stringhe del "messaggio originale" di ciascun cliente ... –