Nel client di posta elettronica iOS, quando un messaggio di posta elettronica contiene una data, ora o posizione, il testo diventa un collegamento ipertestuale ed è possibile creare un appuntamento o visualizzare una mappa semplicemente toccando il collegamento. Non funziona solo per le email in inglese, ma anche in altre lingue. Amo questa funzione e vorrei capire come lo fanno.In che modo Apple trova date, orari e indirizzi nelle e-mail?
Il modo ingenuo per fare questo sarebbe avere molte espressioni regolari e gestirle tutte. Tuttavia, questo non si ridimensionerà molto bene e funzionerà solo per un linguaggio specifico o un formato data, ecc. Penso che Apple debba utilizzare un concetto di machine learning per estrarre le entità (8:00 PM, 8PM, 8:00, 0800, 20:00, 20h, 20h00, 2000 ecc.).
Qualche idea su come Apple sia in grado di estrarre le entità così rapidamente nel suo client di posta elettronica? Quale algoritmo di apprendimento automatico vorresti applicare per svolgere tale compito?
Ho anche pensato a questo, in particolare il trucco regex. So che hanno un brevetto su di esso, quindi forse puoi provare a cercarlo. Tuttavia, sarei molto interessato anche a questo. +1 –
In realtà il trucco regex probabilmente catturerà il 99% dei casi con un tasso di errore molto basso. Ed è super veloce, quando ottimizzi bene le espressioni regolari. Quindi non sarei sorpreso se fosse davvero solo un insieme di espressioni regolari. –