Sto trovando questo abbastanza difficile da spiegare, quindi partirò con alcuni esempi di prima/dopo di ciò che mi piacerebbe ottenere.Dividere la stringa con "." (punto) durante la gestione delle abbreviazioni
Esempio di ingresso:
Hello.World
This.Is.A.Test
The.S.W.A.T.Team
S.W.A.T.
s.w.a.t.
2001.A.Space.Odyssey
uscita Ricercato:
Ciao Mondo
Questo è un test
La SWAT Team
SWAT
swat
2001 Odissea nello Spazio
In sostanza, mi piacerebbe creare qualcosa che sia in grado di suddividere stringhe da punti, ma allo stesso tempo gestisce abbreviazioni.
La mia definizione di un'abbreviazione è qualcosa che ha almeno due caratteri (involucro irrilevante) e due punti, ad esempio "A.B." o "a.b.". È non dovrebbe lavorare con cifre, ad esempio "1.a.".
Ho provato tutti i tipi di cose con regex, ma non è esattamente il mio forte seme, quindi spero che qualcuno qui abbia qualche idea o suggerimento che posso usare.
Qual è la tua logica per determinare un'abbreviazione rispetto a una parola? In altre parole, puoi spiegare i criteri del tuo mondo reale per determinare questo? In particolare il tuo caso limite più grande è probabilmente intorno a parole di una sola lettera "A" e "I". –
Mi dispiace, ho dimenticato di aggiungere quello. Appena aggiunto. –
Vedo la tua definizione, ma mi chiedo se debba essere davvero l'inizio di lettera-punto-lettera-punto-punto '^ [AZ] \. [AZ] \.' O punto-lettera-punto-lettera-punto '\ . [AZ] \. [AZ] \. 'Le abbreviazioni devono essere maiuscole? –