Ho visto alcune domande simili ma sto cercando di ottenere questo risultato.Suddivisione della frase in parole ma problemi con le punteggiature in C#
Dato una stringa, str = "La luna è il nostro satellite naturale, cioè ruota attorno alla Terra!" Voglio estrarre le parole e memorizzarle in un array. Gli elementi di array previsti sarebbero questo.
the
moon
is
our
natural
satellite
i.e.
it
rotates
around
the
earth
Ho provato a utilizzare String.split (',' \ t ',' \ r ') ma questo non funziona correttamente. Ho anche provato a rimuovere il., E altri segni di punteggiatura, ma vorrei una stringa come "i.e." da analizzare anche Qual è il modo migliore per raggiungere questo obiettivo? Ho anche provato a usare regex.split inutilmente.
string[] words = Regex.Split(line, @"\W+");
Apprezzerei sicuramente alcuni suggerimenti nella giusta direzione.
Il secondo '.' in 'i.e' e una punteggiatura' .' sono indistinguibili a meno che non si aggiunga un elenco di parole che si sa terminare in '.'. – CodesInChaos
Prendo atto che la luna * ruota * attorno al proprio asse. * Gira * intorno alla terra. –