Ho sofferto con regex python per un po 'cercando di abbinare i paragrafi all'interno di un testo, ma non ho avuto successo. Devo ottenere le posizioni di inizio e fine dei paragrafi.Come abbinare un paragrafo usando regex
Un esempio di un testo:
Lorem ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod
tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At
vero eos et accusam et justo duo dolores et ea rebum.
Stet clita kasd gubergren,
no sea takimata sanctus est Lorem ipsum dolor sit amet.
Ipsum dolor sit amet, consetetur sadipscing elitr, sed diam nonumy eirmod
tempor invidunt ut labore et dolore magna aliquyam erat, sed diam voluptua. At
vero eos et accusam et justo duo dolores et ea rebum. Stet clita kasd gubergren,
no sea takimata sanctus est Lorem ipsum dolor sit amet.
In questo caso esemplificativo, vorrei corrispondere separatamente tutti i paragrafi che iniziano con Lorem, Stet e Ipsum rispettivamente (senza le righe vuote). Qualcuno ha qualche idea su come farlo?
C'è una ragione per la quale si vogliono fare questo con regex? Per qualcosa di semplice come dividere i paragrafi delimitati a doppia riga di delimitazione, basta usare 'paragraph.split ('\ n \ n')' –
Sono interessato alle posizioni di inizio e fine dei paragrafi, non alle stringhe attuali. Avrei dovuto dirlo. –