Sto provando a dividere una stringa su caratteri di nuova riga (catering per Windows, OS X e Unix file di testo caratteri di nuova riga). Se c'è una successione di questi, voglio dividere anche su quello e non includere qualsiasi nel risultato.Regex da dividere in successioni di caratteri di nuova riga
Così, per quando si divide il seguente:
"Foo\r\n\r\nDouble Windows\r\rDouble OS X\n\nDouble Unix\r\nWindows\rOS X\nUnix"
Il risultato sarebbe:
['Foo', 'Double Windows', 'Double OS X', 'Double Unix', 'Windows', 'OS X', 'Unix']
Cosa regex devo usare?
Siete preoccupati per altri spazi bianchi in verticale? \ r \ n è DOS, ma ci sono ancora altri possibili spazi bianchi verticali come la scheda verticale e Unicode NBSP, PS, LS, NNBSP. Potresti voler controllare se Python supporta il concetto di newline generico. Perl ha \ v e \ R che corrispondono rispettivamente a spazi vuoti generici o linefeed. In caso contrario, se si desidera i caratteri Unicode, aggiungere quelli alle classi di caratteri [\ r \ n] + e l'equivalente Python di cercare quei caratteri Unicode. – dawg