Come unire coppie di righe consecutive in un file di grandi dimensioni (1 milione di righe) utilizzando vim, sed o un altro strumento simile?

Ho bisogno di spostare il contenuto di ogni seconda riga fino alla linea sopra, in modo che i dati di line2 siano accanto a quelli di line1, sia separati da virgola che separati da spazi.Come unire coppie di righe consecutive in un file di grandi dimensioni (1 milione di righe) utilizzando vim, sed o un altro strumento simile?

ingresso:

line1 
line2 
line3 
line4

uscita:

line1 line2 
line3 line4

ho fatto in vim con una semplice registrazione, ma vim sembra bloccarsi quando dico di farlo 100 000 volte. .. Sto pensando che forse sed sarebbe una buona alternativa, ma non sono sicuro di come fare ciò che voglio o forse c'è un'opzione migliore?

Ogni riga contiene solo 1 valore numerico, non mi resta che un milione di linee ...

fonte

2011-12-17 janeruthh

Si prega di formattare la tua domanda, e ci mostrano il corretto ingresso e risultato atteso. –

Se ho capito bene, si hanno:

e si desidera:

line1<SEP>line2 
line3<SEP>line4

quindi puoi farlo facilmente con (g)awk in questo modo:

awk 'NR % 2 == 1 { o=$0 ; next } { print o "<sep>" $0 }' INPUTFILE

See it in action here.

Aggiornamento: se il numero di righe è dispari, quanto sopra si omette l'ultima riga (come Martin Stettner ha sottolineato), quindi questo non sarà:

awk 'NR % 2 == 1 { o=$0 ; next } { print o "<sep>" $0 } END { if (NR % 2 == 1) { print o } }' INPUTFILE

HTH

fonte

2011-12-17 15:21:12

Questo script non dovrebbe omettere l'ultima riga nel caso in cui si disponga di un numero dispari di righe? – MartinStettner

@MartinStettner hai ragione. Aggiornamento della soluzione. –

provare questo:

sed -rn 'N;s/\n/ /;p' yourFile

test con seguenti:

kent$ seq 10 
1 
2 
3 
4 
5 
6 
7 
8 
9 
10 

kent$ seq 10|sed -rn 'N;s/\n/ /;p' 
1 2 
3 4 
5 6 
7 8 
9 10

awk lavora troppo:

awk 'NR%2{printf $0" ";next;}1' yourFile

prova

kent$ seq 10|awk 'NR%2{printf $0" ";next;}1' 
1 2 
3 4 
5 6 
7 8 
9 10

fonte

2011-12-17 15:21:37 Kent

Questo potrebbe funzionare per voi:

sed 'N;s/\n/ /' file

cat file | paste -d' ' - -

fonte

2011-12-17 15:21:58 potong

~~Bene, il tuo esempio è questo in Vim.~~

~~:g/^/+t.|-j~~

~~Ma allora che cosa circa l'ultima riga?~~

~~O intendevi questo?~~

:g/^/j

si potrebbe anche essere interessato a questo script di Vim, che fa fare con file di grandi dimensioni più facile.

http://www.vim.org/scripts/script.php?script_id=1506

fonte

2011-12-18 23:09:18 1983

Ciao, wow, sapevo che ci doveva essere un modo migliore di quello che stavo cercando !! :) Grazie per il sacco di opzioni,: g/^/j è stato il più semplice e fa il lavoro alla grande! – janeruthh

Modificato l'OP in seguito alla precisazione sopra riportata. Il primo suggerimento nella mia risposta può ora essere ignorato. – 1983

Ottimo consiglio Vim! Nel mio caso, non era l'intero file, quindi può usare una selezione visiva ': '<,'> g/^/j' o tra il segno _a e la riga corrente':' a, .g/^/j' per limitare l'adesione al mio raggio d'interesse. Batte facendolo 773 volte manualmente! – ddevienne

$ seq 10 | sed '2~2G' | awk -v RS='' '{$1=$1; print}' 
1 2 
3 4 
5 6 
7 8 
9 10

$ paste -d' ' <(sed -n 'p;n' num.txt) <(sed -n 'n;p' num.txt) 
1 2 
3 4 
5 6 
7 8 
9 10

$ echo -e 'g/^/,+1j\n%p' | ex num.txt 
1 2 
3 4 
5 6 
7 8 
9 10

$ seq 10 | awk 'NR%2{printf("%s ", $0); next}1' 
1 2 
3 4 
5 6 
7 8 
9 10

$ seq 10 | sed 'N;s/\n/ /' 
1 2 
3 4 
5 6 
7 8 
9 10

nota:$ seq 10 >num.txt

fonte

2011-12-19 07:17:21 kev

Che ne dici di 'perl'? 'seq 10 | perl -pe '$ a ++% 2 || s/\ n//' ' – Sorpigal

il comando Incolla può fare questo. La sua opzione "-s" si unirà a linee consecutive; e l'opzione "-d" specifica un elenco di caratteri da usare come delimitatori, ripetendoli ciclicamente. Registrazione prima con uno spazio, poi con un ritorno a capo, e ripetere:

seq 10 | paste -sd" \n" -

fonte

2012-05-04 20:55:24

seq 10 | awk 'ORS=NR%2?FS:RS'

Questa soluzione utilizza "operatore ternario" per impostare ORS

ORS= ....... output register separator (will receive =) 
NR%2 ....... test if it has division remainder of Number of Register by 2 
?FS:RS ..... FS = "space" RS = "\n" (newline)

fonte

2017-09-29 16:19:20 SergioAraujo

Come unire coppie di righe consecutive in un file di grandi dimensioni (1 milione di righe) utilizzando vim, sed o un altro strumento simile?

risposta

Problemi correlati