Come stampare il numero di caratteri in ogni riga di un file di testo

Vorrei stampare il numero di caratteri in ogni riga di un file di testo usando un comando unix. So che è semplice con PowerShellCome stampare il numero di caratteri in ogni riga di un file di testo

gc abc.txt | % {$_.length}

ma ho bisogno di comando unix.

fonte

2012-01-09 vikas368

Prima regola di sviluppo del software: "no" significa "no". Usa "num" o "numero". –

[citazione necessaria]. – uprego

Utilizza Awk.

awk '{ print length($0); }' abc.txt

fonte

2012-01-09 10:03:49

Penso che 'print length;' sia equivalente e POSIX pure http://pubs.opengroup.org/onlinepubs/9699919799/utilities/awk.html –

Funziona anche su mac os. – bdemarest

while read -r line; do echo ${#line}; done < abc.txt

E 'POSIX, così dovrebbe funzionare ovunque.

Modifica: Aggiunto -r come suggerito da William.

fonte

2012-01-09 10:05:55

+1, ma ... fallirà se l'input contiene '\'. Usa read -r –

Prova questo:

while read line  
do  
    echo -e |wc -m  
done <abc.txt

fonte

2012-01-09 10:09:24 Rahul

Intendevi 'echo -e | wc -m', non è vero? È un uso inutile dei comandi; la shell può contare i caratteri in una variabile. Inoltre, 'echo -e' è totalmente incompatibile e funziona a metà delle shell, iniziando con alcune sequenze di escape che funzionano in altre e niente nel resto. –

Sì, corretto ... errore. Grazie per averlo indicato. – Rahul

Ecco esempio usando xargs:

$ xargs -I% sh -c 'echo % | wc -c' < file

fonte

2015-02-07 16:31:28 kenorb

Questo "echo%" non gestisce i caratteri non sicuri che devono essere citati dalla shell. Inoltre, "xargs" sta per dividere il tuo file per spazi e ritorni a capo, non solo per le nuove linee come richiesto dal poster originale. – bovine

ho provato le altre risposte di cui sopra, ma sono molto lontani da soluzioni decenti quando si tratta di file di grandi dimensioni - specialmente quando le dimensioni di una singola riga occupano più di ~ 1/4 della RAM disponibile.

Sia bash che awk borbottano l'intera linea, anche se per questo problema non è necessario. Bash genererà un errore una volta che una riga è troppo lunga, anche se hai abbastanza memoria.

Ho implementato uno script python estremamente semplice e abbastanza non ottimizzato che, se testato con file di grandi dimensioni (~ 4 GB per riga), non si annulla, ed è di gran lunga una soluzione migliore di quelle fornite.

Se questo è il tempo di codice critico per la produzione, si può riscrivere le idee in C o eseguire ottimizzazioni meglio sulla chiamata di lettura (invece che solo la lettura di un singolo byte alla volta), dopo la prova che questo è davvero un collo di bottiglia.

Il codice presuppone che newline sia un carattere linefeed, che è una buona ipotesi per Unix, ma YMMV su Mac OS/Windows. Assicurati che il file finisca con un avanzamento di riga per garantire che l'ultimo conteggio dei caratteri non venga trascurato.

from sys import stdin, exit 

counter = 0 
while True: 
    byte = stdin.buffer.read(1) 
    counter += 1 
    if not byte: 
     exit() 
    if byte == b'\x0a': 
     print(counter-1) 
     counter = 0

fonte

2015-02-11 21:08:35 user13972

Come stampare il numero di caratteri in ogni riga di un file di testo

risposta

Problemi correlati