come contare il numero totale di linee in un file di testo utilizzando python

Per esempio se il mio file di testo è:come contare il numero totale di linee in un file di testo utilizzando python

blue 
green 
yellow 
black

Qui ci sono quattro linee e ora voglio ottenere il risultato come quattro. Come lo posso fare?

fonte

2013-09-25 Anonymous

aperta ('data.txt') come fp: per la linea in fp: se line.strip(): count + 1 = –

@alecxe funzionerà.? –

Sì, funzionerà, ma la soluzione non è pitonica, meglio usare 'sum()'. – alecxe

È possibile utilizzare sum() con un generatore di espressione:

with open('data.txt') as f: 
    print sum(1 for _ in f)

Si noti che non è possibile utilizzare len(f), dal momento che è un fiterator. _ è un nome di variabile speciale per le variabili throwaway, vedere What is the purpose of the single underscore "_" variable in Python?.

È possibile utilizzare len(f.readlines()), ma questo creerà un ulteriore elenco in memoria, che non funzionerà nemmeno su file enormi che non si adattano alla memoria.

fonte

2013-09-25 09:45:52 alecxe

Così pithonic, quindi molto pythonic: O – SARose

Sarebbe più rapido se lo scriveste come con open ('data.txt') come f: print sum ([1 per _ in f])? – jimh

@jimh - è meglio usare solo 'sum (1 per _ in f)' perché usa implicitamente un'espressione di generatore tra parentesi e non crea un elenco di 1s. Tuttavia, la tua versione 'sum ([1 for _ in f])' creerebbe una lista di 1 prima di sommarli, il che alloca inutilmente la memoria. – blokeley

count=0 
with open ('filename.txt','rb') as f: 
    for line in f: 
     count+=1 

print count

fonte

2013-09-25 09:45:03

È possibile utilizzare sum() con un'espressione generatore qui. L'espressione del generatore sarà [1, 1, ...] fino alla lunghezza del file. Quindi chiamiamo sum() per aggiungerli tutti insieme, per ottenere il conteggio totale.

with open('text.txt') as myfile: 
    count = sum(1 for line in myfile)

Sembra da ciò che hai provato che non vuoi includere righe vuote. È quindi possibile fare:

with open('text.txt') as myfile: 
    count = sum(1 for line in myfile if line.rstrip('\n'))

fonte

2013-09-25 09:45:58 TerryA

Questo link (How to get line count cheaply in Python?) ha un sacco di possibili soluzioni, ma tutti ignorano un modo per rendere questo percorso notevolmente più veloce, vale a dire utilizzando l'interfaccia unbuffered (grezzo), utilizzando bytearrays, e facendo il tuo buffering.

utilizzando una versione modificata dello strumento tempi, credo che il seguente codice è più veloce (e marginalmente più divinatorio) rispetto a qualsiasi delle soluzioni offerte:

def _make_gen(reader): 
    b = reader(1024 * 1024) 
    while b: 
     yield b 
     b = reader(1024*1024) 

def rawpycount(filename): 
    f = open(filename, 'rb') 
    f_gen = _make_gen(f.raw.read) 
    return sum(buf.count(b'\n') for buf in f_gen)

qui sono i miei tempi:

rawpycount  0.0048 0.0046 1.00 
bufcount   0.0074 0.0066 1.43 
wccount    0.01 0.01 2.17 
itercount   0.014 0.014 3.04 
opcount   0.021 0.02 4.43 
kylecount   0.023 0.021 4.58 
simplecount  0.022 0.022 4.81 
mapcount   0.038 0.032 6.82

vorrei postare lì, ma io sono un relativamente nuovo utente di impilare scambio e non hanno la manna necessaria.

EDIT:

Questo può essere fatto completamente con i generatori di espressioni in-line utilizzando itertools, ma diventa piuttosto strano cercando:

fonte

2014-12-17 03:05:34

Grazie! Questa implementazione di itertool è velocissima e mi consente di dare una percentuale di completamento quando viene letto un file molto grande. –

Ricevo un errore: AttributeError: l'oggetto 'file' non ha attributo 'raw'. Qualche idea, perché? – MD004

Il codice qui è specifico per python 3 e la divisione raw/unicode è avvenuta lì. La mia memoria di Python 2 non è buona a questo punto, ma se stai usando python 2, penso che se cambi la modalità sulla chiamata open() a 'r' e cambi semplicemente "f.raw.read()" in "f.read()" otterrai effettivamente la stessa cosa in python 2. –

questo si dà anche le linee Numero locali in un file .

a=open('filename.txt','r') 
l=a.read() 
count=l.splitlines() 
print(len(count))

fonte

2016-09-29 10:58:15 Naveen

uno di linea:

total_line_count = sum(1 for line in open("filename.txt")) 

print(total_line_count)

fonte

2017-01-31 17:56:05 Surya

Usa:

num_lines = sum(1 for line in open('data.txt')) 
print(num_lines)

che funzionerà.

fonte

2017-02-24 20:46:14

Per le persone che dicono di usare with open ("filename.txt","r") as f si può fare anyname = open("filename.txt","r")

def main(): 

    file = open("infile.txt",'r') 
    count = 0 
    for line in file: 
      count+=1 

    print (count) 

main()

fonte

2017-05-10 21:18:02 Michell

ecco come si può fare attraverso la lista di comprensione, ma questo sarà sprecare un po 'di memoria del computer come line.strip() è stato chiamato due volte.

 with open('textfile.txt') as file: 
lines =[ 
      line.strip() 
      for line in file 
      if line.strip() != ''] 
print("number of lines = {}".format(len(lines)))

fonte

2018-01-15 14:11:09 Pengoo

come contare il numero totale di linee in un file di testo utilizzando python

risposta

Problemi correlati