Il file dat ha alcune righe di informazioni extra prima dei dati effettivi. li salta con l'argomento skip
:
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)
Un modo semplice per controllare questo se si ha familiarità con il set di dati è quello di utilizzare prima readLines
per controllare poche righe, come di seguito:
readLines("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
n=10)
# [1] "Ozone data from CZ03 2009" "Local time: GMT + 0"
# [3] "" "Date Hour Value"
# [5] "01.01.2009 00:00 34.3" "01.01.2009 01:00 31.9"
# [7] "01.01.2009 02:00 29.9" "01.01.2009 03:00 28.5"
# [9] "01.01.2009 04:00 32.9" "01.01.2009 05:00 20.5"
Qui, possiamo vedere che i dati effettivi iniziano da [4]
, quindi sappiamo saltare le prime tre righe.
Aggiornamento
Se davvero voleva solo la colonna Value
, si potrebbe fai da:
as.vector(
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)$Value)
Anche in questo caso, readLines
è utile per aiutare a capire il nome effettivo del colonne che verranno importate.
Ma non vedo molto vantaggio nel fare ciò leggendo l'intero set di dati ed estraendolo in seguito.
+1 per [esempio riproducibile] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example). – Andrie