Lectura de datos en R

Francisco García García (2014-12-14)


0. Introducción

1. ¿Cómo leemos los datos de ficheros procedentes de EXCEL?

2. ¿Cómo leemos los datos con formato txt?

3. Lectura de otro tipo de formatos desde R.

4. Ejercicios complementarios

5. Enlaces de interés




0. Introducción

Para introducir nuestros datos en R disponemos de dos formas generales:

altura <- c(150,157, 160,130, 158, 157)
#  datos <- read.table("misdatos.txt", header = T)



1. ¿Cómo leemos los datos de ficheros procedentes de EXCEL?

Existen varias funciones de lectura de datos en R según el formato del archivo. Cuando tenemos un fichero en excel, es aconsejable guardarlo previamente en formato csv y posteriormente lo leemos desde R con la función read.csv:

datos <- read.csv("riesgos.csv", header = T, sep = "\t")

Para obtener información detallada de esta función de lectura:

?read.csv

Algunos comentarios:

A continuación es conveniente explorar los datos para conocerlos con más detalle y también comprobar que el proceso de lectura ha sido correcto o bien si debemos realizar algún ajuste:

head(datos)
#>   id contrato  jornada turno carfisi carpsiqui expquímica edad peso talla
#> 1  2        3 completa     1      no        no         no   33   74   155
#> 2  3        1 completa     1      no        no         no   37   74   170
#> 3  6        5 completa     1      sí        no         no   35   67   170
#> 4  7        1 completa     1      sí        no         no   30   57   164
#> 5  8        3 completa     1      sí        no         sí   30   69   160
#> 6 10        2 completa     1      no        sí         no   32   56   160
tail(datos)
#>    id contrato jornada turno carfisi carpsiqui expquímica edad peso talla
#> 86 73        5 parcial     1      no        no         no   32   65   159
#> 87 75        1 parcial     1      no        no         no   33   87   185
#> 88 76        1 parcial     1      sí        no         no   30   76   178
#> 89 80        4 parcial     1      no        no         no   29   65   153
#> 90 82        1 parcial     1      no        no         no   35   78   190
#> 91 86        4 parcial     4      no        no         no   28   65   167
colnames(datos)
#>  [1] "id"         "contrato"   "jornada"    "turno"      "carfisi"   
#>  [6] "carpsiqui"  "expquímica" "edad"       "peso"       "talla"
dim(datos)
#> [1] 91 10
summary(datos)
#>        id          contrato         jornada       turno       carfisi
#>  Min.   : 1.0   Min.   :1.000   completa:67   Min.   :1.000   no:57  
#>  1st Qu.:23.5   1st Qu.:1.000   parcial :24   1st Qu.:1.000   sí:34  
#>  Median :46.0   Median :1.000                 Median :1.000          
#>  Mean   :46.0   Mean   :1.857                 Mean   :1.209          
#>  3rd Qu.:68.5   3rd Qu.:3.000                 3rd Qu.:1.000          
#>  Max.   :91.0   Max.   :5.000                 Max.   :4.000          
#>                                                                      
#>  carpsiqui expquímica      edad            peso           talla      
#>  no:46     no:86      Min.   :23.00   Min.   :50.00   Min.   :150.0  
#>  sí:45     sí: 5      1st Qu.:29.00   1st Qu.:62.00   1st Qu.:160.0  
#>                       Median :31.00   Median :69.00   Median :165.0  
#>                       Mean   :31.45   Mean   :70.34   Mean   :166.3  
#>                       3rd Qu.:34.00   3rd Qu.:76.00   3rd Qu.:171.0  
#>                       Max.   :39.00   Max.   :98.00   Max.   :190.0  
#>                                       NA's   :2
attach(datos)



2. ¿Cómo leemos los datos con formato txt?

La lectura de datos en formato txt es similar a la de los ficheros csv. Se utiliza la función read.table:

datos <- read.table("estres.txt", header = T, sep = "\t")

Para obtener información detallada de esta función de lectura:

?read.table



3. Lectura de otro tipo de formatos desde R.

Es posible leer datos de formatos procedentes de otras herramientas estadísticas como SPSS, STATA, SAS, Epi-Info,.. Para ello se pueden utilizar las funciones de lecturas incluidas en el paquete de R foreign. Un ejemplo:

# library(foreign)  #cargamos esta librería en nuestra sesión de R
# datos <- read.spss( file= "misdatos.sav", to.data.frame = TRUE)
# str(datos)



4. Ejercicios complementarios

La base de datos estres.txt contiene información sobre los niveles de estrés de 90 trabajadores, así como variables relacionadas con su puesto de trabajo. La primera línea del archivo incluye los nombres de las variables.



5. Enlaces interesantes: