Francisco García García (2014-12-14)
Para introducir nuestros datos en R disponemos de dos formas generales:
altura <- c(150,157, 160,130, 158, 157)
# datos <- read.table("misdatos.txt", header = T)
Existen varias funciones de lectura de datos en R según el formato del archivo. Cuando tenemos un fichero en excel, es aconsejable guardarlo previamente en formato csv y posteriormente lo leemos desde R con la función read.csv:
datos <- read.csv("riesgos.csv", header = T, sep = "\t")
Para obtener información detallada de esta función de lectura:
?read.csv
Algunos comentarios:
A continuación es conveniente explorar los datos para conocerlos con más detalle y también comprobar que el proceso de lectura ha sido correcto o bien si debemos realizar algún ajuste:
head(datos)
#> id contrato jornada turno carfisi carpsiqui expquímica edad peso talla
#> 1 2 3 completa 1 no no no 33 74 155
#> 2 3 1 completa 1 no no no 37 74 170
#> 3 6 5 completa 1 sí no no 35 67 170
#> 4 7 1 completa 1 sí no no 30 57 164
#> 5 8 3 completa 1 sí no sí 30 69 160
#> 6 10 2 completa 1 no sí no 32 56 160
tail(datos)
#> id contrato jornada turno carfisi carpsiqui expquímica edad peso talla
#> 86 73 5 parcial 1 no no no 32 65 159
#> 87 75 1 parcial 1 no no no 33 87 185
#> 88 76 1 parcial 1 sí no no 30 76 178
#> 89 80 4 parcial 1 no no no 29 65 153
#> 90 82 1 parcial 1 no no no 35 78 190
#> 91 86 4 parcial 4 no no no 28 65 167
colnames(datos)
#> [1] "id" "contrato" "jornada" "turno" "carfisi"
#> [6] "carpsiqui" "expquímica" "edad" "peso" "talla"
dim(datos)
#> [1] 91 10
summary(datos)
#> id contrato jornada turno carfisi
#> Min. : 1.0 Min. :1.000 completa:67 Min. :1.000 no:57
#> 1st Qu.:23.5 1st Qu.:1.000 parcial :24 1st Qu.:1.000 sí:34
#> Median :46.0 Median :1.000 Median :1.000
#> Mean :46.0 Mean :1.857 Mean :1.209
#> 3rd Qu.:68.5 3rd Qu.:3.000 3rd Qu.:1.000
#> Max. :91.0 Max. :5.000 Max. :4.000
#>
#> carpsiqui expquímica edad peso talla
#> no:46 no:86 Min. :23.00 Min. :50.00 Min. :150.0
#> sí:45 sí: 5 1st Qu.:29.00 1st Qu.:62.00 1st Qu.:160.0
#> Median :31.00 Median :69.00 Median :165.0
#> Mean :31.45 Mean :70.34 Mean :166.3
#> 3rd Qu.:34.00 3rd Qu.:76.00 3rd Qu.:171.0
#> Max. :39.00 Max. :98.00 Max. :190.0
#> NA's :2
attach(datos)
La lectura de datos en formato txt es similar a la de los ficheros csv. Se utiliza la función read.table:
datos <- read.table("estres.txt", header = T, sep = "\t")
Para obtener información detallada de esta función de lectura:
?read.table
Es posible leer datos de formatos procedentes de otras herramientas estadísticas como SPSS, STATA, SAS, Epi-Info,.. Para ello se pueden utilizar las funciones de lecturas incluidas en el paquete de R foreign. Un ejemplo:
# library(foreign) #cargamos esta librería en nuestra sesión de R
# datos <- read.spss( file= "misdatos.sav", to.data.frame = TRUE)
# str(datos)
La base de datos estres.txt contiene información sobre los niveles de estrés de 90 trabajadores, así como variables relacionadas con su puesto de trabajo. La primera línea del archivo incluye los nombres de las variables.