En esta entrada, veremos cómo importar o cargar datos de Excel a R utilizando RStudio . Al final de esta entrada aprenderás:
Además, hay un archivo de Excel para descargar que vamos a usar en la práctica. Puedes copiar el código de la página y pegarlo en tu sesión de RStudio. También puedes ver este video al respecto:
¿Qué es eso de importar datos?
Cuando decimos importar datos estamos hablando del proceso de pasar un archivo de Excel a un formato que R puede utilizar. En la mayoría de los casos, después de importar, obtenemos un dataframe.
Como nota, para nosotros va a ser los mismo cuando digamos importar, cargar, subir o leer datos a R.
Instalando paquete readxl
Ahora, necesitamos instalar el paquete readxl para importar datos de Excel. Éste es, en mi opinión, el paquete más sencillo de usar para importar este tipo de datos.
Instalamos el paquete con el siguiente código
install.package("readxl")
# después cargar el paquete con
library(readxl)
install.package(…) y después cargamos el paquete con library(…)
Si esto te suena a chino, ve a esta entrada de paquetes en R.
Por otra parte, necesitamos conocer la ruta del archivo de Excel. La ruta, o path en inglés, es la dirección/ubicación donde está el archivo en tu computadora u ordenador.
Ruta del archivo para importar de R a excel
Primero, veremos cómo sacar esta ruta con una función muy chévere de R (Es de esos secretos que revelamos aquí para ser mejores con R).
Así, la función se llama file.choose(). Luego, esta función te permite abrir una ventana de Windows para buscar un archivo y regresa una variable tipo carácter con la ruta del archivo. Por ejemplo, en R.
# ejecutar
file.choose()
En la ventana, buscamos el archivo y hacemos click en «open» o «abrir»
Si ahora vemos la consola, encontramos la ruta del archivo en un formato que entiende R, copiamos con todo y las comillas.
Guardamos en una variable tipo caracter que con nombre ruta_excel
ruta_excel <- "C:\\LA\\RUTA\\DE\\TU\\ARCHIVO.xlsx"
Antes de cargar los datos a R, veamos cuales son las hojas que tiene este Excel. Luego, podemos utilizar el código
excel_sheets(ruta_excel)
Ahora a lo que vinimos
Cómo importar de excel a R con código
Para esto, utilizamos la función read_excel(…). Esta función, tiene varias opciones que veremos a través de tres casos típicos de cómo encontramos los archivos de Excel que queremos cargar
Caso ideal
El primer caso, que vamos a llamar caso ideal, es cuando los datos están en la primera hoja del Excel y empiezan en la celda A1.
Entonces, para importar este caso asignamos a una variable la función read_excel(ruta)
# importar caso ideal
caso_ideal <- read_excel(ruta_excel)
Es bueno escoger nombres que digan de que se tratan los datos, evita poner nombres como «datos», «x1», o «x2»,…
Si vemos la variable, es un dataframe con el contenido del excel. Un detalle aquí: fíjate que si pedimos la variable por la consola se ve el contenido pero dice tibble.
Un tibble es una estructura de datos equivalente a un dataframe. O sea que son lo mismo, todo lo de dataframes aplica a un tibble.
Caso Medio
Listo ya importamos nuestro primer archivo de Excel, pero que pasa si los datos no están en la primera hoja o no empiezan en la celda A1… Esto sería el caso medio.
Para este caso, tenemos que agregar la opción «sheet» a la función read_excel(). En esta opción escribimos el nombre de la hoja de Excel que queremos. En R:
caso_medio <- read_excel(ruta_excel,
sheet = 'Hoja2')
Caso Final
Por último, puede ser que nuestros datos no estén en la primera hoja ni que empiecen en A1, esto sería como el final boss o el caso más complejo de esta práctica, vamos a resolverlo.
Tenemos que agregar, además de la opción de sheet, la opción de «range» que sirve para indicar el rango o las celdas que queremos importar. En la función, agregamos esta opción con las celdas C7 y F17. En R:
# importar caso dificil
final_boss <- read_excel(ruta_excel,
sheet = 'Hoja3',
range = 'C7:E13')
Cómo importar de excel a R con la interfaz de RStudio
Para concluir este video vamos a aprender como importar el caso final, con la interfaz de RStudio.
En el menú superior de la interfaz vamos a FILE y hacemos click en IMPORT DATASET > FROM EXCEL
Se abre una ventana en donde podemos buscar el archivo haciendo click en browse y nos muestra una vista de los datos. En las opciones de importación podemos ajustar cosas como el nombre de la variable en R, la hoja, el rango, y otras opciones más avanzadas.
Si te das cuenta, tenemos el mismo código que hemos aprendido a hacer en la sección anterior.
Esto es otra forma de hacer lo mismo. Es importante conocer todas las opciones que tenemos y luego escoger la que nos dé mejores resultados.
Chévere! Ahora puedes leer todos los archivos de Excel que quieras!
Comparte este video con tus compañeros que no conocen la función (no tan secreta) de file.choose() para buscar archivos!
Si quieres estar al tanto del contenido que subo sobre R y RStudio puedes suscribirte a este canal de YouTube