Hola mundo! En esta entrada, vamos a ver cómo pasar archivos de excel a un data frame utilizando jupyter notebook en python.
Esta entrada es parte de la serie Python para data science. Espero te anime a seguir aprendiendo.
Esta entrada incluye un notebook de práctica que puedes descargar en este enlace.
Qué es eso de importar datos de excel a pandas?
Antes de empezar, recordar que hay muchos sinónimos para esto de importar, como pueden ser leer, subir o cargar archivos a Python.
Con esto, nos vamos a referirnos al hecho de pasar un archivo de un formato en este caso excel a uno que python entienda para poder hacer nuestro trabajo.
En este caso, vamos a utilizar de pandas y dentro de pandas vamos a utilizar la función read_excel() con una ruta.
La ruta o también se le llama path en inglés en la dirección en donde esté ubicado el excel.
Para hacer la práctica vamos a plantear tres casos,
- el primero donde los datos de excel esté en la hoja 1 y tenga nombre de columnas,
- el segundo donde cambiemos la hoja de la 1 a la 2 y
- por último un caso donde los datos estén en la hoja 3 y no tengan nombre de columnas.
Vamos allá!
Para empezar, vamos a cargar pandas (el archivo de excel está en el descargable)
Luego podemos extraer la ruta del archivo con
Esto asumiendo que el excel lo has dejado en el misma carpeta en la que estamos trabajando en jupyter notebook. De lo contrario tendrías que escribir toda la ruta o dirección del fichero.
Caso ideal: datos en primera hoja
Ahora para hacer la primera carga más sencilla podemos utilizar el comando:
y con esto obtenemos directamente el dataframe. Esto está muy bien, pero qué pasa si el dataframe está en otra hoja de excel? lo veremos más abajo
Los datos no están en la primera hoja
En este caso, tendríamos que agregar la opción sheet_name dentro de la función pd.read_excel de la siguiente forma
Final Boss: en otra hoja sin nombre de columna
En este caso, hay que incluir, además de lo visto en la lección anterior, las opciones header=False (para indicar que no hay columnas) y los nuevos nombres de columnas en un lista. En nuestro caso
Chévere
Espero que estos comandos de python te ayuden a cargar archivos de excel! Te mando un saludo donde quiera que estés