Hola mundo! En esta entrada vamos a ver el paquete pandas. Este paquete permite construir una de las estructuras de datos m谩s importantes para la programaci贸n en ciencia de datos con python, los dataframes.
Esta entrada es parte de la serie Python para data science. Espero te anime a seguir aprendiendo. el objetivo de esta entrada es que puedas empezar a usar jupyter notebooks utilizando la interfaz de jupyterlab. Vamos a ver.
Esta entrada incluye un notebook de pr谩ctica que puedes descargar en este enlace.
Qu茅 es el paquete PANDAS para ciencia de datos?
Es un paquete que te ayuda a trabajar con datos multidimensionales que son comunes en estad铆stica o econometr铆a. El nombre viene de PANel DAta Set.
Por otro lado, pandas es muy 煤til para manipular tablas de datos, esto con la estructura de datos que vamos a conocer como data frames.
Los dataframes tiene la particularidad de que diferentes tipos de variables pueden encajar en la misma tabla. Esto a diferencia de un array de que s贸lo admite un tipo de dato por conjunto de datos.
Por 煤ltimo, pandas est谩 construido sobre numpy lo que lo hace tambi茅n s煤per r谩pido y eficiente.
C贸mo crear data frames en pandas?
Estando ya en el notebook lo primero que vamos a hacer es cargar o importar el paquete de pandas como pd
Crear Dataframes a partir de listas
Lo primero que vamos a hacer es aprender c贸mo crear un data frame a partir de listas. Entonces, en este caso tenemos datos de las redes sociales
Ahora, para crear el df o data frame a partir de esta lista utilizamos el c贸digo
Crear dataframes vac铆os en Pandas
Otra forma de crear data frames es utilizar data frames vac铆os que despu茅s iremos rellenando. Para eso voy a crear una variable que voy a llamar df_vac铆o con la misma estructura del df anterior
Y como esperamos no tiene ning煤n tipo de informaci贸n. Ahora, para agregar los datos a este tipo de data frame tenemos que hacer una asignaci贸n del mismo data frame donde vamos a utilizar el m茅todo .append()
Agregamos los datos de la siguiente forma
Recuerda siempre al final escribir la opci贸n ignore_index=True. Ahora vemos que el df ya tiene algo de informaci贸n
As铆 que genial, pero recordar que estas son formas de llenar los df digamos 芦directamente禄 de python. Pero lo m谩s com煤n es que siempre tengas un archivo csv o excel.
C贸mo seleccionar elementos de un data frame de pandas?
Seleccionar un elemento
Para esto podemos usar el m茅todo .loc() que es para seleccionar por etiquetas o por los nombres de la columna.
Tambi茅n podemos utilizar el m茅todo .iloc() que ser铆a par seleccionar la posici贸n de la columna, por ejemplo
Seleccionar una columna o fila/rengl贸n
Para seleccionar por columnas
Para seleccionar por fila/rengl贸n
Seleccionar con un filtro en el dataframe
Primero escribimos la condici贸n
La inclu铆mos en el dataframe
C贸mo seleccionar elementos en arrays de Numpy?
De forma ascendente: de menor a mayor
De forma descendente: de mayor a menor
Ordenar por dos columnas
Perfecto!
Ya sabes lo b谩sico para manipular dataframes de python! Espero est谩s entradas te est茅n ayudando.
Te mando un saludo donde quiera que est茅s!