fbpx

Hola mundo! En esta entrada vamos a ver el paquete pandas. Este paquete permite construir una de las estructuras de datos m谩s importantes para la programaci贸n en ciencia de datos con python, los dataframes.

Esta entrada es parte de la serie Python para data science. Espero te anime a seguir aprendiendo. el objetivo de esta entrada es que puedas empezar a usar jupyter notebooks utilizando la interfaz de jupyterlab. Vamos a ver.

Esta entrada incluye un notebook de pr谩ctica que puedes descargar en este enlace.

Qu茅 es el paquete PANDAS para ciencia de datos?

Es un paquete que te ayuda a trabajar con datos multidimensionales que son comunes en estad铆stica o econometr铆a. El nombre viene de PANel DAta Set.

Por otro lado, pandas es muy 煤til para manipular tablas de datos, esto con la estructura de datos que vamos a conocer como data frames.

Los dataframes tiene la particularidad de que diferentes tipos de variables pueden encajar en la misma tabla. Esto a diferencia de un array de que s贸lo admite un tipo de dato por conjunto de datos.

Por 煤ltimo, pandas est谩 construido sobre numpy lo que lo hace tambi茅n s煤per r谩pido y eficiente.

C贸mo crear data frames en pandas?

Estando ya en el notebook lo primero que vamos a hacer es cargar o importar el paquete de pandas como pd

Crear Dataframes a partir de listas

Lo primero que vamos a hacer es aprender c贸mo crear un data frame a partir de listas. Entonces, en este caso tenemos datos de las redes sociales

Ahora, para crear el df o data frame a partir de esta lista utilizamos el c贸digo

Crear dataframes vac铆os en Pandas

Otra forma de crear data frames es utilizar data frames vac铆os que despu茅s iremos rellenando. Para eso voy a crear una variable que voy a llamar df_vac铆o con la misma estructura del df anterior

Y como esperamos no tiene ning煤n tipo de informaci贸n. Ahora, para agregar los datos a este tipo de data frame tenemos que hacer una asignaci贸n del mismo data frame donde vamos a utilizar el m茅todo .append()

Agregamos los datos de la siguiente forma

Recuerda siempre al final escribir la opci贸n ignore_index=True. Ahora vemos que el df ya tiene algo de informaci贸n

As铆 que genial, pero recordar que estas son formas de llenar los df digamos 芦directamente禄 de python. Pero lo m谩s com煤n es que siempre tengas un archivo csv o excel.

C贸mo seleccionar elementos de un data frame de pandas?

Seleccionar un elemento

Para esto podemos usar el m茅todo .loc() que es para seleccionar por etiquetas o por los nombres de la columna.

Tambi茅n podemos utilizar el m茅todo .iloc() que ser铆a par seleccionar la posici贸n de la columna, por ejemplo

Seleccionar una columna o fila/rengl贸n

Para seleccionar por columnas

Para seleccionar por fila/rengl贸n

Seleccionar con un filtro en el dataframe

Primero escribimos la condici贸n

La inclu铆mos en el dataframe

C贸mo seleccionar elementos en arrays de Numpy?

De forma ascendente: de menor a mayor

De forma descendente: de mayor a menor

Ordenar por dos columnas

Perfecto!

Ya sabes lo b谩sico para manipular dataframes de python! Espero est谩s entradas te est茅n ayudando.

Te mando un saludo donde quiera que est茅s!