Hola mundo! En esta entrada vamos a ver el paquete numpy. Este paquete es fundamental para la ciencia de datos y computo científico.
Esta entrada es parte de la serie Python para data science. Espero te anime a seguir aprendiendo. el objetivo de esta entrada es que puedas empezar a usar jupyter notebooks utilizando la interfaz de jupyterlab. Vamos a ver.
Esta entrada incluye un notebook de práctica que puedes descargar en este enlace.
Qué es el paquete Numpy para ciencia de datos?
Es el paquete fundamental para el cómputo científico en Python. En este sentido, Numpy es un acrónimo para numeric-python.
Sirve para crear o utilizar vectores y matrices. A estas estructuras las vamos a llamar nd-array. Numpy también sirve para hacer cálculos estadísticos y matemáticos
Es muy utilizado porque es bastante rápido y eficiente
Cómo crear arreglos en Numpy?
En un notebook, empecemos importando el paquete numpy como np
Crear arreglos de numpy a partir de listas
Ahora, vamos a ver cómo crear de distintas formas los numpy arrays. Una forma que ya habíamos visto era utilizando las listas. Para esto, vamos a crear una lista que se llame números primos y vamos a escribir los primeros 10 números primos
ahora para crear una raya a partir de esto vamos a crear el array de los primos
Crear arrays de numpy con ceros
Ahora, una segunda forma de crear arrays de numpy que es bastante útil también es llenando los con ceros. Para crearlo hacemos
Esto te puede ayudar cuando quieres hacer iteraciones sobre una variable e ir guardando los resultados de cada paso. Esto se llama inicializar una variable.
Crear arreglos de numpy con números
Por último, otra forma de crear arrays es agregándole números. Para esto,
podemos utilizar esta función también agregándole más opciones para crear números sucesivos por ejemplo si quisiera hacer un array de números pares
Cómo operar con numpy-arrays?
Para esto, vamos a ver primero operaciones aritméticas y luego algunas funciones o métodos estadísticos. Por último cómo ordenar arrays de una dimensión.
Operaciones aritmeticas de arreglos de numpy
En cuanto a las operaciones aritméticas, por un lado, podemos sumar un número a un array. Por ejemplo, para sacar el array de los impartes podemos sumar uno al array de pares creado anteriormente:
Otra cosa que podemos hacer es multiplicar por 100
Entre otras operaciones aritméticas, se puede restar,
Además, también podemos dividir y acá si ejecutamos tener siempre presente la división entre 0 no existe y numpy va a regresar»inf» de infinito.
Métodos estadísticos para numpy arrays en python
Para empezar, la suma. Si tomamos el array de los números primos y hacemos un punto zoom lo que estaríamos sumando todas las casillas o todos los elementos de este arreglo
también en vez de sum podríamos tomar el promedio
podemos ver el var que sería la varianza
Esto es muy útil porque ya los nuncas y arrays traen algunos métodos asociados a la estadística y ciencia de datos.
Cómo ordenar un arreglo de numpy
para eso voy a crear un array que se llame fibonacci y le vamos a pasar los números de fibonacci pero desordenado
y para creernos de verdad que si son los números de fibonacci vamos a ordenarlo haciendo el np.sort de este arreglo
para ver que si son estos números podemos tomar los dos primeros que son cero y uno y luego irlos sumando para obtener el siguiente. Esto se cumple en este array ordenado.
si queremos hacer estos de orden descendente con numpy es un poco más engorroso. Sería algo así en dos pasos
Cómo seleccionar elementos en arrays de Numpy?
Vamos a ver estas tres formas de seleccionar elementos de un arreglo de numpy. Primero vamos a empezar creando esta matriz a partir de un arreglo.
Seleccionar un elemento
Podemos seleccionar un elemento podemos perdirlo delimitando entre corchetes el arreglo. Por ejemplo
Seleccionar varios elementos
Podemos seleccionar varios elementos. Por ejemplo, si quisiéramos una fila podríamos seleccionarla, luego coma y luego dos puntos esto es para indicarle que la fila 1
de una manera similar se puede seleccionar por columna haciendo dos puntos luego una coma y acaba seleccionando por ejemplo número 3
Utilizar filtro en arreglos
Vamos a aprender cómo utilizar filtros sobre el array de fibonacci que es el que tenía los números desordenados. Entonces, en este caso lo que vamos a hacer es tomar todos los números que sean menores a 20. Para eso, primero escribimos la condicion lógica de filtro así
y después hacemos el filtro propiamente
Genial!
Ya conoces un poco más sobre el paquete Numpy en python para hacer arreglos en ciencia de datos.
Si te ha parecido útil, comparte. Te mando un saludo donde quiera que estés!