fbpx

Hola mundo! En esta entrada vamos a ver qué son los paquetes y cómo se utilizan en Python.

Esta entrada es parte de la serie Python para data science. Espero te anime a seguir aprendiendo. el objetivo de esta entrada es que puedas empezar a usar jupyter notebooks utilizando la interfaz de jupyterlab. Vamos a ver.

Esta entrada incluye un notebook de práctica que puedes descargar en este enlace.

Qué son los paquetes en python?

Los paquetes son piezas de código que extienden las funcionalidades de python. Un ejemplo de esto lo vimos en la entrada de las listas en donde construíamos con listas de listas un data frame.

Ahora, ¿como se vería un paquete? Es una carpeta con código .py que sería la extensión de código de python:

Cuál es la utilidad de los paquetes en data science?

Como decíamos podemos utilizar funciones que esto nos permite hacer cálculos complejos reutilizando el código. Por ejemplo, cuando queremos calcular promedio o modelo estadístico utilizamos código que ya ha escrito.

Otra persona otra ventaja es que nos permite usar clases y objetos. Y aunque no voy a entrar en mucho detalle sobre lo que significa una clase lo podemos ver como una estructura de datos más compleja como estilos data frame arrays y gráficos.

Si has instalado Python con Anaconda, en principio no tienes que descargar ningún paquete porque Anaconda incluye los paquetes básicos para ciencia de datos. Ahora sin más vamos a ver como importar paquetes en Python

Cómo importar paquetes en Python?

Lo primero que vamos a aprender es cómo importar un paquete en nuestro Jupyter Notebook y para eso lo que vamos a hacer es hacer un import y el nombre del paquete que en este caso lo vamos a hacer con NUMPY ejecutamos y básicamente eso sería todo ya:

para utilizar las funciones pues tendríamos que hacer numpy punto una función en este caso voy a utilizar la función range con un 9 esto básicamente es como una lista de python pero con otras funcionalidades que vamos a ir viendo más adelante.

Cómo importar paquetes con acrónimos

Lo que acabamos de hacer sería la forma digamos más corta de importar un paquete. Sin embargo, en el mundo de python y también en ciencia de datos se suele utilizar otra forma para llamar a los paquetes pero ahora con un acrónimo. Por ejemplo:

Si ejecutamos pues ahora podemos hacer lo mismo de aquí arriba pero utilizando np en lugar de numpy y utilizando a range de 9 esto ejecutamos y que obtenemos exactamente lo mismo

La ventaja de utilizar acrónimos es que además de que escribimos menos letras (y por lo tanto menos código).

También al ver estas letras sabemos ya que se trata de un paquete de numpy porque estos acrónimos tienden a ser estándar para cada paquete.

Cargar solo funciones de un paquete

Una última forma de importar en este caso de cargar funciones específicas de un paquete sería de la siguiente forma

Ahora pudiéramos hacer solamente a range de 9 para llamar a ese arreglo de numpy

Esta forma de importar las funciones de los paquetes yo no la recomiendo mucho porque al no tener ningún acrónimo en esta parte no sabemos si se trata de una función que trae python por defecto o que viene de numpy.

Cuáles es la diferencia entre funciones y métodos?

Esto al principio a mi me causaba confunsión (por eso lo incluyo aquí). Por un lado, una función es un conjunto de instrucciones que regresan algo, como en el caso de la función de numpy range(9) que nos regresaba un objeto que era el numpy array

Por otro lado, un método también son un conjunto de instrucciones pero que van a trabajar sobre un objeto. Como vamos a ver ahora, los numpy array tienen funciones asociadas que permiten hacer también cosas

Pero como esto puede que no haya quedado muy claro vamos a verlo en el notebook.

Vamos a hacer es guardar en una variable el resultado de la función arange(9)

ahora lo que vamos a hacer es utilizar una función para calcular el promedio de este arreglo… No hay mucho misterio aquí

ahora vamos a hacer lo mismo pero utilizando un método

Ambas formas son en principio lo mismo. Pero la diferencia es cómo se está pensando: mientras que a la función le pasamos opciones (en este caso el arreglo de numpy), en el caso del método lo estamos haciendo desde el objeto.

Cuáles son los principales paquetes para ciencia de datos en python?

Los paquetes más básicos serían:

  • Numpy
  • Pandas
  • Matplotlib

Pero como queremos saber más, he separado en este diagrama los principales paquetes de ciencia de datos por su utilidad: Procesamiento, visualización, modelos y minería de datos. Espero te sea de utilidad.

Genial!

Ya conoces un poco más sobre paquetes de python y la diferencia entre funciones y métodos.

Si te ha parecido útil, comparte. Te mando un saludo donde quiera que estés!