fbpx

Hola mundo en esta entrada vamos a dar un introducción a los modelos estadísticos en Machine Learning.

¿Qué son los modelos estadísticos?

Un modelo un modelo es una versión simple de la realidad. Para este artículo, la realidad es algo que no se puede entender en su totalidad por nosotros. Por lo tanto, buscamos siempre algún aspecto que nos interese para poder simplificarlo y entenderlo desde ahí.

Por eso decimos que en principio «todos los modelos están mal pero algunos son útiles», dependiendo lo que queremos estudiar. Esta es una frase del gran estadístico George Box.

Ejemplos de modelos

  • Si considera los modelos de movimiento en física de Newton y de Einstein, Newton habló de una forma simplificada y Einstein considerando la relatividad. El modelo de Newton no es que esté mal o que el de Einstein sea mejor. Para cada caso uno estudia una situación particular, en donde se considera o no la relatividad.
modelos de newton vs einstein
  • También, cuando hablamos de modelos de belleza, podemos referirnos a algún aspecto simplificado donde consideramos solamente la belleza física como atributo.
modelos de belleza
  • Otro caso serían modelos de arquitectura donde se hacen pequeñas maquetas de los edificios que se quieren construir para prevenir riesgos o ver si realmente es viable el proyecto.
modelo arquitectura casas
  • Los modelos económicos, aunque también son muy complejos y nunca la economía pudiera entenderse de una forma global o perfecta sí es verdad que algunos modelos como la ley de oferta y demanda pudieran darnos una mayor intuición sobre cómo se comportan los precios en un mercado.
modelo economico de oferta y demanda
  • Por último, lo que nos va a interesar a nosotros en este vídeo son los modelos de machine learning esto es para qué sirven

Vamos a ver!

¿Cuales son los problemas de machine learning?

En mi experiencia, los modelos más importantes de machine learning son los de clasificación los de regresión y los de clúster y hay muchos otros pero no voy a entrar en detalle aquí por el momento.

Predicción

El problema de predicción consiste en estimar un valor numérico dada información previa. En ejemplo de estos son los valores o precios que tienen las casas basados en precios de otros inmuebles similares.

prediccion con la ouija

Algunos modelos de machine learning interesantes en el caso de predicción es toda la familia de
regresión, como la lineal múltiple o no lineal (salvo la regresión logística que suele utilizarse para clasificación).

Clasificación

El problema de clasificación es similar sólo que en este caso buscaríamos etiquetar o clasificar en diferentes categorías a las observaciones un caso muy popular en el mundo de machine learning son los datos del Titanic.

clasificaciones de pasajeros del titanic

En este caso, lo que buscamos es clasificar a un pasajero para saber si éste sobrevivirá o no basándose en sus características.

Algunos tipos de modelos útiles en clasificación son los árboles de decisión knn o naive bayes.

Clustering

Por último, el problema de clustering lo que quiere es también etiquetar a las observaciones, pero en este caso no tenemos información previa de a qué grupo pertenece.

clustering de uvas

Un ejemplo de esto, es cuando hacemos análisis y segmentación de mercado en donde tenemos diferentes clientes y queremos agruparlos según intereses para después venderle algún tipo de producto.

Los dos tipos de modelos más populares son kmedias o kmeans y clustering jerárquico al clustering
también se le llama análisis de conglomerados.

Modelos en el proceso de data science

Es posible que se te haga familiar el proceso de data science Este proceso básicamente lo que hace es tomar datos de la
realidad y luego son recolectados, procesados y limpiados.

Luego los datos podrían pasar a un análisis exploratorio de datos en donde se determina si tienen algún tipo de problema asociado con los problemas de machine learning.

proceso data science para modelos estadísticos

En el caso de requerir la aplicación de algún modelo estadístico R es un lenguaje muy bueno para este fin. Hablaremos un poco más de esto en otras entradas.

Conclusión

Espero que este artículo te haya ayudado a entender un poco de la intuición detrás de lo que significa un modelo estadístico. En próximas entradas espero hablar de la regresión lineal simple y el modelos de clasificación

Te mando un saludo en donde quiera que estés!