Hola mundo en esta entrada vamos a dar un introducción a los modelos estadísticos en Machine Learning.
¿Qué son los modelos estadísticos?
Un modelo un modelo es una versión simple de la realidad. Para este artículo, la realidad es algo que no se puede entender en su totalidad por nosotros. Por lo tanto, buscamos siempre algún aspecto que nos interese para poder simplificarlo y entenderlo desde ahí.
Por eso decimos que en principio «todos los modelos están mal pero algunos son útiles», dependiendo lo que queremos estudiar. Esta es una frase del gran estadístico George Box.
Ejemplos de modelos
- Si considera los modelos de movimiento en física de Newton y de Einstein, Newton habló de una forma simplificada y Einstein considerando la relatividad. El modelo de Newton no es que esté mal o que el de Einstein sea mejor. Para cada caso uno estudia una situación particular, en donde se considera o no la relatividad.
- También, cuando hablamos de modelos de belleza, podemos referirnos a algún aspecto simplificado donde consideramos solamente la belleza física como atributo.
- Otro caso serían modelos de arquitectura donde se hacen pequeñas maquetas de los edificios que se quieren construir para prevenir riesgos o ver si realmente es viable el proyecto.
- Los modelos económicos, aunque también son muy complejos y nunca la economía pudiera entenderse de una forma global o perfecta sí es verdad que algunos modelos como la ley de oferta y demanda pudieran darnos una mayor intuición sobre cómo se comportan los precios en un mercado.
- Por último, lo que nos va a interesar a nosotros en este vídeo son los modelos de machine learning esto es para qué sirven
Vamos a ver!
¿Cuales son los problemas de machine learning?
En mi experiencia, los modelos más importantes de machine learning son los de clasificación los de regresión y los de clúster y hay muchos otros pero no voy a entrar en detalle aquí por el momento.
Predicción
El problema de predicción consiste en estimar un valor numérico dada información previa. En ejemplo de estos son los valores o precios que tienen las casas basados en precios de otros inmuebles similares.
Algunos modelos de machine learning interesantes en el caso de predicción es toda la familia de
regresión, como la lineal múltiple o no lineal (salvo la regresión logística que suele utilizarse para clasificación).
Clasificación
El problema de clasificación es similar sólo que en este caso buscaríamos etiquetar o clasificar en diferentes categorías a las observaciones un caso muy popular en el mundo de machine learning son los datos del Titanic.
En este caso, lo que buscamos es clasificar a un pasajero para saber si éste sobrevivirá o no basándose en sus características.
Algunos tipos de modelos útiles en clasificación son los árboles de decisión knn o naive bayes.
Clustering
Por último, el problema de clustering lo que quiere es también etiquetar a las observaciones, pero en este caso no tenemos información previa de a qué grupo pertenece.
Un ejemplo de esto, es cuando hacemos análisis y segmentación de mercado en donde tenemos diferentes clientes y queremos agruparlos según intereses para después venderle algún tipo de producto.
Los dos tipos de modelos más populares son kmedias o kmeans y clustering jerárquico al clustering
también se le llama análisis de conglomerados.
Modelos en el proceso de data science
Es posible que se te haga familiar el proceso de data science Este proceso básicamente lo que hace es tomar datos de la
realidad y luego son recolectados, procesados y limpiados.
Luego los datos podrían pasar a un análisis exploratorio de datos en donde se determina si tienen algún tipo de problema asociado con los problemas de machine learning.
En el caso de requerir la aplicación de algún modelo estadístico R es un lenguaje muy bueno para este fin. Hablaremos un poco más de esto en otras entradas.
Conclusión
Espero que este artículo te haya ayudado a entender un poco de la intuición detrás de lo que significa un modelo estadístico. En próximas entradas espero hablar de la regresión lineal simple y el modelos de clasificación
Te mando un saludo en donde quiera que estés!
Hola Senor Gonzalez, le saluda Edgar Nossa, de Bogota, soy estadístico administratyivo, de la universidad de la salle, con especialización en gerencia de mercados, trabaje toda mi vida en la industria farmacéutica, aplique mas que todo modelos estadisticos descritptivos, en mis inicios como esatdistico en colombia , esta profesion en 1986, no era muy calificada por ello me dedique a la farmaceutica donde hice carrera , en esta pandemia la he aprovechado para reeducarme y le doy las gracias por su tutorial, son magnificos, he apendido bastante sobre R, manejo mas el excel para lo que toca haer en mercadeo, me gustaria profundizar mas en el area de Investigacion de mercados con , diseno experiemental,series de tiempo, como R, me puede ayudar en estos campos, gracias, saludos de hermano Colombiano, espero su retroalimentacion
Hola, Edgar! Que interesante saber tu historia en la industria farmacéutica! Este momento es el mejor para aprender cosas nuevas. Me alegra mi contenido te haya servido! Un saludo a Colombia.