fbpx

Hola mundo! Te gustaría saber qué es data science o ciencia de datos? cuáles son los problemas que enfrentan y las aplicaciones que tienen lo que se llama la profesión más sexy del siglo 21?

Lo veremos en está entrada

Muy bien en esta entrada quiero dar una visión más propia de lo que es la ciencia de datos.

Para eso, he dividido este artículo en tres partes una en donde hablamos del contexto y vemos por qué surge esto de la ciencia de datos. Luego otra donde vemos los problemas y las aplicaciones de esta disciplina. Por último, construir con todo esto una definición propia. Una definición flexible y ágil.

Esto un poco con la intención de decirte lo que me hubiera gustado escuchar a mí hace unos años cuando empezaba a buscar trabajos como data scientist.

Contexto: por qué surge data science?

Bien, para hablar un poco del contexto tenemos que mencionar algunas cosas como: transformación digital cuarta revolución industrial nueva era de la información y otros nombres parecidos…

Transformación digital

Esto lo que hace referencia es a todo el cambio que ha venido surgiendo de unos años para acá cosas como:

  • El uso de las redes sociales
  • Amazon para comprar cosas que nos traigan a nuestra casa
  • Utilizar aplicaciones como airbnb para poder quedarnos en otros lugares
  • Utilizar en vez de taxis uber
  • Ver en vez de televisión netflix
  • Y en vez de trabajo de oficina el teletrabajo que ya se está acostumbrando cada vez más

Todos estos cambios que vamos a englobar en lo que se llaman la transformación digital han traído algunas consecuencias.

Crecimiento exponencial de los datos

Entonces, una de las consecuencias que ha traído todo esto de la transformación digital es el crecimiento exponencial de los datos.

Para hacernos una idea, una computadora tiene un terabyte que son mil gigas y se dice o se pronostica que para el año 2025 van a haber aproximadamente 175 zetabytes.

Ojo, porque zeta bytes son mil millones de terabytes. Entonces estamos diciendo que para 2025 vamos a necesitar más o menos 175 mil millones de ordenadores o computadoras para poder almacenar toda esta información.

Esto es una LOCURA y todo esto un poco también se le llama lo que el big data

Entonces, esto que te he dicho del contexto de la transformación digital y del big data son las cosas que van a dar paso a la ciencia de datos como una profesión que va ayudar a resolver los problemas que nacen de todo eso.

Aplicaciones de la ciencia de datos

Desde siempre, los negocios han necesitado información para poder mejorar los productos que ofrecen a sus clientes y también para predecir las tendencias de lo que va a pasar si les va a ir bien mal o prevenir a alguna catastrofe.

Esto antes digamos, que era más sencillo de hacer pero ahora con todo este auge del crecimiento exponencial de los datos y la transformación digital hacen falta nuevas herramientas para poder abordar los mismos problemas de siempre.

Las aplicaciones que tienen data science son muchísimas sin embargo no las voy a mencionar todas voy a ir por algunas que me han llamado la atención.

Banca

Detectar patrones atípicos y pueden detectar fraudes o comportamientos raros

Ciberseguridad

Asociado a la parte de riesgo y seguro estaría todo lo del cálculo de las primas y también el análisis de riesgo de créditos para saber si a una persona se le puede prestar dinero

Reconocimiento de imágenes

Sirve mucho en medicina para poder detectar tumores y alguna que otra enfermedad así como también en los buscadores como google o bing que ya pasar la imagen y hace una búsqueda basada en imágenes para todo esto se utilizan algoritmos

Marketing

Es súper importante para la segmentación o clasificación de cliente esto para saber qué ofrecer a cada tipo de personas dependiendo de sus necesidades

Inteligencia artificial

Se están usando para la conducción de coches de forma automática

Qué es data science

En mi caso, asocio data science con estás imágenes

Por un lado, esa parte de inteligencia artificial o esa mente con esos algoritmos que descubren y hacen todo este montón de cosas.

También, la figura de ese programador otra tasa de ente que está todo el día haciendo ahí su código para trabajar.

Los equipos también de negocios porque como te decía todo esto pues tienen diferentes personas que trabajan en conjunto para lograr que se haga un mismo proyecto.

Y por último, las diferentes empresas no está un poco ya yéndose quizás a silicon valley a todo este mundo de startups no que se asocia y en donde los data scientist aportan valor a las empresas.

Definición flexible y ágil

Bien, antes de dar una definición que quería pasarme rapidísimo por el diccionario de la real academia española rae para encontrar una definición (para ciencia y datos):

Teniendo estas dos piezas vamos a definir ciencia de datos o data science y la vamos a poner entonces como un conjunto de conocimientos pero ese conjunto de conocimiento en cuatro áreas:

  • Estadística/Matemática
  • Programación ( en R y en Python )
  • Negocio/académia
  • Comunicación

Entonces, este conjunto de conocimiento lo importante es que va a servir para aportar valor con información

Esto un poco, lo que hacemos referencia es que todo lo que vamos a aportar va a ser basado en datos ya no nos vamos a guiar por intuiciones o por alguna teoría filosófica de alguna persona. NO. Vamos a tener datos

Con los datos vamos a sacar conclusiones y vamos a ayudar a que otras personas decidan pero basados en información. Por eso, esa parte de ciencia.

Las formas más usuales con las que se suele aportar valor son:

  • Con código, esto puede ser de dashboards o aplicaciones
  • Pipelines de datos o ETLs
  • Modelos de inteligencia artificial o más machine learning o modelos estadísticos
  • Visualizaciones con reportes

Todo esto, con la idea de que ayude a otras personas a tener una visión global o general de los datos de su empresa o negocio.

Genial!

Espero que esta definición te deje un poco más claro qué es la ciencia de datos! Te mando un saludo donde quiera que estés!