fbpx

Hola mundo! tal vez te ha pasado que cuando buscas sobre la profesión de data scientist encuentras otras como las de data engineer o data analyst.

Esto puede generar confusión porque estas profesiones pueden parecerse un poco entre sí.

Soy Rafa, trabajo como data scientist en esta entrada vamos a ver algunas de las diferencias entre estas profesiones, vamos allá.

Muy bien en estaentrada vamos a hablar sobre los tipos de profesiones de data science en este caso estamos hablando del data engineer data analysis y data scientist.

Para esto vamos a ver un poco el contexto del proceso data saints y cómo estas profesiones encajan acá y por último daremos unas conclusiones de cuál podría ser mejor para ti.

Profesiones en el proceso Data Science

bien ahora sí para empezar hablemos del procesos data science o como el flujo de actividades que hay en un proyecto de datos

la primera que sería de extracción y procesamiento de datos la segunda que sería de exploración y análisis y la tercera que sería de creación de un producto y reportes de datos

sería como la fase inicial la fase intermedia y la fase final por verlo de una manera bastante minimalista o sencilla

Tipos de profesiones de datos

Las principales profesionas son el data engineer, data analyst y data scientist. Hablemos un poco más de cada una de ellas.

¿Qué es un data engineer?

ahora la primera profesión de la que van a hablar es el data engineer.

esta persona por lo general se encarga de crear las bases de datos y las tablas todo esto del data warehouse el data lake o los lagos y los data mart

ejemplos de esto es por ejemplo la información los datos que en una empresa o cuando los datos vienen de terceros cuando tenemos que unas redes sociales para traernos información o internet de las cosas

el ingeniero de datos también desarrolla y construye las pipeline de datos que lo que hacen es llevar la información de un sitio a otro transformándola y procesando

algunas de las herramientas de programación que suelen usarlo en género de datos tienen que ver mucho con la gestión de bases de datos también con python escala o java

y por la parte de big data pues se manejan en todo el ecosistema bastante bien y conocen herramientas como zookeeper hadoop yarn nifi hive spark y bueno todas estas

¿Qué es un data analyst?

ahora el data analyst digamos que es como el encargado de tomar toda esa información que se genera en esta primera fase y hace el análisis exploratorio de datos

con esto puede terminar generando visualizaciones o reportes para que lo que stakeholder o interesado descubran ciertas preguntas iniciales que tengan sobre ese proyecto de datos

entonces pues van a estar muy metido en esta parte de hacer dashboards sobre todo y para eso van a manejar herramientas de bi como power bi tablueau o clic

también saben mucho de sql y pues excel también y la programación en R y Python pueden manejarla más a nivel de análisis

¿Qué es un data scientist?

bien hablemos ahora de data scientist

esté profesional en teoría hace lo mismo que un analista pero puede hacer algunas cosas extra

esto extra sería pues la creación de modelo estamos hablando de machine learning y de la inteligencia artificial y también implementar todo esto en el software

las herramientas que suele utilizar un data scientist pues se parecen mucho a las del analista y también pue s R y Python a un nivel más avanzado

aquí estamos hablando de herramientas cómo sklearn jupyter sas spss para manejo de datos a nivel estadístico spark sql y bueno un poco de etl también para la implementación de los modelos

¿Cómo se relaciona el ingeniero, analista y científico de datos?

si volvemos al modelo inicial del proceso de data sign pues ahora lo podemos ver con un poco más de separación en las actividades

acá podemos encontrar cosas como la recolección de datos el procesamiento y la limpieza

también por otro lado la exploración finalmente lo algoritmo los modelos la creación de estos productos de datos

así que estas tres partes pues irían con cada una de las profesiones que estamos hablando

División del trabajo en empresas grandes

en este diagrama podemos ver cómo de forma ideal para empresas grandes cada uno de estos pasos de estas actividades correspondería a algún profesional

la primera parte pues de procesamiento sería para los ingenieros la parte de exploración para los analistas y la parte de los modelos para los científicos de datos

más o menos esto sería en el mundo ideal de las empresas grandes y por ejemplo digo empresas grandes porque en empresas pequeñas es muy probable que una sola persona tenga que hacer todo esto

pero también se esperaría que el proyecto no fuera pues tan grande

Algo más realista sería…

a medida que la empresa va creciendo y pues tiene más dinero para contratar más personas pues se separan un poco de estas funciones

y también pues este modelo muchas veces no se adapta a la realidad

y algo quizá más realista pudiera hacer esto de acá en donde se solapan las funciones

en mi experiencia muchas veces los ingenieros de datos también son activa en la construcción del producto de datos por el hecho de que saben mucho de cómo se maneja la información de nivel inicial y todo el procesamiento

también el analista de datos algunas veces se mete con los modelos estadísticos y trabaja en conjunto en la limpieza de datos con el ingeniero

de igual forma un científico de datos también puede ser muy integral en el sentido de que puede estar en el procesamiento de datos y un poco en la limpieza

como habíamos visto que el data scientist también funciona como un data de analyst pues puede hacer el análisis de datos

¿Qué profesion de datos podría ser mejor para ti?

bien ahora disfrutando un poco sobre cuál podría ser la mejor para ti esto pues siempre recordando que la decisión final la tendrías tú y esto que digo yo se basa un poco en mi experiencia

entonces para eso quiero traerme este diagrama que ya hemos visto en algún otro vídeo sobre las habilidades de un data scientist y que poníamos básicamente que había la estadística la programación y los negocios

y para ir directo al grano si tú consideras que tu perfil se parece más al de estadística o el de data nerd pues yo te aconsejaría apuntar o ir a data scientist

por otro lado si tú pones más de programación o como ese hacker entonces posiblemente sería mejor ir a la parte de data engineer

y por último si tu perfil es más de negocio y te ves reflejando más lo que es como ese accountant o va con tan como se diga pues mi recomendación sería que empezarás como data analyst

y esto por supuesto a lo largo del camino no importa como empieces tú puedes ir variando y saltando entre distintas profesiones

Genial!

Espero esta información te ayude a decidir si Data Science es una profesión que vale la pena para ti! Te mando un saludo donde quiera que estés