Científico de Datos: una guía completa

Milthon Lujan Monja

Updated on:

El Científico de Datos o Data Scientist puede encontrar tendencias en grupos de bases de datos. Imagen de Freepik
El Científico de Datos o Data Scientist puede encontrar tendencias en grupos de bases de datos. Imagen de Freepik

¿Está fascinado por el mundo de la ciencia de datos y ansioso por emprender una carrera como científico de datos? ¡No busques más! En esta guía completa, desvelaremos los secretos de este apasionante campo y te brindamos recomendaciones para expandir tus habilidades y conocimientos esenciales para convertirse en un científico de datos exitoso.

El avance de las tecnologías ha permitido a las empresas transformar una gran cantidad de datos generados en información importante para la toma de decisiones estratégicas (da Silveira et al., 2022). La ciencia de datos está revolucionando las industrias y transformando la forma en que las empresas toman decisiones. Sin embargo, extraer información significativa de grandes cantidades de datos mediante análisis estadístico, técnicas de aprendizaje automático y programación requieren de un profesional formado para atender estas necesidades.

En el escenario actual, se espera que los científicos de datos den sentido a los vastos almacenes de big data que se genera en las diferentes industrias, que son cada vez más complejos y heterogéneos por naturaleza (Smaldone et al., 2022). Esto ha generado que el Científico de Datos se convierta en una profesión más atractiva y bien remunerada (Ramzan et al., 2021).

Según el 2020 US Emerging Jobs Report, citado por Linkedin en su informe “Jobs on the Rise in 2021” la demanda por científicos de datos y el ingenieros en datos tienen un crecimiento promedio anual de 35%, mientras que el ranking de los 50 mejores empleos en Estados Unidos durante el año 2021 de la web Glassdoor, el sueldo promedio anual de un científico de datos es de $113,736.

Si eres principiante o ya tienes experiencia en ciencia de datos, esta guía te llevará en un viaje desde los conceptos básicos hasta los avanzados para convertirte en un científico de datos.

Contenidos ocultar

¿Qué es un Científico de Datos o Data Scientist?

Un Científico de Datos, también conocido como Data Scientist, es un profesional que utiliza métodos científicos, análisis de datos y algoritmos para extraer conocimiento de grandes conjuntos de datos; en este sentido, son los responsables de traducir los datos en bruto en información accionable que pueda ser utilizada por las empresas para tomar decisiones más informadas basadas en datos que les permitan mejorar sus productos, servicios y estrategias.

En palabras sencillas podemos definir al científico de datos (Data Scientist) como el profesional encargado de combinar una variedad de conocimientos para analizar los datos recopilados de la web, teléfonos inteligentes, clientes, sensores y otras fuentes para obtener información útil.

En este sentido, como científico de datos, estarás a la vanguardia de esta revolución y utilizarás tu experiencia para impulsar la innovación y resolver problemas complejos en las diferentes compañías con el advenimiento de la Industria 4.0.

¿Qué hace un Científico de Datos?

Los científicos de datos desempeñan un papel crucial en las organizaciones al utilizar sus habilidades analíticas para extraer información valiosa de los datos y brindar recomendaciones prácticas. Trabajan en estrecha colaboración con las partes interesadas para comprender los objetivos comerciales y desarrollar soluciones basadas en datos. Los científicos de datos también tienen la capacidad de comunicar sus hallazgos de manera efectiva, traduciendo conceptos técnicos complejos en conocimientos comprensibles para las partes interesadas no técnicas.

Funciones y responsabilidades

Las funciones y responsabilidades de un Data Scientist pueden variar según la empresa y el sector, pero generalmente incluyen:

  • Recopilación y limpieza de datos
  • Análisis de datos
  • Desarrollo de modelos predictivos
  • Visualización de datos
  • Comunicación de resultados

¿Cuáles son las principales tareas del científico de datos?

Discover Data Science destaca que las principales tareas de un científico de datos incluyen:

  1. Recopilar cantidades masivas de datos y convertirlos a un formato fácil de analizar.
  2. Resolver problemas relacionados con el negocio mientras se utilizan técnicas y herramientas basadas en datos.
  3. Usar una variedad de lenguajes de programación, así como programas, para la recopilación y el análisis de datos.
  4. Tener una gran riqueza de conocimientos con técnicas y herramientas analíticas.
  5. Comunicar hallazgos y ofrecer consejos a través de visualizaciones de datos efectivas e informes completos.
  6. Identificar patrones y tendencias en los datos; proporcionar un plan para implementar mejoras.
  7. Análisis predictivo; anticipándose a futuras demandas, eventos, actuaciones, tendencias, etc.
  8. Contribuir a las arquitecturas de la minería de datos, estándares de modelado, informes y metodologías de análisis de datos.
  9. Inventar nuevos algoritmos para resolver problemas y construir herramientas analíticas.
  10. Recomendar cambios rentables a los procedimientos y estrategias existentes.

Habilidades necesarias para convertirse en un científico de datos

Convertirse en un científico de datos requiere un conjunto diverso de habilidades que abarcan competencias tanto técnicas como no técnicas. Della Volpe y Esposito (2020) destacan que el trabajo del científico de datos requiere una combinación única de habilidades, que generalmente comprenden tanto una base sólida en ciencia de datos como un talento innato para sintetizar ideas complejas, abordando así los procesos de toma de decisiones en las organizaciones.

Discover Data Science indica que un científico de datos debe ser en parte matemático, en parte científico en computación, y en parte estratega de negocios; además debe tener experiencia en varias disciplinas diferentes; debido que este profesional procesa grandes cantidades de datos para descubrir tendencias (Liu, 2015).

READ  Value stream mapping: ¿Qué es y cómo implementarlo?

Por su parte, Provost y Fawcett (2013) destacan que los científicos de datos exitosos deben ser capaces de ver los problemas de la compañía desde una perspectiva de los datos; con la finalidad de proponer estrategias que permitan mejorar la gestión de la empresa.

Un estudio realizado por Erkan et al., (2023) concluye que las demandas de los empleadores que han anunciado su interés en contratar un científico de datos prefieren personas expertas en aprendizaje automático, ciencia de datos, Python, SQL, R, estadística y matemáticas, personas con niveles educativos de licenciatura, maestría y doctorado, personas con más de 3 años de experiencia laboral y personas que conozcan técnicas de visualización, minería de datos, predicción, PNL y clustering.

De esta forma, si bien las habilidades técnicas son esenciales para la manipulación y el análisis de datos, las habilidades no técnicas son igualmente importantes para una comunicación y resolución de problemas efectivas. A continuación te presentamos una descripción más detallada de las habilidades que debes desarrollar para convertirte en un científico de datos:

Habilidades técnicas

Los científicos de datos deben tener una base sólida en matemáticas y estadística, ya que éstas forman la base de muchas técnicas de ciencia de datos. Una comprensión sólida de la probabilidad, el álgebra lineal y el cálculo es crucial para trabajar con algoritmos y modelos complejos. Además, los científicos de datos deben dominar lenguajes de programación como Python o R, ya que se utilizan ampliamente en la ciencia de datos para la manipulación, el análisis y el aprendizaje automático de datos.

Otra habilidad técnica importante para los científicos de datos es el conocimiento de bases de datos y SQL (lenguaje de consulta estructurado). Los científicos de datos suelen trabajar con grandes conjuntos de datos almacenados en bases de datos y SQL les permite recuperar y manipular datos de manera eficiente. La familiaridad con las tecnologías de big data como Hadoop y Spark también es valiosa, ya que permiten a los científicos de datos trabajar con conjuntos de datos masivos que no se pueden procesar con métodos tradicionales.

Habilidades no técnicas

Además de las habilidades técnicas, los científicos de datos deben poseer ciertas habilidades no técnicas que son esenciales para el éxito en este campo. La comunicación eficaz es crucial, ya que los científicos de datos necesitan explicar conceptos complejos a partes interesadas no técnicas y presentar sus hallazgos de manera clara y concisa. También deben tener sólidas habilidades para la resolución de problemas, ya que se enfrentarán a problemas comerciales complejos que requieren soluciones innovadoras.

Además, los científicos de datos deben ser curiosos y tener pasión por aprender. El campo de la ciencia de datos está en constante evolución y los científicos de datos deben mantenerse actualizados con los últimos avances y técnicas. Deben ser proactivos en la búsqueda de nuevos conocimientos y en la mejora continua de sus habilidades.

¿Qué estudiar para ser científico de datos?

Existen varios caminos educativos que los aspirantes a científicos de datos pueden tomar para adquirir las habilidades y conocimientos necesarios. Si bien un título tradicional en informática, matemáticas o estadística es valioso, no es el único camino para convertirse en un científico de datos. Muchos científicos de datos exitosos provienen de diversos orígenes y han adquirido sus habilidades a través del autoestudio, cursos en línea y campamentos de entrenamiento.

Programas de grado tradicionales

Obtener una licenciatura o maestría en informática, matemáticas o estadística proporciona una base sólida en los conceptos y principios teóricos de la ciencia de datos. Estos programas suelen cubrir temas como algoritmos, probabilidad, estadística, aprendizaje automático y análisis de datos. Un título de una universidad acreditada puede mejorar su credibilidad y abrir puertas a oportunidades laborales en este campo.

Cursos y Bootcamps en línea

Los cursos y bootcamps en línea ofrecen una forma flexible y rentable de adquirir las habilidades necesarias para una carrera en ciencia de datos. Plataformas como Coursera, edX y Udacity ofrecen una amplia gama de cursos en ciencia de datos, aprendizaje automático y programación. Estos cursos suelen ser impartidos por expertos de la industria y brindan experiencia práctica a través de proyectos y asignaciones.

Los bootcamps, por otro lado, son programas intensivos que ofrecen formación inmersiva en ciencia de datos durante un corto período de tiempo. Estos programas están diseñados para proporcionar habilidades prácticas que sean directamente aplicables a las necesidades de la industria. Si bien es posible que no proporcionen la misma profundidad de conocimiento teórico que un título tradicional, pueden ser una excelente opción para quienes buscan ingresar a este campo rápidamente.

Autoestudio

El autoestudio es otra opción viable para los aspirantes a científicos de datos, especialmente para aquellos que prefieren un enfoque de aprendizaje más flexible e independiente. Hay numerosos recursos disponibles en línea, incluidos libros de texto, tutoriales y comunidades en línea, que pueden ayudarlo a aprender las habilidades necesarias a su propio ritmo. Sin embargo, el autoestudio requiere disciplina y automotivación, ya que no existe una estructura ni orientación formal.

Independientemente del camino educativo que elija, es importante complementar su aprendizaje con experiencia práctica. Crear una cartera de proyectos y participar en competencias de Kaggle puede demostrar sus habilidades y ayudarlo a destacarse en un mercado laboral competitivo.

Hoja de ruta para ser un científico de datos

Si lo tuyo es el aprendizaje de forma autonoma, aquí tienes una hoja de ruta para desarrollar tus habilidades como científico de datos:

Habilidades Fundamentales

  • Matemáticas y Estadísticas:
    • Álgebra Lineal
    • Probabilidad
    • Estadísticas
  • Programación:
    • Python o R (preferiblemente ambos)
    • SQL para consultas a bases de datos
  • Conocimiento del Dominio:
    • Desarrollar comprensión en el dominio en el que deseas aplicar Data Science.

Manipulación y Análisis de Datos

  • Manipulación de Datos:
  • Visualización de Datos:
  • Análisis Exploratorio de Datos (EDA):
    • Aprender a analizar y visualizar datos para obtener insights.

Conceptos Básicos de Machine Learning

  • Introducción a ML:
    • Comprender conceptos de aprendizaje supervisado y no supervisado.
  • Bibliotecas de ML:
  • Evaluación de Modelos:
    • Métricas como precisión, sensibilidad, especificidad y puntuación F1.

Machine Learning Avanzado

  • Aprendizaje Profundo:
  • Aprendizaje por Conjuntos:
    • Bosques Aleatorios, Reforzamiento Gradual (Gradient Boosting)
  • Despliegue de Modelos:
    • Comprender cómo desplegar modelos en producción.

Tecnologías de Big Data

  • Ecosistema Hadoop:
  • Spark:
    • Aprender cómputo distribuido para el procesamiento de grandes conjuntos de datos.

Bases de Datos y Almacenamiento de Datos

Plataformas en la Nube

  • AWS, Azure o Google Cloud:
    • Aprender a trabajar con plataformas en la nube para soluciones de datos escalables.
READ  Second Brains: organiza tu vida digital y desbloquea tu creatividad

Control de Versiones

  • Git:
    • Comprender el control de versiones para la colaboración.

Colaboración y Comunicación

  • Cuadernos Jupyter:
    • Entorno colaborativo de codificación.
  • Documentación:
    • Compartir hallazgos de manera efectiva a través de la documentación.

Aprendizaje Continuo y Especialización

  • Mantente Actualizado:
    • Actualizar regularmente tus habilidades en este campo en constante evolución.
  • Especialización:
    • Enfocarte en áreas específicas como Procesamiento del Lenguaje Natural (NLP), Visión por Computadora o Análisis de Series Temporales.

Construir un Portafolio

  • Proyectos:
    • Trabajar en proyectos del mundo real para mostrar tus habilidades.
  • GitHub:
    • Crear un repositorio en GitHub para tu portafolio.

Networking

  • Comunidades en Línea:
  • Conferencias y Encuentros:
    • Asistir a conferencias de la industria y encuentros locales.

Este roadmap es una guía general y las personas pueden progresar a su propio ritmo. El aprendizaje continuo, proyectos prácticos y la creación de redes son cruciales para una exitosa carrera en Data Science. ¡Sigue adaptándote a las nuevas tecnologías y mantente curioso!

¿Dónde estudiar ciencia de datos?

Si la alta demanda y los salarios que llegan a alcanzar los científicos de datos te ha motivado a formarte profesionalmente o continuar estudios de maestría (master) o doctorado, en el mercado existe una amplia variedad de programas de estudios y a diferentes precios.

Asimismo, a continuación te brindamos un listado de formación profesional, master o cursos en ciencias de datos.

Carrera profesional en ciencia de datos

Maestría o master en ciencia de datos

Certificaciones de ciencia de datos y cursos en línea

Las certificaciones y los cursos en línea pueden ser credenciales valiosas para mostrar su experiencia en ciencia de datos. A continuación se muestran algunas certificaciones populares y cursos en línea en ciencia de datos:

Certificaciones

Cursos online

  • Especialización en ciencia de datos de Coursera: esta serie de cursos cubre los fundamentos de la ciencia de datos, incluido el análisis estadístico, el aprendizaje automático y la visualización de datos.
  • edX Data Science MicroMasters: este programa ofrece un plan de estudios integral en ciencia de datos, que cubre temas como probabilidad, estadística, aprendizaje automático y análisis de datos.
  • Udacity Data Science: este programa proporciona experiencia práctica en manipulación, análisis y aprendizaje automático de datos utilizando Python y R.
  • Kaggle: Una plataforma para competencias y colaboración en ciencia de datos.
  • DataCamp: Tutoriales interactivos y desafíos de codificación para aprender la ciencia de datos.

Estas certificaciones y cursos en línea pueden mejorar sus conocimientos y habilidades en ciencia de datos, y muchos de ellos también brindan oportunidades para trabajar en proyectos del mundo real.

Pasos para convertirse en un científico de datos

Convertirse en científico de datos es un viaje que requiere aprendizaje y práctica continuos. Estos son los pasos que puede seguir para embarcarse en esta emocionante carrera profesional:

  1. Define tus objetivos

Empiece por definir sus objetivos profesionales y comprender qué le motiva a convertirse en científico de datos. Esto le dará un sentido claro de dirección y le ayudará a mantenerse concentrado durante todo el viaje.

  1. Adquirir las habilidades necesarias

Identifique las habilidades necesarias para convertirse en un científico de datos y cree un plan de aprendizaje en consecuencia. Esto puede implicar inscribirse en programas de grado, cursos en línea o autoestudio. Recuerde centrarse tanto en las habilidades técnicas como en las no técnicas para desarrollar un conjunto completo de habilidades.

  1. Adquirir experiencia práctica

La práctica es crucial para dominar la ciencia de datos. Busque oportunidades para trabajar en proyectos del mundo real, ya sea a través de pasantías, trabajo independiente o proyectos personales. Crear una cartera de proyectos no solo mejorará sus habilidades prácticas sino que también demostrará su experiencia a posibles empleadores.

  1. Establezca contactos y colabore

La creación de redes es un aspecto importante de cualquier carrera y la ciencia de datos no es una excepción. Únase a comunidades en línea, asista a reuniones y conferencias y conéctese con profesionales en el campo. Colaborar con otros puede brindar valiosas oportunidades de aprendizaje y abrir puertas a nuevas oportunidades.

  1. Manténgase actualizado con las últimas tendencias

La ciencia de datos es un campo que evoluciona rápidamente y es importante mantenerse actualizado con las últimas tendencias y técnicas. Siga blogs de la industria, lea artículos de investigación y participe en foros en línea para mantenerse al tanto de los últimos avances y mejores prácticas.

  1. Aprender y mejorar continuamente

La ciencia de datos es un viaje de aprendizaje permanente. Incluso después de conseguir un trabajo como científico de datos, es importante seguir aprendiendo y mejorando sus habilidades. Mantenga la curiosidad, busque nuevos desafíos y aproveche las oportunidades de crecimiento y desarrollo.

Herramientas y tecnologías utilizadas en la ciencia de datos

La ciencia de datos implica trabajar con una variedad de herramientas y tecnologías que permiten la manipulación, el análisis y la visualización de datos. Estas son algunas de las herramientas y tecnologías más utilizadas en la ciencia de datos:

Lenguajes de programación

Python y R son los dos lenguajes de programación más populares en ciencia de datos. Python es conocido por su simplicidad y legibilidad, lo que lo convierte en la opción preferida de los principiantes. R, por otro lado, está diseñado específicamente para análisis estadístico y tiene una amplia gama de paquetes y bibliotecas para manipulación y visualización de datos.

Manipulación y análisis de datos

Pandas es una poderosa biblioteca de Python para manipulación de datos y análisis. Proporciona estructuras de datos y herramientas de análisis de datos fáciles de usar, lo que lo convierte en una opción popular entre los científicos de datos. SQL es otra herramienta esencial para trabajar con bases de datos y consultar datos.

READ  Metodología Waterfall: una guía completa para la gestión de proyectos

Aprendizaje automático

Scikit-learn es una biblioteca de aprendizaje automático ampliamente utilizada en Python. Proporciona una variedad de algoritmos y herramientas para clasificación, regresión, agrupación y reducción de dimensionalidad. TensorFlow y PyTorch son bibliotecas populares para el aprendizaje profundo, un subconjunto del aprendizaje automático que se centra en redes neuronales.

Visualización de datos

La visualización de datos es un aspecto importante de la ciencia de datos, ya que ayuda a comunicar conocimientos de forma eficaz. Matplotlib y Seaborn son bibliotecas de Python para crear visualizaciones estáticas, mientras que Plotly y Bokeh se utilizan para visualizaciones interactivas. Tableau es una herramienta popular que se utiliza para crear visualizaciones y paneles.

Tecnologías para analizar grandes volúmenes de datos

Hadoop y Spark son tecnologías de big data ampliamente utilizadas que permiten el procesamiento y análisis de grandes conjuntos de datos. Estas tecnologías están diseñadas para manejar computación distribuida y procesamiento paralelo, lo que permite trabajar con cantidades masivas de datos de manera eficiente.

Comparación de Científicos de Datos, Analista de Datos, Ingeniero de Datos, Ingeniero en IA e Ingeniero de Aprendizaje Automático

A continuación presentamos una tabla comparativa de los roles de Data Scientist, Data Analyst, Data Engineer, AI Engineer y Machine Learning Engineer. Ten en cuenta que estos roles pueden variar en diferentes organizaciones y contextos, y algunas responsabilidades pueden solaparse.

Tabla comparativa de Científicos de Datos, Analista de Datos, Ingeniero de Datos, Ingeniero en IA e Ingeniero de Aprendizaje Automático.

CaracterísticaData ScientistData AnalystData EngineerAI EngineerMachine Learning Engineer
Enfoque principalAnálisis predictivo y prescriptivo utilizando modelos avanzados de machine learning y estadísticas.Análisis exploratorio de datos y generación de informes.Diseño y construcción de sistemas de procesamiento de datos.Desarrollo de soluciones que imitan la inteligencia humana.Desarrollo de modelos y algoritmos de machine learning específicos.
Tareas comunesDesarrollo de modelos de machine learning, y exploración de datos.Creación de informes, dashboards, análisis descriptivo y visualización de datos.ETL (Extract, Transform, Load), modelado de datos, optimización de bases de datos.Desarrollo de modelos de aprendizaje profundo, procesamiento del lenguaje natural, visión por computadora.Diseño, implementación y optimización de algoritmos de machine learning.
Habilidades técnicasProgramación (Python, R), estadísticas, machine learning, big data, herramientas de visualización.Excel, SQL, visualización de datos, estadísticas básicas.Programación (Python, Java, Scala), big data, bases de datos, ETL.Programación (Python, Java, C++), machine learning, deep learning, procesamiento de lenguaje natural.Programación (Python, Java, C++), machine learning, estadísticas avanzadas, optimización.
Habilidades no técnicasComunicación efectiva, toma de decisiones basada en datos, pensamiento crítico.Comunicación, resolución de problemas, atención al detalle.Colaboración interdepartamental, habilidades de negocio, comunicación.Pensamiento estratégico, resolución de problemas, ética.Resolución de problemas complejos, habilidades analíticas.
Educación típicaMaestría o doctorado en estadísticas, ciencia de datos o campos relacionados.Licenciatura o maestría en estadísticas, ciencia de datos o campos similares.Licenciatura o maestría en ciencias de la computación, ingeniería, o campos relacionados.Maestría o doctorado en inteligencia artificial, aprendizaje automático, ciencias de la computación.Maestría o doctorado en aprendizaje automático, ciencias de la computación o campos similares.
Industria comúnFinanzas, salud, tecnología, comercio minorista.Cualquier industria que requiera análisis de datos.Tecnología, finanzas, salud, comercio electrónico.Tecnología, investigación, desarrollo.Tecnología, investigación, desarrollo.

Es importante destacar que estas descripciones son generales y que las responsabilidades y requisitos específicos pueden variar según la empresa y la industria. Además, el campo de la inteligencia artificial y el aprendizaje automático está en constante evolución, y las fronteras entre estos roles a veces pueden difuminarse.

Por otro lado, Bonesso et al., (2022) encontró que, en comparación con los analista de datos, los científicos de datos utilizan con mayor frecuencia determinadas competencias relacionadas con la autoconciencia, el trabajo en equipo, la creación de redes, la flexibilidad, el pensamiento sistémico y el pensamiento lateral. En el mismo sentido, Liu (2015) destaca que el científico de datos tiene una mirada holística, a diferencia del analista tradicional de datos.

Conclusión

Si usted es un aspirante a científico de datos o simplemente está interesado en comprender el campo, este artículo le ha proporcionado una guía completa de los conceptos y aplicaciones centrales de la ciencia de datos. A medida que la tecnología siga avanzando y el volumen de datos crezca, la ciencia de datos seguirá desempeñando un papel vital en la configuración del futuro.

En conclusión, la ciencia de datos es un campo dinámico y apasionante que ofrece infinitas posibilidades. Tiene el poder de transformar industrias, impulsar la innovación y resolver problemas complejos. Al adquirir las habilidades y conocimientos necesarios, podrá embarcarse en una carrera satisfactoria como científico de datos.

En esta guía completa, hemos explorado el papel de un científico de datos, las habilidades necesarias para convertirse en uno y los caminos educativos que puede tomar. También hemos discutido los pasos para convertirse en un científico de datos, las herramientas y tecnologías utilizadas en la ciencia de datos y la importancia de la experiencia práctica a través de proyectos y estudios de casos.

Además, hemos destacado el valor de las certificaciones y los cursos en línea en ciencia de datos, así como las diversas oportunidades profesionales disponibles en el campo. Si es principiante o ya tiene experiencia en ciencia de datos, esta guía le ha brindado la información esencial para liberar el poder de la ciencia de datos y embarcarse en su viaje para convertirse en un científico de datos.

Recuerde, convertirse en científico de datos es un viaje de aprendizaje continuo. Mantenga la curiosidad, siga aprendiendo y aproveche las infinitas posibilidades que ofrece la ciencia de datos. ¡Buena suerte en tu aventura en la ciencia de datos!

Referencias

Bonesso, S., Gerli, F. and Bruni, E. (2022), «The emotional and social side of analytics professionals: an exploratory study of the behavioral profile of data scientists and data analysts«, International Journal of Manpower, Vol. 43 No. 9, pp. 19-41. https://doi.org/10.1108/IJM-07-2020-0342

da Silveira, C. C., Marcolin, C. B., da Silva, M., & Domingos, J. C. (2020). What is a Data Scientist? Analysis of core soft and technical competencies in job postings. Revista Inovação, Projetos e Tecnologias, 8(1), 25-39.

Della Volpe, M., & Esposito, F. (2020). How universities fill the talent gap: The data scientist in the Italian case. African Journal of Business Management, 14(2), 53-64.

Erkan, I., Sadullah, Ç., & Dilek, Ö. Y. (2023). Analysis of Skills and Qualifications Required in Data Scientist Job Postings Based on the Pareto Analysis Perspective Using Text Mining. EKOIST Journal of Econometrics and Statistics, (39), 10-25.

Liu A. 2015. Data Science and Data Scientist. IBM Analytics. 11 p.

Provost F. and T. Fawcett. 2013. Data Science and its Relationship to Big Data and Data-Driven Decision Making. Big DataVol. 1, No. 1 https://doi.org/10.1089/big.2013.1508

Ramzan, M. J., Khan, S. U. R., Khan, T. A., Akhunzada, A., & Naseeb, C. (2021). A Conceptual Model to Support the Transmuters in Acquiring the Desired Knowledge of a Data Scientist. IEEE Access, 9, 115335-115347.

Smaldone, F., Ippolito, A., Lagger, J., & Pellicano, M. (2022). Employability skills: Profiling data scientists in the digital labour market. European Management Journal, 40(5), 671-684.