Bluetab, la compañía del grupo IBM especializada en ofrecer soluciones expertas en Data y Cloud que cubre todo el ciclo de vida del dato, ha reflexionado acerca de las tendencias en este sector que impactarán en las empresas españolas durante 2023. Esta área es, sin duda, una de las tendencias tecnológicas más potentes del momento para todo tipo de empresas, y está revolucionando las compañías de todo el mundo. Las cinco tendencias del sector de cara a este año, según Bluetab, serán las siguientes:
- Los Data Warehouses seguirán creciendo en el Cloud
En el último año ha existido un fenómeno que ha llamado la atención de los expertos en data: el notable crecimiento de los Data Warehouses en Cloud. De hecho, en un informe de 2022, Gartner predecía que en 2024 el 75% de los data workloads estarán en Cloud.
Desde Bluetab ya han advertido como esta predicción se está convirtiendo en una realidad para todos los sectores en los que operan sus clientes, entre los que se encuentran servicios financieros, medios de comunicación, telecomunicaciones, seguros, utilities, industria o administración pública. Los motivos de esta tendencia son los beneficios de alojar los datos en la nube, como la posibilidad de procesar datos en tiempo real o la memoria para reducir los tiempos de latencia, además de los beneficios inherentes al cloud: escalabilidad, flexibilidad, reducción de costes…
- El Machine Learning se mantendrá como una de las grandes tendencias en datos
Se están produciendo avances muy notables en modelos de Machine Learning que tienen que ver con el lenguaje. Un ejemplo es el ahora muy popular ChatGPT, que, como otros Large Language Models (LLM), es capaz de aprender para, posteriormente, aplicar el conocimiento adquirido a otro tipo de tareas. Como consecuencia de estos avances, desde Bluetab anticipan que los casos de uso basados en los LLM van a tener un fuerte desarrollo.
La gestión de los datos se está transformando para que se pueda aplicar el Machine Learning en producción y a escala. Para poder aplicarlo, las estructuras de los datos deberán sufrir una transformación semejante a la que se produjo en materias de Business Intelligence (BI). De esta manera, se podrán entrenar los modelos de Machine Learning de forma más eficiente.
Por otro lado, esta transformación va a permitir automatizar e industrializar el entrenamiento y la producción de los modelos de Machine Learning mediante procesos de datos (pipelines).
- El dato será un eje transversal para impulsar las compañías data-driven
Cada vez existen más empresas que quieren ser data-driven, es decir, que quieren implementar estrategias y decisiones basadas en datos reproducibles que se puedan compartir dentro de la compañía a todos los niveles. Es por eso por lo que está aumentando la necesidad de producir aplicaciones de datos.
Dicha presión conllevará la modernización de los stacks de datos de Business Intelligence, de las aplicaciones de análisis de datos e incluso del perfil de los analistas de datos de negocio. Estos pasarán de ser meros usuarios analíticos que consumen información y la interpretan, a ser usuarios analíticos capaces de producir y compartir con toda la organización sus propias aplicaciones.
Alcanzar el objetivo de ser data-driven no solo permitirá a las compañías mejorar la toma de decisión y acelerar su productividad, sino que se volverá un factor clave para determinar su éxito digital. En este sentido, un informe de Gartner señala que de cara al 2025, el 80% de las organizaciones que quieran escalar sus negocios digitales fracasará por no haber adoptado un enfoque moderno de gobierno y analítica de datos.
- La formación en Data Science, una disciplina clave para las empresas
Conforme la inversión en datos no deja de crecer, aumenta la necesidad de contar con personas cualificadas capaces de gestionar y trabajar la ciencia de los datos. IBM predijo que habría 2.720.000 ofertas de trabajo para científicos de datos en 2020, pero después de la pandemia de la Covid-19, la escasez de profesionales se hizo aún más evidente.
En este aspecto, la formación por parte de las empresas es clave. Actualmente son varias las compañías que están implementando programas para formar en Data Science a los universitarios y prepararlos para el mundo laboral. Bluetab, por ejemplo, lleva varios años realizando el programa Talent Data Path, en el que contratan desde el inicio y forman a alto nivel en tecnología de datos a recién graduados y a profesionales que vengan de otras especialidades, que pasan por un proceso de mentoring para formarse a alto nivel en el mundo de los datos.
- El Gobierno del Dato pasa de ser un “nice-to-have” a ser un “must have”
El Gobierno de Dato ha crecido sustancialmente en los últimos tres años, impulsado también por iniciativas europeas como Gaia-X. En este tiempo, Bluetab ha identificado un crecimiento notable tanto de los proyectos relacionados con esta disciplina como de las exigencias de uso de dichos sistemas. Sin embargo, aunque algunas empresas de gran tamaño ya están poniendo en práctica el gobierno del dato, siguen existiendo entornos poco maduros e incipientes en el tejido empresarial. Ahora, el Data Governance ha pasado a ser imperativo para poder crecer y escalar.
En este tiempo, hemos visto, también cómo se han popularizado términos como el ‘data mesh’, ‘data products’ o ‘data observability’, que, en realidad, siempre apuntan al mismo objetivo primario: resolver el problema de confianza y disponibilidad de los datos. Para ello, el Data Governance se postula como un paraguas para abordar esta cuestión tan compleja, donde entran en juego varias cuestiones como: tener los datos e identificarlos (data catalog o data glossary) saber de dónde vienen (data lineage) o tener confianza de que están completos y son correctos (data quality).
En definitiva, en un momento en el que el volumen de datos no para de crecer, es crucial que las empresas cuenten con una estrategia del dato eficaz, capaz de desbloquear el valor de su información e impulsar su productividad e innovación.