En los últimos años, estamos viendo cómo aumenta exponencialmente la cantidad de datos disponibles. Pero también la necesidad de usarlos de forma ágil para mejorar las decisiones que las empresas toman. El Data Mesh es una propuesta que replantea la forma en que dichos datos se diseñan, gestionan y consumen, sobre todo en entornos particularmente complejos y orientados a la analítica y la inteligencia artificial.
Data Mesh es un enfoque organizativo y tecnológico que propone una nueva forma de diseñar la arquitectura de datos en las empresas. Lo habitual es que toda la gestión se centralice en un único equipo o plataforma, pero en este caso, lo que se plantea es que la responsabilidad de los datos se distribuya entre los distintos dominios del negocio.
La finalidad es evitar un problema frecuente, que es que los equipos centrales de datos se conviertan en cuellos de botella que no son capaces de escalar al mismo rato que el negocio demanda. En este entorno, los datos ya no son un recurso que gestiona exclusivamente el departamento de IT, sino que son parte del día a día de todos los equipos que los generan y utilizan.
De este modo, el acceso a la información es más rápido y se mejora la calidad de los datos. No obstante, para que sea posible, se necesita que haya una buena coordinación y que se sigan los mismos estándares.
El Data Mesh se asienta sobre cuatro principios fundamentales que combinan organización, tecnología y cultura.
El primer principio establece que cada dominio del negocio es responsable de sus propios datos. Es decir, que los equipos de dominio conocen, gestionan y mantienen la información que generan, desde su definición hasta su uso. Esta responsabilidad directa mejora la calidad y el contexto de los datos, ya que los gestionan quienes mejor entienden su significado.
El segundo principio introduce la idea de data as a product. Los datos se tratan como un producto que debe ser útil, fiable y fácil de consumir por otros equipos. Para ello, se definen propietarios, niveles de calidad, documentación y métricas claras. Se utilizan enfoques propios del Design Thinking para entender quién los usa y con qué objetivo.
Para que la descentralización de datos sea viable, la organización debe contar con plataformas de autoservicio que faciliten a los equipos crear, gestionar y compartir datos sin depender constantemente de un equipo central. Estas plataformas son las que reducen la complejidad técnica para que los equipos se centren en aportar valor al negocio.
El último principio combina autonomía con control. El gobierno de datos no desaparece, sino que se distribuye mediante un modelo federado. Se establecen estándares comunes, políticas y buenas prácticas que todos los dominios deben cumplir.

El valor de Data Mesh se entiende mejor cuando se compara con arquitecturas más conocidas, como las siguientes.
El Data Warehouse centraliza los datos en un repositorio único, que tiene esquemas definidos y controlados por un equipo especializado. Aunque es eficaz para hacer reporting, suele ser rígido y lleva tiempo que se adapte. Data Mesh, por el contrario, distribuye la gestión para que sea más flexible y escalable.
Data Lake almacena grandes volúmenes de datos sin estructura previa, pero suele derivar en problemas de calidad y gobernanza. Data Mesh no se centra solo en el almacenamiento, sino en la responsabilidad y el consumo de los datos, para evitar que los repositorios terminen siendo poco utilizables.
Data Fabric apuesta por una capa tecnológica integrada que conecta datos procedentes de distintas fuentes. Data Mesh se centra en la organización y en los equipos, y usa la tecnología como facilitador, no como una única solución.
Cuando se eliminan las dependencias excesivas de los equipos centrales, las organizaciones pueden ser más veloces y los equipos pueden crear y consumir datos con mayor autonomía. Por tanto, los tiempos de espera se reducen y se mejora la capacidad de respuesta a medida que las necesidades de la empresa cambian.
Si los datos se tratan como productos bien definidos, es más fácil usarlos en proyectos de análisis de datos e inteligencia artificial. Los modelos se alimentan de información más fiable, contextualizada y actualizada, y gracias a ello, la calidad de los resultados es mayor y se toman mejores decisiones.
La descentralización de datos facilita que se pueda escalar a nivel técnico y organizativo. A medida que la empresa crece, se incorporan nuevos dominios al ecosistema sin que la estructura central se sobrecargue. Así, se mantiene la autonomía de los equipos.

A pesar de las ventajas que ofrece, los equipos se pueden mostrar reticentes porque tienen que asumir nuevas responsabilidades y mejorar sus habilidades en gestión y análisis de datos. Cuando no cuentan con ellas o están dispuestos a adaptarse a esta metodología, el modelo se puede fragmentar.
Para implementar Data Mesh se necesita invertir en tecnología, procesos y formación. Hay que diseñar plataformas de autoservicio que sean robustas y definir mecanismos de coordinación y gobierno que sean claros.
Zalando es un ejemplo de adopción progresiva de Data Mesh. En una primera etapa, la compañía trabajaba con un data warehouse centralizado que facilitaba la generación de informes a partir de los datos de back-end. Cuando el negocio necesitó escalar, el modelo empezó a mostrar sus limitaciones.
Al migrar a la nube y usar una arquitectura de microservicios, apareció un nuevo reto: los datos estaban distribuidos en varios entornos. Para integrarlos se incorporó un data lake, que mejoró la agilidad, pero no resolvió del todo los cuellos de botella ni la dependencia de los equipos centrales.
Fue entonces cuando Zalando dio el paso hacia un enfoque Data Mesh. Adoptaron el principio de tratar los datos como un producto, crearon roles específicos de data product owner y definieron los dominios con claridad. Gracias a ello, los equipos se especializaron, asumieron responsabilidad real sobre sus datos y trabajaron de forma más autónoma. Para ello, se apoyaron en dinámicas ágiles como la metodología Scrum, que sirve para eliminar información innecesaria que solo genera costes sin aportar valor.
Si quieres aprender más sobre Data Mesh y aprender a aplicarlo, antes necesitarás tener conocimientos sobre arquitectura de datos, analítica y tecnologías de inteligencia artificial. El Máster en Inteligencia Artificial aplicada a la Empresa (Online) de Inesdi es un programa dirigido a aquellos profesionales que quieren diseñar arquitecturas modernas, gobernar datos de forma eficiente y aplicar estos enfoques a las necesidades actuales de las empresas. Consulta el programa y los requisitos de acceso desde el enlace.