Skip to main content

Conheça a abordagem Data Mesh para gerenciamento de dados analíticos, baseada em uma arquitetura distribuída e descentralizada

O número de dados gerados em todo o mundo está em expansão. Dessa forma, a gestão de dados também teve que evoluir bastante.

As abordagens mais tradicionais, como uma arquitetura centralizada para armazenar e processar dados, têm criado desafios em termos de escalabilidade, agilidade e governança. 

Por causa disso, surgiu o conceito de Data Mesh, uma abordagem inovadora que foi criada com a promessa de resolver muitos dos problemas associados às arquiteturas tradicionais de dados.

O Data Mesh, criado por Zhamak Dehghani, surge como uma alternativa para gerenciar os dados de forma descentralizada e orientada ao domínio. 

Confira, a seguir, o que é Data Mesh, quais são os seus princípios fundamentais e suas aplicações práticas!

O que é Data Mesh?

Zhamak Dehghani, em 2019, identificou que a hipercentralização na gestão de dados gerava obstáculos para garantir a escalabilidade e a agilidade exigidas pelas arquiteturas modernas dos dados. Então, propôs uma abordagem descentralizada. Como? Dividindo-a entre diferentes domínios empresariais, o que supõe mais autonomia e uma eficácia muito maior.

Por exemplo, algumas das arquiteturas mais tradicionais, como Data Warehouses e Data Lakes centralizam a coleta, o armazenamento e o processamento de dados em uma única infraestrutura. Isso cria um ponto único de falha e pode restringir a escalabilidade e a agilidade na análise de dados.. 

Com o Data Mesh, essa responsabilidade é distribuída em diferentes domínios, o que permite que cada uma gerencie seus dados de forma autônoma e com flexibilidade.

Princípios do Data Mesh

Arquitetura de dados orientada ao domínio

No Data Mesh, a arquitetura de dados é organizada por meio de domínios de negócios específicos que são responsáveis pelo gerenciamento completo de todos os seus dados, desde o momento da coleta de informações até o consumo final. 

Isso permite que as equipes da área se tornem especialistas em seus próprios dados, aumentando a qualidade e a relevância das informações.

Governança descentralizada

Em vez de optar por uma governança centralizada e mais rígida, o Data Mesh adota uma governança federada, ou seja, um formato em que as políticas de segurança são definidas de forma colaborativa entre os domínios. 

Isso garante que as práticas de governança sejam consistentes e alinhadas com as necessidades específicas de cada domínio, mantendo um nível de controle e compliance em toda a organização.

Dados disponibilizados como produto

Um dos pilares do Data Mesh é tratar os dados como produtos. Ou seja, isso significa que cada domínio é responsável por disponibilizar os seus dados para que sejam facilmente consumíveis, garantindo qualidade, documentação e suporte. 

Essa abordagem descentralizada promove uma mentalidade de produto entre as equipes de dados, incentivando a melhoria contínua e a inovação.

Plataforma de dados self-service

Para suportar esse formato inovador e descentralizado, o Data Mesh depende de uma plataforma de dados self-service feita para garantir que as equipes de domínio tenham acesso e utilizem as ferramentas que são necessárias para gerenciar todos os dados de forma independente. 

Isso inclui oferecer ferramentas para ingestão, processamento, armazenamento e análise de dados, que são integradas para reduzir a dependência de equipes centralizadas.

Vantagens do Data Mesh para o seu negócio

Acelerar o tempo de insights

Essa abordagem descentralizada do Data Mesh permite que as equipes de domínio sejam muito mais ágeis na entrega de insights valiosos, já que elas não dependem de uma equipe centralizada para gerenciar os seus dados. 

E isso, consequentemente, diminui o tempo necessário para coletar, processar e analisar dados, permitindo decisões muito mais ágeis e bem informadas.

Democratização dos dados

O Data Mesh garante uma maior democratização dos dados, tornando-os acessíveis a mais pessoas dentro da organização. 

Com toda essa descentralização, cada domínio pode fornecer acesso direto aos seus dados, o que facilita a utilização pelos usuários finais e aumenta a utilização dos dados em toda a empresa.

Cultura data-driven

A implementação do Data Mesh garante ainda uma cultura que é mais orientada a dados, chamada de data-driven, um formato em que as decisões baseadas em dados são incentivadas e valorizadas. 

A autonomia e a visibilidade dos dados em cada domínio ajudam a integrar a análise de dados no cotidiano das equipes na empresa, fortalecendo a tomada de decisões pensadas e bem fundamentadas.

Visibilidade dos dados

A abordagem de dados como produto e a plataforma de dados self-service melhoram ainda a visibilidade dos dados em toda a organização. 

Isso facilita a descoberta e a reutilização de dados, evitando repetições desnecessárias e garantindo uma colaboração cada vez maior entre os domínios.

Aplicações do Data Mesh

O Data Mesh é especialmente vantajoso para indústrias e setores que lidam com grandes volumes de dados no dia a dia e que requerem mais agilidade na análise das informações, como as áreas apontadas a seguir:

  • Setor financeiro: útil para a análise de riscos, detecção de fraudes e compliance.
  • Saúde: importante para a pesquisa médica, a gestão de pacientes e a análise de dados clínicos.
  • E-commerce: o Data Mesh é valioso para fazer uma análise de comportamento do consumidor, além da personalização e otimização de campanhas de marketing.
  • Manufatura: essencial para garantir a otimização de processos, a manutenção preditiva e a gestão da cadeia de suprimentos.

Alguns casos de uso importantes de Data Mesh incluem:

  • Análise de dados em tempo real, habilitando decisões mais rápidas e bem informadas em operações críticas.
  • Integração de dados multi-domínio, facilitando a colaboração entre diferentes departamentos e áreas de negócio.
  • Melhoria da qualidade de dados, com cada domínio responsável pela governança e qualidade de seus próprios dados.

Nesse sentido, grandes empresas que são líderes em tecnologia, como é o caso das companhias Netflix e Amazon, têm implementado os princípios de Data Mesh para gerenciar seus vastos volumes de dados. 

Isso tem permitido maior agilidade e eficiência na gestão de dados nessas organizações, o que resulta em melhorias significativas na qualidade dos serviços e produtos oferecidos por elas.

Principais desafios na adoção do Data Mesh

Mudança cultural e organizacional

A adoção do Data Mesh pelas empresas exige uma mudança cultural e organizacional importante. 

Isso porque as companhias precisam abraçar uma mentalidade mais orientada a produtos e domínios, o que pode ser desafiador para as organizações que são acostumadas a trabalhar com arquiteturas rígidas e centralizadas.

Governança de dados

Dessa forma, implementar uma governança federada e descentralizada eficaz em uma empresa pode ser complexo, pois envolve a definição de políticas de governança colaborativas e a coordenação entre múltiplos domínios. 

Por isso, é essencial garantir que as práticas de governança sejam consistentes e alinhadas com as necessidades da organização como um todo.

Complexidade técnica

A adoção de Data Mesh também possui alguns desafios técnicos, como a integração de múltiplas ferramentas e plataformas, a orquestração de fluxos de dados entre domínios e a garantia de desempenho e escalabilidade.

Treinamento e capacitação

Para que o Data Mesh seja eficiente no dia a dia da empresa, é necessário investir em treinamento e capacitação das equipes de dados, que precisam adquirir novas habilidades e conhecimentos para gerenciar dados de forma autônoma e eficaz.

Coordenação entre domínios

A coordenação entre diferentes domínios pode ser uma missão desafiadora, especialmente em grandes organizações.

Dessa forma, é importante estabelecer processos claros de comunicação e colaboração para garantir que os dados sejam gerenciados de forma clara, coesa e eficiente.

Ferramentas e tecnologias associadas

Algumas das principais ferramentas e plataformas associadas ao Data Mesh incluem:

  • Databricks: uma plataforma de dados unificada que suporta engenharia de dados, ciência de dados e machine learning;
  • Starburst.io: uma plataforma de análise de dados que facilita a consulta de dados distribuídos.

Comparação entre diferentes soluções

Por conta desses fatores de diferenciação, ao escolher as ferramentas que deverão ser usadas para implementar o Data Mesh em uma organização, é preciso considerar algo que vai atender todas as necessidades e que seja fácil de usar, de integrar seus sistemas de informação pré-existentes e apoiar domínios de vários dados. 

Nesse sentido, ferramentas como o Databricks oferecem uma plataforma unificada que pode suportar diversas necessidades, enquanto o Starburst.io se destaca pela capacidade de consultar dados distribuídos de forma eficiente, entre outros exemplos.

Recomendações para escolha de ferramentas

Por isso, para escolher as ferramentas que são mais adequadas para a implementação de Data Mesh, é importante considerar os pontos a seguir:

  • Necessidades específicas de seus domínios de dados;
  • Integração com a infraestrutura de dados existente;
  • Capacidade de suporte e escalabilidade;
  • Facilidade de uso e curva de aprendizado;
  • Custo e modelo de licenciamento.

Conclusão

Data Mesh representa uma evolução fundamental e relevante na forma de gerenciar dados: oferecendo uma abordagem descentralizada e orientada ao domínio – uma receita que resolve muitos dos problemas associados às arquiteturas centralizadas tradicionais de dados. 

Com princípios de arquitetura que levam em conta pontos como domínio, governança descentralizada, dados como produto e plataformas self-service, o Data Mesh proporciona mais agilidade, uma maior democratização dos dados, cultura data-driven e visibilidade de dados.

Embora a adoção dessa ferramenta apresente alguns desafios culturais, organizacionais e técnicos, as vantagens para o negócio são diversas, especialmente em setores que lidam com grandes volumes de dados e requerem análises de dados mais rápidas e precisas. Nesse sentido, escolher ferramentas e plataformas adequadas é essencial para garantir o sucesso da implementação, sendo que o investimento em treinamento e capacitação das equipes também é um ponto fundamental.

E para uma leitura ainda mais aprofundada sobre o tema, baixe agora mesmo nosso e-book “Introdução ao Data Mesh“, que traz cada aspecto dessa inovadora abordagem de arquitetura de dados descentralizada.

Leia também:

Gestão de dados: conceitos, vantagens, táticas e porque implementar

Sobre o Autor
  • Redação BRQ

    Desde 1993 no mercado, a BRQ Digital Solutions se consolidou como líder e uma das maiores empresas de Transformação digital do país.

    Ver todos os posts