Causas de perda de dados em sistemas virtualizados

Facebook
Twitter
LinkedIn
WhatsApp

A tecnologia de virtualização domina o cenário corporativo. As melhorias nos hipervisores reduziram a complexidade de configuração e manutenção de servidores físicos. Melhoraram muito a utilização do servidor, e aumentaram a flexibilidade e capacidade de resposta de TI às necessidades dos negócios.

Não é de se admirar que a maior parte dos sistemas de TI modernos sejam virtualizados. Mas, quer você use VMwareHyper-VCitrix XenServer, Oracle ou qualquer um dos outros hipervisores, há uma desvantagem potencial na virtualização.

A DESVANTAGEM DA VIRTUALIZAÇÃO

Para transformar um servidor físico em muitas máquinas virtuais (VMs), uma camada de software adicional é adicionada. Enquanto simplifica a experiência do administrador, a virtualização aumenta a complexidade geral do ambiente de TI.

O hardware onde o hypervisor está rodando fica em segundo plano, tornando mais difícil para os administradores saberem em qual sistema físico suas VMs estão sendo executadas, ou qual armazenamento é usado quando Ocorrer um evento de perda de dados.

Com menos pessoas para manter e monitorar um grande número de máquinas virtuais (em comparação com servidores físicos), há maiores chances de problemas causando perda de dados.

OS PRINCIPAIS MOTIVOS DE PERDA DE DADOS EM AMBIENTES VIRTUAIS

Existem várias causas para incidentes de perda de dados em ambientes virtualizados. Os principais motivos para a perda de dados da máquina virtual são erros do usuário, ransomware, falhas de hardware e corrupção de RAID.

O objetivo deste artigo é explicar o que leva à perda de dados virtuais, e explicar como as empresas de recuperação de dados são capazes de resolver uma alta porcentagem das situações de perda de dados mais desafiadoras em ambientes virtualizados.

1 – PROBLEMAS DE HARDWARE / RAID

Para ajudar a evitar a perda de dados, os sistemas modernos costumam usar alguma forma de replicação de dados em várias unidades físicas (HDD ou SSD) que são consolidadas em uma única unidade lógica. Essa proteção de dados pode ser uma solução baseada em hardware ou software.

O RAID combina vários discos para melhorar a redundância, aumentar a confiabilidade e desempenho do sistema. O RAID fragmenta os arquivos em muitos discos, e os remonta quando solicitado pelo usuário ou necessário para o sistema.

É necessário um sistema RAID robusto para controlar tudo e gerenciar os dados. Os problemas de hardware que os sistemas virtuais enfrentam são basicamente os mesmos dos sistemas físicos, como HDs ou SSDs com falha, controlador RAID que parou de funcionar, componentes do servidor com problemas e falhas no fornecimento de energia.

Mas corrupção de RAID é um desafio muito maior com VMs devido à natureza da virtualização. Infelizmente, a perda de dados não é incomum com sistemas de armazenamentos configurados em RAID. A complexidade do RAID a nível de hardware e software aumenta com a presença de desduplicação e compactação.

Agora, inclua uma camada de virtualização adicional e a probabilidade de falhas aumentará exponencialmente. Os controladores RAID são responsáveis por mapear onde as informações estão gravadas nos vários discos à sua disposição. Mas se uma configuração RAID for corrompida, os arquivos não poderão mais ser reconstruídos. Quando isso acontece, pode causar perda de dados significativa.

2 – PROBLEMAS LÓGICOS CAUSADOS POR FORMATAÇÃO / QUEDA DE ENERGIA  / SOFTWARE 

Reformatar um HD / SSD, disco virtual, array, LUN, vDisk, volume  (ou outra mídia de armazenamento) e reinstalar o software são causas adicionais de perda de dados em ambientes virtualizados. Específico para VMs, por exemplo, pode haver reformatação no nível de convidado ou host.

A corrupção também pode ocorrer devido a corrupção nos dados por quedas de energia, patches e atualizações com erros sem um backup offline, implementação mal planejada de novo software, problemas de integração e corrupção de banco de dados.

Esses problemas também podem causar corrupção de arquivo host e danos ao sistema de arquivo convidado. A perda de dados de provisionamento thin em storages all-flash também deve ser considerada. Isso pode resultar em um ambiente virtual mais complexo e fragmentado no volume físico e também nos discos virtuais.

Se as informações de metadata estiverem ausentes ou danificadas, será um desafio localizar os vários fragmentos e reconstruir o disco virtual. Como alternativa, a camada de mapeamento dentro do disco virtual pode ser danificada ou sobrescrita, tornando a remontagem extremamente difícil.

3 – CORRUPÇÃO DE METADADOS DO SISTEMA DE ARQUIVOS VIRTUAL

Outra fonte de perda de dados é a corrupção de metadados. Os metadados são ainda mais importantes em ambientes virtualizados devido ao número de camadas e VMs existentes. Um pequeno problema com os metadados VMFS pode ter repercussões graves na disponibilidade dos dados.

4 – ERROS DO USUÁRIO

Muitas dessas fontes de perda de dados podem ser classificadas como erro do usuário pelos administradores. Os privilégios de acesso permitem que os administradores excluam as VMs por engano. Porém, mesmo que os direitos de acesso sejam gerenciados corretamente, os erros permanecem comuns.

Uma quantidade surpreendentemente grande de falhas ocorre devido a discos virtuais serem excluídos por engano, VMs sendo substituídas ou seu espaço redistribuído. Também pode haver corrupção da snapshots, ou seja, um de uma série de instantâneos está corrompido, foi excluído ou se tornou indisponível por algum outro motivo. Isso pode atrapalhar os backups e dificultar a recuperação dos dados.

Ironicamente, a facilidade de uso dos hipervisores modernos está fazendo com que as organizações invistam em menos treinamento. Uma equipe inexperiente está sendo responsabilizada pelo gerenciamento de ambientes virtualizados grandes, complexos e em constante crescimento.

As empresas de pequeno e médio porte podem não ter um número suficiente de funcionários experientes para monitorar ambientes virtuais com freqüência suficiente para detectar problemas conforme eles aparecerem. Em alguns casos, os administradores de TI podem não iniciar as medidas de segurança adequadas em um banco de dados ou omitir a documentação das alterações.

Se a criptografia estiver ativada e um volume for excluído, por exemplo, os dados se tornam difíceis de recuperar. A rotatividade de funcionários é outra fonte de problemas. O novo operador não consegue descobrir os detalhes das arquiteturas virtualizadas, podendo excluir inadvertidamente VMs ou introduzir alterações que resultam em perda de dados.

5 – OUTROS MOTIVOS

Negligenciar os backups também é um motivo comum para a perda de dados virtuais. E quanto a diferentes equipes para cada processo, cada um trabalhando em seu próprio nicho? Uma equipe pode criar um volume, outra pode conectar o hypervisor e um administrador convidado irá configurar a máquina virtual.

Esse tipo de estrutura organizacional aumenta os riscos omissões e erros. A reformatação, dados sendo sobrescritos e exclusões podem ocorrer mais facilmente. O que as empresas podem fazer, então, quando experimentam perda de dados em um ambiente virtualizado?

Não há botão de voltar ou desfazer. Uma VM excluída se foi. Backups? Muitas vezes estão incompletos ou corrompidos.

Felizmente, a recuperação de dados geralmente é possível por meio de empresas de recuperação de máquinas virtuais experientes e capacitadas para este tipo de desafio.

SOLICITAÇÃO DE ORÇAMENTO

Rolar para cima