O que é RAID e para que serve?

Facebook
Twitter
LinkedIn
WhatsApp

RAID (Redundant Array of Independent / Inexpensive Disks) é uma tecnologia que permite armazenar dados em vários HDs que funcionam como um volume único. O objetivo do RAID é obter redundância de dados para diminuir o risco de perda de dados e, em muitos casos, melhorar o desempenho. 

O termo RAID remonta a 1987, quando pesquisadores da Universidade de Berkeley na Califórnia, observaram que os computadores mainframe poderiam se beneficiar dos \”discos baratos\” que inundavam o mercado de computadores pessoais. Na verdade, o artigo original se referia a \”matriz redundante de discos baratos\”. 

A tecnologia foi aplicada pela primeira vez em uma mídia de armazenamento para mainframes, com a ideia de que, se qualquer uma das unidades falhasse, os dados seriam preservados. Embora o RAID inicialmente aplicado a discos rígidos, o armazenamento SSD também pode ser configurado nestes equipamentos.

Uma configuração RAID ser baseado em software ou hardware. No primeiro caso, se você tiver algumas unidades configuradas em uma matriz RAID dentro do seu PC doméstico, é provável que isso seja feito com o processador do PC (CPU) cuidando do trabalho. No último caso, digamos com um NAS ou servidor, haverá uma placa controladora dedicada para lidar com as operações de entrada e saída (E / S) da matriz RAID.

Por exemplo, considere uma matriz RAID 0 com discos rígidos. Ela será em torno de quatro vezes mais rápida do que uma única unidade. Em vez de ter 4 carros trafegando em uma rodovia de faixa única, agora existem quatro faixas de tráfego sendo usadas simultaneamente. Embora RAID 0 não ofereça proteção nos dados, as outras configurações de RAID geralmente conciliam o aumento no desempenho com redundância nos dados.

COMO FUNCIONA O RAID

Em quase todos os níveis de RAID, a tecnologia se baseia na interpretação de “paridade” que implementa a “tolerância a falhas”. Paridade refere-se à proteção contra erros. A tolerância a falhas permite que um sistema opere no caso de falha de um componente. Esses tipo de RAID com paridade dependem da distribuição de blocos de dados em duas ou mais unidades.

Existem seis níveis principais de RAID: 0, 1, 5, 6, 10 e 50. Os níveis 2, 3 e 4 são obsoletos ou raramente usados. Em tudo isso, a ideia é que vários dispositivos de armazenamento sejam representados como um único volume de unidade. Dependendo da implementação, você verá um aumento na capacidade de armazenamento de volume total com base no uso de vários discos. 

Apenas RAID 1 espelhado resulta em uma redução líquida de capacidade. No entanto, a capacidade de armazenamento utilizável total será sempre 25–50% menor do que o espaço disponível real.

POR QUE USAR RAID?

As razões para escolher usar RAID em vez de outras abordagens de armazenamento de dados remontam ao uso da tecnologia de “paridade” para fornecer tolerância a falhas. Com o RAID, você tem um nível de redundância de dados projetado para oferecer segurança de que seus dados estarão protegidos no caso de uma falha de hardware. 

Este tipo de sistema não nega o conceito de necessidade de um backup, mas oferece uma segurança extra. É uma boa proteção contra falhas de hardware, mas não protege contra corrupção de dados causada pelo sistema operacional ou outra falha de software.

RAID NÃO É BACKUP

Nunca é demais enfatizar que o uso de RAID não é uma estratégia de backup em si. Pense nisso como uma estratégia de sobrevivência de dados em oposição a uma estratégia de backup. 

Dependendo do nível que você usa, o RAID pode fornecer um aumento de desempenho ou uma camada adicional de proteção contra uma falha de hardware. No entanto, essa tecnologia não deve ser confundida com um backup. 

É apenas um componente dentro de uma estratégia de backup que deve incluir backup em nuvem e um segundo backup feito em local diferente de onde está instalado o equipamento principal. 

Particularmente para implementações domésticas e de pequenos escritórios, esses sistemas redundantes são agora mais fáceis de fazer backup do que costumavam ser, graças à capacidade cada vez maior dos disco rígidos. E alguns storage NAS incluem uma porta USB para fazer backup do array para um HD externo.

PARIDADE NOS DADOS EM ARRANJOS RAID

Paridade, ou bits de paridade, são códigos binários que atuam como somas de verificação para rastrear erros nas transferências de dados. Um bit de dados (1 ou 0) é adicionado ao final de cada bloco de dados, criando bits pares ou ímpares, e permite que um disco danificado seja reconstruído sem qualquer perda de dados. Para que um RAID funcione corretamente, ele passa por algoritmos de verificação de erros que garantem a integridade dos dados e detecta erros usando operações lógicas de dados.

TOLERÂNCIA A FALHAS DO RAID

No RAID, a ideia é que a tolerância a falhas vem do fato de que a paridade de dados é espalhada por duas ou mais unidades, dependendo do nível do RAID. Se uma unidade dentro do array falhar, os dados de paridade podem ser usados para reconstruir os dados da matriz nos arranjo RAID. 

Mesmo que um ou mais HDs falhe, dependendo do tipo de arranjo, o sistema continuará a funcionar em modo e os arquivos continuarão acessíveis. Nos níveis 1 e superiores, há menos armazenamento utilizável do que a soma das capacidades individuais do discos. 

CAPACIDADE TOTAL DO ARRAY RAID

Como o ditado que diz que uma corrente é tão forte quando o seu elo mais fraco, em um princípio semelhante, os níveis de RAID funcionam com base no denominador comum mais baixo. Ou seja, a menor capacidade do HD de todos do arranjo RAID.

Isso significa que se, por algum motivo, você misturar uma unidade de 1 TB com três unidades de 2 TB, todas as unidades funcionarão apenas como se estivessem usando 1 TB de espaço. Isso é menos problemático do que costumava ser, devido ao custo cada vez menor de armazenamento, mas se você aproveitar a máximo a capacidade armazenamento do seu array RAID, sempre utilize HDs de mesma capacidade.

A única exceção para esta regra é o sistema BeyondRAID utilizado nos equipamento da Drobo. Com um Drobo, você poderá misturar discos de qualquer capacidade, que o próprio equipamento achará a melhor configuração para aproveitar o máximo de espaço dos HDs.

QUANDO USAR RAID?

O RAID é extremamente útil se o tempo de atividade e a disponibilidade forem importantes para você ou sua empresa. Os backups ajudarão a protegê-lo contra uma perda catastrófica de dados. Porém, a restauração de grandes quantidades de dados, como quando ocorre uma falha na unidade, pode levar muitas horas ou dias para ser executada. 

O RAID permite resistir à falha de uma ou mais unidades sem perda de dados e, em muitos casos, sem qualquer tempo de inatividade. Se houver uma perda nos dados, esses backups podem demorar horas ou dias, custando a você todos os dados armazenados ou alterados desde o último backup.

O RAID também é útil se você estiver tendo problemas de E/S de disco, onde os aplicativos estão esperando o disco para executar tarefas. Adotar o RAID fornecerá uma taxa de transferência adicional, permitindo que você leia e grave dados de várias unidades em vez de uma única unidade. Além disso, se você escolher o RAID de hardware, a placa RAID de hardware incluirá memória adicional para ser usada como cache, reduzindo a pressão sobre o hardware físico e aumentando o desempenho geral.

QUAIS SÃO OS TIPOS DE RAID E SUAS APLICAÇÕES?

Quando vários discos rígidos são configurados para trabalharem em conjunto, isto é chamado de RAID (Redundant Array of Independent Disks). Existem vários tipos diferentes de RAID, e cada configuração oferece vantagens e desvantagens. 

Para a maioria dos usuários comuns, RAID nível 1 é uma proteção adequada. Em todos os momentos, você terá uma cópia duplicada de todas as suas mídias. As configurações do RAID 1 não oferecem nenhum aumento na velocidade de gravação ou leitura de dados. Mas você ficará tranquilo sabendo que sempre há duas cópias de cada arquivo armazenado no volume.

O RAID 5 é ideal para profissionais liberais ou empresas que buscam um equilíbrio entre desempenho, segurança e custo. Com uma matriz de discos RAID 5, você ganha capacidade de armazenamento adicional, velocidades mais rápidas de leitura e gravação e proteção contra uma única falha de disco. 

Se ocorrer uma falha de disco, você ainda terá acesso a todos os seus arquivos. Embora reconstruir o RAID seja importante e deva ser executado imediatamente, você ainda pode recuperar arquivos essenciais e fazer o backup deles em outro lugar durante esse tempo. Para empresas de médio ou grande porte, outros tipos de arranjos são mais adequados para gerenciar grandes volumes de dados.

A escolha do nível de RAID correto depende de como você gosta de trabalhar e de como gerencia seus dados. Interessado em aprender mais? Continue lendo para descobrir os tipos de RAID mais comuns e como organizar seus volumes para obter o máximo da tecnologia RAID.

O RAID 0 pega qualquer número de discos e os junta em um grande volume. Freqüentemente chamado de “stripping”, esse é um é um tipo de array que nem deve ser chamado de RAID, pois não oferece redundância e paridade para segurança dos dados. A capacidade total de um volume RAID 0 é igual à soma das capacidades de cada disco. 

Por exemplo, se 4 unidades de 4 TB forem configuradas em um RAID 0, elas se tornarão um único volume de 16 TB. Neste exemplo, os dados são gravados uniformemente em ambas as unidades, o que aumenta a capacidade de leitura e gravação. 

Essa configuração é usada em sistemas orientados para o desempenho, como PCs para jogos ou streaming ao vivo nos quais a confiabilidade dos dados fica em segundo plano. Mas não deve ser usado para outra coisa senão isso. Por exemplo, com a taxa de falha anual de 2,5% das unidades, se você tiver um array RAID 0 de 10 discos, você aumentou o risco anual de perda de dados para quase 25,0%. 

RAID 0 funciona com no mínimo dois discos. Se uma unidade falhar, todo o volume será perdido. A desvantagem do RAID 0 é que ele NÃO é redundante. A perda de qualquer disco individual causará a perda total dos dados. Este tipo de RAID é muito menos confiável do que ter um único disco.

Uma configuração de RAID 1 consiste em pelo menos duas unidades que são espelhadas para conter exatamente as mesmas informações. Esta configuração de RAID inclui tolerância a falhas, já que uma falha em disco não resultará na falha de outras unidades também. 

Não há striping envolvido, então, enquanto uma unidade funcionar, o array continuará a funcionar, sendo ideal para aqueles que exigem alta confiabilidade. Na maioria dos casos, o desempenho de leitura deve ser quase o mesmo de um único disco, embora possa haver uma perda na velocidade de gravação e na redução da capacidade de armazenamento.

Quando os dados são gravados no array, eles devem ser gravados em cada unidade independentemente. As velocidades de gravação serão tão rápidas quanto a unidade mais lenta do array. Da mesma forma, a capacidade de armazenamento depende do tamanho do menor disco. Então ter um drive de 1 TB e outro de 2 TB no RAID 0 significa que você perderá metade do espaço de armazenamento do último disco. A solução? Use unidades semelhantes, tanto em desempenho quanto em tamanho, e você aproveitará o melhor de uma configuração RAID 1.

O RAID 1 é geralmente uma mais cara, pois metade da capacidade total de armazenamento será perdida. Por exemplo, se você tem duas unidades (o número mínimo para uma configuração RAID), você está obtendo apenas o espaço de armazenamento da menor unidade na configuração. Essa equação é a mesma, não importa quantas unidades você tenha. Uma configuração de 10 unidades ainda terá apenas uma unidade com informações armazenadas, embora tenha uma redundância de dados impressionante.

RAID 5 suporta tolerância a falhas e paridade, distribuindo os dados de paridade em todas as unidades. O espaço perdido é equivalente a uma unidade dentro do array. Por exemplo, em um arranjo RAID-5 com 6 HDs de 8 TB, seriam perdidos 8 TB da capacidade total, sobrando 42 TB livres.

Ao distribuir os bits de paridade em todos os discos, ele reduz o desgaste em apenas uma unidade. Os bits de paridade giram uniformemente entre as unidades e melhora o desempenho de leitura, uma vez que os dados são acessados de vários discos simultaneamente. Entretanto, em servidores com grandes volumes, a paridade pode prejudicar o desempenho tornando a gravação mais lenta. 

RAID 5 usa o espaço de um disco extra para reconstruir os dados perdidos, o que significa que a configuração mínima do disco é de três unidades. Isso protegerá contra uma falha de apenas um HD. 

No entanto, há uma pegadinha… Depois de substituir uma unidade com falha, RAID-5 coloca uma carga extrema nas outras unidades enquanto trabalha para reconstruir a matriz. O que por sua vez pode levar a uma segunda falha da unidade, especialmente se o processo de reconstrução encontrar um taxa de erro de leitura irrecuperável em uma unidade e nesse ponto o rebuild será interrompido. 

É por esse motivo que o RAID 5 não é recomendado para uso com armazenamento corporativo, embora seja adequado para servidores de armazenamento de arquivos em sistemas NAS e de pequenos escritórios. Por exemplo, para uma configuração com três ou quatro unidades, RAID-5 provavelmente será a sua melhor escolha. No entanto, uma configuração de RAID 5 com três drives irá perder 33 por cento de seu espaço para funções de paridade. 

O RAID 6 é semelhante ao RAID 5, usando pelo menos quatro unidades devido a sua configuração de paridade dupla. Isso significa que em uma configuração de quatro unidades, você perde metade do seu espaço de armazenamento para paridade, embora seus dados ainda estejam intactos no caso de perda simultânea de duas unidades. 

Esta pode ser considerada a variedade mais tolerante a falhas e como o RAID 5, as velocidades de leitura são excelentes devido ao stripping, embora as velocidades de gravação geralmente sejam reduzidas devido à paridade. Embora possa funcionar a partir de quatro discos, uma configuração RAID 6 é provavelmente mais adequada para matrizes com cinco ou mais unidades.

O uso de paridade dupla funciona para fornecer tolerância a falhas para duas unidades, ao contrário de apenas uma unidade no RAID 5. É por isso que o RAID 6 é especialmente apropriado para sistemas com maiores capacidades de armazenamento como servidores de arquivos ou de aplicativos. 

O RAID 10 requer pelo menos 4 drives e é uma combinação de RAID 1 (espelhamento) e RAID 0 (striping). Isso aumentará a velocidade e a redundância. Geralmente, esse é o nível de RAID recomendado se você está procurando velocidade, mas ainda precisa de redundância. 

Em uma configuração de quatro unidades, duas unidades espelhadas mantêm metade dos dados distribuídos e outras duas espelham a outra metade dos dados. Isso significa que você pode perder qualquer unidade única e, possivelmente, até uma segunda unidade, sem perder nenhum dado. 

Assim como o RAID 1, você só terá a capacidade de metade das unidades, mas verá um desempenho de leitura e gravação aprimorado. Você também terá um tempo reduzido de reconstrução do RAID 1 no caso de perda de um dos discos.

Onde usar RAID 10? Este tipo de arranjo é direcionado para equipamentos que rodem aplicações onde seja exigido o máximo de performance no acesso ao volume, tais como renderização e procesamento de videos 4k, servidores de arquivos ou bancos de dados, máquinas virtuais e animação 3D.

O RAID 50 requer uma matriz com pelo menos seis discos com duas matrizes RAID 5 de três discos cada. RAID-50 também pode ser referido como 5 + 0. Esta configuração combina stripping com paridade distribuída por stripping de dados em duas matrizes RAID 5. Essa combinação permite até quatro unidades com falha, desde que cada unidade com falha esteja em um RAID 5 diferente dentro de 5 + 0. No entanto, se várias unidades falharem na mesma matriz, você pode não ter tanta sorte.

Com o RAID 50, você precisa alocar um disco por array subjacente para paridade, então você fica com menos espaço utilizável do que teria se simplesmente usasse o RAID 5. À medida que você aumenta cada conjunto de RAID 5, essa porcentagem de perda diminui. 

Na figura acima, com três discos usados em cada conjunto RAID 5, 33% da capacidade é usada para sobrecarga de paridade. Se você configurar cinco discos por conjunto RAID 5, essa porcentagem cairia para 20%. 

Entretanto, à medida que o percentual de perda de espaço diminui, seu risco aumenta. Esse é um dos motivos pelos quais manter as matrizes RAID 5 individuais pequenas (três ou quatro discos no máximo) faz muito sentido. Quanto mais discos você adicionar aos arrays RAID 5 individuais, maior será o risco de sofrer uma perda dupla de disco em um array.

Quando se trata de alcançar um equilíbrio entre custo de armazenamento, risco e desempenho, poucos níveis de RAID vão tão longe quanto o RAID 50 pelos seguintes motivos.

RAID DE SOFTWARE X RAID POR HARDWARE

O RAID de software é uma opção gratuita incluída na maioria dos sistemas operacionais modernos. Isso significa que NÃO há custo para o RAID 0 ou RAID 1 de software, e é altamente recomendado se você estiver usando armazenando dados localmente. É altamente recomendável que as unidades em uma matriz RAID sejam do mesmo tipo e tamanho.

O RAID baseado em software aproveitará parte da capacidade de computação do sistema para gerenciar a configuração do RAID. Se você está procurando maximizar o desempenho de um sistema, como uma configuração RAID 5 ou 6, é melhor usar uma placa RAID baseada em hardware.

O volume estendido criado pelo Windows 10 é uma arranjo JBOD, o volume distribuído é um RAID-0 e um volume espelhado é um RAID-1. A vantagem de criar um RAID a partir do Windows é que os HDs podem ser montado em outro computador sem perda dos dados, apenas importados os discos no sistema.

O RAID baseado em hardware requer uma controladora dedicada instalado no servidor que é fabricado por empresas como 3ware, Adaptec, Areca, Broadcom, HighPoint, Intel e LSI. Uma placa RAID baseada em hardware faz todo o gerenciamento da (s) matriz (s) RAID (s), fornecendo discos lógicos ao sistema sem a interferência do sistema operacional. 

Além disso, o RAID de hardware pode fornecer muitos tipos diferentes de configurações de RAID simultaneamente para o sistema. Isso inclui o fornecimento de uma matriz RAID 1 para a unidade de inicialização e aplicativo e uma matriz RAID-5 para a grande matriz de armazenamento de dados. 

PRINCIPAIS PROBLEMAS EM ARRANJOS RAID

A questão não é se o seu disco rígido irá falhar, mas quando. No caso de discos rígidos configurado em RAID, eles geralmente são compostos de discos rígidos fabricados em datas próximas, com os mesmos materiais, pelo mesmo fabricante. É lógico que todos eles provavelmente falharão quase ao mesmo tempo.

Nem mesmo três ou mais discos rígidos podem proteger suas informações se eles falharem todos de uma vez. Portanto, mantenha seus dados protegidos monitorando regularmente o status das unidades RAID. Rastreie o uso do array RAID e crie um plano de ação para responder rapidamente a qualquer falha do RAID.

Se você notar uma falha na matriz RAID, substitua a unidade defeituosa imediatamente para que o rebuild do array seja executado. Espere muito tempo e você poderá ter dois ou três discos rígidos inativos antes de resolver o problema. 

Mas essa solução não é totalmente à prova de falhas. Sempre há a chance de algo dar errado durante a reconstrução, causando danos adicionais. Quando dois ou mais discos falharem em seu disco rígido RAID, sua melhor aposta para evitar a perda de dados é enviar os discos a um especialista em recuperação de dados. Se você tentar substituir mais de uma unidade RAID ao mesmo tempo, e executar uma reconstrução, corre o risco de perder seus dados para sempre. Então não faça isso!

Embora haja muitas vantagens em usar um disco rígido em um arranjo RAID, nenhuma peça de hardware é perfeita. Como toda tecnologia, eles não são infalíveis, complexos e, em algum momento, falharão.

Tome medidas para evitar falhas de RAID e perda de dados. Mas se você precisar da recuperação de dados da unidade RAID, conte com a ajuda da E-RECOVERY para obter seus dados de volta. A E-Recovery é especialista em recuperação de dados empresarial e aqui você terá as melhores chances na recuperação de dados de RAID!

SOLICITAÇÃO DE ORÇAMENTO

Rolar para cima