Pesquisa de site

Introdução ao RAID, Conceitos de RAID e Níveis de RAID - Parte 1


RAID é um Redundant Array de discos baratos, mas hoje em dia é chamado de Redundant Array of Independent drives. Anteriormente costumava ser muito caro comprar um disco de tamanho ainda menor, mas hoje em dia podemos comprar um disco de tamanho grande com a mesma quantidade de antes. Raid é apenas uma coleção de discos em um pool para se tornar um volume lógico.

Raid contém grupos ou conjuntos ou matrizes. Uma combinação de drivers forma um grupo de discos para formar uma matriz RAID ou conjunto RAID. Pode haver no mínimo 2 números de disco conectados a um controlador RAID e formar um volume lógico ou mais unidades podem estar em um grupo. Apenas um nível de Raid pode ser aplicado em um grupo de discos. Raid são usados quando precisamos de excelente desempenho. De acordo com o nível de ataque selecionado, o desempenho será diferente. Salvando nossos dados por tolerância a falhas e alta disponibilidade.

Esta série será intitulada Preparação para a configuração de RAID nas Partes 1 a 9 e cobre os seguintes tópicos.

Esta é a Parte 1 de uma série de 9 tutoriais, aqui abordaremos a introdução de RAID, conceitos de RAID e níveis de RAID que são necessários para configurar o RAID no Linux.

RAID de software e RAID de hardware

Software RAID tem baixo desempenho, devido ao consumo de recursos dos hosts. O software Raid precisa ser carregado para leitura de dados de volumes de ataque de software. Antes de carregar o software raid, o sistema operacional precisa inicializar para carregar o software raid. Não há necessidade de hardware físico em ataques de software. Investimento com custo zero.

RAID de hardware tem alto desempenho. Eles são controladores RAID dedicados que são construídos fisicamente usando placas PCI Express. Não usará o recurso host. Eles têm NVRAM para cache para leitura e gravação. Armazena o cache durante a reconstrução, mesmo se houver falha de energia; ele armazenará o cache usando backups de energia da bateria. Investimentos muito dispendiosos necessários para uma grande escala.

A placa RAID de hardware será semelhante a abaixo:

Conceitos apresentados de RAID

  1. O método Paridade no ataque regenera o conteúdo perdido a partir de informações salvas por paridade. RAID 5, RAID 6 baseado em paridade.
  2. Stripe está compartilhando dados aleatoriamente em vários discos. Isso não terá dados completos em um único disco. Se usarmos 3 discos, metade dos nossos dados estará em cada disco.
  3. Espelhamento é usado em RAID 1 e RAID 10. Espelhamento é fazer uma cópia dos mesmos dados. No RAID 1, ele também salvará o mesmo conteúdo no outro disco.
  4. Hot Spare é apenas uma unidade sobressalente em nosso servidor que pode substituir automaticamente as unidades com falha. Se alguma unidade falhar em nosso array, esta unidade sobressalente será usada e reconstruída automaticamente.
  5. Chunks são apenas um tamanho de dados que pode ter no mínimo 4 KB ou mais. Ao definir o tamanho do bloco, podemos aumentar o desempenho de E/S.

Os RAID estão em vários níveis. Aqui veremos apenas os níveis de RAID que são usados principalmente em ambiente real.

  1. RAID0=Distribuição
  2. RAID1=Espelhamento
  3. RAID5=Paridade Distribuída de Disco Único
  4. RAID6=Paridade Distribuída de Disco Duplo
  5. RAID10=Combinação de Mirror & Stripe. (RAID aninhado)

O RAID é gerenciado usando o pacote mdadm na maioria das distribuições Linux. Vamos dar uma breve olhada em cada nível de RAID.

RAID 0 (ou) Striping

Striping tem um excelente desempenho. No Raid 0 (Striping) os dados serão gravados no disco usando o método compartilhado. Metade do conteúdo estará em um disco e outra metade será gravada em outro disco.

Vamos supor que temos 2 unidades de disco, por exemplo, se gravarmos os dados “TECMINT” no volume lógico, eles serão salvos, pois 'T' será salvo no primeiro disco e 'E' serão salvos no segundo disco e 'C' serão salvos no primeiro disco e novamente 'M' será salvo em Segundo disco e continua no processo round-robin.

Nesta situação, se algum dos drives falhar, perderemos nossos dados, pois com metade dos dados de um dos discos não podemos usar para reconstruir o ataque. Mas ao comparar a velocidade de gravação e o desempenho, o RAID 0 é excelente. Precisamos de pelo menos 2 discos para criar um RAID 0 (Striping). Se você precisar de seus dados valiosos, não use este NÍVEL DE RAID.

  1. Alta performance.
  2. Há perda zero de capacidade no RAID 0
  3. Tolerância zero a falhas.
  4. Escrever e ler terão um bom desempenho.

RAID 1 (ou) Espelhamento

O espelhamento tem um bom desempenho. O espelhamento pode fazer uma cópia dos mesmos dados que temos. Supondo que temos dois números de discos rígidos de 2 TB, no total temos 4 TB, mas no espelhamento enquanto os drives ficam atrás do controlador RAID para formar um drive lógico. Só podemos ver os 2 TB do drive lógico.

Embora salvemos todos os dados, eles serão gravados em ambas as unidades de 2 TB. São necessárias no mínimo duas unidades para criar um RAID 1 ou Mirror. Se ocorrer uma falha no disco, podemos reproduzir o conjunto raid substituindo um novo disco. Se algum disco falhar no RAID 1, podemos obter os dados do outro, pois havia uma cópia do mesmo conteúdo no outro disco. Portanto, não há perda de dados.

  1. Boa performance.
  2. Aqui metade do espaço será perdida em capacidade total.
  3. Tolerância total a falhas.
  4. A reconstrução será mais rápida.
  5. O desempenho da escrita será lento.
  6. A leitura será boa.
  7. Pode ser usado para sistemas operacionais e bancos de dados de pequena escala.

RAID 5 (ou) Paridade Distribuída

RAID 5 é usado principalmente em níveis empresariais. RAID 5 funciona pelo método de paridade distribuída. As informações de paridade serão usadas para reconstruir os dados. Ele reconstrói a partir das informações deixadas nas unidades boas restantes. Isso protegerá nossos dados contra falhas na unidade.

Suponha que temos 4 unidades, se uma unidade falhar e enquanto substituímos a unidade com falha, podemos reconstruir a unidade substituída a partir das informações de paridade. As informações de paridade são armazenadas em todas as 4 unidades, se tivermos 4 números de disco rígido de 1 TB. As informações de paridade serão armazenadas em 256 GB em cada driver e outros 768 GB em cada unidade serão definidos para os Usuários. O RAID 5 pode sobreviver a uma única falha de unidade. Se as unidades falharem, mais de 1 causará perda de dados.

  1. Excelente desempenho
  2. A leitura será extremamente boa em velocidade.
  3. A escrita será média, lenta se não usarmos um controlador RAID de hardware.
  4. Reconstrua a partir das informações de paridade de todas as unidades.
  5. Tolerância total a falhas.
  6. 1 O espaço em disco estará em paridade.
  7. Pode ser usado em servidores de arquivos, servidores web, backups muito importantes.

Disco distribuído RAID 6 de duas paridades

RAID 6 é igual ao RAID 5 com sistema distribuído de duas paridades. Usado principalmente em um grande número de arrays. Precisamos de no mínimo 4 unidades, mesmo se 2 unidades falharem, podemos reconstruir os dados enquanto substituímos novas unidades.

Muito mais lento que o RAID 5, porque grava dados em todos os 4 drivers ao mesmo tempo. A velocidade será média enquanto usarmos um controlador RAID de hardware. Se tivermos 6 números de discos rígidos de 1 TB, 4 unidades serão usadas para dados e 2 unidades serão usadas para paridade.

  1. Desempenho ruim.
  2. Leia o desempenho será bom.
  3. O desempenho de gravação será ruim se não usarmos um controlador RAID de hardware.
  4. Reconstrua a partir de 2 unidades de paridade.
  5. Tolerância total a falhas.
  6. 2 O espaço em disco estará em paridade.
  7. Pode ser usado em grandes matrizes.
  8. Pode ser usado para fins de backup, streaming de vídeo, usado em larga escala.

RAID 10 (ou) Espelho e Faixa

RAID 10 pode ser chamado como 1+0 ou 0+1. Isso fará os dois trabalhos de Mirror & Striping. O espelho será o primeiro e o stripe será o segundo no RAID 10. O stripe será o primeiro e o espelho será o segundo no RAID 01. O RAID 10 é melhor em comparação com o 01.

Suponha que temos 4 números de unidades. Enquanto estou gravando alguns dados em meu volume lógico, eles serão salvos em todas as 4 unidades usando métodos de espelhamento e distribuição.

Se eu estiver gravando dados “TECMINT” no RAID 10, os dados serão salvos da seguinte maneira. O primeiro “T” gravará em ambos os discos e o segundo “E” gravará em ambos os discos, esta etapa será usada para todas as gravações de dados. Ele também fará uma cópia de todos os dados para outro disco.

Ao mesmo tempo, ele usará o método RAID 0 e gravará os dados da seguinte forma: “T” gravará no primeiro disco e “E” gravará no segundo disco. Novamente “C” irá gravar no primeiro disco e “M” no segundo disco.

  1. Bom desempenho de leitura e gravação.
  2. Aqui metade do espaço será perdida em capacidade total.
  3. Tolerância ao erro.
  4. Reconstrução rápida a partir da cópia de dados.
  5. Pode ser usado em armazenamento de banco de dados para alto desempenho e disponibilidade.

Conclusão

Neste artigo vimos o que é RAID e quais níveis são mais usados em RAID em ambiente real. Espero que você tenha aprendido o artigo sobre RAID. Para configurar o RAID é necessário ter conhecimentos básicos sobre RAID. O conteúdo acima irá preencher o entendimento básico sobre RAID.

Nos próximos artigos irei abordar como configurar e criar um RAID usando vários níveis, aumentando um grupo RAID (matriz) e solução de problemas com unidades com falha e muito mais.