Cloud Computing

Ξ 5 comentários

Virtualização de Storages

publicado por Diego Salim De Oliveira

Gostaria de abordar este assunto, tendo em vista que o mesmo ainda gera enormes dúvidas em muitos profissionais.

Primeiramente, é importante separar o que são storages com características de virtualização, do que é virtualização de storages.

Storages com características ou funcionalidades de virtualização: São tecnologias aplicadas internamente aos storages através de suas controladoras, ou que fazem parte de sua própria arquitetura, porém, se limitam ao storage em si, não se aplicando a outros storages do ambiente.

Atualmente, diversos storages de mercado possuem uma ou mais características de virtualização, sendo as principais:

  • Virtualização de discos:

No modelo tradicional, os discos são agrupados de acordo com o nível de RAID a ser aplicado (0, 1, 5, 6).

Desta forma, um storage configurado, por exemplo, com 06 discos em RAID 5, e 12 discos em RAID 0+1, passa a ter os IOPS em disco de seus volumes limitados de acordo com a quantidade de discos do disk group onde ele se encontra, quantidade esta limitada pela necessidade de segregar os discos de acordo com o nível de RAID que será aplicado a eles.

Outro problema do modelo tradicional é que se você tiver área em disco com RAID 5 não alocada, você não tem como aproveitá-la em RAID 0+1, ou você acrescenta discos ao disk group em RAID 0+1 ou cria o volume em RAID 5.

Já com a virtualização de discos, os discos físicos são agrupados em disk groups que nada mais são que pools de discos.

Todos os volumes estão distribuídos entre todos os discos do pool, desta forma, o I/O em disco é distribuído fisicamente entre todos os discos, independentemente do nível de RAID aplicado.

Isto porque, neste caso, o RAID não é aplicado diretamente no disco físico, e sim no disco virtual.

Um storage com 18 discos terá todos os discos físicos servindo a todos os volumes.

O disco virtual é um volume, porém, com algumas características adicionais, como, por exemplo as configurações de RAID. As controladoras aplicam as configurações de RAID nos discos virtuais, e não nos discos físicos. Com isto, todos os discos virtuais utilizam todos os discos físicos, distribuindo por igual o I/O entre os mesmos, o que otimiza a utilização de área e também a performance do ambiente.

Isto tudo sem comprometer a disponibilidade ou integridade dos dados, uma vez que o RAID continua a ser aplicado, sendo possível escolher entre RAID 0, 1 , 5 ou 6.

A única diferença é que o RAID é aplicado via hardware, pelas controladoras, porém no disco virtual, ou seja, um disco virtual em RAID 1 (neste caso 0+1), estaria distribuído em 18 discos, sendo que seus dados estariam distribuídos em 09 discos, e o espelho (cópia) destes dados estaria distribuído nos outros 09 discos.

  • Storage Grid:

Atualmente diversos fabricantes estão oferecendo modelos mid-range baseados em storage grid.

Storage grid é uma arquitetura de storage baseada em células.

No modelo tradicional, utiliza-se um par de controladoras, as quais controlam uma quantidade X de disk shelves e discos. Desta forma, embora os IOPS em disco e a capacidade possam ser facilmente escalados com a adição de mais disk shelves e discos físicos, alguns itens de grande importância para o desempenho, como a capacidade de processamento, cache e host ports não são passíveis de incrementos.

Com o storage grid, capacidade e desempenho crescem de forma linear.

Estes storages são divididos em células.

Cada célula é um conjunto de processador, memória (cache), discos internos (capacidade de armazenamento) e portas de comunicação (para comunicação entre as células e também com os hosts).

Similar a virtualização de discos, os dados são distribuídos entre todas as células.

Desta forma, se você iniciar com 02 células e depois fizer uma ampliação para 04 células, dobrará não apenas a capacidade, mas também o desempenho do storage.

O RAID é aplicado internamente em cada célula, e também entre as células.

Desta forma, pode-se, por exemplo aplicar um RAID 5 nos discos internos das células, prevenindo que uma célula saia de operação pela simples perda de um disco, e ainda aplicar RAID 1 (0+1) entre as células, ou seja, em um storage com 04 células, 02 células teriam os dados e outras 02 células os espelhos, fazendo com que o ambiente suporte a falha simultânea de até 02 células sem gerar indisponibilidade ou acarretar em perda de dados.

Vale lembrar que este conceito atualmente ainda está focado em storages mid-range, que têm como diferencial um ótimo custo por TB e sua capacidade de crescimento linear, via de regra baseados em iSCSI apenas, e que apesar de excelente para diversos ambientes, não é o ideal para outros.

  • Storage Tiering:

Storage Tiering é uma tecnologia encontrada em alguns storages mid-range e em grande parte dos storages High-End, que permite que o storage migre automaticamente os dados entre discos nearline (SATA, SAS 7.2k ou FC 7.2k), enterprise (SAS 10k, SAS 15k, FC 10k ou FC 15k) e discos SSD, de acordo com as necessidades do ambiente, seguindo políticas previamente estabelecidas.

Desta forma, por exemplo, pode-se ter um storage que contenha discos de 7.2k, 15k, e SSD.

Os volumes que não necessitam de alto desempenho, como backups em disco, volumes utilizados para desenvolvimento e homologação, e outros ambientes não produtivos, podem ficar 100% armazenados em discos de 7.2k, de menor performance, porém, com um custo por TB também bastante inferior.

Já os volumes destinados a ambientes produtivos podem inicialmente utilizar discos de 15k, e permitir-se que o storage redistribua partes do volume entre seus tiers de disco (7.2k, 15k e SSD), de acordo com o perfil de I/O do volume.

Por exemplo, ao identificar que em um volume de 20TB apenas 1% (200GB) de dados recebem I/Os de forma intensa, 15% (3TB) dos dados tem alto índice de I/Os, e os 84% (16,8%) restantes dos dados possuem baixo índice de I/Os, o storage pode automaticamente redistribuir o volume, deixando 1% de sua área em discos SSD, 15% em discos de 15k, e 84% em discos de 7.2k.

Desta forma, obtêm-se o balanceamento ideal entre desempenho e custo, visto que os dados são distribuídos online otimizando o desempenho e também buscando se possível reduzir custos ao utilizar discos nearline.

Tudo isto de forma transparente para os usuários, aplicações e hosts.

O storage executa este processo internamente, o host continua a acessar uma única LUN, sem notícia de que o volume está distribuído em 3 tiers diferentes de disco.

O mesmo conceito é aplicado quando se virtualiza diversos storages de capacidades e características diferentes, através de um appliance ou controladora de outro storage High-End.

Virtualização de Storage: São tecnologias que se utilizam de appliances ou de storages high-end para virtualizar diversos storages.

O dispositivo que realiza a virtualização dos storages, não interfere no funcionamento interno de cada dispositivo, mas, agrega inteligência ao ambiente de armazenamento.

Os principais benefícios e funcionalidades da virtualização de storage são:

  • Gerenciamento unificado:

Toda a área em discos de todos os storages FC do ambiente passa a ser mapeada através da SAN pelo dispositivo de virtualização (appliance ou controladoras), que passa a “controlar” o ambiente como um todo. Os discos internos de cada storage seguem normalmente conectados a suas controladoras e sendo controlados pelas mesmas, porém, quem gerencia estes storages passa a ser o dispositivo de virtualização, o qual se torna responsável pela criação dos volumes.

Deste modo, um ambiente com diversos storages passa a ser muito mais simples de se gerenciar, visto que a console de gerenciamento será única.

  • Maior desempenho:

Uma vez que o dispositivo de virtualização controla tudo, tem acesso a toda a área de todos os storages, ele permite que se crie, por exemplo, um volume único, porém, “dividido” entre diversos storages. Desta forma, pode-se otimizar o desempenho do ambiente.

O host na ponta enxergará uma única LUN, sem ter ciência da localização física dela, se está centralizada em um único storage ou distribuída.

  • Storage Tiering:

Da mesma forma como já citado acima, o dispositivo de armazenamento pode adicionar funcionalidades ao ambiente. Uma vez que é ele quem controla o ambiente, ele pode entregar funcionalidades como Thin Provisioning ou Storage Tiering, mesmo que os storages gerenciados por ele não tenham estas funcionalidades.

Por exemplo, no caso do Storage Tiering, ele pode decidir como movimentar os dados entre diferentes storages físicos (por exemplo, entre um storage high-end com discos SSD, um storage mid-range com discos SAS e um storage entry-level com discos SATA), de acordo com as necessidades, seguindo a políticas previamente estabelecidas.

  • Melhor aproveitamento das áreas brutas de discos disponíveis nos storages físicos do ambiente:

Uma vez que ele pode utilizar áreas de diversos storages, você pode utilizar a capacidade disponível de diversos storages, para criar um único volume com a capacidade necessária.

  • Migração entre diferentes storages de forma transparente:

Como ele abstrai o controle das LUNs das controladoras dos storages, sendo o responsável por gerenciar e intermediar o acesso dos hosts aos storages, um volume pode ser migrado entre diferentes storages online, ou seja, sem interrupção do serviço, o que é extremamente útil para ambientes de missão crítica.

Autor

• Profissional com 16 anos de experiência em empresas multinacionais e nacionais de Tecnologia da Informação e Telecomunicações, com conhecimentos e experiência adquiridos nas áreas Comercial, Canais, Parcerias, Produtos e Técnica. • MBA em Gestão Estratégica de Negócios (ESALQ/USP), Master in Information Technology (FIAP) com módulo internacional pela Singularity University, Pós-graduação em Administração (UNIP) e graduação em Tecnologia em Marketing (UNIP). • Sólida experiência na gestão de equipes multidisciplinares. • Liderança técnica e comercial de projetos estratégicos em clientes privados e públicos, incluindo experiência e conhecimento da Lei Federal 8.666/93. • Experiência em Tecnologia da Informação (TI), incluindo Soluções em Big Data Analytics, Nuvem (Cloud), Continuidade de Negócios, Recuperação de Desastres, Virtualização (de Servidores, Desktops, Aplicações e Armazenamento), Bancos de Dados, Redes (SAN, LAN e WAN), Arquivamento, Data Center, Monitoramento e Mascaramento de Dados. • Experiência em Segurança da Informação (SI), incluindo Cyber Intelligence, Anti-DDoS, Segurança Perimetral e de Redes, End Point Security, MDM (Mobile Device Management), DLP (Data Loss Prevention), entre outros temas. • Experiência em Telecomunicações, incluindo Fixas e Móveis. • Experiência em Automação, com foco em M2M (Machine to Machine) e IoT (Internet of Things). • Domínio da Lei Geral de Proteção de Dados e das Resoluções 4658 e 3909 do Banco Central do Brasil. • Conhecimentos em Administração, Contabilidade, Gestão Tributária, Marketing e Direito (com foco em Direito Digital e legislação específica a respeito a respeito de Licitações e Contratos Públicos). LinkedIn: https://www.linkedin.com/in/DiegoSalimDeOliveira

Diego Salim De Oliveira

Comentários

5 Comments

You must be logged in to post a comment.

Busca

Patrocínio

Publicidade



Siga-nos!

Newsletter: Inscreva-se

Para se inscrever em nossa newsletter preencha o formulário.

Artigos Recentes