Boa tarde a todos, é muito bom voltar a escrever para os colegas e leitores da TI Especialistas. Podemos dizer que a Cloud Computing está consolidada, a prova disso é que temos diversas empresas no segmento e muitas empresas migraram parte ou totalmente seus recursos e aplicações de TI para ela. Mas o que podemos falar das empresas que preferem manter seu CPD e estão procurando uma forma de contingência desse ambiente?
Quando pensamos em montar um site de contingência, temos a lembrança dos intermináveis fins de semanas em que precisamos trabalhar para colocar nosso ambiente de produção funcional, com certa dose de segurança e estabilidade.
Criar outro site pode ser muito mais simples do que se parece, mas não menos crítico. Você precisará definir alguns pontos importantes antes de iniciar o projeto:
- Definir a localidade do site de contingência;
- Definir rede (link) entre site de produção e contingência;
- Definir metodologia e ferramentas para a gestão do ambiente;
- Definir hardware necessário para suportar o ambiente;
- Definir custos envolvendo a operação;
Partindo do ponto que você tem isso definido, o que precisa ser feito a seguir? Em ambos os sites (produção e contingência), você precisará gerenciar utilizando o vCenter Server. Com o vCenter Server configurado e funcional, será a hora de instalar o vSphere Replication Server em ambos os sites. Durante a instalação, serão solicitadas informações referentes ao servidor vCenter, em cada um dos sites, o que permitirá que o Replication, seja capaz de gerenciar réplicas de VM´s presentes no vCenter de produção.
Ao finalizar a instalação do Replication nos dois sites, você precisará conectar os sites para que seja possível criar réplicas das VM´s no site de contingência.
Nesse ponto já é possível criar réplica entre os sites, porém há um inconveniente que praticamente inviabiliza sua utilização. Ao ter o site de produção indisponível e o de contingência iniciado, para que a produção volte a ser ativada, uma nova réplica de todo o conteúdo precisará ser feito. Imagine trafegar entre diferentes sites, servidores de 500 GB, 1 TB de dados? Serão muitas horas para ter seu ambiente de produção operacional novamente. O SRM praticamente elimina esse problema e permite que se faça simulações de virada de ambiente e configurações nos servidores que serão iniciados no site de contingência.
Para a instalação do SRM. Recomendo que crie um banco específico para o SRM em um servidor de banco de dados independente, nele estarão contidas as informações das máquinas, políticas e configurações do ambiente.
Durante a instalação do SRM, também são solicitadas informações do vCenter Server de cada localidade (o SRM precisa ser instalado em ambos os sites também) e ao término você precisará conectar os dois sites, assim como no Replication.
Feito isso, qualquer mudança feita em um dos sites relacionado a réplica, automaticamente a mesma configuração é processada no outro site.
Com as máquinas já replicadas é hora de criar os Protection Groups e Recovery Plans. O primeiro separa em grupos de VM´s e o segundo fica responsável pela política que será aplicada para cada grupo. Com esses passos criados, é possível simular uma parada do site principal sem necessidade de parada do ambiente ou realizar a inversão dos sites em caso de simulação real, ou mesmo a ativação do site de contingência no caso de queda do site principal. Durante a simulação é possível identificar quanto tempo será necessário para levantar suas VM´s no site de contingência, em meus testes com 15 servidores, não esperei 10 minutos.
Com a normalização do site principal, basta acessar o SRM do site de contingência e solicitar um REPROTECT. Ele irá perguntar se deseja que os dados mais recentes sejam transferidos para o site principal ou se as máquinas devem ser imediatamente ativadas. Caso as alterações realizadas no ambiente de contingência precisem estar disponíveis no site de produção, aceite a opção informada e aguarde o término da réplica dos dados. Lembrando que essa opção pode acarretar em uma demora não estimada, vai depender da quantidade de dados alterados e do link entre os sites.