Gerência de Projetos

Ξ 3 comentários

Case – Projeto de IT DRP

publicado por Leonardo Matarazzo

Manter alta disponibilidade nos ambientes de tecnologia da informação é fator necessário para empresas que dependem de sua plataforma. Em um dos últimos projetos que necessitei conduzir, eu tive como missão replicar todas as aplicações críticas de uma empresa de forma com que a operação não ficasse indisponível caso o datacenter principal ficasse parcial ou totalmente indisponível.

Grande parte das empresas se preocupa com seu PCN (Plano de Continuidade de Negócios), afinal de contas qualquer indisponibilidade de sua operação pode comprometer seriamente a imagem da empresa no mercado.
O IT DRP (Information Technology Disaster Recovery Plan) é um plano de contingência para toda Infraestrutura de TI&Telecom e este plano torna parte do PCN corporativo.

A empresa possui 4 unidades de negócio e cada uma delas com aproximadamente 5 aplicações críticas, ou seja, devem estar disponíveis 24x7x365. Totalizamos assim 20 aplicações críticas em todo ambiente de TI.
Após pesquisar diversas soluções de mercado, decidimos seguir com a seguinte solução:

– Virtualização de todas as aplicações críticas.
– Replicações de Storages entre o datacenter principal e o datacenter de contingência.
– Link de Fibra de 1Gbps conectando os dois datacenters.

No datacenter principal possuíamos 5 Storages EMC-CX4 totalizando aproximadamente 20Tbytes de dados a serem replicados. Montamos um cluster de VmWare contendo 5 nós (Cada um com 8 cores e 48Gbytes de Memória) no datacenter principal e um cluster de VmWare com 2 nós (Cada um com 8 cores e 96 Gbytes de Memória) no datacenter de contingência e virtualizamos todos os servidores de aplicações de missão crítica. Os únicos servidores que não foram virtualizados foram os servidores ORACLE RAC.

Implantamos a ferramenta Recover Point da EMC para realizar replicação dos 5 Storages para 1 único storage localizado no datacenter de contingência em tempo real através do link de 1Gbps.
Já que os clusters de VMWare estavam conectados nos storages, toda replicação que ocorria entre eles, garantia também a replicação dos servidores de aplicações.

Dado este cenário, toda vez que algum servidor ficar indisponível por conta de algum problema físico no datacenter principal, basta subir a VMWare deste servidor no datacenter de contingência, de forma que a operação sinta impacto somente durante uns 5 minutos aproximadamente. A conexão dos datacenters foi realizada em trunk, portanto não há problemas de IP nos servidores, pois em ambos os datacenter os servidores possuem o mesmo IP.

Em relação ao ORACLE, como disse anteriormente, não houve virtualização, mas já que os bancos de dados estavam sendo replicados através do Recover Point da EMC, bastava deixar o servidor ORACLE de contingência com as instâncias pré-configuradas que devem receber um start caso o ORACLE do datacenter principal se torne indisponível.

Não basta implantar um IT DRP. É necessário testá-lo, da mesma forma que de nada vale um backup se ele não for capaz de prover um restore. Por conta disso, realizamos testes de contingência com a operação no ar das 4 unidades de negócio e todos os testes ocorreram com sucesso. A indisponibilidade foi de 5 minutos para subirmos os servidores no datacenter de contingência e no retorno das aplicações para o datacenter principal mais 5 minutos, totalizando apenas 10 minutos de indisponibilidade e uma capacidade de manobra de ambientes de infraestrutura excelente e eficiente.

Lembro que este tipo de solução que replica os dados de um datacenter para o outro em tempo real cobre desastres físicos e não desastres lógicos.

Maiores detalhes sobre o projeto e a solução podem ser obtidos no seguinte link:
http://i.dell.com/sites/content/corporate/case-studies/en/Documents/2011-tempo-assist-10009450.pdf

Uma solução simples e extremamente confiável, implantada em seis meses de projeto e que pode ser aplicada em outros ambientes. Requer, sem dúvidas, alguns investimentos que são pagos através da alta disponibilidade de toda plataforma.

Autor

Sou graduado em Gestão de TI e atuo na área de tecnologia da informação há 15 anos, especificamente na área de infraestrutura de TI e Telecom gerenciando times e projetos. Incentivo e participo da comunidade Open Source e sou a favor do trabalho Home-Office para profissionais de TI. Certificações Profissionais: •ITIL V3 Foundation •Oracle 11i Applications Database Administrator Certified Professional •Oracle Certified Professional (OCP 11g) •Oracle Certified Professional (OCP 10g) •Oracle Certified Professional (OCP 9i) •IBM Certified Database Administrator (DB2 UDB 8.1) •Microsoft Certified Technology Specialist: SQL Server 2005 •Microsoft Certified IT Professional: Database Administrator •Microsoft Certified Professional (MCSA,MCSA+M,MCDBA, MCSE, MCT) •Oracle Database 10g: Administering Real Applications Clusters Certified Expert •Instrutor Homologado Oracle e Microsoft Meus Contatos: leonardo.matarazzo@itlearning.com.br www.itlearning.com.br

Leonardo Matarazzo

Comentários

3 Comments

  • Leonardo,

    Bom dia !! Parabéns pelo texto

    Concordo com este parágrafo – Grande parte das empresas se preocupa com seu PCN (Plano de Continuidade de Negócios), afinal de contas qualquer indisponibilidade de sua operação pode comprometer seriamente a imagem da empresa no mercado.

    Boa sorte
    Fabiana Segatto

  • Obrigado Segatto ! Vamos em frente !

  • Muito bacana você ter compartilhado sua experiência conosco. Estou tendo meu primeiro contato com o assunto e estou achando tudo muito interessante. A leitura do seu arquivo em pdf será de grande valor agregado.
    Mais uma vez obrigado e fique com Deus.

You must be logged in to post a comment.

Busca

Patrocínio

Publicidade



Siga-nos!

Newsletter: Inscreva-se

Para se inscrever em nossa newsletter preencha o formulário.

Artigos Recentes