Sistemas operacionais de alta disponibilidade

Estudo comparativo entre sistemas operacionais de alta disponibilidade de serviços

Ricardo Antonio da Silva

ABSTRACT
This article discusses technical details between cluster tools on high availability servers, the main objective is to show the pros and cons of each operating system. Project reference is assessment requirement for the discipline of Requirements Analysis Infrastructure in Postgraduate Network Administration Microsoft.

RESUMO
Este artigo aborda detalhes técnicos entre ferramentas de cluster sobre servidores de alta disponibilidade, o objetivo principal é mostrar os prós e contras de cada sistema operacional. Projeto em referência é requisito de avaliação para a disciplina de Análise de Requisitos de Infraestrutura na Pós-graduação em Administração de Redes Microsoft.

Categories and Subject Descriptors
K.8.3 [Personal Computing]: Management/Maintenance.

General Terms
Measurement.
Palavras-chave
Alta disponibilidade, inatividade, serviços.

1. INTRODUÇÃO

Cluster, ou aglomerado de computadores, é formado por um conjunto de computadores que utiliza um sistema operacional especial para gerenciar os serviços de sistemas distribuídos disponibilizados.

Trata-se de uma verdadeira revolução de serviços em alta disponibilidade, a princípio o que conduz ao cluster foi desenvolvida na década de 1960 pela IBM como uma forma de interligar grandes mainframes, visando obter uma solução comercialmente viável de paralelismo. Nesta época o sistema HASP (Houston Automated Spooling Program) da IBM e seu sucessor o JES (Job Entry System) proviam uma maneira de distribuir tarefas nos mainframes interligados. [1]

Hoje em dia é possível utilizar alguns tipos de cluster como:

Cluster de Alta Disponibilidade: São cluster cujos sistemas conseguem permanecer ativos por um longo período de tempo e em plena condição de uso sendo assim pode-se dizer que eles nunca param seu funcionamento.
Cluster de Alto Desempenho: Também conhecido como cluster de alta performance, ele funciona permitindo que ocorra uma grande carga de processamento.
Cluster de Balanceamento de Carga: Esse tipo de cluster tem a função de controlar a distribuição equilibrada do processamento.

A importância da alta disponibilidade varia conforme as aplicações, tantos as pequenas empresas e empresas globais tem utilizado esse recurso em toda parte do mundo que necessitam de acesso aos dados 24 horas por dia e 7 dias da semana, sem o acesso a esses dados as operações podem parar e consequentemente seus lucros. No entanto, a necessidade de proporcionar níveis crescentes de disponibilidade continua a acelerar a medida que as empresas reestruturam as suas soluções para ganhar vantagem competitiva. [2]

Na maioria das vezes, estas novas soluções dependem do acesso imediato aos dados críticos do negócio. Quando não houver dados disponíveis, as operações podem deixar de funcionar e o tempo de inactividade pode levar à perda de produtividade, perda de receita, relacionamento com clientes afectado, má publicidade e mesmo a acções judiciais.

No entanto, paralelamente a todos estes benefícios surge também uma crescente dependência desta infraestrutura. Se uma aplicação crítica se torna indisponível, todo o negócio pode estar em perigo. As receitas e os clientes podem ser perdidos, podem ser exigidas penalizações e a publicidade negativa pode ter um efeito duradouro sobre os clientes e sobre as acções da empresa.

É importante analisar os factores que determinam como os dados estão protegidos e maximizar a sua disponibilidade para os utilizadores. Os computadores são cada vez mais rápidos e mesmo assim as empresas que dependem deles não param de exigir mais e mais de todos os sistemas informáticos.

As interligações e as diversas dependências no mundo da computação, constituído por diversos componentes e tecnologias, estão a tornarem-se mais complexas a cada dia que passa. A disponibilidade de acesso em todo o mundo através da Internet está a colocar exigências extremamente altas para as empresas, departamentos de TI e administradores que têm que gerir e manter os computadores que suportam tudo isso.

As ferramentas testadas em nível de implantação de cluster são: Failover Cluster Windows Server 2008, ESXi e o Heartbeat do sistema operacional Linux, destes apenas o Linux é de uso gratuito os demais tem seu uso restrito à compra de uma licença para utilização dos recursos.

Assim, este artigo aborda a comparação de sistemas operacionais de alta disponibilidade em serviços, apontando as métricas relativas a confiabilidade. Seguindo este raciocínio na Seção 2 aborda-se uma fundamentação teórica sobre o tema; na Seção 3, mostra-se a metodologia aplicada nos testes; na Seção 4, descrevem-se os resultados obtidos na fase de testes; concluímos o artigo na seção 5; registram-se os agradecimentos na Seção subsequente e as referências utilizadas na 7ª e última seção.

2. FUNDAMENTAÇÃO TEÓRICA

Nesta seção apresentar-se-ão resumidamente os conceitos relacionados ao projeto em questão.

2.1 Problemática e Justificativa

Clusters ou combinações de clusters são usados quando os conteúdos são críticos ou quando os serviços têm que estar disponíveis e/ou processados o quanto mais rápido possível. Internet Service Providers (provedores de Internet) ou sites de comércio eletrônico frequentemente requerem alta disponibilidade e balanceamento de carga de forma escalável.

Os clusters paralelos têm uma importante participação na indústria cinematográfica para renderização de gráficos de altíssima qualidade e animações, relembrando que o Titanic foi renderizado dentro desta plataforma nos laboratórios da Digital Domain.

Os clusters Beowulf são usados na ciência, engenharia e finanças para atuarem em projetos de desdobramento de proteínas, dinâmica de fluídos, redes neurais, analise genética, estatística, economia, astrofísica dentre outras.

Pesquisadores, organizações e empresas estão utilizando os clusters porque necessitam incrementar sua escalabilidade, gerenciamento de recursos, disponibilidade ou processamento a nível supercomputacional a um preço disponível.

Os computadores possuem uma forte tendência a parar quando menos se espera, principalmente num momento em que se mais necessita dele. É raro não encontrar um administrador que nunca recebeu um telefonema no meio da madrugada com a triste notícia de que o sistema de missão critica ficou fora ar, ou seja, não tem jeito, você tem que ir resolver o problema.

A Alta Disponibilidade está ligada diretamente à crescente dependência dos computadores, pois estes possuem um papel crítico, principalmente em empresas cuja maior funcionalidade é exatamente a oferta de algum serviço computacional, como e-business, notícias, sites web, banco de dados, dentre outros.

2.2 Cluster de Alta disponibilidade

Este modelo de cluster aumenta a disponibilidade e performance das aplicações, particularmente as grandes tarefas computacionais. Uma grande tarefa computacional pode ser dividida em outras pequenas, as quais são distribuídas ao redor das estações (nodos), como se fosse um supercomputador massivamente paralelo. [3]

2.3 Cluster de Balanceamento de Carga (load Balancing)

Como o próprio nome diz é o conjunto de duas ou mais máquinas nas quais estão sendo executadas aplicações requeridas por um número muito grande de pessoas. Um bom cluster de balanceamento de carga deve ter a capacidade de receber os pedidos de requisição de serviços de vários clientes e distribuir a carga entre os servidores que fazem parte dos nodos (nó) de forma que nenhuma máquina fique sobrecarregada ou ociosa. [3]

2.4 Cluster de Alto Desempenho

São direcionados a aplicações bastante exigentes no que diz respeito ao processamento. Sistemas utilizados em pesquisas cientificas, por exemplo, podem se beneficiar deste tipo de cluster por necessitarem analisar uma grande variedade de dados rapidamente e realizar cálculos bastante complexos.

O foco deste tipo de cluster é o de permitir que o processamento redirecionado a aplicação forneça resultados satisfatórios em tempo hábil, mesmo que haja centenas de milhares de gigaflops envolvidos com a tarefa (1 gigaflops corresponde a 1 bilhão de instruções de pontos flutuante executadas por segundo). [4]

3. METODOLOGIA

Utilizar-se-á um processo de simulação através de máquinas virtuais, este processo tem como finalidade a coleta de dados sobre as etapas de configuração e implantação dos sistemas de cluster, usou-se um equipamento com as seguintes configurações:

Configurações do equipamento.
Máquina Física Máquina Virtual
CPU Core i7 CPU Core i7
Memória RAM 8 GB Memória RAM 4 GB
Disco Rígido 750 GB Disco Rígido 30 GB

A opção pela realização de máquinas virtuais para coleta de dados deu-se em virtude da facilidade de configuração que esse tipo de tecnologia oferece para os testes, que se fizeram necessários, sobretudo, pela facilidade na obtenção dos dados que serão apresentadas, além, do curto espaço de tempo para montagem de um laboratório exclusivo para essa finalidade.

As métricas coletadas foram realizadas em total igualdade de condições entre as três ferramentas, visando um resultado satisfatório do uso da tecnologia.

As simulações realizadas visaram à obtenção de resultados e qual tecnologia a empresa deverá utilizar forma que sua infraestrutura não venha ter a indisponibilidade dos recursos na rede, onde o foco maior do funcionamento do cluster em ambientes corporativos é garantir além dos serviços prestados a integridade a disponibilidade e a confiabilidade dos dados salvos em seus datastores.

4. RESULTADOS

Os resultados comparativos entre os sistemas, foram bem diversos com relação a cada modo que cada uma foi interpretada de acordo com os problemas apresentados durante a instalação e configuração das tecnologias afim de conseguir resultados que foi separado por sistemas operacionais.

4.1 Sistema Operacional Linux

Um fator muito importante que se deve levar em consideração durante a implantação de um servidor de alta disponibilidade é justamente o custo x beneﬁcio, como pode ser visto, quando maior o grau de disponibilidade maior será o recurso ﬁnanceiro necessário para implementação.

Por ser um sistema operacional de código fonte aberto e de ser distribuído gratuitamente pela Internet, o Linux termina sendo uma solução bastante atrativa para quem não dispõe de um investimento considerável para construção de um cluster de alta capacidade.

Porém, com um grau maior de complexidade devido à falta de uma interface gráfica, e com a curva de aprendizado que pode levar dias dificulta um pouco na hora da instalação e configuração dos servidores para usuários que não são familiarizados com interface Shell, a famosa tela console. Algumas ferramentas se fez necessário para o funcionamento dos cluster de alta disponibilidade que podem ser baixada gratuitamente pela internet. Que são elas:

O Drbd, que replica as informações de um servidor em outro, utilizando como meio de transmissão à rede.
O Heartbeat que faz veriﬁcações e tomada de decisões podendo assumir os recursos desses computadores que não estão respondendo.
O Mon tendo ﬁnalidade de monitorar o sistema. Caso detecte uma falha é possível enviar um e-mail e até mesmo fazer com que ele acione o Heartbeat para que ele tome alguma decisão para a solução do problema. [5]

Vale também deixar claro que para montar esse ambiente utilizamos duas máquinas virtuais com as seguintes configurações de hardware:

Configuração do experimento 1.

Máquina Física Máquina Virtual
CPU Core i7 CPU Core i7
Memória RAM 8 GB Memória RAM 1 GB
Disco Rígido 750 GB Disco Rígido 30 GB
Datastore Disco Rígido 20 GB

4.2 Sistema Operacional ESXi

Para a instalação do ambiente de cluster sobre o ESXi ao contrário do sistema operacional Linux tiveram-se algumas exigências sobre hardware como:

Configuração do experimento 2.
Máquina Física Máquina Virtual
CPU Core i7 CPU Core i7
Memória RAM 8 GB Memória RAM 2,5 GB
Disco Rígido 750 GB Disco Rígido 30 GB
Datastore Disco Rígido 30 GB

Os seguintes passos foram executados para instalação do sistema operacional ESXi:

download direto do site da VMware;
com o arquivo .ISO conseguiu-se instalar o sistema operacional;
após a conclusão da instalação optamos em deixar o IP fixo das máquina para que possamos acessar os hosts com o sitema ESXi através de um outro computador que continha a versão do Vcenter que é responsável em gerenciar o ambiente ESXi;

O cliente Vcenter é disponibilizado quando o host com ESXi é acessado via web, é ofertado o download do próprio S.O. para ser acessado de qualquer local da rede após essa instalação uma apresentação do host é exibido em uma forma gráfica e muito amigável. Onde a partir dele é possível criar as máquinas virtuais assim como pode-se fazer a configuração do cluster entre hosts executando o ESXi.

A configuração é relativamente muito simples e tranquila comparando-se com o sistema Operacional Linux, que através de um assistente adicionamos os hosts e ambos apontando para o mesmo datastore.

Na configuração do cluster é possível configurar o item chamado DSR (Distributed Resources Scheduler) [6] esse recurso é muito interessante, pois ele configurado na opção totalmente automatizado, que significa que o próprio DSR se encarregara de fazer o balanceamento das máquinas virtuais sobre os hosts, ou seja, ele nunca deixará que uma máquina fique sendo mais utilizada ou obsoleta que a outra, assim os administradores do ESXi bastam se preocupar com a infraestrutura dos datastores e as próprias máquinas físicas. Além de muitas outras funções que são de controle do Vcenter como criação de snapshot, clonar máquinas virtuais, dentre outras, além disso no próprio software é criado registros de logs onde podem ser consultados e alertas de qualquer anormalidade do sistema operacional. Mais para que essa tecnologia esteja acessível em um ambiente é necessário efetuar a compra da licença de uso através das empresas parceiras existentes em cada região.

4.3 Sistema Operacional Windows:

Para iniciar os testes com cluster em ambiente Microsoft utilizamos duas máquinas virtuais com as seguintes configurações:

Configuração do experimento 2.
Máquina Física Máquina Virtual
CPU Core i7 CPU Core i7
Memória RAM 8 GB Memória RAM 2,5 GB
Disco Rígido 750 GB Disco Rígido 30 GB
Datastore Disco Rígido 30 GB

Os seguintes passos foram executados para instalação do sistema operacional e a configuração do cluster foi feito um download direto do site da Microsoft onde baixamos a versão Windows Server 2008 R2. [7]

É possível adicionar dois ou mais servidores no cluster para escolher quais serviços irão disponibilizar na rede, podendo também configurar o cluster para que ele possa assumir toda a infraestrutura do ambiente corporativo com um balanceamento de carga automático onde os serviços das máquinas virtuais podem ser transferidos para os servidores no cluster e as máquinas virtuais podem ser transferidas de host para o outro. Em caso de um desastre um dos servidores cair todas as máquinas virtuais serão transferidos para o servidor disponível no cluster, assim que o servidor voltar a ativa o sistema do cluster automaticamente irá transferir as máquinas virtuais para o servidor de origem.
Foi levantada duas máquinas virtuais com Windows Server 2008 com o recurso hyper-v instalado em ambas e todas as máquinas host apontando para o datastore onde é armazenado todos os dados das máquinas virtuais.

Então o administrador da rede pode não só apenas utilizar o recurso hyper-v no cluster podem também utilizar outros serviços como servidor de arquivos, impressão entre outros recursos do Windows Server.

Tudo isso sendo gerenciado pelo Gerenciado do Failover Cluster que é o responsável em ter o controle dos hosts e dos serviços disponibilizados.

5. CONCLUSÃO

A vantagem do cluster é que pode-se manter os serviços sempre ativos caso um dos hosts venham danificar ou precisar de alguma manutenção o serviço não ficara indisponível.

Levando em consideração que o sistema utiliza máquinas virtuais e o tempo de restore de uma máquina virtual a partir de um snapshot é mais rápido do que reconfigurar toda a máquina física.

Mesmo que seu ambiente esteja com cem por cento de integridade de backups e estejam em dias o tempo de restore ainda é maior do que o restore do backup, mesmo sendo da melhor ferramenta de backup que posso citar o TSM da IBM.

Então a utilização do cluster em um ambiente corporativo é muito eficaz na resolução dos problemas, ficando as três opções citadas no artigo ou outras que existam no mercado.

6. AGRADECIMENTOS

Registram-se agradecimentos ao Prof. Luciano Cabral pela atenção e orientação e principalmente pelo incentivo a pesquisa.

7. REFERÊNCIAS

[1] Wikipédia. Cluster Acesso em 16 de 06 de 2013, disponível em pt.wikipedia.org: http://pt.wikipedia.org/wiki/Cluster
[2] Redes & Servidores. Alta Disponibilidade. Acesso em 17 de 06 de 2013, disponível em blogspot.com.br: http://redes-e-servidores.blogspot.com.br/2011/02/alta-disponibilidade-introducao.html
[3] Desmonta & CIA. Entenda o que é Clusters de servidor. Acesso em 17 de 06 de 2013, disponível em wordpress.com: http://desmontacia.wordpress.com/2010/09/01/entenda-o-que-clusters-de-servidor/
[4] Alecrim, Emerson (22 de 03 de 2013) Cluster: Conceito e características. Acesso em 17 de 06 de 2013, disponível em infowester.com: http://www.infowester.com/cluster.php
[5] The IT Axis. Heartbeat – A Step by Configuration Guide to High Availability Linux Clusters. Acesso em 021 de 06 de 2013, disponível em wordpress.com: http://theitaxis.wordpress.com/2009/11/14/heartbeat-a-step-by-step-configuration-guide-to-high-availability-linux-clusters/
[6] VMware. Build a Flexible, Efficient Datacenter. Acesso em 21 de 06 de 2013, disponível em wmware.com: http://www.vmware.com/products/datacenter-virtualization/vsphere/drs-dpm.html
[7] Guia passo-a-passo do cluster de Failover. Acessado em 21 de 06 de 2013, disponível em technet.com:
http://technet.microsoft.com/pt-br/Library/cc771509(v=ws.10).aspx