Banco de Dados

Ξ 5 comentários

MTBF e MTTR em sua aplicação. Sua equipe de TI sabe do que estamos falando?

publicado por Renato Medina

Olá galera, esta semana estou fazendo um curso de Alta Disponibilidade com MySQL Cluster e entre os vários tópicos abordados há uma forma de calcular o tempo de atividade Uptime “disponibilidade”das máquinas. E sendo esta umas das principais razões para usarmos o Cluster do MySQL o assunto realmente me interessou, o que me fez ler e procurar entender melhor o conceito e de quebra fiz este artigo baseado em um outro do site http://world-class-manufacturing.com uma vez que não encontrei muita documentação em português. Espero que apreciem.


MTBF e MTTR o que são?

MTBF, Mean Time Between Failures (Tempo médio entre falhas) e MTTR – Mean Time To Repair (Tempo médio de reparo) são dois importantes KPI’s dentro do nível de desempenho de processos.

MTBF = (Total up time) / (número de breakdowns)

MTTR = (Total down time) / (número de breakdowns)

 

MTBF e MTTR – O que eles querem dizer?

“Tempo médio” significa, estatisticamente falando, o valor médio de tempo dentre a ocorrência de uma mesma situação.

“Mean Time Between Failures” (MTBF) é literalmente a média de tempo decorrida entre uma falha e a próxima vez em que ela irá ocorrer. Normalmente pessoas pensam nisto como uma média de tempo de alguma coisa funcionando até  falhar e precisar ser reparada (novamente).

“Mean Time To Repair” (MTTR)  é a média de tempo que se leva para reparar alguma coisa depois de uma falha.

Para algo que não pode ser reparado o termo correto é MTTF – “Mean Time To Failure” (Tempo médio para falhas). Alguns definiriam MTBF – para dispositivos reparáveis –  como a soma de MTTF mais MTTR.  (MTTF = MTTF + MTTR). Em outras palavras, o Meio Tempo entre falhas é o tempo entre uma falha e outra. Esta distinção é importante se o tempo de reparo (MTTR) é uma fração significante do MTTF.

Aqui está um exemplo: Uma lâmpada em um candelabro não é reparável, então MTTF é mais apropriado. A lâmpada deve ser trocada. O MTTF possivelmente é de 10.000 horas.

Por outro lado, sem trocas de óleos, um motor de carro pode falhar depois de 150 horas dirigindo em uma rodovia – neste caso é MTTF. Assumindo 6 horas para remover e substituir o motor (MTTR), MTBF é 150 + 6 = 156 horas.

Como automóveis, a maioria de equipamentos manufaturados serão reparados, ao invés de substituidos após uma falha. Logo MTBF é a mais apropriada forma de medir.

 

O que é uma falha?

“”Falha” pode ter vários significados. Vamos rapidamente examinar uma falha em um dispositivo:

Uma Fonte de Energia Ininterrupta (UPS – Uninterruptible Power Source) pode ter cinco funções dentro de duas condições:

  • Enquanto a principal fonte de energia está disponível:
    • F1) Permite a energia circular da fonte principal para as máquinas protegidas;
    • F2)Condiciona a energia limitando saltos ou interrupções;
    • F3)Armazena energia em uma bateria até completá-la;
  • Quando a principal fonte de energia é interrompida:
    • F4)Fornece energia para as máquinas protegidas;
    • F5)Emite um sinal indicando que a forte de energia principal está inoperante;
Não há dúvida sque o UPS falhou se ele interromper o fluxo de energia provido pela fonte principal para as máquinas protegidas (F1). Falhas para F2, F3 ou F5 podem não ser óbvias porque as “máquinas protegidas” estão ainda rodando pela fonte principal ou pela bateria. Ainda que notado, estas falhas pode não acionar medidas corretivas porque as “máquinas protegidas” estão ainda rodando e pode ser mais importante mantê-las rodando do que corrigir ou substituir o UPS.
O que é Disponibilidade

A “disponibilidade” de um equipamento é, matematicamente, MTBF / (MTBF + MTTR) para tempo de trabalho programado.

O automóvel do exemplo anterior está disponível para 150/156 = 96,2% do tempo. O reparo é tempo de inatividade não programada.

Com meia hora de não programada troca de óleo a cada 50 horas dirigidas – acontece quando um indicador no painel do carro alerta o motorista –  o tempo de disponibilidade sobre para 50 / 50.5 = 99%.

Se trocas de óleo fossem agendadas corretamente como atividade de manutenção a disponibilidade do veículo seria de 100%.

Porque tudo isso é importante?

“Disponibilidade” é um indicador de performance para processos e fábricas. É parte da medida da eficácia geral do equipamento ou “Overall Equipment Effectiveness” (OEE).

Uma produção programada que inclui tempos de paradas para manutenção preventiva pode precisamente prever o total de uma produção. Agendamentos que ignoram MTBF e MTTR são simplesmente um desastres (programados ou não, desculpe o trocadilho) aguardando para acontecer.

Como calcular o atual MTBF

Atual ou histórico MTBF é calculado usando observações no mundo real. (Há uma disciplina para designers de equipamentos preverem MTBF, baseado nos componentes e cargas de trabalho previstas).

Calculando o atual MTBF requer um conjunto de observações, onde cada uma seria:

  • Tempo de Funcionamento (Uptime_moment): o momento no qual a máquina começa a operar (inicialmente ou após um reparo);
  • Tempo de Parada (Downtime_moment): o momento no qual a máquina parou após iniciado suas operações.
Cada tempo entre falhas (Time Between Failure TBF) é a diferença entre um tempo de funcionamento (Uptime_moment) e seu tempo de parada (Downtime_moment) subsequente.
Três quantidades são requeridas:
n = Numero de observações
ui = Este é o ith Uptime_moment
di = Este é o ith Downtime_moment seguido de um ith Uptime_moment

Então temos MTBF = Sum (di – ui) / n, para todos i = 1 entre n observações. Mais simplesmente, este é o tempo de trabalho total dividido pelo número de falhas.

Texto extraído e traduzido de http://world-class-manufacturing.com/KPI/maintenance.html.

Outras referências sobre o assunto:

http://pt.wikipedia.org/wiki/Indicador-chave_de_desempenho

Autor

Renato Medina é certificado MySQL CMDEV/CMDBA e Magento Developer. Trabalha como PHP e MySQL há mais de 7 anos. Já desenvolveu vários softwares para empresas dos mais diversos ramos. Hoje vive em Melbourne, Australia. Mantém o blog http://blog.mdnsolutions.com onde fala sobre desenvolvimento, PHP, frameworks, MySQL entre outros assuntos relacionados.

Renato Medina

Comentários

5 Comments

  • Muito boa a explicação sobre o mtbf e o mttr.
    pois nao sabia o isso significava.

  • Excelente Artigo!!

  • Olá, tenho uma divida, como faço para calcular o MTBF de um grupo de maquinas?

    Posso somas todos os valores das maquinas e fazer o calculo de tudo junto?

  • Ola Cleidson.

    Primeiramente, obrigado pela sua pergunta. Bem, o calculo vai depender do que cada maquina faz. Quando você diz “grupo de maquinas” esta se referindo a:
    1) um Cluster? Elas compartilham a mesma informação e em caso de uma maquina parar as outras tomam frente ao processo?
    2) Cada maquina tem diferentes tarefas entre si.

    No primeiro caso você calcularia o uptime do serviço que eles provem (nessa caso o grupo de maquinas). Já no segundo, você tem que fazer os cálculos individualmente.

    Espero que tenha ajudado.

You must be logged in to post a comment.

Busca

Patrocínio

Publicidade



Siga-nos!

Newsletter: Inscreva-se

Para se inscrever em nossa newsletter preencha o formulário.

Artigos Recentes