Olá galera, esta semana estou fazendo um curso de Alta Disponibilidade com MySQL Cluster e entre os vários tópicos abordados há uma forma de calcular o tempo de atividade Uptime “disponibilidade”das máquinas. E sendo esta umas das principais razões para usarmos o Cluster do MySQL o assunto realmente me interessou, o que me fez ler e procurar entender melhor o conceito e de quebra fiz este artigo baseado em um outro do site http://world-class-manufacturing.com uma vez que não encontrei muita documentação em português. Espero que apreciem.
MTBF, Mean Time Between Failures (Tempo médio entre falhas) e MTTR – Mean Time To Repair (Tempo médio de reparo) são dois importantes KPI’s dentro do nível de desempenho de processos.
MTBF = (Total up time) / (número de breakdowns)
MTTR = (Total down time) / (número de breakdowns)
MTBF e MTTR – O que eles querem dizer?
“Tempo médio” significa, estatisticamente falando, o valor médio de tempo dentre a ocorrência de uma mesma situação.
“Mean Time Between Failures” (MTBF) é literalmente a média de tempo decorrida entre uma falha e a próxima vez em que ela irá ocorrer. Normalmente pessoas pensam nisto como uma média de tempo de alguma coisa funcionando até falhar e precisar ser reparada (novamente).
“Mean Time To Repair” (MTTR) é a média de tempo que se leva para reparar alguma coisa depois de uma falha.
Para algo que não pode ser reparado o termo correto é MTTF – “Mean Time To Failure” (Tempo médio para falhas). Alguns definiriam MTBF – para dispositivos reparáveis – como a soma de MTTF mais MTTR. (MTTF = MTTF + MTTR). Em outras palavras, o Meio Tempo entre falhas é o tempo entre uma falha e outra. Esta distinção é importante se o tempo de reparo (MTTR) é uma fração significante do MTTF.
Aqui está um exemplo: Uma lâmpada em um candelabro não é reparável, então MTTF é mais apropriado. A lâmpada deve ser trocada. O MTTF possivelmente é de 10.000 horas.
Por outro lado, sem trocas de óleos, um motor de carro pode falhar depois de 150 horas dirigindo em uma rodovia – neste caso é MTTF. Assumindo 6 horas para remover e substituir o motor (MTTR), MTBF é 150 + 6 = 156 horas.
Como automóveis, a maioria de equipamentos manufaturados serão reparados, ao invés de substituidos após uma falha. Logo MTBF é a mais apropriada forma de medir.
O que é uma falha?
“”Falha” pode ter vários significados. Vamos rapidamente examinar uma falha em um dispositivo:
Uma Fonte de Energia Ininterrupta (UPS – Uninterruptible Power Source) pode ter cinco funções dentro de duas condições:
A “disponibilidade” de um equipamento é, matematicamente, MTBF / (MTBF + MTTR) para tempo de trabalho programado.
O automóvel do exemplo anterior está disponível para 150/156 = 96,2% do tempo. O reparo é tempo de inatividade não programada.
Com meia hora de não programada troca de óleo a cada 50 horas dirigidas – acontece quando um indicador no painel do carro alerta o motorista – o tempo de disponibilidade sobre para 50 / 50.5 = 99%.
Se trocas de óleo fossem agendadas corretamente como atividade de manutenção a disponibilidade do veículo seria de 100%.
Porque tudo isso é importante?
“Disponibilidade” é um indicador de performance para processos e fábricas. É parte da medida da eficácia geral do equipamento ou “Overall Equipment Effectiveness” (OEE).
Uma produção programada que inclui tempos de paradas para manutenção preventiva pode precisamente prever o total de uma produção. Agendamentos que ignoram MTBF e MTTR são simplesmente um desastres (programados ou não, desculpe o trocadilho) aguardando para acontecer.
Como calcular o atual MTBF
Atual ou histórico MTBF é calculado usando observações no mundo real. (Há uma disciplina para designers de equipamentos preverem MTBF, baseado nos componentes e cargas de trabalho previstas).
Calculando o atual MTBF requer um conjunto de observações, onde cada uma seria:
Então temos MTBF = Sum (di – ui) / n, para todos i = 1 entre n observações. Mais simplesmente, este é o tempo de trabalho total dividido pelo número de falhas.
Texto extraído e traduzido de http://world-class-manufacturing.com/KPI/maintenance.html.
Outras referências sobre o assunto:
http://pt.wikipedia.org/wiki/Indicador-chave_de_desempenho
You must be logged in to post a comment.
5:38:50 pm
Muito boa a explicação sobre o mtbf e o mttr.
pois nao sabia o isso significava.
7:49:47 pm
Excelente Artigo!!
8:05:31 pm
Olá, tenho uma divida, como faço para calcular o MTBF de um grupo de maquinas?
Posso somas todos os valores das maquinas e fazer o calculo de tudo junto?
9:54:35 pm
Ola Cleidson.
Primeiramente, obrigado pela sua pergunta. Bem, o calculo vai depender do que cada maquina faz. Quando você diz “grupo de maquinas” esta se referindo a:
1) um Cluster? Elas compartilham a mesma informação e em caso de uma maquina parar as outras tomam frente ao processo?
2) Cada maquina tem diferentes tarefas entre si.
No primeiro caso você calcularia o uptime do serviço que eles provem (nessa caso o grupo de maquinas). Já no segundo, você tem que fazer os cálculos individualmente.
Espero que tenha ajudado.