Machine Learning é um termo o qual nos nos remete normalmente a questões mais acadêmicas, mas essa parte da ciência computacional já está em nossas vidas práticas há alguns anos.
Grandes Datacenters por exemplo têm problemas de consumo de energia e manutenção do seu SLA, em função das dificuldades de gestão entre hosts físicos e provisionamento da VM´s de forma ótima. Por vezes há hosts com muitas máquinas e por vezes outros com poucas.
Existe atualmente um algoritmo dinâmico para a consolidação de máquinas virtuais a fim de minimizar o número de servidores físicos ativos em um centro de dados, com a finalidade da redução do custo de energia.
O método utiliza o algoritmo de regressão k-nearest neighbor regression para prever o uso de recursos em cada host. Com base na previsão de utilização, o método de consolidação pode determinar quando um host torna-se super utilizado ou quando torna-se sub-utilizado.
Há uma extensa quantidade de propostas sobre tecnologia de virtualização no que se refere a dinâmica de consolidação das VM´s, as técnicas mais recentes visam reduzir o consumo de energia enquanto atende os requisitos de desempenho e as necessidades dos clientes.
Em algumas abordagens, a consolidação de VM´s foram formuladas como um problema de otimização. Embora um problema de otimização esteja associado com restrições tais como a capacidade de um centro de dados e o seu SLA.
Portanto, os estudos nesse sentido utilizam um método multidimensional heurístico como um algoritmo para a consolidação das cargas de trabalho de Máquinas Virtuais.
Os algoritmos tentam resolver o problema para minimizar o número de hosts, melhorando a divisão de todos os seus objetos (máquinas virtuais).
O algoritimo KNN foi utilizado para as previsões das futuras demandas de recursos, através de dados históricos, os quais foram recolhidos durante a vida dos Host´s como um conjunto de dados de treinamento.
Um método de predição é proposto e prevê a utilização da CPU por utilização de uma função de aproximação com base no histórico dos dados de utilização. Assim, o conjunto de dados de treinamento é recolhido sobre o universo real da carga de trabalho para cada host, durante o tempo de simulação.
Os dados são coletados a cada cinco minutos e são armazenados em uma variedade de arquivos.
As entradas normalmente mostram os valores totais de utilização de todas as VMs em um host durante os últimos 30 minutos. Estes valores são significativos para prever a utilização de curto prazo.
Os pesquisadores dessa implementação dividiram a consolidação dinâmica em quatro algoritmos para atingir as metas de redução de custos de energia e violação de SLA, baseado na historicidade do consumo de energia dos Hosts:
- Previsão de super utilização: o host torna-se super utilizado se o valor da predição de utilização é maior do que a capacidade disponível de CPU.
- Auto provisionamento das máquinas virtuais: Faz a escolha de quais VMs devem ser migradas a partir dos hosts sub utilizados ou super utilizados.
- Auto migração das VM: seleciona um novo host para a hospedar as VMs identificadas como sub ou super utilizadas.
- Previsão de host´s sub utilizados: uma série torna-se subutilizada enquanto a soma do futuro e a sua atual utilização é menor do que 10% da utilização total hospedeiros.
Conclusão:
Já que a CPU consome a maior parte da energia, o algoritmo KNN prevê o uso da CPU em cada host a fim de gerar ganhos ótimos com a economia de energia, os experimentos mostram que o algoritmo proposto pode minimizar o consumo de energia de maneira mais eficiente do que outros métodos e ferramentas consolidação dinâmicas, ajudando na gestão do parque de host´s e vm´s.
[Crédito da Imagem: Provisionamento de VM’s – ShutterStock]