Big Data

Ξ Deixe um comentário

A (r)evolução da auditoria com data analytics

publicado por Caio Azevedo

Figura - A (r)evolução da auditoria com data analytics

Pesquisas mostram que só nos EUA, fraudes são responsáveis por prejuízos na ordem de 5% do faturamento em pelo menos 30% das empresas. Pense nas empresas bilionárias que existem por lá e fica fácil imaginar o tamanho do problema, e no Brasil esse número certamente seja ainda maior. De acordo com matéria do jornal O Globo de janeiro deste ano, as fraudes do programa Bolsa Família geram prejuízos na ordem de 1.3 bilhão ao ano. O fato é que a fraude sempre esteve entre nós. Organizações criminosas ou mesmo uma ação isolada podem levar a prejuízos financeiros, desvios orçamentários, contratos fraudulentos dentre outras possibilidades.

Fraude não é um fenômeno apenas da nossa sociedade moderna. Ao longo da história, a humanidade tem se especializado em ações fraudulentas. Entretanto, nunca tivemos tantas ferramentas como hoje, para detectar e preveni-las.

Mas o que é fraude?

Fraude envolve uma ou mais pessoas que intencionalmente atuam secretamente para privar outro de algo de valor, para seu próprio benefício. Fraude é um evento criminoso, incomum, imperceptível, que requer tempo para ser concretizado e pode aparecer de muitas e diferentes formas, tais como: fraude com cartão de crédito, seguros, planos de saúde, benefícios advindos de projetos sociais, manipulação de valores ou sistemas, corrupção, lavagem de dinheiro, cyber crime e a lista poderia seguir indefinidamente.

A fraude ocorre por diversas razões. Seja por um problema financeiro, que leve a buscar formas de se ganhar mais dinheiro, seja por pura falta de caráter ou apenas uma oportunidade. Como diz o velho ditado brasileiro: “a ocasião faz o ladrão”. Independente da razão que motivou a fraude, detecção e prevenção de fraude são dois temas bastante abordados em eventos de Data Science pelo mundo e Cientistas de Dados capazes de lidar com este tipo de problema, estão sendo disputados pelas
maiores empresas do mundo.

Os dois principais componentes no combate às fraudes, são a detecção e a prevenção. A detecção de fraudes refere-se à habilidade de detectar o evento fraudulento, buscando padrões e reconhecendo a ocorrência do evento. Ou seja, buscamos formas de identificar se a fraude ocorreu. Já a prevenção, esta sim bem mais complicada, busca analisar e prever os eventos fraudulentos, antes que ocorram.

Dados x Fraudes

A detecção e prevenção de fraudes é um campo em crescimento. Governos, empresas, mídia e o público em geral tem visto a fraude não apenas como um problema econômico, mas também social e embora muito avanço tenha ocorrido na detecção de fraudes, através da adoção de metodologias estatísticas na análise de quantidades massivas de dados, ainda é difícil detectar e prever a ocorrência de
eventos fraudulentos.

A fraude em si é um fenômeno dinâmico, que muda e se adapta ao longo do tempo e as pessoas que cometem fraudes, são normalmente experts naquilo que fazem, o que torna o desafio de combate à fraude ainda maior. E por isso mesmo os métodos tradicionais de análises de dados não têm sido capazes de identificar e prever as fraudes, mesmo com os dados disponíveis.

É quando entra em ação o Cientista de Dados no campo de Data Analytics. O volume de dados gerado pelo Big Data e as técnicas e ferramentas de análises estão criando um novo nicho profissional. O combate à fraude está se tornando um departamento dentro das empresas, atuando em parceria com os programas de Auditoria, Compliance, Due Diligence e até mesmo com a LAC (Lei Anti Corrupção), focado não apenas no combate às fraudes internas, mas externas também. Operadoras de cartão de crédito, de telefonia, bancos e indústrias, todos estão criando seus departamentos de combate à fraude, e usando a Ciência de Dados para isso.

Técnicas de Detecção de Fraudes

As técnicas de Analytics tradicionais orientadas a extrair insights, ajudam no processo de gerar conhecimento a partir do datasets.

Um sistema de análise de dados para detecção e prevenção de fraudes deve estar equipado com uma quantidade substancial de parâmetros e ser capaz de executar rapidamente milhares de cálculos e comparações por meio de distribuições estatísticas, tendências e desvios, para que possa gerar as informações das quais se posam extrair insights que nos coloque diante do evento suspeito.

Algoritmos de Data Analytics permitem automatizar o processo de detecção e combate às fraudes, sejam este em demonstrativos financeiros, planilhas orçamentárias, densidade demográfica e até mesmo endereços em campanhas de marketing de incentivos, dentre outras aplicações que carecem de uma análise prévia.

Um exemplo que tem elevado reconhecimento nos Estados Unidos e vem ganhando relevância no Brasil é o modelo de Auditoria dos Números desenvolvida e reconhecida nos Estados Unidos, tornou-se prova de acusação em um dos maiores escândalos de fraudes, no Brasil foi utilizada para identificação de sobre preços nas planilhas orçamentárias da reforma do Estádio do Maracanã em 2013. Esta técnica, de  acordo com a autora do artigo, conseguiu rastrear e identificar mais de 70% das irregularidades presentes na análise de sobre preços.

Uma Aplicação Prática

Como um case de uso, aprofundamos nossos estudos nesta técnica e a combinamos com outras análises estatísticas, aplicando-as na base de dados de Pagamentos do Bolsa Família relativos ao mês de janeiro de 2018, dados estes disponíveis no portal da transparência do Governo Federal.

Para análise desta base de dados com aproximadamente 15 milhões de beneficiários, realizamos um agrupamento dos valores pagos por município, totalizando 5570 municípios.

Todo o processamento e análise de dados foi realizado com auxílio BigDataHal, plataforma desenvolvida por Caio Azevedo, Carlos Prado, Glauber Romão e Victor Venites, formando uma startup de Big Data Analytics.

Nossa análise, Base de Benefícios pagos na forma de Bolsa Família apontou que um processo de auditoria, este deveria ser no cadastro dos beneficiários e deveria iniciar pelas seguintes localidades “municípios”, cujo as análises não passaram nos algoritmos e testes estatísticos aplicados:

Município (Localidade)     Benefícios Pagos (R$)
SALVADOR ( BA )                          25.371.994
SANTAREM ( PA )                         4.870.679
NITEROI ( RJ )                               2.596.912
BARREIRINHAS ( MA )               2.579.779
MAGE ( RJ )                                    2.565.227
CASA NOVA ( BA )                        2.550.894
LAURO DE FREITAS (BA )         2.543.233
COARI ( AP )                                   2.515.374
VARZEA GRANDE (MG )            2.507.538
MARACANAU ( CE )                     2.501.001
SEM. JOSE PORFIRIO ( PA )     819.005

Fonte: bigdatahal.com.br

Coincidentemente, nossas análises culminaram com matérias veiculadas no portal G1 e jornal A Tarde de Salvador, que noticiaram “Salvador tem 10 mil beneficiários do Bolsa Família com pendências”.

A conclusão é que identificamos 56,81% das amostras (base de dados) apresentam algum tipo de divergência com relação às análises preliminares antifraudes aplicadas pela plataforma, portanto merecem uma análise mais cuidadosa, iniciando pelos municípios acima destacados e considerando uma curva ABC.

Entendemos também que estudos mais aprofundados carecem de ser realizados e outros algoritmos aplicados para aumentar a efetividade e assertividade da análise.

Estas técnicas se complementam e podem focar em diferentes aspectos de uma fraude. Um sistema mais completo de combate à fraude, combina estas técnicas, que juntas se tornam ainda mais eficazes e eficientes.

 

Nota do Autor: Esse artigo foi originalmente publicado no Portal Big Data HAL.

Bibliografia digital:
https://oglobo.globo.com/economia/fraudes-no-bolsa-familia-geram-prejuizo-de-13-bilhao-22255818
https://g1.globo.com/politica/noticia/quase-350-mil-cadastros-do-bolsa-familia-foram-fraudados-diz-auditoria.ghtml
http://atarde.uol.com.br/bahia/salvador/noticias/1924004-salvador-tem-10-mil-beneficiarios-do-bolsa-familia-com-pendencias
http://www.cienciaedados.com/usando-data-science-no-combate-a-fraudes/
http://www.portaltransparencia.gov.br/
http://bigdatahal.com.br/

Autor

MBA - FGV Administração de Empresas, Graduado em Ciência da Computação, apaixonado por ciências exatas e fotografia. Web System Manager da Samsung e Arquiteto de Softwares. Palestrante, tecno-colunista e instrutor da treinando .net. Criador do aplicativo smartBuy Certificado Microsoftt - MCP, MCAD, MCSD, MCTS e MCPD. LinkedIn.

Caio Azevedo

Comentários

You must be logged in to post a comment.

Busca

Patrocínio

Publicidade



Siga-nos!

Newsletter: Inscreva-se

Para se inscrever em nossa newsletter preencha o formulário.

Artigos Recentes