Neste ano um dos assuntos mais falados foi Big Data. Uma pesquisa no Google Trends mostra um crescimento exponencial no interesse sobre o tema. Participei também de diversas palestras e reuniões com executivos para debater o assunto e a conclusão que cheguei é que ainda estamos discutindo muito e fazendo relativamente pouco. Existem, é claro, diversos casos de sucesso, mas a maioria das empresas ainda não tem uma visão clara do que é Big Data, do seu potencial e como alavancar esta potencialidade. O próprio conceito de Big Data ainda está um pouco nebuloso. Veja, por exemplo, o que diz o Global Language Monitor em relação ao assunto.
No artigo de hoje vou falar rapidamente sobre um assunto que gera bastante polêmica entre os profissionais que trabalham com Banco de Dados (BD) Oracle e que pretendem otimizar o acesso aos dados através de configurações dos tablespaces. Existe um mito no mundo Oracle que diz que somente separar dados e índices em tablespaces diferentes pode otimizar consultas aos dados das tabelas envolvidas.
Existem diversos exemplos reais de uso de Big Data como os que a Amazon e NetFlix fazem com seus sofisticados sistemas de recomendação.
Analisando padrões em imensos volumes de dados pode-se prever desde a magnitude de uma epidemia a sinais de uma provável ocorrência de uma seca severa.
Por ironia do destino, ou não, há 4 anos atrás desenvolvi meu TCC sobre qualidade de dados, em ambiente Datawarehouse para PEP – prontuário eletrônico do paciente, e hoje trabalho com BI – Business Intelligence, que tem como ambiente de desenvolvimento um datawarehouse. Mas o que me chamou mais a atenção sobre essa coincidência foi a necessidade da qualidade de dados, ou Data Quality, para que o relatórios obtidos sejam concisos, coerentes e transparentes.
Hoje no mercado existem várias ferramentas que promovem a qualidade de dados, portanto, analisar o cenário correto, para um processo que nos dê dados limpos e de acordo com a realidade da empresa, depende da visão do analista.
A qualidade de dados é multi-dimensional, dependendo do seu contexto ou aplicabilidade. Podemos agrupar as dimensões em 4 categorias, como segue:
Categorias
Intrínseca
Contextual
Representação
Acessibilidade
Dimensões
Correção, objetividade, reputação e credibilidade
Valor acrescentado, relevância, disponibilidade, completude, quantidade apropriada
Interpretabilidade, compreensibilidade, consistência e representação concisa
Acessibilidade e segurança
O assunto Big Data começa a chamar atenção. Diversos estudos e pesquisas apontam que muitas empresas começam a implementar iniciativas nesta área.
A partir de desta quinta-feira (1º/3), entrou em vigor a nova e única versão da política de privacidade para os serviços do Google.
As empresas tem investido bastante em tecnologias para cada vez mais obter resultados satisfatórios, e quando falamos em resultados pensamos logo em números, informações que mostram o status da organização.
Está cada vez mais claro que o que acontece no mundo virtual gera impactos imensuráveis no mundo real. Seja na vida pessoal, seja na vida profissional, ou ainda no desempenho das empresas, o uso da internet e de todos os recursos disponíveis de comunicação utilizando a web 2.0 inspira cuidado dobrado.
A Sony admitiu, após sete dias de espera, que os dados que armazenava dos usuários do PlayStation Network PSN e do Portal de venda de música Qriocity, haviam sido acessados e copiados por um “invasor externo”.