Continuando nossa série de artigos sobre BI, irei falar um pouco sobre as ferramentas utilizadas pela maioria das soluções de BI existentes no mercado.
As soluções de BI geralmente são compostas por:
- Planilhas eletrônicas.
- DSS (Decision support system).
- Geradores de consultas e relatórios.
- Data Marts e Data Warehouse.
- Data Mining.
- Ferramentas OLAP(OnLine Analytical Process)
- ETL (Extração, transformação e carga).
- BAM (Business activity Monitoring).
Na seqüência, irei apresentar algumas delas.
Data Warehouse
Como principal núcleo do BI, está o repositório de dados analítico. Este não deve ser a mesma base de dados operacional (onde as transações do dia-a-dia ocorrem e onde aplicações gravam os seus dados). Para o pai do data warehouse, Bill Inmon (Inmon, Terdeman, Imhoff, 2001), deve-se montar uma CIF (fábrica de informações incorporadas). No geral uma CIF possui o seguinte esquema:
Imagem 1:Modelo de uma CIF
adaptado de (Inmon, Terdeman, Imhoff, 2001)
O data warehouse deve possuir dados granulares integrados, que formam a fundação do ambiente. Isto é necessário porquê segundo (Inmon, Terdeman, Imhoff, 2001) isto permite que os dados sejam moldados e remodelados facilmente, permitindo uma grande flexibilidade ao agrupá-los em novas formas de dados.
Na CIF o exploration warehouse é o lugar onde analistas podem realizar análise pesada e inexplorada em uma gama de dados recuperados do data warehouse corporativo. Sem ele, estas explorações poderiam causar a destruição de performance de outros usuários do data warehouse. Irei falar um pouco mais sobre a questão de exploração do data warehouse em um futuro artigo.
ETL(Extração, transformação, carga)
Note no esquema que as ferramentas de ETL terão um papel importante de trabalhar os dados dos sistemas legados corporativos (loja virtual, ERP, sistema de autorizações, CRM etc). Muitas vezes isto envolve muitas diferenças: tecnologias (linguagens, paradigmas de desenvolvimento, formas de integração, estruturas de dados etc), fornecedores (Oracle, Microsoft, IBM, Sybase, MySql, Adabas etc) e domínio de dados (em um sistema pode estar o nome do estado em outro úm código e em ainda outro a sigla da UF. Um sistema pode indicar o sexo masculino pelo caracter M e o feminino por F, ainda outro por 0 e 1 respectivamente)
Assim, as ferramentas de ELT terão o importante papel de normalização e integração dos dados advindos de inúmeras fontes de dados.
Data Mining
Ferramentas de data-mining podem ser utilizadas sobre o data warehouse para detectar tendências, padrões e oportunidades de negócio. As análises que seriam realizadas por analistas, é automatizada por meio de algoritmos que utilizam o conceito de inteligência artificial, redes neurais regras de indução. Essas ferramentas são extremamente úteis para detecção de fraudes e para previsões de comportamentos.
Segundo Chapple(2008), o primeiro passo em uma estratégia de data mining é a obtenção de dados onde se possa realizar a garimpagem. Se já existir um data warehouse bem estruturado, isto não será um problema. Após isto, é necessário escolher um algoritmo que irá procurar os padrões. Chapple lista alguns exemplos destes algoritmos que podem ser:
- Regressão – Um das mais antigas e bem conhecidas técnicas estatísticas utilizadas para a mineração de dados. Funciona bem com dados quantitativos como peso, idade, velocidade, altura etc.
- Classificação – È capaz de processar uma ampla variedade de dados e está crescendo em popularidade.Utiliza arvores binárias de decisão.
- Redes Neurais – Técnica analítica, que utiliza sistemas não lineares que procuram imitar a estrutura do cérebro humano.
Existem ainda inúmeras outras técnicas que podem ser utilizadas em uma estratégia de data mining, o que não será objetivo deste documento explicar a cada uma delas.
OLAP(OnLine Analytical Process)
Trata-se de ferramentas que permitem aos administradores, ter “a visão conceitual multidimensional dos negócios de uma empresa”(Anzanello,2002). Estas ferramentas permitem a visualização das informações em diferentes perspectivas multidimensionais e tratam principalmente de dados sumarizados e históricos. Para muitos, quando se fala de OLAP logo vem à mente o cubo sendo movimentado para lá e para cá. Esta imagem surge devido à necessidade de expressar múltiplas coordenadas em um único gráfico.
Também a ferramenta permite obter um maior ou menor detalhamento dos dados que estão sendo analisados, utilizando de recursos como: Slice and Dice e Drill down/up.
Referências bibliográficas
INMON, W.H; TERDEMAN, R.H, IMHOFF, C. “Data Warehousing – Como transformar informações em oportunidades de negócios” – Berkeley. 2001.
CHAPPLE, M. “Data Mining: an introduction.” Disponível em: http://databases.about.com/od/datamining/a/datamining.htm. Acessado em: 19/08/2008
ANZANELLO, C. A. “OLAP Conceitos e utilização”. Disponível em: http://www.inf.ufrgs.br/~clesio/cmp151/cmp15120021/artigo_cynthia.pdf . Acessado em: 19/08/2008.