segunda-feira, 2 de junho de 2014

Conceitos iniciais de BI



Origem e Significado

O termo BI (Business Intelligence) foi criado no final da década de 80 pelo grupo Gatner, mas desde a década de 70 alguns de seus conceitos já eram utilizados em sistemas SIG (Sistemas de Informações Gerenciais).
O objetivo do BI é transformar grandes massas de dados em informação, e com isso, auxiliar o nível Estratégico de uma organização a tomar decisões.
Com informações de qualidade e precisas os responsáveis pela tomada de decisão podem elaborar melhores estratégias para obter vantagem competitiva em relação à concorrência.
Apesar do foco inicial do BI ser o nível Estratégico, podemos ver atualmente a aplicação no nível Tático.






Figura 1 – Os 3 níveis de uma organização.



Quando nos referenciamos a grande massa de dados, não nos referenciamos apenas aos bancos de dados dos sistemas OLTP (Online Transaction Processing) tradicionais. Podemos considerar as planilhas eletrônicas, muito usadas em Organizações por diversas áreas. Podemos considerar também  relatórios analíticos e documentos extraídos dos sistemas. E hoje em dia pode-se considerar a Web, principalmente as redes sociais.
Resumindo, uma grande quantidade de dados de inúmeras fontes. 


Figura 2 – O papel do BI e como ele pode ajudar uma organização.





Componentes do BI

Para se realizar um projeto de BI é preciso entender sua arquitetura e alguns de seus componentes.


  • ·         Data Warehouse (DW) e Data Mart (DM):

 São componentes básicos e importantes para realização de um projeto de BI. Na verdade se trata do repositório de dados do BI.
Apresenta características diferentes dos Bancos de Dados Operacionais (OLTP), que são voltados para transações do dia a dia. Essas transações podem ser “Update’s”, “Insert’s” e “Delete’s”.
Um DW ou DM tem características não voláteis, ou seja, só aceita inserção, os dados não podem ser modificados. O DW costuma trabalhar com dados históricos, são integrados (obedecem uma padronização para os dados) e são orientados por assunto.
DW e DM tem as mesmas características, o que os diferencia é sua abrangência.
Em uma analogia, o DW representa toda a empresa e o DM as áreas dessa empresa.
Seria como uma hierarquia, temos o DW (pai) e seus sub-componentes (filhos) os DM.



Figura 3 – Exemplo de DW e DM.




Dica: Para se aprofundar no assunto pesquise por Bill Inmon e Ralph Kimball que são referencias no assunto.
 


  • ·         Modelagem Dimensional:
O Modelo Relacional se mostra eficiente quando utilizado em transações do dia a dia. Mas quando se trata de informações em nível gerencial onde se encontra sumarizações e agregações (que exigem custo de processamento) não é o mais apropriado.
Com a quantidade excessiva de dados e pela necessidade de visualização dinâmica da informação surge o Modelo Dimensional. Vale lembrar que o DW trabalha com dados de histórico, ou seja, o volume de dados pode ser muito superior ao dos bancos transacionais. Nesse cenário uma simples consulta tradicional pode demorar muito. O Modelo Dimensional ajuda a agilizar essas consultas.
No modelo dimensional existem dois tipos de tabelas que são fundamentais:
Dimensões: São as tabelas que possuem as nomenclaturas das classificações ou visões possíveis. Em termos relacionais, as tabelas de dimensões possuem chaves primárias. Essas chaves irão se relacionar com as tabelas Fato.
Fatos: As tabelas fatos geralmente contem valores numéricos, como as chaves estrangeiras das 
dimensões e as métricas (ou medidas), por exemplo, quantidade, preço, média e etc.
Vale lembrar que a tabela Fato deve conter o menor nível de detalhe possível da informação.
Geralmente o conteúdo de uma tabela Fato é estático (uma Foto) e incremental (só há inserções).
Além das Dimensões (Visões) e da Fato (Medidas), devemos considerar outro fator importante: O Tempo. Com o tempo se obtém visões diferentes e importantes para o negócio.
Por exemplo, para a quantidade de vendas você pode ter os resultados: diário, semanal, mensal, trimestral, semestral, anual e etc. Para cada variação do tempo o resultado será diferente.



Figura 4 – Exemplo básico da Modelagem Dimensional.




Dica: Para mais detalhes sobre Modelagem Dimensional pesquise sobre Star Schema e Snow Flake Schema.


  • ·         ETL – Extract, Transform and Load:
Agora que conhecemos o repositório de dados (DW e DM) e conhecemos o modelo utilizado (Modelagem Dimensional) falta a inserção dos dados ou carga dos dados. Só que essa atividade não é tão simples como parece (não é um simples insert).
Aí que entra o ETL na parada.
Para realizar o ETL é preciso definir as fontes de dados de origem, que serviram como entrada ou origem dos dados (Extract).
Também é preciso definir todas as transformações necessárias, como por exemplo, cálculos, padronizações, retirar duplicações e etc. (Transform).
Por ultimo é preciso definir as fontes de destino, provavelmente tabelas Dimensões e Fato em um DW/DM (Load).



Figura 5 – Representação simples do processo de ETL.




Conclusão

Nesse post apresentamos alguns conceitos sobre BI. Verificamos aqui exemplos básicos sobre DW/DM, Modelagem Dimensional e ETL.
Existem outros componentes como Data Mining, Dashboards, Olap e Cubos e etc.
Este post é apenas uma introdução, recomendo a todos que pesquisem sobre os temas aqui abordados e também as referencias pois existe muito mais a ser pesquisado sobre os temas abordados.

Obrigado e até a próxima!

Referencias:


TURBAN, Efraim, SHARDA, Ramesh, ARONSON, Jay E. e KING, David.
Business Intelligence: um enfoque gerencial para a inteligência do negócio.
Bookman, 1a. ed. 2008.


BARBIERI, C. BI
Business Intelligence: Modelagem e Tecnologia. Rio de Janeiro: Axcel Books do Brasil, 2001.


JACOBSON, Reed MISNER, Stacia. Microsoft SQL server 2005, analysis services / passo a passo.
Porto Alegre: Bookman, 2007.

DATAWAREHOUSE 4 U, Star Schema. 2008. Disponível em:
<http://datawarehouse4u.info/Data-warehouse-schema-architecture-star-schema.html>








Nenhum comentário:

Postar um comentário