Origem e Significado
O termo BI (Business Intelligence) foi criado no final da
década de 80 pelo grupo Gatner, mas desde a década de 70 alguns de seus
conceitos já eram utilizados em sistemas SIG (Sistemas de Informações
Gerenciais).
O objetivo do BI é transformar grandes massas de dados em
informação, e com isso, auxiliar o nível Estratégico de uma organização a tomar
decisões.
Com informações de qualidade e precisas os responsáveis pela
tomada de decisão podem elaborar melhores estratégias para obter vantagem
competitiva em relação à concorrência.
Apesar do foco inicial do BI ser o nível Estratégico, podemos
ver atualmente a aplicação no nível Tático.
Figura 1 – Os 3 níveis de uma organização.
Quando nos referenciamos a grande massa
de dados, não nos referenciamos apenas aos bancos de dados dos sistemas OLTP
(Online Transaction Processing) tradicionais. Podemos considerar as planilhas
eletrônicas, muito usadas em Organizações por diversas áreas. Podemos
considerar também relatórios analíticos
e documentos extraídos dos sistemas. E hoje em dia pode-se considerar a Web,
principalmente as redes sociais.
Resumindo, uma grande quantidade de dados
de inúmeras fontes.
Figura 2 – O papel do BI e como ele pode ajudar uma
organização.
Componentes do BI
Para se realizar um projeto de BI é preciso entender sua
arquitetura e alguns de seus componentes.
- · Data Warehouse (DW) e Data Mart (DM):
São componentes
básicos e importantes para realização de um projeto de BI. Na verdade se trata
do repositório de dados do BI.
Apresenta características diferentes dos Bancos de Dados
Operacionais (OLTP), que são voltados para transações do dia a dia. Essas
transações podem ser “Update’s”, “Insert’s” e “Delete’s”.
Um DW ou DM tem características não voláteis, ou seja, só
aceita inserção, os dados não podem ser modificados. O DW costuma trabalhar com
dados históricos, são integrados (obedecem uma padronização para os dados) e
são orientados por assunto.
DW e DM tem as mesmas características, o que os diferencia é
sua abrangência.
Em uma analogia, o DW representa toda a empresa e o DM as
áreas dessa empresa.
Seria como uma hierarquia, temos o DW (pai) e seus
sub-componentes (filhos) os DM.
Figura 3 – Exemplo de DW e DM.
Dica: Para se
aprofundar no assunto pesquise por Bill
Inmon e Ralph Kimball que são
referencias no assunto.
- · Modelagem Dimensional:
O Modelo Relacional se mostra eficiente quando utilizado em
transações do dia a dia. Mas quando se trata de informações em nível gerencial
onde se encontra sumarizações e agregações (que exigem custo de processamento)
não é o mais apropriado.
Com a quantidade excessiva de dados e pela necessidade de
visualização dinâmica da informação surge o Modelo Dimensional. Vale lembrar que
o DW trabalha com dados de histórico, ou seja, o volume de dados pode ser muito
superior ao dos bancos transacionais. Nesse cenário uma simples consulta
tradicional pode demorar muito. O Modelo Dimensional ajuda a agilizar essas
consultas.
No modelo dimensional existem dois tipos de tabelas que são
fundamentais:
Dimensões: São as tabelas que possuem as nomenclaturas das
classificações ou visões possíveis. Em termos relacionais, as tabelas de
dimensões possuem chaves primárias. Essas chaves irão se relacionar com as
tabelas Fato.
Fatos: As tabelas fatos geralmente contem valores numéricos,
como as chaves estrangeiras das
dimensões e as métricas (ou medidas), por
exemplo, quantidade, preço, média e etc.
Vale lembrar que a tabela Fato deve conter o menor nível de
detalhe possível da informação.
Geralmente o conteúdo de uma tabela Fato é estático (uma
Foto) e incremental (só há inserções).
Além das Dimensões (Visões) e da Fato (Medidas), devemos
considerar outro fator importante: O Tempo. Com o tempo se obtém visões
diferentes e importantes para o negócio.
Por exemplo, para a quantidade de vendas você pode ter os
resultados: diário, semanal, mensal, trimestral, semestral, anual e etc. Para
cada variação do tempo o resultado será diferente.
Figura 4 – Exemplo básico da Modelagem Dimensional.
Dica: Para mais
detalhes sobre Modelagem Dimensional pesquise sobre Star Schema e Snow Flake
Schema.
- · ETL – Extract, Transform and Load:
Agora que conhecemos o repositório de dados (DW e DM) e
conhecemos o modelo utilizado (Modelagem Dimensional) falta a inserção dos
dados ou carga dos dados. Só que essa atividade não é tão simples como parece
(não é um simples insert).
Aí que entra o ETL na parada.
Para realizar o ETL é preciso definir as fontes de dados de
origem, que serviram como entrada ou origem dos dados (Extract).
Também é preciso definir todas as transformações
necessárias, como por exemplo, cálculos, padronizações, retirar duplicações e
etc. (Transform).
Por ultimo é preciso definir as fontes de destino,
provavelmente tabelas Dimensões e Fato em um DW/DM (Load).
Figura 5 – Representação simples do processo de ETL.
Conclusão
Nesse post apresentamos alguns conceitos sobre BI. Verificamos
aqui exemplos básicos sobre DW/DM, Modelagem Dimensional e ETL.
Existem outros componentes como Data Mining, Dashboards,
Olap e Cubos e etc.
Este post é apenas uma introdução, recomendo a todos que
pesquisem sobre os temas aqui abordados e também as referencias pois existe
muito mais a ser pesquisado sobre os temas abordados.
Obrigado e até a próxima!
Referencias:
TURBAN, Efraim, SHARDA, Ramesh, ARONSON, Jay E. e KING, David.
Business Intelligence: um enfoque gerencial para a inteligência do negócio.
Bookman, 1a. ed. 2008.
BARBIERI, C. BI
Business Intelligence: Modelagem e Tecnologia. Rio de Janeiro: Axcel Books do Brasil, 2001.
JACOBSON, Reed MISNER, Stacia. Microsoft SQL server 2005, analysis services / passo a passo.
Porto Alegre: Bookman, 2007.
DATAWAREHOUSE 4 U, Star Schema. 2008. Disponível em:
<http://datawarehouse4u.info/Data-warehouse-schema-architecture-star-schema.html>
Nenhum comentário:
Postar um comentário