Business intelligence? âh, desculpe ? não entendi (parte II de III) - ArtigoPT - Diretório de Artigos em Português

Business intelligence? âh, desculpe ? não entendi (parte II de III)

Ver PDF | Ver Impressão
por: Pedro Miguel Garrido Mesquita Total leituras: 386 Nº de Palavras: 1781 Data: Wed, 20 Apr 2011 Hora: 11:00 AM 0 comentários

Business Intelligence (BI) ...humm. Se colocarmos esta frase à entrada, de uma máquina de tradução «(Inglês) para (Português)» e clicarmos no botão que diz "GO",  o resultado será algo do género : "Inteligência nos Negócios".
De que estou a falar concretamente aqui ? parece algo relacionado com uma organização ultrasecreta, que trabalha para o governo, mas não, nada disso. Trata-se sim, de um tópico muito cativante e interessante, no mundo da informação, mundo este casado (com sucesso) com o mundo empresarial.

Se não leu a parte 1 deste artigo, pare!
Não vale a pena continuar, volte atrás por favor e começe pela numeração correcta...

Se está a ler esta linha então vou assumir que já leu a parte 1 e que está em condições de prosseguir leitura. Excelente.
Nesta parte, eu e o leitor, iremos abordar os tópicos abordados na leitura anterior :

- (F)erramentas
- (R)ecolha
- (A)nálise

Vamos então analisar, eu e o leitor, em conjunto :

(F)erramentas :

Já temos a noção do que trata o BI.
Mas, para implementar o pretendido, são necessárias ferramentas de sofware. Só assim, poderão ser representados fisicamente os dados, só assim poderão ser processados,
manipulados e apresentados.

Por exemplo, no mercado, existem ferramentas de software que permitem registar os dados fisicamente sob a forma de bases de dados (por exemplo produtos como SQL Server,
Oracle), existem ferramentas que permitem movimentar e manipular os dados de ponto a ponto (designam-se normalmente de ETL - Extraction (extracção), Transformation (transformação) e Loading (carregamento), algo muito importante no mundo de BI;

por exemplo, a Microsoft tem o produto SQL Server Integration Services, a IBM tem o produto Cognos Data Manager), existem ferramentas que permitem efectuar análise sobre os dados em termos de agregações e operações de conjunto (por exemplo a Microsoft tem o produto SQL Server Analysys Services), existem ferramentas que permitem exibir os resultados depois de tratados, já numa forma mais inteligível para os decisores de negócio (por exemplo a Microsoft tem o Excel, SQL Server Reporting) e mesmo ferramentas de programação, que possam ser necessárias para complementar a solução de BI, com outros programas informáticos desenvolvidos à medida.

Sem as ferramentas não haveria BI, ficaria todo no papel apenas!

(R)ecolha :

Os dados precisam de ser registados num suporte físico adequado - bases de dados. E já falei delas neste artigo.
As bases de dados têm o conhecimento, a informação, na sua forma bruta, muito importante para os decisores de negócio.

Existem vários possíveis formatos de bases de dados : umas estão simplesmente em ficheiros de texto, formatados de determinada maneira; outras estão no formato excel ou
xml por exemplo; outras estão em definidas em servidores de bases de dados (SQL Server, Oracle por exemplo); outras estão embebidas em sistemas proprietários, etc.

Como se pode constantar, existem vários formatos e localizações possíveis. Este passo de Recolha permite realizar isso mesmo : recolher os dados necessários, dos vários pontos
onde estão presentes, com possíveis manipulações e transformações a serem aplicadas ainda, para um ponto especial, intermédio (no sentido em que ainda não é acessível
pelos decisores de negócio), onde possam ser tratados e processados.
Este processo, já falado em cima, designa-se de ETL - (E)xtraem-se os dados, (T)ransformam-se os dados e (C)arregam-se os dados, agora sim, num ponto já acessível pelos decisores de negócio.

A extracção é necessária porquê ? é necessária porque é preciso ir aos sítios onde os dados estão e copiá-los (apenas os necessários).

A transformação é necessária porquê ? é necessária porque é preciso corrigir eventuais falhas nos dados origem, ou criar novos dados a partir dos existentes e também porque é necessário formatar e organizar os dados, de acordo com padrões pretendidos.

O carregamento é necessário porquê ? é necessária porque senão os decisores de negócio nunca veriam os dados no seu formato final, inteligível para eles. Esta fase encarrega-se de movimentar os dados, do ponto intermédio de ETL, para o ponto final, onde já podem ser apresentados sob a forma de relatórios aos decisores de negócio.

(A)nálise :

Ora bem, os dados estão passaram pelo ETL. E agora? agora terá que haver uma análise sobre eles. Ou não... Ou não? - pensa você... Está confuso, eu explico :
Os dados, resultantes da aplicação do processo de ETL, podem apenas servir para serem consultados directamente por relatórios de dados. Não é necessário e imperativo
haver uma fase de análise.
Então... o que significa «Análise» ? Diz respeito a um tratamento especial, efectuado sobre esses dados resultantes do ETL, e que envolve agregações de dados, definições de hierarquias entre eles e operações de conjunto (somatórios, totais, médias, máximos, mínimos, etc), podendo depois serem exibidos pelos decisores de negócio,
através da navegação pela informação, juntando métricas, dimensões e atributos...

"Âh ?! o quê?! métricas, dimensões e atributos ?! o que é isso???" - está de novo a pensar. Mais uma vez, eu explico :

Os dados resultantes do processo de ETL, normalmente, são organizados sob a forma de métricas e dimensões de análise :

- «Métricas» são os factos que os decisores de negócio querem medir e conhecer. Por exemplo: número total de vendas, total de custos, total de receitas, total de empregados, etc.

- «Dimensões» definem as várias maneiras como os factos podem ser analisados. Por exemplo, "listar «total de vendas» POR «região» POR «empregado» POR «mês»" significa que se quer saber o total de vendas (facto) discriminado por :

1-região (dimensão)
2-empregado (dimensão)
3-mês (dimensão)

o que dá uma perspectiva de conhecimento aos decisores de negócio mais completa e abragente! Assim, eles conseguem perceber onde estão concentradas mais (ou menos) as vendas, quais os empregados que vendem mais e em que mês do ano vendem mais.

Isto é espectacular!

E podíamos definir mais dimensões para além destas. Depende do projecto, do que os decisores de negócio querem exactamente.

Estabelecendo uma analogia, trata-se como se fosse de uma equação matemática : Y=X1 + X2 + X3 + X4, onde Xn seriam as dimensões e Y o facto a ser medido...

E as hierarquias ? é uma maneira de estabelecer hierarquias de informação, de um nível mais abrangente, para outro mais atómico. Por exemplo, a dimensão «região» é um exemplo adequado : um país tem regiões, uma região tem cidades, uma cidade tem concelhos, etc... isto é uma hierarquia, no topo o país, no fundo o concelho.
No fundo, é uma maneira mais inteligível e auxiliar para o decisor de negócio navegar e seleccionar a informação que pretende.

E os atributos ? são campos informativos definidos nas dimensões e que ajudam na filtragem e selecção de informação. Por exemplo, na dimensão «empregado» podem-se
definir atributos como a idade, sexo, categoria, etc. Por exemplo, um decisor de negócio, pode querer ver se são os empregados masculinos que vendem mais ou não. Bastaria então, discriminar a informação dos factos, pela dimensão «empregado» usando o atributo "sexo"... Fácil !

A fase de análise envolve estes conceitos todos. E existem também ferramentas para fazer este tipo de análise.
No fundo, os dados resultantes do ETL, num dado formato, são guardados em outro formato numa base de dados multidimensional (cá está : o poder de analisar informação numa perspectiva dimensional).

Isto é fantástico! Mas eu sou suspeito por gostar muito desta área...

Neste momento, já vamos com setenta e um percento (71%) da nossa missão cumprida.
Na parte III (e última), na sequência da nossa missão conjunta, iremos analisar e aprender sobre : (P)rocessamento e (A)presentação.

 

Até lá e o meu obrigado pela sua atenção.

Os meus cumprimentos,
Pedro Mesquita

( http://pedromesquita.pt.to )

Sobre o Autor

(ver site pessoal)




Pontuação: Não pontuado ainda


Comments

No comments posted.

Add Comment