Download PDF
ads:
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO PARANÁ
ROSANA ADAMI MATTIODA
QUALIDADE DA INFORMAÇÃO EM EMPRESAS QUE
UTILIZAM DATA WAREHOUSE NA PERSPECTIVA
DO CONSUMIDOR DE INFORMAÇÃO
CURITIBA
2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ROSANA ADAMI MATTIODA
QUALIDADE DA INFORMAÇÃO EM EMPRESAS QUE
UTILIZAM DATA WAREHOUSE NA PERSPECTIVA
DO CONSUMIDOR DE INFORMAÇÃO
CURITIBA
2006
Dissertação apresentada para o Programa de Pós-Graduação e
m
Engenharia de Produção e Sistemas da Pontifícia Universidade
Católica do Paraná como requisito parcial para obtenção do título
de Mestre em Engenharia de Produção e Sistemas.
Área de Concentração: Gerência de Produção e Logística -
Gerenciamento de Operações
Orientador: Prof. Dr. Fábio Favaretto
ads:
“Deus quer, o homem sonha, a obra nasce".
Fernando Pessoa
iv
AGRADECIMENTOS
Ao meu orientador, Prof. Dr. Fábio Favaretto, pelo constante incentivo, sempre
indicando a direção a ser tomada nos momentos de maior dificuldade, interessado em
participar de minhas dúvidas, com excelentes sugestões. Agradeço principalmente pela
confiança depositada na elaboração do meu trabalho de dissertação.
Aos Professores Dr. Luiz Marcio Spinosa e Dr. Alfredo Iarozinski Neto, que em suas
aulas permitiram espaços para discussões de algumas questões relevantes e importantes aqui
desenvolvidas e por aceitarem integrar a Banca de Qualificação.
Agradeço ao PPGEPS / PUCPR, pela concessão da bolsa-de-estudo e a todos os
professores, funcionários e alunos do Mestrado de Engenharia de Produção e Sistemas da
PUCPR.
Agradeço em especial ao meu esposo João Carlos que participou da realização deste
ideal tão almejado por mim, confiando, sendo sempre um bom ouvinte, motivando, dando
seu apoio e carinho incondicional.
"Escolha sempre o caminho que pareça o melhor,
mesmo que seja o mais difícil;
o hábito brevemente o tornará fácil e agradável".
(Pitágoras)
v
SUMÁRIO
Agradecimentos
Sumário
Lista de Figuras
Lista de Tabelas
Lista de Abreviaturas
Resumo
Abstract
CAPÍTULO 1 INTRODUÇÃO
1.1 Localização
1.2 Problema
1.3 Objetivos da Pesquisa
1.4 Justificativa
1.5 Delimitação do Estudo
1.6 Estrutura
CAPÍTULO 2 REVISÃO DA LITERATURA
DATA WAREHOUSE
2.1 Tecnologia da Informação e Sistemas de Informação
2.2 Sistemas de Apoio à Decisão
2.3 Data Warehouse
2.3.1 Definições
2.3.2 Processo de Criação e Ciclo de Vida do DW
2.3.3 Modelagem e Projeto
2.3.4 Vantagens e Desvantagens da Utilização de um DW
2.3.5 Extração de Informações
2.4 Componente Humano na Implantação de Sistema de Informação
2.5 Atores do Processo de Informação
iv
v
ix
x
xi
xii
xiii
14
16
16
17
19
19
20
24
27
29
31
32
36
37
41
44
vi
CAPÍTULO 3 REVISÃO DA LITERATURA
QUALIDADE DA INFORMAÇÃO
3.1 Qualidade da Informação
3.2 Produto de Informação e TDQM (Total Data Quality Management)
3.3 Estratégia da Qualidade da Informação
3.4 Dimensões da Qualidade da Informação
3.5 Qualidade de Dados Pobre e Remendos Típicos
3.6 A Informação na Perspectiva do Consumidor de Informação
3.7 Avaliação da Qualidade da Informação
3.8 Síntese da Revisão da Literatura
CAPÍTULO 4 METODOLOGIA CIENTÍFICA
4..1 Metodologia Conceitual
4.1.1 Definição dos Métodos de Pesquisa
4.1.2 Definição da Coleta de Dados
4.1.3 Instrumento de Pesquisa
4.2 Metodologia de Pesquisa Adotada
4.2.1 Procedimento para Coleta de Dados
4.2.2 Elaboração do Instrumento de Pesquisa
4.2.3 Resultados Esperados
CAPÍTULO 5 APLICAÇÃO DA METODOLOGIA
5.1 Identificação das Empresas
5.2 Visita a Empresa e Definição do Número de Casos
5.2.1 Perfil Empresa A
5.2.2 Perfil Empresa B
5.3 Confecção do Instrumento de Pesquisa e Aplicação do Pré-Teste
5.4 Montagem do Banco de Dados
5.5 Aplicação do Instrumento de Pesquisa
5.6 Análise das Informações e Relatório Final
46
47
54
56
62
66
68
74
78
79
83
86
87
89
90
92
94
95
96
96
97
97
97
98
vii
CAPÍTULO 6 ANÁLISE DO ESTUDO DE CASO
Fase I Fatores Limitantes
Fase II Informações sobre o Uso do DW
Fase III Avaliação da QI e do Data Warehouse
6. 1 Avaliação da Empresa A
6.1.1 Estágio de Informatização e Tempo de Implementação
6.1.2 Motivação para o Uso do DW
6.1.3 Alterações Trazidas com a Opção de Trabalhar com o DW
6.1.4 Vantagens do Uso do DW
6.1.5 Métodos e Técnicas Estatísticas Utilizadas
6.1.6 Aplicação do DW na Rotina de Trabalho
6.1.7 Avaliação das Dimensões da QI
6.1.8 Avaliação da Existência de Qualidade de Dados Pobre
6.1.9 Avaliação do Grau de Importância das Dimensões e Categorias da QI
6.1.10 Avaliação Geral do DW
6.1.10.1 Pontos Positivos na Utilização do DW
6.1.10.2 Pontos Passíveis de Melhoria com a Utilização do DW
6.2 Avaliação da Empresa B
6.2.1 Estágio de Informatização e Tempo de Implementação
6.2.2 Motivação para o Uso do DW
6.2.3 Alterações Trazidas com a Opção de Trabalhar com o DW
6.2.4 Vantagens do Uso do DW
6.2.5 Métodos e Técnicas Estatísticas Utilizadas
6.2.6 Aplicação do DW na Rotina de Trabalho
6.2.7 Avaliação das Dimensões da QI
6.2.8 Avaliação da Existência de Qualidade de Dados Pobre
6.2.9 Avaliação do Grau de Importância das Dimensões e Categorias da QI
6.2.10 Avaliação Geral do DW
6.2.10.1 Pontos Positivos na Utilização do DW
6.2.10.2 Pontos Passíveis de Melhoria com a Utilização do DW
101
102
103
106
107
107
110
112
113
114
115
117
119
122
122
123
125
126
127
128
130
130
131
132
134
136
138
138
139
viii
CAPÍTULO 7 CONSIDERAÇÕES FINAIS
7.1 Considerações Finais
7.2 Síntese da Conclusão
7.3 Proposta de Trabalhos Futuros
REFERÊNCIAS BIBLIOGRÁFICAS UTILIZADAS
ANEXOS
Anexo I Protocolo de Pesquisa
Anexo II Questionário - Nível Gerencial
Anexo III Questionário - Consumidor de Informação
140
153
155
156
162
167
173
ix
LISTA DE FIGURAS
Figura 1 Processo do Data Warehouse
Figura 2 Componente do Data Warehouse
Figura 3 Modelo Estrela
Figura 4 Dimensão do Produto Normalizada
Figura 5 Processo do Data Mining
Figura 6 Ciclo PDCA para o TDQM (Total Data Quality Management)
Figura 7 Ciclo de Melhoramento da Qualidade de Dados
Figura 8 Escala Likert
Figura 9 Estrutura Metodológica
Figura 10 Modelo de Referência - Método de Estudo de Caso
Figura 11 Aplicação da Metodologia
Figura 12 Etapas da Análise do Estudo de Caso
Figura 13 Escala Likert Adaptada
Figura 14 Motivação para o Uso do DW – Empresa A
Figura 15 Avaliação das Alterações Trazidas com o Uso do DW – Empresa A
Figura 16 Avaliação das Formas de Utilização da Ferramenta DW – Empresa A
Figura 17 Alterações Trazidas com o Uso do DW – Empresa B
28
29
33
34
38
51
52
71
79
84
93
100
104
110
111
114
129
x
LISTA DE TABELAS
Tabela 1 Analogia Manufatura de Produto vs Manufatura de Informação
Tabela 2 Dimensões da Qualidade de Dados e suas Medidas
Tabela 3 Seleção das Definições Atuais da QI
Tabela 4 Categorias, Dimensões e Definições da QI
Tabela 5 Dimensões da Qualidade – Visão Ontológica
Tabela 6 Qualidade de Dados Pobre e Remendos Típicos
Tabela 7 Classificação da QI Baseada na Perspectiva do Consumidor de Informação
Tabela 8 Situações Relevantes para Diferentes Estratégias de Pesquisa
Tabela 9 Questões para a Escolha do Estudo de Caso
Tabela 10 Respostas as Questões para a Escolha do Estudo de Caso
Tabela 11 Avaliação da Motivação para o Uso do DW – Empresa A
Tabela 12 Avaliação das Alterações Trazidas com o Uso do DW – Empresa A
Tabela 13 Avaliação das Vantagens do Uso do DW – Empresa A
Tabela 14 Avaliação dos Métodos e Técnicas Estatísticas Utilizadas - Empresa A
Tabela 15 Avaliação das Dimensões da QI – Empresa A
Tabela 16 Avaliação Existência de Qualidade de Dados Pobre – Empresa A
Tabela 17 Avaliação do Grau de Importância das Dimensões e Categorias da QI - Empresa A
Tabela 18 Avaliação da Motivação para o Uso do DW – Empresa B
Tabela 19 Avaliação das Alterações Trazidas com o Uso do DW – Empresa B
Tabela 20 Avaliação das Vantagens do Uso do DW – Empresa B
Tabela 21 Avaliação dos Métodos e Técnicas Estatísticas Utilizadas- Empresa B
Tabela 22 Avaliação das Dimensões da QI – Empresa B
Tabela 23 Avaliação da Existência de Qualidade de Dados Pobre – Empresa B
Tabela 24 Avaliação do Grau de Importância das Dimensões e Categorias da QI – Empresa B
Tabela 25 Avaliação da Motivação para o Uso do DW – Considerações Finais
Tabela 26 Avaliação das Alterações Trazidas com o Uso do DW – Considerações Finais
Tabela 27 Avaliação das Vantagens do Uso do DW – Considerações Finais
Tabela 28 Avaliação das Dimensões da QI – Considerações Finais
Tabela 29 Avaliação da Existência de Qualidade de Dados Pobre – Considerações Finais
49
56
58
59
60
65
67
81
83
88
109
111
112
113
116
119
121
128
129
130
131
133
136
137
142
143
144
146
149
xi
LISTA DE ABREVIATURAS
CI
C’s
Consumidor de Informação
Três Papeis na Manufatura de Operação
DM
Data Mining
DSS
Decision Support Systems
DW
Data Warehouse
EDP
Electronic Data Processing
EIS
Executive Information Systems
ERP
Enterprise Resources Planning
ES
Expert Systems
ESS
Expert Support Systems
MIS
Management Information Systems
MIT
Massachussets Institute of Tecnology
OLAP Processamento Analítico On-Line
PDCA Ciclo de Melhoramento Contínuo (Plan, Do, Check, Action)
PI Produto de Informação
QI Qualidade da Informação
SAD Sistema de Apoio à Decisão
SI
SMI
Sistema de Informação
Sistema de Manufatura de Informação
TDQM
Total Data Quality Management
TI Tecnologia da Informação
TQM
WEB
Total Quality Management
World Wide Web
xii
RESUMO
Atualmente, convivemos com um grande volume de dados, redundantes e
inconsistentes que necessitam cada vez mais serem administrados com eficiência e
transformados em informação pertinente para fins de suporte á decisão. Sabendo-se que a
competitividade de uma empresa é diretamente proporcional à sua capacidade de obter
informação, processá-la e disponibilizá-la de forma rápida, segura e com qualidade, torna-se
importante observar que a informação somente cumpre o seu papel quando integrada à
organização como recurso, sendo o elemento fundamental do planejamento, da definição de
estratégias e da tomada de decisão. A implantação da ferramenta Data Warehouse altera essa
possibilidade para uso da informação analítica, tornando-se necessário um mecanismo de
gerência da qualidade desses dados. Tendo-se em vista a necessidade de se conhecer a
qualidade dessas informações, o presente estudo tem por objetivo analisar nas empresas que
utilizam a ferramenta DW a qualidade da informação na perspectiva do Consumidor de
Informação. A analise da qualidade da informação será feita através de dimensões e
categorias. Para maior familiaridade com o problema, com vistas a torná-lo explícito, foram
feitas uma revisão da literatura e entrevistas em duas empresas, com emprego de dois
questionários, um a nível Gerencial e outro para os Consumidores de Informação. Como
resultado obteve-se a resposta de como é a qualidade da informação nestas empresas que
utilizam a ferramenta DW, percebendo-se de forma geral os conceitos da literatura.
Palavras-Chave: Data Warehouse, Qualidade da Informação, Dimensões da Qualidade da
Informação, Consumidor de Informação.
xiii
ABSTRACT
Nowadays we live among a great amount of redundant and inconsistent data that have an
increasing need to be administrated with efficiency and transformed into pertinent information
to give support for a decision. Taking into account that a company competitiveness is directly
proportional to its capacity to get information, process and make it available in a quick and
safe way with quality, it is important to consider that the information only play its role when
integrated to the organization as a resource, being the main key of planning, defining
strategies and making decisions. Data Warehouse tool implementation modifies this
possibility for the use of analytical information, opening the necessity of a quality
management mechanism of these data. Regarding the need of knowing the quality of these
information, the present study aims to analyze the quality of information under the
perspective of the information consumer in companies that use data warehouse (DW) tool.
The quality analysis will be carried out through dimensions and categories. In order to get
more acquainted with the problem, and making it explicit, literature revision was performed
as well as interviews in two companies applying two questionnaires: one at management level
and other for information consumers. As a result, it was obtained a response of how the
quality of information is characterized in the companies which use DW tool studied in this
work, noticing in a general way the literature concepts.
Keywords: Data Warehouse, Quality of Information, Dimensions of Quality Information,
Information Consumer.
14
CAPÍTULO 1
INTRODUÇÃO
1.1 Localização
No final do século XX a revolução da Tecnologia da Informação (TI) começa a
convergir para a “gênese de um mundo novo”. Esta revolução atua remodelando as bases
materiais da sociedade e induzindo à emergência do informacionismo como a base material de
uma nova sociedade, tendo uma importância igual ou maior à da Revolução Industrial. Uma
das principais características do paradigma tecnológico informacional é que a informação é a
matéria-prima fundamental, e não apenas informação para agir sobre a tecnologia, como foi o
caso das revoluções anteriores (CASTELLS, 1999).
Neste período, surgiram as primeiras iniciativas de demanda por Sistemas de
Informações (SI) que pudessem suportar a tomada de decisão gerencial. Assim sendo, na
medida em que o ambiente de negócios se torna mais dinâmico e competitivo, a necessidade
de implementação de tais sistemas cresce significativamente, sendo necessário desenvolver
sistemas para o gerenciamento da qualidade de dados.
As organizações passaram por profundas transformações em decorrência da
globalização da economia e dos avanços tecnológicos, não apenas os relacionados à produção,
mas especialmente os que dizem respeito a TI, tornando-se importante o papel dos SI
gerenciais, no sentido de coordenar e otimizar o fluxo de informações relevantes aos gestores
na tomada de decisão (BEUREN; GIBBON, 2001).
15
Foi apenas na segunda metade dos anos de 1990 que o tema qualidade de dados atraiu
a atenção da indústria da informação. Buscando um diferencial competitivo, as organizações
perceberam a importância que deve ser dada a TI, visto estarem elas e suas atividades
inundadas com dados e informações.
Quase sempre, o dado é considerado um componente de tecnologia e não um
componente importante do negócio. Identificar o comportamento, formas e condições do
processo decisório no cenário atual, e os modelos conceituais aplicados com sua respectiva
qualidade de informação é de extremo interesse para o entendimento da relação existente
entre o uso da informação e a sobrevivência das empresas.
Enquanto as empresas lidavam com todos os recursos computacionais de
processamento e gerenciamento, elas não absorviam o uso de ferramentas de apoio à decisão.
Foi quando, nesse período, surgiram os conceitos de ferramentas Armazém de Dados, ou em
inglês, Data Warehouse (DW) e de Processamento analítico “On-Line” ou, em inglês, On-
Line Analytic Processing (OLAP), desenvolvidas a partir da necessidade das grandes
corporações de disporem de melhores informações para tomada de decisão.
O DW consiste de uma metodologia de armazenamento e estruturação que organiza os
dados num banco de dados paralelo aos sistemas operacionais da empresa, dando subsídio de
informações à tomada de decisão. O conceito de OLAP proporciona as condições de análise
de dados “On-Line”, oferecendo respostas rápidas às consultas de questões gerenciais. Eles
surgiram juntamente com os Sistemas de Apoio à Decisão (SAD).
A soma dos desafios tecnológicos e a própria pressão do mercado por empresas mais
atentas às relações com seus clientes justificam a tendência de usar as soluções de qualidade
da informação (QI) que surgiram no fim da década de 1990, as quais identificam categorias e
dimensões inspiradas nos processos de gestão de qualidade da manufatura, aplicados aos SI
por pesquisadores do Massachussets Institute of Technology (MIT).
16
Segundo Burgess, Gray e Fiddian (2004), muitos trabalhos atualmente conduzidos na
área de pesquisa da QI focaram a qualidade a partir da perspectiva organizacional ou da
produção de informação. A perspectiva de qualidade do Consumidor de Informação difere
desta, sendo que este não tem controle sobre a QI disponível e seu objetivo é encontrar
informação que atenda suas necessidades pessoais, ao invés de prover informação que atenda
a necessidade de outros.
1.2 Problema
Levando-se em consideração que as questões acima relatadas lidam com ligações
operacionais que necessitam serem traçadas ao longo do tempo, em vez de ser encarada como
mera repetição ou incidência, a presente pesquisa irá descrever e analisar a seguinte questão:
como é a Qualidade da Informação gerada pelo Data Warehouse na perspectiva do
Consumidor de Informação?
1.3 Objetivos da Pesquisa
O objetivo principal da pesquisa é analisar a Qualidade da Informação em
empresas que utilizam o Data Warehouse, na perspectiva do Consumidor de
Informação, tendo como objetivos secundários:
a. Avaliar a qualidade da informação gerada pelo DW;
b. Verificar o grau de importância atribuído às dimensões da qualidade da informação; e
c. Verificar o grau de importância atribuído às categorias da qualidade da informação.
17
1.4 Justificativa
Hoje se convive permanentemente com um grande volume de dados disponibilizados
através da TI. Verifica-se que tais dados necessitam cada vez mais de um tratamento prático e
de bom senso que os transformem em informação pertinente. A análise criteriosa de dados,
tanto internos como externos a uma organização, torna-se cada vez mais necessária dada a
escassez de tempo e a cobrança por agilidade e flexibilidade impostas pelo mercado.
A maioria das organizações sofre de abundância de dados redundantes e
inconsistentes, difíceis de administrar com eficiência e mais difíceis de serem usados para fins
de suporte à decisão. A não implementação de sistemas e métodos para realizarem análise dos
dados resultará em sérias desvantagens para as empresas. Verifica-se que a intuição é parte
integrante do processo de tomada de decisão, fazendo-se necessário que os sistemas de auxílio
a esse processo possam ser capazes de auxiliar na geração de pensamentos intuitivos, e
também de testá-los (SINGH, 2001).
Para Cassarro (2001), a informação é ao mesmo tempo matéria prima e produto
acabado da atividade de sistemas. E a informação adequadamente estruturada, contribui para
que a empresa se torne mais dinâmica, onde se pode afirmar que “tanto mais dinâmica será
uma empresa quanto melhores e mais adequadas forem as informações de que os gerentes
dispõem para as suas tomadas de decisão”.
Sendo assim, torna-se importante observar que a informação somente cumpre o seu
papel quando integrada à organização como recurso, sendo o elemento fundamental do
planejamento, da definição de estratégias e da tomada de decisão. A informação serve à
tomada de decisão, logo a necessidade de decidir precisamente é justificada pela necessidade
que temos em agir dentro das organizações e no campo da pesquisa. Segundo Rezende e
Abreu (2001), "o propósito básico da informação é habilitar a empresa a alcançar seus
18
objetivos pelo uso eficiente dos recursos disponíveis, nos quais se inserem pessoas, materiais,
equipamentos, tecnologia, dinheiro, além da própria informação".
Os conceitos de DW e ferramentas OLAP, desenvolvidos a partir da necessidade das
grandes corporações de dispor de melhores informações para tomada de decisão, alteram as
possibilidades para uso da informação analítica. Porém, grande parte das soluções
implementadas responde apenas questões táticas específicas dos departamentos, usufruindo
apenas uma pequena parte dos benefícios potencializados pelos SI que apóiam a tomada de
decisão e a inteligência do negócio (PENNA; REIS, 2003).
A qualidade dos dados armazenados em um DW é um fator de extrema importância.
Essa afirmação é consistente porque a qualidade de um sistema está ligada diretamente à
confiança dos seus usuários. Quando se trata de um DW, o risco de gerar dados incorretos ou
inconsistentes é maior, pois os mesmos sofrem muitas transformações, podendo vir de origens
distintas e muitas vezes desconhecidas. Devido a isso se torna necessário um mecanismo de
gerência da qualidade desses dados (CARNEIRO, 2001).
Com base no exposto, seria importante analisar a qualidade dessas informações por
suas dimensões nas empresas que utilizam a ferramenta DW. De acordo com Wang, Ziad e
Lee (2000), muitas iniciativas coorporativas, tais como o “Business-to-Business”,
Gerenciamento Integrado de Cadeia de Suprimento e o ERP (Enterprise Resources Planning)
correm o risco de falhar se não forem consideradas a qualidade e a melhoria dos dados.
19
1.5 Delimitações do Estudo
Para a elaboração do presente estudo, foram encontradas as seguintes delimitações:
a. conhecimento do número e perfil das empresas que utilizam a ferramenta DW;
b. falta de conhecimento nas empresas pesquisadas, sobre os assuntos do projeto. Tal fato fez
dos fatores tempo e disponibilidade do pessoal envolvido uma limitação, uma vez que
exigiu a necessidade de treinamento prévio dos participantes antes das entrevistas. O
tempo médio dispendido no total foi de aproximadamente uma hora no treinamento e uma
hora para cada participante responder o respectivo questionário.
1.6 Estrutura
O presente estudo encontra-se estruturado da seguinte forma: O Capítulo 1 apresentou
a localização, o problema de pesquisa e seus objetivos, a justificativa e delimitações do
estudo. No Capítulo 2 será apresentada a Revisão da Literatura do Data Warehouse, partindo
da Tecnologia da Informação até autores do processo de Informação. No Capítulo 3, ainda na
Revisão da Literatura - Qualidade da Informação, será enfocada a Qualidade da Informação e
a Informação na Perspectiva do Consumidor de Informação. O Capítulo 4 discute a
metodologia da pesquisa conceitual e adotada, bem como os resultados esperados.
No Capítulo 5 será descrita a aplicação da metodologia, onde serão relatados os passos
para a identificação das empresas, o perfil, a confecção do protocolo e instrumento de
pesquisa e sua a aplicação. No Capítulo 6 será feita a análise do estudo, sendo esse dividido
em três fases onde se destaca a descrição dos resultados. Finalmente, no Capítulo 7 serão
descritas as considerações finais e sua síntese, colocando em pauta propostas de trabalhos
futuros.
20
CAPÍTULO 2
REVISÃO DA LITERATURA - DATA WAREHOUSE
2.1 Tecnologia da Informação e Sistemas de Informação
Conforme Graeml (2000), ao conjunto de tecnologias resultantes da utilização
simultânea e integrada de informática e telecomunicações tem-se chamado de Tecnologia da
Informação (TI), que passou a ser o quarto principal recurso disponível para os executivos,
depois das pessoas, do capital e das máquinas. O objetivo da TI é ser um instrumento
facilitador do processo de tomada de decisão, possibilitando a integração e troca de
informações entre as atividades que compõem a cadeia de valor.
Para uma decisão acertada deve-se ter consciência de que os benefícios advindos do
investimento em TI não estão diretamente ligados ao investimento em Sistemas de
Informação, mas ao uso que é feito dela e descobrir se a tecnologia realmente faz diferença
para a competitividade da empresa (PORTER, 1997).
Conforme Rezende e Abreu (2001), pode-se conceituar TI como todo e qualquer
dispositivo que tenha capacidade para tratar dados e/ou informações, tanto de forma
sistêmica como esporádica, quer esteja aplicada ao produto ou processo.
Para os autores, todo sistema, usando ou não recursos de TI, que manipula e gera
informação, pode ser genericamente considerado Sistema de Informação, podendo ser
definido como: “processo de transformação de dados em informações que são utilizadas na
21
estrutura decisória da empresa e que proporcionam a sustentação administrativa, visando à
otimização dos resultados esperados”. Ainda afirmam que “informação é todo dado
trabalhado, útil, tratado, com valor significativo atribuído ou agregado a ele e com um
sentido natural e lógico para quem usa a informação”.
O papel de um SI é proporcionar uma representação de um domínio de aplicação
(também chamado sistema de mundo real) conforme percebido pelos usuários e, portanto, as
visões dos usuários servem de padrão contra o que é definido como qualidade de dados
(WAND; WANG, 1996).
Segundo Falsarella e Chaves (1995), uma grande quantidade de termos é usada para
classificar e caracterizar SI. Uma forma de limitar e demarcar corretamente as fronteiras
conceituais entre esses termos é relacionar cada tipo de SI com o estágio de utilização da
informática em que uma organização se encontra. O uso da TI dentro das organizações tende
a seguir um padrão previsível no tempo, como descreve o autor Richard Nolan apud
Falsarella e Chaves (1995), em seu livro Management Accounting and Control of Data
Processing, que foi o primeiro a analisar estes padrões em relação à adoção de novas
tecnologias de processamento de informação.
Ele propôs colocar as organizações em seis estágios possíveis da utilização de recursos
de informática e informação. De acordo com o modelo de Nolan, a informática evolui
segundo uma seqüência definida de estágios, os quais representam a familiaridade e o
domínio crescentes da tecnologia pela empresa. Cada estágio é caracterizado por um tipo de
aplicação preponderante, forma de planejamento e controle da informática e tecnologia
empregada. São eles, em negrito:
a. Iniciação: Neste estágio o usuário é resistente ao uso da informática e seu envolvimento
com a tecnologia é superficial. A organização encoraja o uso da informática e se preocupa
com o aprendizado, mas poucas atividades são automatizadas.
22
b. Contágio: Neste estágio começam a proliferar SI informatizados, que automatizam
atividades antes desenvolvidas manualmente, sem, porém, se preocupar com a integração
das informações.
c. Controle: Neste estágio o crescimento do uso de SI na organização passa a ser explosivo,
o usuário sendo a força propulsora. Por isso, a organização passa a exigir melhor gestão
dos recursos de informática.
d. Integração: Neste estágio, em resposta à pressão por melhor gestão, os SI passam a serem
orientados para atender às necessidades dos níveis gerenciais, as informações são de
melhor qualidade e é exigida maior integração entre elas.
e. Administração de Dados: Neste estágio, os SI começam a serem organizados em termos
de sistemas que interessam à organização como um todo (chamados corporativos) e
sistemas de uso setorial ou especializado, havendo cuidado, em qualquer hipótese, com a
correta administração dos dados de modo a evitar redundâncias.
f. Maturidade: Neste estágio, a informação passa a ser considerada como patrimônio da
organização, o usuário é participativo e responsável e o crescimento da informática é
ordenado.
Outra forma de caracterizar SI, ainda, conforme os autores, Falsarella e Chaves (1995), é a
que os classifica em:
a. Sistemas Transacionais: Também identificados pela expressão "Electronic Data
Processing" (EDP), são necessários para o controle operacional das organizações. No
modelo da evolução da informática nas organizações proposto por Richard Nolan, os SI
transacionais se enquadram nos estágios de iniciação e contágio;
b. Sistemas Gerenciais: Provêem material para análise, planejamento e suporte à decisão.
São geralmente chamados de "Management Information Systems" (MIS). O surgimento
23
desses sistemas acontece nos estágios de controle e integração no modelo proposto por
Richard Nolan, onde o usuário é força propulsora e exige informações em maior
quantidade, menor tempo e com melhor nível de integração;
c. Sistemas Executivos: Com base nos dados existentes nos EDP, nas informações
disponíveis nos MIS e em informações coletadas de fontes externas à organização, é
possível construir SI dirigidos para a alta gerência. São geralmente chamados de
"Executive Information Systems" (EIS). No modelo definido por Richard Nolan, os EIS
começam a serem desenvolvidos nas organizações nos estágios de administração de dados
e maturidade. Nesses estágios os SI existentes refletem o fluxo de informações da
organização, o usuário participa integralmente do desenvolvimento dos sistemas, as
informações passam a serem consideradas patrimônio da organização, o crescimento da
informática é ordenado, a informática passa a ter função de apoio estratégico para a
organização e não se tomam decisões sem base nas informações produzidas por um EIS;
d. Sistemas Especialistas: São geralmente conhecidos como "Expert Systems" (ES), quando
fornecem, eles mesmos, soluções para determinados problemas, e como "Expert Support
Systems" (ESS), quando fornecem informações extraídas das bases de conhecimento a
profissionais e executivos para auxiliá-los no processo de tomada de decisão.
Normalmente, o desenvolvimento desses sistemas não depende da existência de outros SI
e, portanto, eles podem ser desenvolvidos em qualquer um dos estágios da evolução da
informática no modelo definido por Richard Nolan;
e. Sistemas de Apoio à Decisão: São sistemas que não só fornecem informações para apoio
à tomada de decisão, mas também contribuem para o processo de tomada de decisão. Os
SAD, que também são conhecidos como "Decision Support Systems" (DSS), possuem
funções específicas, não vinculadas aos sistemas existentes, que permitem buscar
informações nas bases de dados existentes e delas retirar subsídios para o processo de
24
tomada de decisão. Os SAD começam a serem desenvolvidos na organização a partir dos
estágios de controle e integração no modelo proposto por Richard Nolan.
Para classificar e caracterizar um SI é útil analisar o estágio da evolução da
informática em que a organização se encontra. Se a organização estiver no estágio de
iniciação ou contágio, dificilmente os SI implantados poderão ser classificados e
caracterizados como MIS, SAD, ou EIS.
Independente de seu nível e classificação, os SI têm como maior objetivo auxiliar o
processo de tomada de decisão nas empresas, sendo o Sistema de Apoio à Decisão tecnologia
fundamental para a evolução desse processo.
2.2 Sistemas de Apoio à Decisão
Como já mencionado, para Falsarella e Chaves (1995), Sistemas de Apoio à Decisão
(SAD) são sistemas que não só fornecem informações para apoio à tomada de decisão, mas
também contribuem para essa atitude. A obtenção da informação é apenas parte do processo.
Também conhecidos como "Decision Support Systems" (DSS), possuem funções específicas,
não vinculadas aos sistemas existentes, que permitem buscar informações nas bases de dados
existentes e delas retirar subsídios para o processo de tomada de decisão. Sendo assim, SAD
é um sistema que apóia, mas não substitui os gerentes em suas atividades de tomada de
decisão.
25
A necessidade dos SAD surgiu na década de 1970, em decorrência de diversos fatores
como, por exemplo:
a. Competição cada vez maior entre as organizações;
b. Necessidade de informações rápidas para auxiliar no processo de tomada de decisão;
c. Disponibilidade de tecnologias de hardware e software para armazenar e buscar
rapidamente as informações;
d. Possibilidade de armazenar o conhecimento e as experiências de especialistas em bases de
conhecimentos; e
e. Necessidade de a informática apoiar o processo de planejamento estratégico empresarial.
Para Martin (2001), um SAD é baseado em computador, é quase sempre interativo e é
desenvolvido para auxiliar no processo decisório. Os dados são freqüentemente extraídos de
um sistema de processamento de transações ou de um DW. Os SAD não são justificados pela
tradicional abordagem custo/benefício. Para estes sistemas, muitos dos benefícios são
intangíveis, tais como uma tomada de decisão mais rápida e um melhor entendimento dos
dados.
Para Sauter (1999), o SAD deve combinar ferramentas analíticas com heurística
intuitiva para aumentar a perspicácia dos administradores sobre fatores muito complexos para
serem montados dentro de modelos, devendo facilitar a modificação de resultados de
ferramentas analíticas quando eles contradizem a intuição.
Para o autor, intuição refere-se a uma percepção de sentimentos de padrões ou relações
e sentimentos vagos. Os SAD podem encorajar a intuição enquanto ajudam os usuários a se
protegerem contra o uso inapropriado da intuição. Esses podem ser projetados para facilitar
este objetivo provendo modelos, orientação e dispositivos de alerta, e até mesmo
26
incorporando intuição dentro dos próprios modelos que apóiam, encorajam e verificam a
intuição.
Relacionam-se abaixo algumas definições de Sistemas de Apoio à Decisão, conforme
vários autores:
Para Sprague e Watson (1991), SAD é um sistema de informação que apóia qualquer
processo de tomada de decisão em áreas de planejamento estratégico, controle gerencial e
controle operacional. Para os autores, qualquer SI que forneça informações para auxílio à
decisão é um SAD.
Para Inmon (1997), SAD é um sistema utilizado para prestar suporte às decisões
gerenciais e que, geralmente, engloba a análise de muitas unidades de dados conduzida de
forma heurística.
Segundo Bhargava; Sridhar e Herrick (1999), SAD são “softwares” que auxiliam os
usuários a aplicar métodos analíticos e científicos para a tomada de decisão. Eles trabalham
utilizando modelos e algoritmos de disciplinas, tais como análise de decisão.
Autores como Sprague (1991) e Binder (1994) apud Freire, Seixas e Cazarini (2001),
definem SAD como sendo sistemas computacionais, que ajudam os responsáveis pela tomada
de decisões a enfrentar problemas estruturados, e principalmente, não estruturados, através de
uma interação direta com modelos de dados e análises.
Basicamente o SAD consiste no processo de agrupar, estruturar, manipular,
armazenar, acessar, apresentar e distribuir informações de negócios de maneira oportuna, ou
seja, a informação certa no momento certo e na quantidade certa (PENNA; REIS, 2003).
27
2.3 Data Warehouse
O termo “Data Warehouse” (DW) segundo Singh (2001), é utilizado para definir “um
conjunto de novos conceitos e ferramentas que evolui para uma tecnologia que permite atacar
o problema de oferecer a todas as pessoas-chave da empresa acesso a qualquer nível de
informação necessário para que a organização possa sobreviver e prosperar em um mundo
cada vez mais competitivo”.
Um DW é um lugar em que os dados ficam armazenados de forma que as aplicações
possam acessá-los e compartilhá-los facilmente. Armazena dados no formato “read-only”
(somente leitura) e coleta informações de várias fontes diferentes, sendo utilizado como local
em que essas diferenças se tornam compatíveis, e é colocado em umwarehouse” (armazém)
para que vários aplicativos usem as mesmas informações.
Inmon (1997) foi o primeiro a cunhar o termo “Data Warehouse” (ou armazém de
dados), para repositórios analíticos corporativos, e sua definição clássica é de “uma coleção
de dados orientada por assunto, integrada, variante e não volátil, que tem por objetivo dar
suporte aos processos de tomada de decisão”. Por sua definição tem-se :
a. Organizado por assuntos: Um DW orientado por temas armazena informações sob a
forma de assuntos diferentes entre si e que são considerados importantes para o negócio
da empresa;
b. Integrado: A integração do DW diz respeito à consistência de denominações, das
unidades dos valores contidos nas tabelas e outras padronizações aplicadas aos dados no
sentido de que estes sejam transformados até estarem num estado uniforme;
c. Variante no Tempo: Os dados contidos num DW são temporais, referem-se a períodos de
tempo bem definidos, e isso auxilia na análise e na confirmação de acontecimentos
sazonais dentro de uma determinada atividade ou ramo de negócio;
28
d. Não Volátil: Um sistema de DW deve permitir apenas uma carga inicial dos dados e
posteriormente oferecer estes mesmos dados para consultas dos usuários. Este ambiente é
conhecido por "load-and-access" (carga e acesso).
A Figura 1, a seguir, detalha o processo descrito pelo autor:
Bases de
Dados
Transacionais
Dados
ERP
Dados
de
Departamentos
Extração
Integração
Limpeza
Transformação
Fontes
de
Dados
Preparação
de
Dados
Data
Warehouse/
Data Mart
Ferramentas de
Análise de
Dados
Portais
Ferramentas de
Acesso a
Dados
Data
Mining
OLAP
Relatórios
Exibão
em Telas
Gráficos
Conversões
Treinamento
Distribuição
Metadados
Figura 1 – Processo do Data Warehouse Adaptado de Inmon (1997)
29
2.3.1 Definições
Para Inmon (1997), o DW é o alicerce do processamento dos SAD. Ele capacita o
analista de SAD a lidar com a necessidade da gerência em termos de informações rápidas e de
mudança de enfoque; a examinar dados integrados e poder fazer uma análise prospectiva. A
idéia é armazenar os dados em vários graus de relacionamento e sumarização, de forma a
facilitar e agilizar os processos de tomada de decisão por diferentes níveis gerenciais.
Quando se fala em DW, a abordagem refere-se apenas a base de dados. O conceito de
Data Warehousing” (armazenagem de dados) é mais abrangente, considerando o processo
contínuo de extrair dados dos sistemas transacionais da organização, “limpá-los”, carregá-los
no banco de dados e disponibilizar os dados finais para os usuários (PENNA; REIS, 2003).
A Figura 2 mostra os componentes do DW, fontes internas e externas de dados passam
por um processo de extração e transformação, resultando no DW, onde temos um diretório de
informações para o acesso e análise de dados.
Figura 2 – Componente do Data Warehouse adaptado de Inmon (1997)
30
Para Singh (2001), em uma definição simples, um DW é a separação física dos
sistemas de dados operacionais de uma organização, de seus sistemas de suporte à decisão.
Ele integra diversas atividades e origens de dados e é desenvolvido para fins de suporte à
decisão. Em resumo, “DW é uma tecnologia de gestão e análise de dados”.
Para Freitas Junior et al. (2001), o DW oferece os fundamentos e os recursos
necessários à tomada de decisão, fornecendo dados integrados e históricos a todos os níveis da
organização. O dado em um DW tem valor histórico, ou seja, refere-se a algum momento
específico, não sendo atualizável. Todo ambiente de DW enfrenta o obstáculo da sobrecarga
de informações. Portanto, a essência do sucesso no ambiente de DW consiste na capacidade
de monitorar e gerenciar o fluxo de dados.
Sferra e Corrêa (2003), definem “Data Warehouse” como um depósito central de
dados, extraído de dados operacionais, em que a informação é orientada a assuntos, não
volátil e de natureza histórica.
Para Sakaguchi e Frolick (1997), em termos tecnológicos, “Data Warehouse” é uma
combinação de várias tecnologias, tendo como primeiro objetivo a integração efetiva de bases
de dados operacionais em um ambiente que habilita o uso estratégico dos dados.
Num estudo de laboratório realizado para tomada de decisões na área de marketing,
Park (2006) verificou que, melhorando a qualidade de um SAD pela adição de um DW pode-
se melhorar a qualidade e disponibilidade da informação e, por conseqüência, melhorar a
performance de decisão dos usuários do SAD.
31
2.3.2 Processo de Criação e Ciclo de Vida do DW
Conforme Kimball (1996), como em qualquer abordagem de sistema de informação, o
ciclo se inicia com o planejamento do projeto sendo em seguida definidos os requerimentos
do negócio. Os requerimentos de informação devem ser baseados nas necessidades de
informação analítica dos tomadores de decisão e na disponibilidade e qualidade da
informação existente nos sistemas transacionais.
O projeto do DW prossegue em três caminhos paralelos. Sob a perspectiva dos dados,
o modelo dimensional é desenhado, a estrutura física do banco de dados é definida e são
desenvolvidos os programas para alimentação do DW a partir dos sistemas transacionais ou
fontes externas. Esse processo é conhecido como Extração, Transformação e Carga.
O DW precisa ser considerado como um organismo vivo, pois o ambiente de negócio
certamente se modificará com uma dinâmica cada vez maior, demandando novas análises e
informações adicionais para a tomada de decisão. Compreendendo isso, fica fácil perceber
que o DW não pode ser encarado como um projeto finito e estanque com início, meio e fim.
Ao contrário, o processo de “Data Warehousing” (armazenagem de dados) passa a ser visto
como contínuo, em constante evolução de forma a acompanhar a evolução do negócio.
Por ser um organismo vivo, o processo de “Data Warehousing” não se encerra e o
DW corporativo certamente continuará a evoluir adequando-se as novas demandas de
informação analíticas que surgirão em função de mudanças na organização e no ambiente de
negócios. Analisando-se dessa forma, Come (2001), adotou em sua pesquisa “fator
impactante” ao invés de “fator crítico de sucesso”, considerando que existe controvérsia sob o
término de um projeto de DW.
Segundo Bispo (1998), as necessidades de informação por parte dos usuários variam
com o passar do tempo, adequando-se às necessidades do negócio. Essas necessidades são
32
impostas por diversos eventos e fatores de influências internas e externas que ocorrem e que
afetam a empresa. A elaboração do projeto do “Data Warehouse” deve prever essa
dinamicidade das necessidades de informações. As ferramentas de pesquisa e análise devem
ser versáteis para que possam acompanhar essas mudanças.
2.3.3 Modelagem e Projeto
Apesar da maioria dos bancos de dados serem relacionais, inclusive os que armazenam
os DW, o desenho das tabelas dentro deles é feito conforme o uso que se vai fazer. No caso
dos sistemas transacionais, usa-se a modelagem relacional (entidades e relacionamentos) para
representar as tabelas e como elas se relacionam. A modelagem dimensional introduzida por
Ralph Kimball tornou-se praticamente um sinônimo de modelagem de dados para tomada de
decisão.
A modelagem dimensional deve ser iniciada pela definição do “Data Mart”, isto é,
definição da estrela a ser modelada. Este esquema é chamado de estrela, por apresentar a
tabela de fatos "dominante" no centro do esquema e as tabelas de dimensões nas
extremidades. A tabela de fatos é ligada às demais tabelas por múltiplas junções, enquanto as
tabelas de dimensões se ligam apenas à tabela central por uma única junção.
A tabela de fatos é onde as medidas numéricas do fato representado estão
armazenadas. Cada uma destas medidas é tomada segundo a interseção de todas as dimensões.
A Figura 3 mostra um exemplo de um modelo tipo estrela
33
Figura 3 – Modelo Estrela adaptado de Kimball (1996)
Outro tipo de estrutura bastante comum é o esquema do tipo floco de neve ou
"snowflake", que consiste em uma extensão do esquema estrela onde cada uma das "pontas"
da estrela passa a ser o centro de outras estrelas. Isso, porque cada tabela de dimensão seria
normalizada, "quebrando-se" a tabela original ao longo de hierarquias existentes em seus
atributos. No caso da Figura 4, no exemplo de modelo dimensional “snowflake” a dimensão
produto possui uma hierarquia definida na qual a categoria se divide em marca e marca se
divide em produtos.
Atributos:
Chave
Endereço
Bairro
Cidade
Estado
Região
País
Dimensões:
Pontos de venda
Dimensões:
Promoções
Atributos:
Chave
N
ome da promoção
Tipo de anúncio
Média anunciada
Fato: Volume de vendas
Chaves:
Chave de tempo
Chave de produto
Chave de ponto de
vendas
Chave de promoções
Medidas:
Unidades medidas
Receita obtida
Custo
Dimensão:
Tempo
Atributos:
Chave
Dia
Semana
Mês
Ano
Dimensões:
Produtos
Atributos:
Chave
Descrição
Marca
Categoria
Departamento
34
Figura 4 - Dimensão do Produto Normalizada – adaptado de Kimbal (1996)
Kimball (1996) aconselha os projetistas "bem-intencionados" a resistirem à tentação
de transformar esquemas estrela em esquemas floco-de-neve, devido ao impacto da
complexidade deste tipo de estrutura sobre o usuário final, enquanto que o ganho em termos
de espaço de armazenamento seria pouco relevante.
Em seguida a granularidade dos fatos a serem armazenados deve ser definida. O grão é
o nível de detalhe com que os fatos serão armazenados no DW. O terceiro passo da
modelagem dimensional consiste em definir com precisão as dimensões e seus atributos,
finalizando a modelagem com a definição dos fatos a serem armazenados, que devem ser
compatíveis com o grão definido.
Com os “Data Mart” construídos, é preciso disponibilizar as informações para a
empresa. É importante classificar e entender as necessidades de informação de cada um. Para
atender estas necessidades diversas e não estruturadas, surgiram os softwares
multidimensionais, também conhecidos como ferramentas OLAP. O conceito de hiper cubo,
cubo com mais de três dimensões é a base da abordagem das ferramentas OLAP, que pode ser
Dimensão:
Cidade de
vendas
Dimensão:
Estado de
venda
Dimensão:
Região de
venda
Dimensão:
promoções
Fato: Volume de
Vendas
Dimensão:
Produtos
Dimensão:
Tempo
Dimensão:
País de
venda
35
fatiado (slice) isolando-se uma ou mais dimensões. O pivotamento (rotação) permite girar o
hiper cubo com a mudança do eixo de dimensões analisado. O conceito de “dicing”
(cubagem) permite a criação de hiper cubos menores restringindo as ocorrências de interesse
em cada dimensão.
Essas características, usualmente suportadas pelas ferramentas OLAP, são
fundamentais para assegurar flexibilidade para que os usuários realizem consultas analíticas,
em geral, demandas não estruturadas de informação. Outros conceitos de operadores
dimensionais fundamentais no ambiente analítico estão relacionados com o nível de
granularidade das informações e consistem na navegação para níveis mais baixos da
hierarquia buscando mais detalhes sobre as informações (drill down) e seu inverso, navegando
para níveis mais altos da hierarquia buscando dados mais consolidados (drill up).
Existem dois importantes aspectos vinculados à construção do DW: o projeto da
interface com os sistemas operacionais e o projeto do DW propriamente dito. O “projeto” não
é uma descrição exata do que acontece durante sua construção, uma vez que ele é construído
de modo heurístico. Primeiro o “warehouse” é povoado com alguns dados, então tais dados
são examinados pelo analista de SAD. Com base no “feedback” do usuário final, os dados são
modificados e/ou são adicionados ao DW. O ciclo deste “feedback” tem continuidade por
toda a vida do DW (COME, 2001).
Conforme Inmon (1997), o DW não pode ser projetado do mesmo modo pelo qual são
construídos os sistemas clássicos baseados em requisitos, pois os requisitos para sua criação
não podem ser conhecidos até que ele esteja parcialmente povoado e sendo usado pelo
analista de SAD. Por outro lado, pode se constituir num engano pensar que não prever
requisitos seja uma boa idéia.
Segundo os autores Penna e Reis (2003), certamente no decorrer da evolução e
amadurecimento do “Data Warehouse”, a questão de qualidade e disponibilidade de dados
36
surgirá por diversas vezes. O processo de “Data Warehousing” deverá estar seguidamente
alimentando e orientando as equipes envolvidas com os sistemas operacionais e com coleta de
informação externa, no sentido de aprimorar e assegurar a qualidade e disponibilidade dos
dados relevantes para a tomada de decisão da organização.
2.3.4 Vantagens e Desvantagens da Utilização de um DW
Desde a definição do conceito de "Data Warehouse" em 1990 por William Inmon
muitas empresas decidiram apostar nesta nova maneira de armazenar e extrair informações
úteis para o suporte a decisões. Para avaliar as vantagens e desvantagens da utilização de um
DW foi feito um estudo sobre vários casos de empresas que já estão utilizando ou estão no
processo inicial de construção de um DW. Os seguintes itens são relacionados no estudo de
Sakaguchi e Frolick (1997), da Universidade de Memphis, EUA:
a. Vantagens: simplicidade, qualidade dos dados, acesso rápido, facilidade de uso,
competitividade, custo de operação, administração do fluxo da informação, habilita o
processamento paralelo, infra-estrutura computacional, e segurança.
b. As desvantagens citadas são que nem todas as empresas podem construir um DW, umas
por serem pequenas e não terem o suporte financeiro necessário, e outras por não terem o
tempo necessário para a conclusão de todo o projeto, pela complexidade e alto custo de
desenvolvimento e administração e, também, pela necessidade de um bom nível de
treinamento.
Através dos novos conceitos da TI, o DW começa a conquistar espaço nas grandes
empresas onde está sendo considerado como uma segunda reengenharia, pela qual as
companhias devem passar para se tornarem mais competitivas e globalizadas. O primeiro
37
resultado alcançado é a capacidade de oferecer informações precisas e atualizadas para
diferentes unidades de negócios dentro das companhias.
2.3.5 Extração de Informações
Para Sferra e Corrêa (2003), “Data Mining” (DM) ou Mineração / Garimpagem de
Dados, pode ser entendida como o processo de extração de informações, sem conhecimento
prévio, de um grande banco de dados e seu uso para tomada de decisões. É uma metodologia
aplicada em diversas áreas que usam o conhecimento, como empresas, indústrias e
instituições de pesquisa. “Data Mining” define o processo automatizado de captura e análise
de grandes conjuntos de dados para extrair um significado, sendo usado tanto para descrever
características do passado como para predizer tendências para o futuro.
Segundo Kwank e Yih (2004), “Data Mining” é a aplicação de algoritmos específicos
para ajustar modelos, ou extrair padrões de dados observados, como parte da descoberta de
conhecimento em bases de dados, que é o processo maior de descoberta de conhecimentos
úteis e compreensíveis a partir dos dados.
Conforme Singh (2001), coletar os dados a serem garimpados é um processo difícil.
Embora os dados operacionais sejam coletados para o processo do negócio, após seu uso
imediato eles freqüentemente são armazenados. O processo de extração de dados, como
mostra a Figura 5, extrai conjuntos úteis de dados para a garimpagem. A amostragem
(“sampling”) pode limitar o tamanho dos dados extraídos e podem ser aplicados atributos de
seleção para que sejam focados conjuntos de dados relevantes. Dados agregados poderão ser
criados para estatísticas de resumo.
38
Data
Warehouse
Dados
Extraídos
Selecionar Transformar Garimpar Assimilar
Informação
Assimilada
Informação
Extraída
Dados
Transformados
Figura 5 – Processo do Data Mining – Adaptado de Singh (2001)
Para encontrar respostas ou extrair conhecimento interessante, existem diversos
métodos de “Data Mining” disponíveis na literatura. É importante ressaltar que a maioria
desses métodos é baseada em técnicas das áreas de aprendizado de máquina, reconhecimento
de padrões e estatística. Essas técnicas vão desde as tradicionais da estatística multivariada,
como análise de agrupamentos e regressões, até modelos mais atuais de aprendizagem, como
redes neurais, lógica difusa e algoritmos genéticos.
Os métodos tradicionais de “Data Mining” são:
a. Classificação: associa ou classifica um item a uma ou várias classes categóricas pré-
definidas. Uma técnica estatística apropriada para classificação é a análise discriminante.
Essa análise permite que dois ou mais grupos possam ser comparados, com o objetivo de
determinar se diferem uns dos outros e, também, a natureza da diferença, de forma que,
39
com base em um conjunto de variáveis independentes, seja possível classificar indivíduos
ou objetos em duas ou mais categorias mutuamente exclusivas.
b. Modelos de Relacionamento entre Variáveis: associa um item a uma ou mais variáveis
de predição de valores reais, consideradas variáveis independentes ou exploratórias.
Técnicas estatísticas como regressão linear simples, múltipla e modelos lineares por
transformação são utilizadas para verificar o relacionamento funcional que,
eventualmente, possa existir entre duas variáveis quantitativas.
c. Análise de Agrupamento “Cluster”: associa um item a uma ou várias classes categóricas
(ou “clusters”), em que as classes são determinadas pelos dados, diversamente da
classificação em que as classes são pré-definidas. São definidos por meio do agrupamento
de dados baseados em medidas de similaridade ou modelos probabilísticos. A análise de
“cluster” (ou agrupamento) é uma técnica que visa detectar a existência de diferentes
grupos dentro de um determinado conjunto de dados e, em caso de sua existência,
determinar quais são eles.
d. Sumarização: determina uma descrição compacta para um dado subconjunto. As funções
de sumarização são freqüentemente usadas na análise exploratória de dados com geração
automatizada de relatórios, sendo responsáveis pela descrição compacta de um conjunto
de dados. A sumarização é utilizada, principalmente, no pré-processamento dos dados,
quando valores inválidos são determinados por meio do cálculo de medidas estatísticas –
como mínimo, máximo, média, moda, mediana e desvio padrão amostral –, no caso de
variáveis quantitativas, e, no caso de variáveis categóricas, por meio da distribuição de
freqüência dos valores.
e. Modelo de Dependência: Análises de dependência são aquelas que têm por objetivo o
estudo da dependência de uma ou mais variáveis em relação a outras, sendo
40
procedimentos metodológicos para tanto a análise discriminante, a de medidas repetidas, a
de correlação canônica, a de regressão multivariada e a de variância multivariada.
f. Regras de Associação: determinam relações entre campos de um banco de dados. A idéia
é a derivação de correlações multivariadas que permitam subsidiar as tomadas de decisão.
A busca de associação entre variáveis é, freqüentemente, um dos propósitos das pesquisas
empíricas. A possível existência de relação entre variáveis orienta análises, conclusões e
evidenciação de achados da investigação. Medidas estatísticas como correlação e testes de
hipóteses apropriados revelam a freqüência de uma regra no universo dos dados
minerados.
g. Análise de Séries Temporais: determina características seqüenciais, como dados com
dependência no tempo. As séries são compostas por quatro padrões: tendência, variações
cíclicas, variações sazonais e variações irregulares. Há vários modelos estatísticos que
podem ser aplicados a essas situações, desde os de regressão linear (simples e múltiplos),
os lineares por transformação e regressões assintóticas, além de modelos com defasagem,
como os autoregressivos e outros deles derivados.
Diante da descrição de metodologias estatísticas aplicáveis ao procedimento de
Mineração de Dados, mostra-se a relevância da estatística para o processo de extração de
conhecimentos, ao afirmar que essa ciência provê uma linguagem e uma estrutura para
quantificar a incerteza resultante quando se tenta deduzir padrões de uma amostra a partir de
uma população.
A estatística preocupa-se com a análise primária dos dados, no sentido de que eles são
coletados por uma razão particular ou por um conjunto de questões particulares a priori.
Data Mining”, por outro lado, preocupa-se também com a análise secundária dos dados,
num sentido mais amplo e mais indutivo do que uma abordagem hipotético-dedutiva,
freqüentemente considerada como o paradigma para o progresso da ciência moderna. Assim,
41
Data Mining” pode ser visto como o descendente direto da estatística, já que são técnicas
metodológicas complementares.
Muitos modelos existem para utilizar a ferramenta, porém estes modelos são
freqüentemente subutilizados. Geralmente os usuários preferem métodos que exijam menos
esforço. Para Chenoweth, Dowling e St. Louis (2004), o grande desafio está em aumentar a
consciência da necessidade da informação melhorada obtida por modelos complexos.
Os SAD auxiliam os usuários a aplicar métodos analíticos e científicos para a tomada
de decisão. Eles trabalham utilizando modelos e algoritmos de disciplinas tais como análise
de decisão, programação matemática e otimização, modelos estocásticos, simulação, e
modelos lógicos. Podem executar, interpretar, visualizar, e analisar interativamente estes
modelos em múltiplos cenários. Quando bem implementados e utilizados, podem melhorar
significativamente a qualidade de decisões organizacionais (BHARGAVA; SRIDHAR;
HERRICK, 1999).
2.4 Componente Humano na Implantação de Sistema de Informação
Conforme Doherty e Doig (2003), a implementação de SI está crescentemente
resultando em impactos significativos na cultura das organizações. Mudanças maiores em
fluxo e qualidade de informações, produzidas através da implementação de “Data
Warehouse”, têm impacto na cultura organizacional. Uma análise desses casos sugere que
melhorias nos fluxos de informação podem ter o potencial para modificar a cultura
organizacional, particularmente as áreas de serviço ao consumidor, flexibilidade, integração e
delegação.
42
Para Falsarella e Chaves (1995), quando uma organização não possui SI que auxiliem
o processo de tomada de decisão, as decisões são baseadas em dados históricos e em
experiências individuais. Quando existe um SAD apoiando esse processo, as informações
fornecidas por ele são incorporadas aos dados históricos e experiências individuais,
possibilitando melhores condições para a tomada de decisão.
Conforme os autores, em qualquer das situações citadas, a saída ou a mudança do
usuário poderá causar grande impacto na organização. Isto acontecerá devido à perda da
história de como as decisões foram tomadas. O processo de tomada de decisão se desenrola,
portanto, através da interação constante do usuário com um ambiente de apoio à decisão
especialmente criado para dar subsídio às decisões a serem tomadas.
Partindo do princípio de que um SAD auxilia o processo de tomada de decisão, é
importante que seus conceitos retratem a cultura da organização e façam parte integrante dela,
não servindo apenas para atender às necessidades específicas de um usuário. Este é o principal
motivo para que as empresas implantem SI que auxiliam o processo de tomada de decisão. O
sucesso de um SAD, a sua continuidade e, principalmente, a motivação para que as pessoas
responsáveis pela tomada de decisão o utilizem, dependem dos seguintes fatores:
a. O modelo construído deve atender às necessidades gerais da organização e não somente às
necessidades específicas de um usuário;
b. Eventuais mudanças no sistema devem ser feitas rapidamente pelo analista de sistemas
para atender a novas necessidades de informação para apoio à decisão;
c. Informações sobre as decisões tomadas devem ser armazenadas e estarem disponíveis para
que outras pessoas as utilizem em novos processos de tomada de decisão;
d. A interface com o usuário deve ser a mais amigável possível;
e. A obtenção das informações, internas e externas à organização, deve ser imediata;
43
f. Os benefícios da utilização de SAD devem ser disseminados na organização através de
cursos, palestras, etc.
Com a introdução dos sistemas informatizados, surgiu a necessidade de troca de
dados, assim como a demanda por informações, emergindo com isso a sociedade da
informação, com uma série de recursos. Contudo, o problema da falta de preparo dos
colaboradores em processar as informações, a fim de mapear, perceber e interpretar seus
ambientes para guiar suas decisões e ações, tem de ser resolvido (FREIRE; SEIXAS;
CAZARINI,
2001).
Conforme Sferra e Côrrea (2003), para os tomadores de decisão se tornará cada vez
mais necessário saber aplicar as metodologias e técnicas estatísticas de forma correta e
interpretar as informações disponíveis, a fim de entender melhor o que acontece em seus
negócios e melhorar a qualidade de suas decisões. Desta forma, o aprendizado acadêmico dos
cursos de graduação deverá se adequar a essas rápidas mudanças promovidas pelo alcance
tecnológico em todas as áreas, pois todas as ferramentas estatísticas podem ser aplicadas e
servem para equacionar qualquer fenômeno, em qualquer área do conhecimento humano,
principalmente no processo decisório.
A “cultura do observador” formada por meio do conjunto de informações que ele
acumulou em sua experiência administrativa, científica e da própria experiência de vida,
associa-se a um modelo conceitual, no qual a percepção da realidade permite definir um
modelo conceitual. Cultura significa um misto de informação, experiência e criatividade. Um
modelo é uma representação da realidade, vista por meio dos recursos (cultura) do analista ou
decisor.
44
2.5 Atores do Processo de Informação
Para chegar-se a uma ampla compreensão dos valores, em qualquer problema de
decisão, é necessária a análise de cenários, que caracteriza em essência, o que se denomina
pensamento ou planejamento estratégico. É importante nesse cenário distinguir o grau de
influência dos decisores do processo de decisão. Segundo Gomes; Gomes e Almeida (2002)
pode-se definir:
a. Decisor: aquele a quem o processo decisório destina-se e que tem o poder e a
responsabilidade de ratificar uma decisão e assumir suas conseqüências;
b. Agidos: são pessoas às quais o programa é imposto, ou que são afetadas por ele;
c. Intervenientes: são pessoas que tomam decisões sobre os programas e tem ação direta
sobre a mudança;
d. Facilitador: é um líder experiente que deve focalizar sua atenção na resolução do
problema; e
e. Analista: é o que faz a análise e auxilia os facilitadores e o decisor na estruturação do
problema.
A produção e armazenagem de dados tem sido conceitualizada como um sistema de
manufatura de dados. No centro desse conceito estão os processos de produção de dados que
transformam dados em informações úteis aos consumidores de dados. Os autores
identificaram três papeis dentro dos sistemas de manufatura de dados: produtores de dados,
guardiões de dados e os consumidores de dados. Cada papel é associado a um processo ou
tarefa: Produtores de dados associados a processo de produção de dados; guardiões de dados
são associados com armazenagem de dados, manutenção e segurança; os consumidores de
dados com processos de utilização de dados os quais podem envolver agregação de dados
adicionais e integração (STRONG; LEE; WANG, 1997b).
45
Sobre papeis na manufatura de informações Wang, Ziad e Lee (2000), também
definem três papeis (chamados de três C):
a. Coletores de Informações ou “Collectors”: criam, coletam ou abastecem/suprem os
dados para o produto de informação. Estão associados ao processo de produção de dados;
b. Guardiões de informações ou “Custodians”: projetam, desenvolvem ou conservam a
infra-estrutura de sistema e dados para o produto de informação. Estão associados ao
armazenamento, manutenção e segurança; e
c. Consumidores de Informações (CI) ou “Consumers”: utilizam o produto de informação
no seu trabalho e estão associados ao processo de utilização dos dados, podendo implicar
agregação de dados adicionais e integração.
46
CAPÍTULO 3
REVISÃO DA LITERATURA
QUALIDADE DA INFORMAÇÃO
3.1 Qualidade da Informação
Para Wand e Wang (1996), a noção de qualidade de dados ou informações depende da
real utilização do dado. O que pode ser considerado um dado bom em um caso pode não ser
suficiente em outro. Esta relatividade da qualidade apresenta um problema. A qualidade dos
dados gerados por um sistema de informação depende do projeto do sistema. Ainda, o uso real
do dado está fora do controle do projetista. Portanto, é importante prover uma definição de
orientação de projeto de qualidade de dados que irá refletir a intenção de uso da informação.
A qualidade de dados depende dos processos de projeto e produção envolvidos na
geração do dado. Para projetar uma melhor qualidade é necessário primeiro entender o que
significa qualidade e como ela é medida” (WAND; WANG, 1996).
Para os autores, uma pobre qualidade de dados tem severos impactos na efetividade
geral de uma organização. Pesquisas revelaram que nos Estados Unidos, mais de 60% das
firmas de médio porte com vendas anuais de mais de 20 milhões de dólares, tinham
problemas com qualidade de dados. Nos arquivos de registros criminais nos EUA 50% a 80%
dos dados são incompletos, ambíguos, ou sem acuracidade.
47
Segundo Wang, Ziad e Lee (2000), um problema que a má qualidade de dados
provoca, muito pior que o custo direto, é o descrédito interno e externo e suas conseqüências
sobre os processos de tomada de decisão e sobre a percepção que os clientes e fornecedores
formam acerca dos sistemas da empresa. Por outro lado, a qualidade de dados da organização
pode ser considerada uma vantagem competitiva. Ainda são poucas as organizações que
adotam práticas estruturadas de gestão de dados e, sem esta prática, é certa a exposição a
riscos e falhas nas iniciativas de TI e de negócio.
Para Strong, Lee e Wang. (1997b), os impactos social e econômico da existência de
dados pobres custam bilhões de dólares as organizações. Os autores definem problemas de
qualidade de dados como qualquer dificuldade encontrada em uma ou mais dimensões de
qualidade que torna o dado completamente ou largamente não pronto para uso.
3.2 Produto de Informação e TDQM (“Total Data Quality Management”)
Dados e informação são freqüentemente usados como sinônimos na literatura. Na
prática, os gerentes diferenciam, intuitivamente, informação como dados que foram
processados. Existe uma analogia entre questões de qualidade na manufatura de produtos e
manufatura de informações. A manufatura de produtos pode ser vista como um sistema de
processamento que age em materiais brutos para produzir produtos físicos. Analogamente, a
manufatura da informação pode ser vista como um sistema agindo em dados brutos para
produzir um produto de informação (WANG; ZIAD; LEE, 2000).
Conforme Shankaranarayan, Ziad e Wang (2003), a abordagem Produto de
Informação (PI) ganhou considerável aceitação por várias razões:
a. produzir um PI é semelhante a produzir um produto físico;
48
b. PI, assim como os produtos físicos, podem ser “agrupados” baseando-se em características
similares e entradas de dados comuns, permitindo-se que o “grupo” possa ser gerenciado
como um todo; e
c. métodos aprovados para TQM (Total Quality Management) - tais como qualidade de
fontes e melhoria contínua - que têm sido aplicadas com sucesso na produção, podem ser
adaptados para o gerenciamento total da qualidade de dados.
Atualmente, os modelos de gestão de hierarquia rígida e centralização de decisões e
informações, não são adequados ao dinamismo do mercado. As empresas estão procurando
qualidade e eficácia dos serviços executados, principalmente das atividades relacionadas ao
gerenciamento de informações, pois a informação é o insumo básico do qual dependem todos
os processos de decisão e, para tomar decisões corretas, as empresas devem trabalhar com
informações sempre atualizadas, de acesso rápido, e respeitar os padrões pré-definidos
(FREIRE; SEIXAS; CAZARINI, 2001).
Para Santos, Amaral e Oliveira (2002), a gestão dos dados é uma das áreas que menos
atenção recebe no contexto organizacional, e é também aquela que tem menor sustentação de
um conhecimento teórico-prático. A discussão pode mesmo iniciar-se pelo significado da
trilogia dados – informação -conhecimento, exercício esse que muitas vezes extravasa a
utilidade dos seus resultados. A informação não é um recurso como outro qualquer.
Outro aspecto é a confusão entre informação e tecnologia. Para muitos, informação é
algo tecnológico, não sendo encarada como uma responsabilidade de gestão, mas como algo a
entregar aos analistas de informática.
Conforme Shankaranarayan, Ziad e Wang (2003), uma organização pode seguir certa
orientação para focar o projeto de qualidade de dados, identificando questões críticas e
desenvolvendo procedimentos e medidas para melhoria e análise contínuas. Sistema de
49
Manufatura de Informação (SMI) pode ser visto como um sistema que produz produtos de
informação. O conceito de produto de informação enfatiza a saída de informação de um
sistema de manufatura de informação com valor transferível ao consumidor interno ou
externo.
Para Wang (1998), o propósito da metodologia TDQM é a entrega de produtos de
informação (PI) de alta qualidade para os CI. Visa a facilitar a implementação em uma
organização como um todo de uma política de qualidade de dados formalmente expressa
como gerenciamento de alto nível. Fundamental para esta metodologia é a premissa de que as
organizações devem tratar informação como um produto que se move através dos sistemas de
manufaturas de informações, de forma muito parecida com a de um produto físico.
A seguir, a Tabela 1 descreve uma analogia entre manufatura de produto, baseado no
Total Quality Management (TQM), e manufatura de informação, criado para a prática de
qualidade de dados.
Sistema de Manufatura
Manufatura do Produto
Manufatura da Informação
Entrada
Material bruto
Dados brutos
Processo
Linha de montagem
Sistema de informação
Saída
Produto físico
Produto informação
Tabela 1 – Analogia Manufatura de Produto vs Manufatura de Informação (WANG; ZIAD; LEE. (2000)
Com a definição de um processo de produção da informação, é possível também fazer
uma analogia da aplicação das ferramentas e abordagens de qualidade aplicadas a produtos,
existindo assim a oportunidade de se trabalhar de forma objetiva com a qualidade da
informação (FAVARETTO; MATTIODA, 2005).
50
Uma analogia de aplicação de ferramenta pode ser feita sobre o conceito de
melhoramento contínuo, que implica literalmente um processo sem fim, questionando
repetidamente e re-questionando os trabalhos detalhados de uma operação do TQM. A
natureza repetida e cíclica do melhoramento contínuo é mais bem resumida do que é chamado
ciclo PDCA (Planejar, Fazer, Checar, Agir). O PDCA é a seqüência de atividades que são
percorridas de maneira cíclica para melhorar atividades (SLACK, 1999).
O método PDCA, que se baseia no controle de processos, foi desenvolvido na década
de 1930 pelo americano Shewhart, mas foi Deming seu maior divulgador, ficando
mundialmente conhecido ao aplicá-lo nos conceitos de qualidade no Japão. Neste sentido, a
análise e medição dos processos são relevantes para a manutenção e melhoria dos mesmos,
contemplando inclusive o planejamento, padronização e a documentação destes.
a. P (Plan) = Planejar: Definir o que se quer, planejar o que será feito, estabelecer metas e
definir os métodos que permitirão atingir as metas propostas.
b. D (Do) = Executar: Tomar iniciativa, educar, treinar, implementar, executar o planejado
conforme as metas e métodos definidos.
c. C (Check) = Verificar: Verificar os resultados que se está obtendo, verificar
continuamente os trabalhos para ver se estão sendo executados conforme planejados.
d. A (Action) = Agir: Fazer correções de rotas se for necessário, tomar ações corretivas ou
de melhoria, caso tenha sido constatada na fase anterior a necessidade de corrigir ou
melhorar processos.
Questões de qualidade de dados têm sido conduzidas em várias áreas de pesquisa, por
exemplo: gerenciamento da qualidade em SI, limpeza de dados, Data Warehousing,
integração de bases de dados heterogêneas e fontes de informação WEB. Baseando-se na
analogia entre dados e produtos manufaturados, uma extensão do TQM para dados foi
51
proposta: o TDQM. Quatro fases são reconhecidas como necessárias para gerenciar o Produto
de Informação: definição, medida, análise e melhoria (BERTOLAZZI; SCANNAPIECO,
2001).
Conforme Wang, Ziad e Lee (2000), a TDQM, analogamente ao ciclo PDCA,
compreende quatro passos (Figura 6). O primeiro passo é definir os requisitos de qualidade e
as métricas a serem adotadas. Em segundo, deve-se medir a qualidade ao longo do ciclo de
vida da informação nos sistemas e processos que a produzem. O terceiro passo, é a analise e
identificação de potenciais causas dos problemas de qualidade. Por fim, especifica-se e
implementam-se as melhorias nos processos e sistemas para manter a qualidade dos dados e
prevenir eventuais vulnerabilidades.
Figura 6 – Ciclo PDCA para o TDQM – Adaptado Wang; Ziad e Lee (2000)
52
Conforme Lee et al. (2004), o estado do mundo real é dinâmico e não estático,
mudando ao longo do tempo. A Figura 7 demonstra o ciclo de melhoramento da qualidade na
visão dos autores.
Figura 7 – Ciclo de Melhoramento da Qualidade de Dados - Adaptado de Lee et al. (2004)
Conforme Al-Hakim (2004) existe diferença entre manufatura de produtos e
manufatura de informações, que podem ser classificadas sob cinco categorias principais. A
seguir, apresentam-se as principais diferenças entre o processamento do produto e o
processamento da informação:
a. Intangibilidade: Os produtos feitos pela fabricação são tangíveis, visíveis ou físicos
enquanto que a informação é intangível. A qualidade do produto pode ser medida por
53
medidas físicas como as especificações do projeto. As medidas para a QI são subjetivas e
baseadas principalmente na opinião dos usuários e expectativa.
b. Inserção: O processamento do produto requer matéria prima, experiência / conhecimento,
tecnologia, enquanto que o processamento da informação requer quatro inserções: dados,
experiência, tecnologia e tempo.
c. Consumidor Final: Os usuários do produto final são indefinidos no passado, enquanto
que são claramente definidos no futuro. O consumidor de um sistema de informação é
parte do sistema, enquanto que os produtos são produzidos longe dos consumidores.
d. Consumo: As matérias primas utilizadas no processamento da informação são dados que
podem ser consumidos por mais de um consumidor sem depreciação, não sendo como as
matérias primas na fabricação do produto que pode somente ser utilizada por produtos
físicos únicos. Além disso, a informação pode ser produzida e consumida
simultaneamente, enquanto que produtos precisam ser produzidos antes do consumo.
e. Negociação: Produtos desagradáveis, mesmo dados e informações, podem ser
transportados para um número indefinido de consumidores simultaneamente por
transportadores físicos, ex., disco, ou por meio intangível, ex., e-mail. No entanto, ambas,
informações e produtos podem ser guardados e inspecionados antes do envio para os
consumidores. Isso faz a QI similar ao produto, mas se diferencia da qualidade de serviço,
pois a qualidade do serviço não pode ser guardada e inspecionada antes do envio.
Segundo Naumann, Leser e Freytag (1999), não existe uma definição comum ou
conclusiva ou medida para a QI ou para a qualidade de uma fonte de informação, longe destas
noções gerais como "adequação ao uso". Os autores definem QI como um conjunto de
critérios de qualidade. Uma fonte de informação ou um plano de questionamento atinge certos
valores em cada um desses critérios.
54
3.3 Estratégia da Qualidade da Informação
A maioria das organizações sofre de abundância de dados redundantes e
inconsistentes, difíceis de administrar com eficiência e mais difíceis de serem usados para fins
de suporte à decisão. A não implementação de sistemas e métodos para realizar análise dos
dados resultará em sérias desvantagens para as empresas (SINGH, 2001).
As decisões envolvendo aspectos das organizações podem falhar por falta de
instrumentos racionais e objetivos que permitam auxiliar o decisor. Paradoxalmente, enquanto
as empresas lidam com todos os recursos computacionais de processamento e gerenciamento,
não conseguem absorver o uso de ferramentas de apoio à decisão. Os conceitos DW e
ferramentas OLAP, desenvolvidos a partir da necessidade das grandes corporações de dispor
de melhores informações para tomada de decisão, alteram as possibilidades para uso da
informação analítica.
Porém, grande parte das soluções implementadas responde apenas questões táticas
específicas dos departamentos, usufruindo apenas uma pequena parte dos benefícios
potencializados pelos sistemas de informação que apóiam a tomada de decisão e a inteligência
do negócio, sendo essas questões que precisam ser respondidas pelo DW e viabilizam a
implementação de estratégias que não poderiam ser postas em prática sem esse suporte
analítico (PENNA; REIS, 2003).
Conforme Graeml (2000), “a maioria dos profissionais e das empresas ainda não estão
preparados para administrar, de forma eficaz, projetos de informática com objetivos
estratégicos. Por muito tempo, a informática serviu de suporte às atividades empresariais.
Agora, deve-se utilizá-la para impulsionar as estratégias da organização, agregando valor ou
mesmo transformando a forma tradicional de se fazer negócios”.
55
Para Pierce (2004), antes de desenvolver uma estratégia de QI do produto, é
importante expressar a visão geral de que contexto de QI deve funcionar na cultura e nos
valores compartilhados da organização, seguidos de uma definição clara dos objetivos
precisos da QI, especialmente se eles estão relacionados com o contexto geral de qualidade da
organização.
A estratégia de qualidade do produto de informação deve documentar os mecanismos
pelos quais estes objetivos devem ser ativados para um produto de informação específica ou
linha de produto. Além de expressar a visão, a cultura, e os valores compartilhados da
organização assim como definindo a oportunidade de negócio, este estatuto da missão deve
fornecer um guia e direcionar os indivíduos com firmeza para as ações que eles devem ter. O
estatuto da missão deve explicar como a QI se encaixa no posicionamento estratégico
desejado.
Como parte do desenvolvimento de uma estratégia efetiva de qualidade de informação
do produto, o gerenciador do produto de informação deve primeiro identificar os seus clientes,
a fim de obter uma lista de dimensões da qualidade de dados que são importantes para estes
consumidores. Uma vez estas definidas, pode então determinar a importância relativa de cada
uma e a amplitude em que tipos diferentes de consumidores do produto de informação estão
preparados para negociar um aspecto de qualidade de dados para outro.
56
3.4 Dimensões da Qualidade da Informação
Conforme Al-Hakim (2004), assim como no gerenciamento de produtos físicos, a QI
tem múltiplas dimensões. A escolha destas dimensões foi primeiramente baseada no
entendimento intuitivo, experiência individual, ou revisão bibliográfica e depende do uso
atual da informação. Boas informações para um usuário específico podem não ser suficientes
em outro caso, podendo cada dimensão ser considerada como um indicador compreendendo
várias medidas. A Tabela 2 explana as dimensões da QI que se referem a assuntos que são
importantes para os CI.
Tabela 2 – Dimensões da Qualidade de Dados e suas Medidas (AL-HAKIM, 2004)
57
Para Favaretto (2005), “o senso comum aponta a Acuracidade como sendo a própria
QI, sendo esta apenas uma das dimensões. A categoria Intrínseca mostra o fato de a
informação ter qualidade em si mesma. Acessibilidade e Representação enfatizam a
importância do papel dos SI, que fazem o papel do SMI. A categoria Contextual mostra a
inserção da informação em seu meio de utilização”.
Segundo Burgess, Gray, e Fiddian (2004), embora a qualidade de dados seja um termo
difícil de definir, algumas pesquisas foram conduzidas nessa área demonstrando a variedade
de definições de qualidade e modelos que foram desenvolvidos através da seleção em vários
domínios descritos na Tabela 3: Qualidade de software, qualidade de dados, qualidade da
informação e qualidade WEB. A despeito de todas as pesquisas conduzidas na tentativa de
criar uma definição de qualidade “não existe uma definição padrão única para qualidade”,
porém, usando diferentes terminologias (tais como, atributos critérios e métricas), todas
identificam:
a. Importância de uma definição de qualidade; e que
b. A qualidade é uma entidade de múltiplos atributos.
A maioria também concorda que os múltiplos atributos usados para definir qualidade
podem ser agrupados em categorias relacionadas, representando uma estrutura hierárquica.
58
Projeto Ano Framework Qualidade
Definição de Qualidade de Software
Barbacci et al 1995 4 modelos para cada 4 atributos primários, com um total
de 13 relações
Boehm et al 1976 Estrutura da árvore hierárquica comparando 10 categorias
e 15 métricas
Dromey 1995 3 modelos contendo 17 atributos e 42 sub-atributos únicos
(repetidos entre os modelos)
Hyatt & Rosenberg 1996 4 objetivos e 13 atributos
ISSO 9126-2001 2001 2 modelos: a) Qualidade de software interno e externo – 6
dimensões e 34 métricas b) Qualidade em uso – 4 métricas
Liu et al 2000 3 fatores e 8 critérios
McCall 1977 3 classes, 11 fatores e 23 critérios
Ortega et al 2001 6 métricas
Royce 1990 4 métricas
Ruby & Hardwick 1968 7 descrições de atributos
Definições de Qualidade de dados
Abate et al 1998 4 categorias e 15 dimensões
Cykana et al 1996 6 características
Gardyn 1997 5 dimensões
Long & Seko 2002 5 dimensões e 24 características
Naumann 2002 4 dimensões e 22 métricas
Redman 1996 3 categorias e 27 dimensões
Wang e Strong 1996 4 categorias e 15 dimensões
Definições de Qualidade da Informação
Bovee et al 2001 4 critérios e 10 componentes
Dedeke 2000 5 dimensões e 28 métricas
Eppler 2001 4 níveis de qualidade e 16 critérios
Matsumura & Shouraboura 1996 2 categorias e 4 atributos
Miller 1996 10 dimensões
Definições de Qualidade WEB
Aladawni& Palvia 2002 4 dimensões e 25 itens
Chen et al 1998 10 parâmetros de qualidade
Olsina et al 2001 Modelo Hierárquico contendo 100 métricas
Zhu & Gauch 2000 15 métricas
Tabela 3: Seleção das Definições Atuais da QI (BURGESS; GRAY;FIDDIAN, 2004)
Wang e Strong (1996), identificaram empiricamente quinze critérios da QI
considerados por consumidores de dados como os mais importantes. Sua estrutura já havia
sido utilizada eficientemente pela indústria e o governo (apud NAUMANN; LESER;
FREYTAG, 1999).
Para melhorar a qualidade de dados, é preciso entender o que qualidade de dados
significa para o consumidor. Os autores avaliaram a QI disposta em quatro categorias e quinze
dimensões, a seguir relacionadas:
a. Intrínseca: acuracidade, objetividade, credibilidade e reputação;
59
b. Acessibilidade: acesso e segurança;
c. Contextual: relevância, valor agregado, temporalidade, integridade / completeza /
perfeição e quantidade de dados;
d. Aspectos Representacionais: interpretabilidade, fácil entendimento, representação
concisa e representação consistente.
Na Tabela 4 encontram-se as Categorias, Dimensões e Definições, adaptadas de alguns
autores, focando principalmente as definições das dimensões:
Categoria
Dimensão Definição
Acuracidade (accuracy ) a extensão do quanto a informação é correta e confiável
Credibilidade (believability) a extensão do quanto a informação é considerada como
verdadeira e verossímil
Objetividade (objectivity) a extensão do quanto a informação é imparcial
Intrínseca
Reputação (reputation) a extensão do quanto a informação é altamente considerada em
termos de sua fonte ou conteúdo
Acessibilidade (accessibility) a extensão do quanto a informação está disponível, ou fácil e
rapidamente recuperável
Acessibilid
ade
Segurança no acesso (Access
security)
a extensão do quanto o acesso a informação é restrito
apropriadamente para manter sua segurança
Integridade / Completeza / Perfeição
(Completeness)
a extensão do quanto a informação não está extraviada e é
suficiente para a tarefa em amplitude e profundidade
Quantidade de informação apropriada
(appropriate amount)
a extensão do quanto o volume da informação é apropriado para
a tarefa ser executada
Relevância (relevancy) a extensão do quanto a informação é aplicável e útil
p
ara a tarefa
a ser realizada
Temporalidade / Oportunidade
(timeliness)
a extensão do quanto a informação está suficientemente
atualizada
para a tarefa a ser realizada
Contextaul
Valor Agregado (Value-added) a extensão do quanto a informação é
b
enéfica e proporciona
vantagens por seu uso
Facilidade de entendimento (ease o
f
understanding )
a extensão do quanto a informação é facilmente compreendida
Facilidade de manipulação /operação
(ease of manipulation /operacion)
a extensão do quanto a informação é fácil de ser manipulada e
aplicada em diferentes tarefas
Interpretabilidade( interpretability) a extensão do quanto a informação está em linguagem
apropriada, símbolos e unidades, e as definições são claras
Representação concisa (concise
representation)
a extensão do quanto a informação está compactamente
representada
Representativa
Representação consistente (consistent
representation)
a extensão do quanto a informação é apresentada em um mesmo
formato
Tabela 4 - Categorias, Dimensões e Definições da QI. Adaptado de Wang; Ziad; Lee (2000), Strong; Wang.
(2002), Lee et al. (2002) e Pipino; Lee; Wang (2002)
60
Para Bertolazzi e Scannapieco (2001), em um Sistema de Informação Coorporativo
(SIC), as mais importantes dimensões intrínsecas e aquelas consideradas mais relevantes no
ambiente cooperativo são: acuracidade, integridade, circulação, e consistência interna. Nas
dimensões de processos específicos, em SIC, o processo cooperativo prove o contexto e as
dimensões de qualidade de dados são relativas à evolução dos dados no tempo e dentro do
processo. Dimensões de processos específicos estão ligadas a trocas de dados específicas
dentro de um processo, em vez de no processo como um todo.
Numa visão ontológica, segundo Wand e Wang (1996), a visão interna de um SI deve
preocupar-se com o uso e efeito de um SI. Ela diz respeito ao propósito e justificações do
sistema e seu desdobramento na organização. Na visão externa, um sistema de informações é
considerado “entregue”, isto é, uma caixa preta com a funcionalidade necessária para
representar o sistema do mundo real. A visão interna preocupa-se com a construção e
operação necessárias para atingir a funcionalidade requerida, oferecendo um conjunto de
requisitos que refletem a visão externa, conforme o descrito na Tabela 5:
Visão
Dimensões
Visão Interna
(projeto, operação)
Relacionadas a dados: acuracidade, confiabilidade, temporalidade, Integridade,
aceitação/uso geral, consistência, precisão
Relacionadas a sistemas: confiabilidade
Visão Externa
(uso, valor)
Relacionadas a Dados: temporalidade, relevância, satisfação, importância,
quantidade suficiente, utilização, utilidade, clareza, concisão, imparcialidade,
informatividade, nível de detalhe, quantitatividade, escopo, interpretabilidade,
compreensibilidade
Relacionadas a sistemas: temporalidade, flexibilidade, formato, eficiência
Tabela 5: Dimensões da Qualidade de Dados – Visão Ontológica (WAND; WANG, 1996)
61
Apesar de existirem diversas propostas de critérios para a avaliação da qualidade de
dados, ainda não há um consenso em relação ao conjunto de critérios que melhor expressa o
conceito de qualidade no âmbito dos dados. Amaral e Campos (2004) em seu artigo
Modelando Metadados de Qualidade no Data Warehouse. para a avaliar QI, selecionaram um
conjunto de critérios, tendo como base os critérios propostos por vários autores, além dos
critérios identificados em entrevistas realizadas em empresas com diferentes perfis. São eles
apresentados a seguir:
a. Acuracidade: Representa a distância entre dois valores v e v’, sendo v considerado o valor
correto. Pode ser classificada em três tipos: acurácia sintática, acurácia semântica e
acurácia do conteúdo.
b. Credibilidade / Precisão: Grau no qual o valor do dado corresponde a um valor
aproximado em relação ao valor real . A diferença entre o dado e o valor real não ocorre
devido a erros, e sim a aproximações realizadas de forma proposital.
c. Integridade / Completeza: É o grau no qual os elementos de um esquema estão presentes
nas instâncias. No DW, os problemas de completeza podem ser causados por diversos
motivos, tais como, carga incompleta na tabela de fatos e dimensões incompletas. Outro
aspecto importante é a forma como são tratados os valores nulos.
d. Atualidade: É a diferença de tempo entre o instante em que o dado é atualizado na origem
e o instante em que ele é disponibilizado no DW. É o caso de informações que podem
variar com o tempo, como dados de endereço.
e. Reputação: Corresponde à credibilidade da organização de origem, que atua como fonte
dos dados do DW. Esse critério possui especial relevância no contexto
interorganizacional, onde a origem da informação pode ser externa à organização.
62
f. Alterações Propositais: Grau de alteração proposital nos dados. É o caso, por exemplo, de
informações provenientes de diferentes organizações que, por motivos políticos, não
podem ser apresentadas com seu valor real.
g. Confiabilidade: A confiabilidade expressa o grau de confiança que usuários têm nos dados
Uma definição mais objetiva desse critério apóia-se no fato de que a confiança do usuário
é diretamente proporcional à capacidade do DW de refletir corretamente os dados dos
sistemas transacionais.
3.5 Qualidade de Dados Pobre e Remendos Típicos
Para Strong, Lee e Wang (1997a), uma qualidade pobre de informação pode gerar o
caos, a menos que a causa seja diagnosticada. Esforços para sua melhoria seriam similares a
tentar remendar buracos de uma estrada. Os autores identificam três tarefas dentro do Sistema
de Manufatura de Informações, e as associaram a processos. A Tabela 6 descreve as dez
causas chaves, sinais de alerta e remendos típicos, e seus respectivos processos e efeitos na
organização considerando também as dimensões afetadas:
a. Produtores de informação geram e provêm informações, a matéria prima para o SMI:
Três problemas são o resultado direto de como trabalham os produtores de informação e
processos de produção da informação. Processos de produção pobremente projetados e
gerenciados geram pobre qualidade da informação como matéria prima (itens a1, a2 e a3
na Tabela 6).
b. Guardiões de informação provêm e gerenciam fontes computacionais para
armazenamento, manutenção e segurança da informação:
63
Três problemas são a conseqüência das dificuldades em armazenar grandes quantidades de
informações variadas através de diferentes sistemas computacionais (itens b1, b2 e b3 na
Tabela 6).
c. Consumidores de informação acessam e utilizam as informações para suas tarefas. A
utilização pode envolver informações adicionais, agregação e integração:
Quatro problemas são a evidência da falha em atender aos requisitos do consumidor
visando análises avançadas no contexto do mutável ambiente de tarefa do consumidor de
informação (itens c1, c2, c3, e c4 na Tabela 6).
No caso específico do Consumidor de Informação temos que:
c1. Análise de conteúdo automatizada, em coleções de informação ainda não está disponível:
Prover ao consumidor acesso à informação não numérica distribuída entre os sistemas não
é suficiente. Se a informação tem relevância e algum valor agregado, o consumidor deve
também ser capaz de agregar, manipular e utilizar essas informações para computar
tendências. Um problema relacionado é a dificuldade de analisar tendências entre
informações armazenadas em sistemas múltiplos com inconsistentes definições, nomes ou
formatos.
c2. A medida em que mudam as tarefas dos CI e o ambiente organizacional, a informação que
é relevante e útil também muda:
A informação somente é de alta qualidade se atender as necessidades das informações dos
consumidores; somente eles fazem isso satisfazer o aspecto contextual da QI. Prover a
informação que os consumidores precisam é um problema difícil porque existem
múltiplos consumidores, e cada um deles pode ter diferentes necessidades. Além disso,
essas necessidades mudam ao longo do tempo. Enquanto uma solução inicial para as
64
necessidades dos CI pode ser satisfatória, ao longo do tempo a qualidade da solução se
deteriora.
c3. Fácil acesso à informação pode conflitar com requisitos de segurança privacidade e
confidencialidade:
Para os CI, informação de alta qualidade é informação que é facilmente acessível. Garantir
privacidade, confidencialidade e segurança da informação, entretanto, requer barreiras ao
acesso. Neste caso, acessibilidade e segurança tendem a conflito. Solucionar esses
problemas significa encontrar soluções ad hoc para privacidade, confidencialidade ou
segurança a medida em que eles aparecem.
c4. Falta de fontes suficientes de computação limitam o acesso:
Não prover recursos pode no fim custar mais caro. Uma solução de longo prazo é
desenvolver políticas de atualização tecnológica.
65
Sinais de Alerta e Remendos Típicos de uma
Qualidade de Dados Pobre
Processo / Efeitos na Organização Dimensões afetadas
Produção da Informação a1. Múltiplas fontes da mesma informação
produzem diferentes valores
Financeiro e Problemas legais
Consistência e
credibilidade
Produção da Informação a2. Informação que é produzida utilizando
julgamentos subjetivos conduz ao viés
Financeiro e Problemas legais
Objetividade e
Credibilidade
Produção da Informação a3. Erros sistêmicos na produção da
informação levam a perda da informação
Informação perdida ou distorcida
Integridade e
Relevância
Armazenagem da Informação
b
1. Grandes volumes de informações
armazenadas tornam difícil o acesso a
informação em um tempo razoável
Excesso de tempo requerido para
extrair e sumarizar informação
Representação
Concisa,
Temporalidade,
Valor Agregado e
Acessibilidade
Armazenagem da Informação b2. Sistemas distribuídos de forma heterogênea
conduzem a valores, definições e formatos
inconsistentes
Informação inconsistente que é difícil
para acessar e agregar
Representação
Concisa,
Temporalidade e
Valor Agregado
Armazenagem da Informação b3. Informação não numérica é difícil de
indexar
Dispendioso custo de armazenamento
da informação, com um pequeno
potencial de benefício
Representação
Concisa, Valor
Agregado e
Acessibilidade
Utilização da Informação c1. Análise de conteúdo automatizada, em
coleções de informação ainda não está
disponível
A análise de informações de imagem
e texto armazenadas de forma
eletrônica, é muito limitada
Representação
Consistente,
Relevância e Valor
Agregado
Utilização da Informação c2. A medida em que mudam as tarefas dos CI
e o ambiente organizacional, a informação que
é relevante e útil também muda
Desenvolvimento de diferenças entre
a informação disponível e o que é
necessário para as tarefas
Relevância, Valor
Agregado e
Integridade
Utilização da Informação c3. Fácil acesso à informação pode conflitar
com requisitos de segurança privacidade e
confidencialidade
Mecanismos para seguramente barrar
o acesso, então a informação provê
menos valor
Segurança,
Acessibilidade e
Valor Agregado
Utilização da Informação c4. Falta de fontes suficientes de computação
limitam o acesso
Falta de fontes de computação limita
a qualidade da informação
Acessibilidade e
Valor Agregado
Tabela 6: Qualidade de Dados Pobre e Remendos Típicos (Baseado em STRONG; LEE, WANG, 1997a)
66
3.6 A Informação na Perspectiva do Consumidor de Informação
Para o consumidor de dados, um dado pronto para uso significa: que é acurado, crível,
objetivo, relevante, oportuno, com reputação, valor agregado, apropriado em quantidade, tem
representação concisa consistente e completa, é interpretável, acessível, compreensível e
seguro (WANG; STRONG, 1996). Conforme Arndt e Langbein (2002), qualidade de dados é
"encontro consistente das “expectativas” dos consumidores de informação".
A qualidade de uma informação pode ser maior ou menor, dependendo de que quem
está avaliando. Uma informação considerada de qualidade pelo administrador do DW por
estar preenchida (completeza) e pertencer ao domínio (acurácia sintática), pode não ser
considerada de qualidade pelo usuário final por se tratar de um valor estimado, por exemplo
(AMARAL; CAMPOS, 2004).
Essa diferença de foco significa que as definições de qualidade que têm surgido para
uso por provedores de informação, não são apropriadas para o CI. O típico CI quer encontrar
a melhor informação disponível que atenda seus requisitos, num momento apropriado e no
seu domínio de interesse atual. Isso pode não necessariamente ser o melhor resultado possível,
na medida em que o consumidor sempre tem restrições, tal como o tempo disponível para
pesquisar a informação.
Uma classificação diferente da dimensão da qualidade de dados foi desenvolvida por
Angeles (2004) baseada na perspectiva do consumidor de dados. Categorias de qualidade de
dados foram identificadas como intrínseca, acessibilidade, contextual e representativa, sendo
o método de medida da qualidade de dados não endereçado. A seguir, a Tabela 7 descreve
cada categoria sendo diretamente relacionada a diferentes dimensões da qualidade de dados.
67
Categoria de QD
Interesses da QD
Causas
Dimensões da QD
QD Intrínseca
Despareamento entre
referências de um mesmo
dado são uma causa comum
do interesse da QD intrínseca.
Múltiplas referências de um
mesmo dado.
Julgamento envolvido da
produção dos dados.
Exatidão,
Objetividade,
Confiabilidade,
Reputação.
Qualidade de
Acessibilidade de
Dados
Baixos recursos
computacionais.
Problemas na privacidade e
confidencialidade:
Interpretação.
Entendimento.
Representação dos dados.
Sistemas difíceis de acessar.
Deve proteger a
confidencialidade.
Dimensões da QD
representativa são causas
relevantes do problema da
qualidade de acessibilidade de
dados.
Acessibilidade e
Segurança no
Acesso
Qualidade
Contextual de
Dados
Problemas operacionais da
produção de dados:
Mudança de necessidades dos
consumidores de dados.
Computação distribuída.
Dados incompletos.
Representação inconsistente.
Inadequação definida ou dados
mensurados.
Resultados de dados que não
poderiam ser propriamente
agregados.
Relevância, Valor
Agregado,
Prontidão,
Completeza,
Integridade e
Quantidade de
Dados.
QD Representativa
Computação e análise de
dados.
Dados computadorizados
inacessíveis porque:
Muitos especialistas são
necessários para interpretar os
dados entre muitas
especialidades.
Capacidade limitada de se
relacionar entre a imagem e o
texto dos dados.
Interpretabilidade,
Facilidade de
Entendimento,
Concisão,
Representação
Consistente e
Prontidão
Tabela 7: Classificação da QI Baseada na Perspectiva do Consumidor de Informação (ANGELES, 2004)
68
3.7 Avaliação da Qualidade da Informação
Conforme Wang e Strong (1996), três aproximações são utilizadas na literatura para
estudar a qualidade de dados: uma intuitiva, uma teórica e uma aproximação empírica.
a. Aproximação intuitiva: é feita quando a seleção da qualidade dos atributos dos dados
para qualquer estudo particular é baseada na experiência dos pesquisadores ou por
entendimento intuitivo a respeito de quais atributos são "importantes". A maior parte dos
estudos de qualidade de dados cai nesta categoria. Nenhum desses estudos, no entanto,
coletam empiricamente atributos de qualidade de dados dos consumidores de dados.
b. Aproximação teórica: Mesmo as aproximações teóricas sendo freqüentemente
recomendadas, a pesquisa oferece poucos exemplos. Um estudo usa uma aproximação
ontológica, onde os atributos da qualidade de dados são derivados com base nas
deficiências dos dados, que são definidas como as inconsistências entre a visão do sistema
do mundo-real (que podem ser inferidas do sistema de informação representativo) e a
visão que pode ser obtida por observação direta do sistema do mundo-real.
A vantagem da utilização de uma aproximação intuitiva é que cada estudo pode
selecionar os atributos mais relevantes para os objetivos particulares daquele estudo. A
vantagem de uma aproximação teórica é o potencial para prover uma demonstração
compreensível dos atributos da qualidade de dados que estão intrínsecos a um produto de
dados. O problema de ambas as aproximações é que elas falham ao capturar a voz do
consumidor.
c. Aproximação empírica: Captura os atributos da QD que são importantes para os
consumidores de dados. Analisa a qualidade de dados para determinar as características
que eles costumam buscar para que os dados se encaixem em suas tarefas. Para tanto,
69
estas características não podem ser teoricamente determinadas ou intuitivamente
selecionadas pelos pesquisadores.
A vantagem da aproximação empírica é que ela captura a voz dos consumidores.
Além do mais, isto pode revelar características que os pesquisadores não têm considerado
como parte da qualidade de dados. A desvantagem é que resultados completamente corretos
ou completos não podem ser provados por princípios fundamentais.
Baseando-se na limitada literatura relevante, no conceito de adequação para
utilização da literatura de qualidade, e em nossas experiências com os consumidores de dados,
propomos uma estrutura conceitual preliminar para a qualidade de dados que inclui os
seguintes aspectos:
a. os dados devem ser acessíveis para o consumidor de dados;
b. o consumidor deve ser capaz de interpretar os dados;
c. os dados devem ser relevantes para o consumidor; e
d. o consumidor deve encontrar os dados exatos.
Uma classificação de avaliação orientada para critérios de QI, foi apresentada por
Naumann e Rolker (2000), onde identificaram três classes de critérios de avaliação, com
respeito a: informação do usuário, própria fonte de informação e processo de questionamento.
Para os autores, cada classe de avaliação tem seus próprios problemas e incertezas. Então,
independente da classe de avaliação e o critério específico de QI, é praticamente impossível
obter-se valores totalmente realistas e verdadeiros.
Mesmo assim, é muito importante ter uma descrição detalhada das avaliações
disponíveis para os avaliadores e os usuários e também repetir a avaliação regularmente. É
desejado para o futuro ter um padrão descrevendo como e quando a avaliação deve ser feita.
70
Conforme Pipino, Lee e Wang (2002), para responder a questão do quanto boa é a
qualidade de dados de uma organização, se requer medidas de QI utilizáveis. As organizações
devem lidar com as percepções subjetivas dos indivíduos envolvidos com os dados e com as
medidas objetivas baseadas no conjunto de dados em questão.
Avaliações subjetivas da qualidade de dados refletem as necessidades e experiências
dos envolvidos: os coletores, guardiões, e consumidores de produtos de dados. Avaliações
objetivas podem ser tarefas independentes ou tarefas dependentes. Medidas de tarefas
independentes refletem a condição do dado sem o conhecimento contextual da aplicação, e
pode ser aplicado em qualquer conjunto de dados, desconsiderando as tarefas em mãos.
Medidas de tarefas dependentes, que incluem as regras comerciais da organização fornecidas
pelo administrador da base de dados, são desenvolvidas em contextos específicos de
aplicação.
Três formas funcionais dessas medidas são: proporção simples, operação mínima ou
máxima, e média estimada. Refinamentos destas formas funcionais, como a adição de
parâmetros de sensitividade, podem facilmente ser incorporados. Freqüentemente, a tarefa
mais difícil é definir uma dimensão, ou o aspecto da dimensão que demonstre a aplicação
específica da companhia. A formulação da medida acontece assim que a tarefa se completa.
Para usar as medidas subjetivas e objetivas para aprimorar os requerimentos da
qualidade de dados da organização são necessários três passos:
a. Desempenhar a avaliação de qualidade de dados subjetiva e objetiva;
b. Comparar os resultados das avaliações, identificar discrepâncias, e determinar as raízes
das discrepâncias; e
c. Determinar e realizar as ações necessárias para o melhoramento.
71
A experiência sugere que um conjunto de medidas de "tamanho único" não é uma
solução. Melhor, a busca da qualidade de dados é um esforço em andamento que requer
disponibilidade dos princípios fundamentais destacando o desenvolvimento das medidas de
qualidade de dados subjetiva e objetiva.
Em seu estudo de Validação Empírica da Estrutura de um Modelo de QI, Bovee
(2004) utilizou a escala Likert, para o conjunto de afirmações que era precedido pelas
questões na estrutura, e cada afirmação era seguida por 7 pontos. Em todos os casos, as
primeiras afirmações eram relativas a importância da construção da frase para permitir a
comparação da importância percebida na construção dos atributos com percepções de
atributos de informações reais recebidas, conforme descrita na Figura 8:
Figura 8 – Escala Likert (BOVEE, 2004)
A estrutura do modelo demonstrou ter habilidade para predizer percepções da QI,
sendo os elementos avaliados considerados muito importantes.
Para Shankar e Watts (2003), a avaliação de critérios de QI é uma tarefa difícil. A
avaliação deveria ser tão precisa e prática quanto possível. Este é um conflito de objetivos e
um compromisso difícil de alcançar. Uma avaliação imprecisa pode tanto resultar em uma
informação recuperada de baixa qualidade ou levar a evitar informações de alta qualidade.
Avaliação imparcial também pode resultar em uma avaliação imprecisa ou levar a uma
avaliação indevida de tempo e custo.
72
Tendo como objetivo obter valores reais, perceberam que cada classe de avaliação tem
seus próprios problemas e incertezas. Então, independente da classe de avaliação e critério
específico de QI, é praticamente impossível obter-se valores totalmente realistas e
verdadeiros.
Para Pierce (2004), como parte do desenvolvimento de uma estratégia efetiva de QI, o
gerenciador poderá determinar a importância relativa de cada uma das dimensões da
qualidade e a amplitude. Como os consumidores irão variar em suas visões, o administrador
do produto de informação (PI) deve formular os objetivos de QI dependendo das respostas
dos consumidores para as seguintes questões:
a. Do ponto de vista do consumidor, quanto importante é uma dimensão particular de
qualidade comparada a outra dimensão de qualidade no contexto da QI?
b. Que componentes de dados e suas dimensões associadas da qualidade de dados
contribuem melhor para a satisfação geral do consumidor com o produto de informação?
c. Que dimensões da QI são vistas como prioridades pelos consumidores quando eles fazem
sua escolha do suprimento de PI?
Para descobrir as respostas para estas perguntas, podem-se empregar várias técnicas:
a. Técnica de Pesos: Esta técnica incorpora uma escala de alcance. Os consumidores
poderiam atribuir um peso de 1 a 10 para cada componente de dados das dimensões da
qualidade de acordo com a importância que eles dão a cada elemento. A desvantagem
desta técnica é que quase todos tenderão a taxar a maior parte das dimensões de qualidade
de dados como sendo altamente importantes, especialmente se estas dimensões de
qualidade de dados foram geradas originalmente em uma base de significância para os
consumidores.
73
b. Técnica de Negociação: Freqüentemente referida como um conjunto de análises na área
da pesquisa de marketing, esta técnica é baseada no conceito das negociações. Para
conduzir esta análise, é necessário especificar uma lista de níveis ou opções para cada
dimensão de QI. Por exemplo, para um atributo de QI como a reputação, que indica a
extensão em que os dados são de confiança ou altamente confiados em termos de sua
fonte ou conteúdo, alguém poderia escolher valores como "Altamente Respeitado",
"Respeito Médio", "Pouco Respeito", e "Sem Respeito".
Para definir quanto os consumidores do PI preferem um PI que revela uma certa
combinação de opções de atributos de qualidade, pode-se usar uma variedade de métodos de
inspeção como listado a seguir:
a. Aproximação próprio-explicada: Os respondentes tacham os níveis de cada atributo de
QI do mais para o menos preferido e depois avaliam o peso de importância de cada
atributo. O contexto próprio-explicado dá ênfase à avaliação dos Produtos de Informação
em uma sistemática maneira de dimensionar a qualidade dimensão-por-qualidade, ao
invés de julgar o produto de informação como um todo ou em um contexto competitivo.
b. Conjunto tradicional de comparações: os respondentes são apresentados com dois ou
mais conjuntos de qualidade diferentes para um PI e são designados a tachar os diferentes
conjuntos de qualidade de acordo com sua preferência.
c. Conjunto de análise baseado em escolha: Os respondentes são apresentados com dois
ou mais conjuntos de qualidade para um PI e são designados a escolher que conjunto de
qualidades eles usariam.
Desconsiderando o método escolhido, as preferências dos respondentes podem ser
examinadas individualmente, plotadas (ou medidas) em uma simples função de utilidade, ou
quebradas em segmentos que possuem preferências similares.
74
3.8 Síntese da Revisão da Literatura
Neste item será apresentada uma síntese da Revisão da literatura que irá ser utilizada
no estudo. Conforme a literatura sobre TI e SI, a aplicação será efetuada em empresas que
possuam um dispositivo que trate dos dados de forma sistêmica aplicada ao processo; que use
a TI para manipular e gerar informações, ou seja, onde exista um processo de transformação
de dados em informações que serão utilizadas no processo decisório para sustentação
administrativa que otimize os resultados esperados.
As empresas deverão estar em um estágio de utilização da informática igual ou
superior ao de integração, onde os SI são orientados a atender as necessidades dos níveis
gerenciais, as informações são de melhor qualidade, sendo exigida maior integração, de forma
que seu SI esteja classificado no estágio de Sistemas Gerenciais ou Sistemas de Apoio à
Decisão, o qual estará não só provendo material para análise, planejamento e suporte a
decisão, mas também contribuindo para o processo decisório. A obtenção da Informação é
apenas parte do processo.
A análise do estágio da evolução da informática se faz necessária, pois se a empresa se
encontra em um estágio de iniciação ou contágio, encontraremos o envolvimento superficial
por parte dos usuários e poucas atividades estarão automatizadas, não existindo a preocupação
com a integração das informações.
Conforme referência, é importante que os conceitos do SAD retratem a cultura da
empresa e sejam partes integrantes dela, não servindo para atender apenas as necessidades
específicas de um usuário, sendo este o principal motivo para que a empresa implante SI que
venham a auxiliar o processo decisório.
Como descrito no item 2.3.1, o alicerce do processamento dos SAD é a ferramenta
Data Warehouse” ou Armazém de Dados, que é o objetivo de aplicação do presente estudo.
75
O DW capacita os envolvidos a lidar com as necessidades da gerência em termos de
informações rápidas, mudança de enfoque, exame de dados integrados e elaboração de análise
prospectiva.
Um DW é uma coleção de dados orientada por assunto, integrada, variante e não
volátil, que tem por objetivo dar suporte aos processos decisórios. É uma tecnologia de gestão
e análise de dados e deve ser considerado um organismo vivo, sempre acompanhando a
dinâmica do negócio. Portanto o projeto do DW deve ser visto como um processo contínuo
que causará impactos significativos na cultura da empresa, particularmente nas áreas de
serviço ao consumidor, flexibilidade, integração e delegação, e o sucesso da implantação e a
sua continuidade serão motivos para a sua utilização.
Uma vez que a empresa tenha implantado o DW, é de interesse da pesquisa conhecer
quais técnicas estatísticas são utilizadas para extrair as informações. Acredita-se num primeiro
instante que os usuários do DW não estejam capacitados adequadamente e que a ferramenta
esteja sendo subutilizada pela falta de preparo dos colaboradores, resultando na dificuldade de
um melhor entendimento do que acontece no negócio, tornando o processo de melhoria da
qualidade da tomada de decisão mais lento.
O presente estudo tem por objetivo analisar a QI em empresas que utilizam o DW na
perspectiva do CI e verificar o grau de importância atribuída às dimensões e categorias da
qualidade da informação. O sujeito do estudo é o Consumidor de Informação, por utilizar o
produto de informação na sua rotina de trabalho e estar diretamente associado à utilização
desses dados. Ele não tem controle sobre a QI disponível e seu objetivo é encontrar
informação que atenda suas necessidades pessoais.
Conforme descrito no item 3.3, que faz uma analogia entre questões da qualidade da
manufatura de produtos e manufatura de informações, tem-se que produto é igual à
76
informação. Assim sendo, os dois processos deverão ser similares na produção, controles das
características, metodologia aplicada para a melhoria contínua e gerenciamento.
Conforme descrição da literatura, para a implantação da ferramenta DW o ciclo será
iniciado com o planejamento, sendo em seguida definidos os requisitos do negócio, sendo
estes baseados nas necessidades de informação analítica dos tomadores de decisão e na
disponibilidade e QI existente nos sistemas transacionais. Primeiro o “Warehouse” é povoado
com alguns dados que serão analisados pelos analistas do SAD, os dados são modificados e
adicionados ao DW. No decorrer do processo de evolução e amadurecimento do DW, a
questão da qualidade e disponibilidade dos dados surgirá por diversas vezes aprimorando e
assegurando a melhoria do processo.
Cruzando-se informações, pode-se observar que está intrínseca na proposta DW a
qualidade dos dados e seu ciclo de melhoramento contínuo, podendo-se assim considerar uma
manufatura de informação agindo em dados brutos para produzir um produto de informação
que é o insumo básico do processo decisório. A informação não é um recurso como outro
qualquer e não é tecnologia, podendo ser encarada como uma responsabilidade de gestão.
Como no gerenciamento do produto físico, a QI tem múltiplas dimensões e não
existem medidas específicas para cada dimensão. Embora a QI seja um termo difícil de se
definir, existe uma variedade de definições e modelos que foram desenvolvidos, identificando
a importância de uma definição de qualidade e que essa é uma entidade de múltiplos atributos.
Esses múltiplos atributos podem ser agrupados em categorias relacionadas representando uma
estrutura hierárquica.
As dimensões mencionadas por alguns autores estão dentro das categorias referentes à
QI Intrínseca, da Acessibilidade, Contextual e Representativa. Como não existe um conjunto
rigorosamente definido de dimensões de qualidade de dados a opção foi a de aplicar 16
dimensões distribuídas nas categorias acima citadas. A aplicação será justificada pela
77
aproximação empírica para análise da QI, que captura os atributos que são importantes para os
consumidores de dados e que determina as características que estes costumam buscar em suas
tarefas.
Para tanto, essas características podem ser teoricamente determinadas ou
intuitivamente selecionadas pelos pesquisadores. A vantagem dessa aproximação é que ela
captura a voz dos consumidores. A desvantagem é que resultados corretos ou completos não
podem ser provados por princípios fundamentais.
Para responder a questão do quanto boa é a qualidade de dados na empresa, serão
aplicadas medidas de QI utilizáveis. Uma forma funcional é a média estimada. A avaliação
será feita pela pontuação de 1 a 7, baseada na escalada Likert adaptada da literatura, onde 1
corresponde a “discordo plenamente” e 7 “concordo plenamente”. Como parte do
desenvolvimento de avaliação, será determinado o grau de importância através de peso para
cada uma das dimensões de QI.
Serão analisadas na perspectiva do CI, qual a avaliação atribuída a cada dimensão
particular da QI e quais dimensões e categorias são vistas como prioridades por esses
consumidores. Para essa análise será utilizado o método de inspeção de aproximação próprio-
explicada.
78
CAPÍTULO 4
METODOLOGIA CIENTÍFICA
No presente Capítulo serão descritas a metodologia conceitual e a metodologia
aplicada no presente estudo. Abrange-se a conceituação e aplicação dos diferentes métodos de
pesquisa, coleta de dados, instrumento de pesquisa e aplicação do instrumento de pesquisa.
4.1 Metodologia Conceitual
Neste item serão descritas as várias metodologias que podem ser utilizadas no presente
estudo. A Figura 9 descreve os passos da Metodologia Científica entendendo que, a escolha e
delimitação do assunto, a justificativa da escolha, a revisão da literatura, a formulação do
problema e os seus objetivos já foram descritos nos Capítulos 1, 2 e 3, conforme resumo
abaixo descrito:
a. A escolha e delimitação do assunto: Qualidade da Informação em empresas que utilizam
Data Warehouse na perspectiva do CI.
b. Problema: Como é a QI gerada pelo DW na perspectiva do CI.
c. Objetivos da pesquisa: Avaliar a QI gerada pelo DW e verificar o grau de importância
atribuído às dimensões e categorias da QI.
79
Figura 9: Estrutura Metodológica (Criado pela autora)
4.1.1 Definição dos Métodos de Pesquisa
Existem várias formas de classificar as pesquisas e, como o problema objeto do
presente estudo é a verificação de como é a qualidade da informação gerada pelo DW na
perspectiva do CI, é isso que irá determinar o tipo de pesquisa científica a ser desenvolvida,
podendo esta ser Pesquisa Bibliográfica, Descritiva ou Experimental.
Sob o ponto de vista da forma de abordagem do problema, a pesquisa pode ser
quantitativa ou qualitativa. A pesquisa com abordagem quantitativa considera tudo o que pode
ser quantificável, requerendo o uso de formulação de hipóteses a partir da teoria e o uso de
técnicas estatísticas. Os métodos mais comuns deste tipo de pesquisa são a pesquisa de
avaliação (survey), o experimento de campo e o experimento de laboratório (MARTINS,
1999).
80
A pesquisa qualitativa considera as relações entre o mundo real e o sujeito, ou seja, um
vínculo entre o objetivo e subjetividade do sujeito, que não pode ser traduzido em números e
não requer o uso de métodos e técnicas estatísticas. O ambiente natural é a fonte direta para
coleta de dados. Conforme Bryman (1989) apud Martins (1999) a ênfase desta abordagem de
pesquisa é captar a perspectiva dos indivíduos que estão sendo estudados, para poder captar as
interpretações das pessoas pesquisadas.
Na pesquisa qualitativa, temos diversos aspectos relevantes a considerar: ênfase na
interpretação do entrevistado em relação à pesquisa, importância do contexto da organização
pesquisada, proximidade do pesquisador em relação aos fenômenos estudados, intervalo
maior para alcance do estudo no tempo e várias fontes de dados. O ponto de vista do
pesquisador é interno à organização e os quadros teóricos e hipóteses são menos estruturados.
Para Cervo e Bervian (1996), a pesquisa bibliográfica busca conhecer e analisar as
contribuições culturais e científicas do passado. A pesquisa descritiva observa, registra,
analisa e correlaciona fatos ou fenômenos sem manipulá-los, podendo assumir diversas
formas, entre elas: Estudos exploratórios, Estudos descritivos, Pesquisa de opinião, Pesquisa
de motivação, Estudo de caso e Pesquisa documental. Para os autores, a pesquisa
experimental caracteriza-se por manipular diretamente as variáveis relacionadas com o objeto
de estudo, a relação entre causa e efeito.
Os métodos / estratégias mais utilizados na pesquisa qualitativa são a pesquisa-ação e
o estudo de caso. Na pesquisa-ação, o pesquisador participa da implementação e realiza
intervenção técnica; já no estudo de caso, o pesquisador tem como objetivo conduzir uma
pesquisa, e os pesquisadores são investigadores-observadores, não participantes.
Pela definição de Yin (2001) "o estudo de caso é a estratégia escolhida ao se
examinarem acontecimentos contemporâneos, quando não se podem manipular
comportamentos relevantes. Muitas das técnicas são utilizadas pelas pesquisas históricas, mas
81
acrescenta duas fontes de evidências que usualmente não são incluídas num repertório de um
historiador: observação direta e série sistemática de entrevistas".
Destaca ainda o autor que questões do tipo “como” e “por que” apresentam natureza
mais explanatória, não podendo ser tratadas simplesmente por dados quantitativos, enquanto
questões do tipo “quem”, “o que”, e “onde” têm melhor tratamento com dados quantitativos.
O que diferencia as estratégias de pesquisas não é a hierarquia, mas as condições
implicativas que fazem com que os limites entre as estratégias ou as ocasiões nas quais cada
uma é usada sejam claros e bem definidos, conforme enfatizado na Tabela 8.
Estratégia
Forma da questão da pesquisa
Controle sobre os
eventos
comportamentais
Focaliza
acontecimentos
contemporâneos
Experimento
como, porque
Sim Sim
Levantamento
quem, o que, onde, quantos,
quanto
Não Sim
Análise de Arquivos
quem, o que, onde, quantos,
quanto
Não Sim/não
Pesquisa histórica
como, porque Não Não
Estudo de caso
como, porque Não Sim
Tabela 8: Situações Relevantes para Diferentes Estratégias de Pesquisa.YIN (2001)
Quando o objetivo é construir teorias, as evidências qualitativas permitem
compreender mais profundamente o fenômeno, dentro do seu próprio contexto. O estudo de
caso destaca-se por ser um método potencial de pesquisa quando se deseja entender um
82
fenômeno social complexo, pressupondo um maior nível de detalhamento das relações entre
os indivíduos e as organizações, bem como dos intercâmbios que se processam com o meio
ambiente nos quais estão inseridos (MACHADO FILHO, 2002).
Diversos autores analisam o estudo de caso enquanto técnica qualitativa. Conforme
Pozzebon e Freitas (1997), o estudo de caso, como um método, não é apenas aplicável com
rigor sob o ponto de vista científico, mas também adequado para conduzir diversas das atuais
investigações na área de SI.
Na área de Sistemas de Informação, as evidências buscadas estão inseridas em um
contexto formado pela interação entre o homem e o computador. Pozzebom e Freitas (1997)
adotam uma perspectiva sócio-técnico: aspectos humanos e técnicos, que devem ser levados
de forma integrada em problemas nos quais a pesquisa e teoria estão em estágio inicial de
formação ou aqueles baseados na prática, quando a experiência dos atores é importante e o
contexto de ação é crítico. Para os autores, as razões que justificam o estudo de caso são:
a. Estudar o SI no ambiente natural;
b. Responder a perguntas do tipo “como”? e “por quê”?; e
c. Pesquisar na área onde poucos estudos prévios tinham sido realizados.
Para Bensat, Goldstein e Mead apud Pozzebon e Freitas (1997), de posse de uma
questão de pesquisa específica e estando o estudo de caso definido, cabe verificar se é,
efetivamente, a metodologia mais adequada e útil. Na Tabela 9 apresentam-se as questões
conceituais e respectivas respostas propostas pelos autores:
83
Pergunta
Resposta
O fenômeno de interesse pode
ser estudado fora de seu
ambiente natural?
Não. Um ambiente natural rico é considerado fértil para a geração de
teorias.
O estudo focaliza eventos
contemporâneos?
Sim. A metodologia case é claramente útil quando o ambiente natural é
necessário e quando foca evento contemporâneo.
O controle ou a manipulação
dos sujeitos ou eventos é
necessário?
Não. Quando pessoas ou eventos devem ser controlados ou manipulados
no curso de um projeto de pesquisa, o estudo de caso não é recomendável.
O fenômeno de interesse tem
uma base teórica estabelecida?
Não. O fenômeno estudado, não suportado por forte base teórica, deve ser
verdadeiramente perseguido através da pesquisa.
Tabela 9 - Questões para a Escolha do Estudo de Caso (POZZEBON; FREITAS, 1997)
4.1.2 Definição da Coleta de Dados
A coleta de dados ocorre após a escolha e delimitação do assunto, revisão
bibliográfica, definição dos objetivos e formulação do problema. A coleta de dados envolve
diversos passos, como a amostra a ser estudada, a elaboração do instrumento de pesquisa e o
planejamento da coleta de dados (CERVO; BERVIAN, 1996).
Estudo de casos, da mesma forma que os experimentos, são generalizáveis em termos
de proposições teóricas e não para populações ou universos. Para Yin (2001) o estudo de caso
não representa uma amostra, e o objetivo do investigador é expandir e generalizar teorias e
não enumerar freqüências, baseando-se em generalizações analíticas, tornando-se o tamanho
da amostra irrelevante. Para Martins (1999), o número de casos deve ser escolhido conforme
as necessidades de generalização analítica e não de acordo com critérios de inferência
estatística.
84
A pesquisa de estudo de caso pode ser de caso único ou casos múltiplos, sendo essas
as duas variantes do estudo de caso. Os casos não devem ser considerados “unidades de
amostragem” e sim seguir a lógica da replicação, como descrito na Figura 10. Conforme Yin
(2001), casos múltiplos, são vistos como experimentos múltiplos podendo ser aplicado o
método de generalização analítica. Se dois ou mais casos são utilizados para sustentar a
mesma teoria, os resultados empíricos podem ser considerados ainda mais fortes.
De se nv ol v er
teoria
Selecionar
casos
Des enhar
protocolo de
coleta de
dados
Conduzir o
primeiro
estudo de caso
Conduzir o
segundo
estudo de caso
Conduzir os
estudos
remanescentes
Escrever
relatório do
caso individual
Escrever
relatório do
caso individual
-Definir operacionalmente o
processo
-Definir resultados do processo
(e não apenas efeitos
imediatos)
-Usar técnicas de coleta de dados
formais
-Entrevistas
-Observações
-Documentos
-Entrevistas
-Observações
-Documentos
Escrever
relatório do
caso individual
Deli nea r
conclusões
cruzadas
Modificar
a teoria
Desenvolver
implicações
políticas
Escrever
relatórios
cruzados
-Combinação
de padrões
-Implicações
políticas
-Combinação
de padrões
-Implicações
políticas
-Etc
-Etc
-Etc
-Etc
Definições e projeto Preparação, coleta e análise Análise e conclusão
Figura 10 – Modelo de Referência - Método de Estudo de Caso. YIN (2001)
85
A adoção de múltiplos casos é desejável para a descrição de um fenômeno, a
construção ou teste de uma teoria, podendo ser considerado análogo a uma replicação
realizada com experimentos tradicionais múltiplos, o que permite maior poder de
generalização (POZZEBON; FREITAS, 1997).
Baseado em Machado Filho (2002), a confiabilidade se dá devido ao fato de que
apenas um pesquisador será responsável pela coleta de informações com o objetivo de
minimizar vieses. As entrevistas devem ser presenciais, permitindo que os conceitos
embutidos nas questões sejam esclarecidos para os entrevistados, procurando com isso,
minimizar os problemas de interpretações das perguntas.
A coleta de dados deverá ocorrer em um só momento (cross-sectional), pretendendo-
se descrever e analisar o estado de uma ou diversas variáveis em um dado instante, pois o
objetivo é retratar a percepção dos CI no momento atual (OLIVEIRA, 1996 apud
POZZEBOM; FREITAS, 1997).
Uma proposta para selecionar o número de casos, ou seja, as empresas para um estudo
de caso encontra-se em Pozzebon e Freitas (1997), conforme baixo se descreve:
a. Identificar empresas que possuam sistemas em plena utilização, adotando os critérios de
tempo de implantação e número de usuários.
b. Selecionar no mínimo 10 empresas que atendam aos critérios pré-estabelecidos;
c. Elaborar uma grade de análise que permita identificar os elementos do modelo proposto;
d. Contatar as empresas, tendo como objetivo o preenchimento da grade de análise,
e. Ordenar as empresas de acordo com o número de elementos dos seus sistemas. Esta
classificação permitirá selecionar duas empresas que possuam um grande número de
elementos do modelo e duas empresas que possuam um pequeno número de elementos do
modelo.
86
Um princípio que deve ser respeitado durante a coleta de dados tem a ver com a
maneira de organizar e documentar os dados coletados, criando-se um banco de dados que
pode ser utilizado para uma análise secundária, independente de qualquer parecer feito pelo
pesquisador original, não eliminando a necessidade de apresentar provas suficientes no
próprio relatório final. (YIN, 2001)
4.1.3 Instrumento de Pesquisa
Os instrumentos de coleta de dados mais utilizados são a entrevista, o formulário e o
questionário. Na aplicação da entrevista e do formulário o informante conta com a presença
do pesquisador. Já o questionário, sem a presença deste, é preenchido pela pessoa que dá as
informações. O tipo de pergunta pode ser fechada, pelo número limitado de opções ou aberta,
sem restrições (CERVO; BERVIAN, 1996).
A entrevista é, segundo Yin (2001), uma fonte essencial de evidências para um estudo
de caso. Os entrevistados fornecem ao pesquisador percepções e interpretação sobre um
assunto, as quais constituem uma fonte essencial de evidência para os estudos de caso.
Conforme Cervo e Bervian (1996), a entrevista “é uma conversa orientada para um
objetivo definido: recolher, através do interrogatório do informante, dados para a pesquisa”, e
onde se devem adotar os seguintes critérios para seu preparo e realização:
a. Planejamento da entrevista, delineando o objetivo a ser alcançado;
b. Obter conhecimento prévio acerca do entrevistado;
c. Marcar com antecedência o local e horário para entrevista;
d. Criar condições para entrevista;
87
e. Escolher o entrevistado de acordo com a familiaridade ou autoridade em relação ao
assunto escolhido;
f. Fazer uma lista das questões, destacando as mais importantes; e
g. Assegurar um número suficiente de entrevistados.
Para prover maior confiabilidade à pesquisa é necessária a confecção de um protocolo
de pesquisa, tornando-se essencial em todas as circunstâncias, uma vez que é a maneira
especialmente eficaz de lidar com o problema. O protocolo deve ser composto dos seguintes
tópicos: visão do projeto de estudo de caso, procedimentos de campo, informações gerais
assim como notas para lembrar detalhes importantes e, questionário de estudo (YIN, 2001).
A avaliação deverá ser feita de forma abrangente, envolvendo aspectos gerenciais e
tecnológicos que, segundo Yin (2001), provêm maior confiabilidade à pesquisa. Para o autor,
a entrevista é uma fonte essencial de evidências para um estudo de caso.
4.2 Metodologia de Pesquisa Adotada
"A essência de um estudo de caso, tenta esclarecer uma decisão ou um
conjunto de decisões: o motivo pelo qual foram tomadas, como foram
implementadas e com quais resultados." (Schramm, 1971 apud Yin, 2001)
Tendo em vista que a abordagem principal do problema é a avaliação da qualidade da
informação gerada pela ferramenta DW nas organizações, o estudo terá como instrumento
principal a pesquisa qualitativa descritiva, assumindo a forma de Estudo de Caso. Não existe
uma definição clara, a priori, de quais serão as variáveis de interesse, de como serão medidas
e nenhum controle ou manipulações estão envolvidas.
88
O objetivo é a condução de uma pesquisa, e o pesquisador é investigador-observador
não participante e, sendo o Data Warehouse um Sistema de Informação, o estudo de caso é a
metodologia apontada como particularmente apropriada para determinados tipos de problemas
como esse, em que a pesquisa e teoria estão em estágio inicial de formação ou baseado na
prática.
Com base em Pozzebon e Freitas (1997), na Tabela 10 apresentam-se as questões /
respostas que determinaram que o estudo de caso é a metodologia mais adequada para
aplicação do presente estudo:
Pergunta
Resposta para a aplicação no presente estudo
O fenômeno de interesse pode ser estudado
fora de seu ambiente natural?
Não. O objetivo é verificar a Qualidade da Informação com
utilização do DW.
O estudo focaliza eventos contemporâneos?
Sim. O objetivo é observar o comportamento dos CI, com a
tecnologia atualmente disponível.
O controle ou a manipulação dos sujeitos ou
eventos é necessária?
Não. O objetivo é identificar elementos técnicos e
comportamentais.
O fenômeno de interesse tem uma base
teórica estabelecida?
Não. A avaliação da QI com a utilização do DW não é
freqüentemente encontrada na literatura.
Tabela 10 – Respostas às Questões para a Escolha do Estudo de Caso
Justifica-se a aplicação do estudo de caso no presente estudo por:
a. Avalia-se a QI nas empresas que utilizam a ferramenta DW;
b. Responde-se a pergunta de como é a qualidade da informação na visão do CI nestas
empresas; e
c. Existem poucos estudos sobre a QI do DW.
89
4.2.1 Procedimento para Coleta de Dados
A pesquisa será aplicada em duas organizações, levando-se em consideração: possuir a
ferramenta DW em plena utilização, número de CI, tempo de implementação e número de
elementos em comum com o modelo proposto, sendo permitida a observação de evidências
em diferentes contextos, pela replicação do fenômeno, sem necessariamente se considerar a
lógica de amostragem.
Como estabelecido, será feita inquirição empírica que irá procurar um fenômeno
contemporâneo dentro de um contexto da vida real em situações em que as fronteiras entre o
fenômeno e o contexto não são claramente estabelecidas.
O foco não é a ferramenta Data Warehouse, mas o comportamento dos CI em face da
utilização da ferramenta em empresas que utilizam o DW. Portanto, a unidade de análise do
projeto de pesquisa é a qualidade de dados.
Como característica principal para a coleta de dados, temos a utilização da ferramenta
DW e de elementos comuns com os objetivos propostos. As etapas para a seleção da amostra
e aplicação da pesquisa foram as seguintes:
1. Identificação das empresas que tinham implementa a ferramenta DW, e levantamento das
seguintes variáveis, como critérios: estágio de informatização, tempo de implementação
(no mínimo dois anos) e número de usuários;
2. Visita a no mínimo uma empresa, para o levantamento e formulação dos itens a serem
avaliados, e coletar informações de fontes secundárias;
3. Definição do número de empresas a serem pesquisadas (número de casos);
4. Confecção do instrumento de pesquisa,
90
5. Aplicação do Pré-teste do questionário, para identificar os elementos dos objetivos
propostos na abrangência metodológica e corrigir o questionário;
6. Montagem de um banco de dados;
7. Aplicação da entrevista com o maior número possível de CI;
8. Digitação dos dados no banco de dados;
9. Analise e comparação das informações; e
10. Redação do relatório final.
4.2.2 Elaboração do Instrumento de Pesquisa
Foram elaborados questionários, um a nível gerencial e outro para os CI (Anexos II e
III) respectivamente, sendo a coleta de informações realizada por meio de entrevistas
pessoais. O instrumento de pesquisa foi estruturado com questões fechadas e abertas,
formatadas através de um roteiro / protocolo (Anexo I) no qual, uma vez as entrevistas
aplicadas, serão feitas análises para o aprofundamento do objeto em estudo.
Para a estruturação do protocolo do presente estudo foram tomados como referência os
autores Ferro (2003), Silva (2002) e Cella (2002) e a avaliação será feita de forma abrangente,
envolvendo aspectos gerenciais, tecnológicos e humanos, com suas respectivas abrangências
metodológicas:
a. Informações estruturais da empresa e dos CI: Neste item são descritas de forma genérica
as principais características da empresa e dos CI. Serão também levantadas a subordinação
e informações sobre treinamento específico para a função.
91
b. Processo de documentação e procedimentos: Diz respeito à documentação, armazenagem
e atualização dos documentos relativos ao DW e Qualidade da Informação.
c. Estágio de Informatização. Item onde será levantada a classificação do Sistema de
Informação, que diz respeito à informatização, uso da TI, a classificação dos sistemas
propriamente ditos, os SI utilizados nas diversas áreas da empresa e sistemas transacionais
(FALSARELA; CHAVES, 1995) e (SILVA, 2002).
d. Implementação do DW: Levanta questões sobre o DW, o processo decisório para a
aquisição e implementação, as fases de desenvolvimento e implementação do projeto.
e. Utilização do DW: Identifica o fluxo de informação do DW, a descrição da utilização
atual nos setores da empresa, relaciona os métodos e técnicas utilizadas para tomada de
decisão, a motivação para sua utilização e a percepção dos resultados obtidos (SFERRA;
CORRÊA, 2003) e (FALSARELLA; CHAVES, 1995).
f. Qualidade de informações / Avaliação das dimensões: Será realizada a métrica da
qualidade das informações e grau de importância, conforme as dimensões da qualidade de
dados na perspectiva dos consumidores de dados, com suas respectivas percepções da
influência da qualidade para os resultados da empresa. Será ainda verificada a existência
de sinais de alerta de uma qualidade pobre de informação, descritos por Strong, Lee e
Wang (1997). Para a confecção do quadro de resposta foram consideradas as seguintes
Referências Bibliográficas:
f.1 Categorias e dimensões: (WANG, ZIAD; LEE, 2000), (KAHN; STRONG;
WANG, 2002), e (LEE et al, 2002).
f.2 Metodologia de avaliação: Avaliação Próprio explicada (PIERCE, 2004).
92
f.3 Formato de Questionamento: (WANG, 1996), (KAHN; STRONG; WANG, 2002),
(LEE et al, 2002), (ANGELES, 2004), (PEPINO et al, 2002), (ARNDT; LANGBEIN,
2002).
f.4 Tipo de avaliação: Aproximação Intuitiva – (WANG; STRONG, 1996); A
percepção do usuário – (NAUMANN; LESER; FREYTAG, 1999) e (NAUMANN;
ROLKER, 2000), Escala de Avaliação (Likert) - (BOVEE, 2004).
g. Comentário geral: Perguntas abertas relativas ao conhecimento do DW, pontos positivos e
passíveis de melhoria de sua utilização e avaliação geral do DW.
4.2.3 Resultados Esperados
Uma vez completadas as etapas para a aplicação da pesquisa e tendo os questionários
confeccionados, espera-se obter, como resultado, os questionários preenchidos de forma
coerente e concisa, cuja análise responda ao problema e aos objetivos propostos.
93
CAPÍTULO 5
APLICAÇÃO DA METODOLOGIA
Neste Capítulo será descrita a aplicação da metodologia de pesquisa, conforme os
passos descritos na Figura 11. Descrevem-se as etapas que foram utilizadas para aplicação do
instrumento de pesquisa, iniciando pela identificação das empresas até a aplicação do
instrumento de pesquisa.
Figura 11 – Aplicação da Metodologia (Criado pela autora)
94
5.1 Identificação das Empresas
Para a realização de um estudo sobre o uso do DW nas empresas, em um primeiro
momento teve-se a intenção de realizar uma pesquisa Survey em diversas empresas no Estado
do Paraná. Porém, encontrou-se dificuldade para obtenção do cadastro de empresas que
utilizassem a ferramenta DW, assim como qualquer outro dado quanto a utilização de SI por
parte das empresas cadastradas. Foram pesquisadas as bases de dados da Secretaria Estadual
da Indústria e Comércio e FIEP.
Como forma de contornar o problema e levantar dados quanto ao uso da tecnologia
DW pelas empresas, foi feito contato com um representante regional de uma desenvolvedora
de software, atuante a nível mundial, e indagou-se, inicialmente, sobre o perfil das empresas
na Cidade de Curitiba e Região Metropolitana que utilizavam a ferramenta, sendo-se
prontamente atendidos.
Quanto ao perfil das empresas apresentadas pelo representante regional da
desenvolvedora mundial de software, e posterior revisão literária, verificaram-se como
características de maior ocorrência:
a. Serem empresas de grande porte ou com nível de Sistema de Informação, compreendido
no estágio de classificação de Nolan entre Integração, Administração de Dados e
Maturidade e caracterizadas por Falsarella e Chaves (1995) entre Sistemas: Gerenciais,
Executivos, Especialistas e de Apoio à Decisão, conforme descrito no Capítulo 2.
b. Serem empresas que já tinham um histórico de implementação e estivessem utilizando
sistematicamente a ferramenta. Neste caso em particular, cumpre ressaltar que foi
informado pelo representante da desenvolvedora mundial de software que, para a
utilização sistemática da ferramenta, o tempo necessário para a implementação do DW
seria de, no mínimo, dois anos.
95
A delimitação destas variáveis, para aplicação no presente estudo de caso, corrobora e
complementa Sakaguchi e Frolick (1997), que colocam como desvantagens da utilização do
DW o fato de nem todas as empresas poderem construir um DW, umas por serem pequenas e
não terem o suporte financeiro necessário e outras por não terem tempo necessário para a
conclusão de todo o projeto; seja pela complexidade de desenvolvimento, ou pelo alto custo
de desenvolvimento, de administração e treinamento.
Uma vez definida a metodologia a ser aplicada e o perfil das empresas a serem
pesquisadas, o próximo passo foi a visitação as empresas e determinação do número de casos.
5.2 Visita a Empresa e Definição do Número de Casos
Uma vez estabelecidas as características, porte ou estágio de classificação de SI e
tempo de implementação, solicitou-se ao representante da empresa mundial de software a
possibilidade de indicação nominal das empresas que atendessem tais requisitos, respectivos
contatos e que, também, se pudesse ter acesso as mesmas para a aplicação do presente estudo.
Sete empresas foram relacionadas. Feitos os contatos iniciais, apenas uma demonstrou
interesse. As outras alegaram estar em fase de mudança, não ter interesse ou, simplesmente,
desconhecer a existência da ferramenta na empresa e mesmo o nome/conceito da ferramenta.
Junto a empresa contatada e interessada, foi feita inicialmente uma reunião com o
responsável pela implantação do DW, onde foram apresentadas as idéias do projeto e também
se levantaram informações sobre o ambiente de estudo e possíveis questionamentos.
Em passo posterior, decidiu-se que, para a aplicação do presente estudo, seria
realizada uma pesquisa na empresa já contatada e que havia manifestado interesse e, também,
96
em uma segunda empresa indicada pelo orientador. A seguir, apresentam-se informações
sobre as empresas pesquisadas, ambas instaladas no Município de Curitiba/PR.
5.2.1 Perfil Empresa A
A empresa A é um órgão da Administração Pública Estadual, atuante a mais de 50
anos no Estado do Paraná e, neste período, vem contribuindo para o desenvolvimento de uma
Administração Pública eficiente e dinâmica, através do constante aperfeiçoamento de suas
ações. Dentro de sua esfera de competência, tem buscado na informação, a formação de sua
história. Visando agilizar o processo de obtenção de informações, preocupa-se com a
modernização de seus sistemas, que passaram a subsidiar as análises em âmbito Estadual.
5.2.2 Perfil Empresa B
A empresa B é uma empresa estrangeira do setor industrial, que inaugurou sua fábrica
em Curitiba há quase trinta anos. Seu produto é líder absoluto em tecnologia agregada e
vendas no mercado brasileiro. Desde a implantação da fábrica no Brasil, preocupou-se com a
qualidade de seus produtos e serviços, sendo uma das pioneiras na implantação de Sistemas
de Gestão da Qualidade. Atualmente exporta seus produtos para aproximadamente 30 países.
A empresa trabalha visando à melhoria contínua de seus produtos e serviços.
97
5.3 Confecção do Instrumento de Pesquisa e Aplicação do Pré-teste
Uma vez elaborado o protocolo de pesquisa (Anexo I), conforme revisão bibliográfica
e informações relatadas sobre o ambiente de estudo, foram confeccionados dois questionários,
um a nível gerencial (Anexo II) e um segundo para os CI (Anexo III). Contatou-se a empresa
A para definição da agenda de aplicação do instrumento de pesquisa, fase esta considerada
pré-teste. Na reunião para agendamento, foi levantada pela Diretoria de Informática a
necessidade de, antes de serem realizadas as entrevistas, ser feita uma conscientização inicial
dos participantes sobre as definições e conceitos do que vem a ser o DW, do que é a TDQM e
das Dimensões da Qualidade de Informação.
5.4 – Montagem do Banco de Dados
Com a finalidade de armazenar as informações e possibilitar as tabulações e
inferências, na fase de análise foi construído e preenchido um banco de dados, utilizando-se
para tal uma planilha eletrônica. Em sua estrutura básica, nas colunas estão as questões,
abertas por itens, e nas linhas, as respostas obtidas dos entrevistados.
5.5 Aplicação do Instrumento de Pesquisa
Conforme o definido, antes da aplicação dos questionários na Empresa A, procurou-se
conscientizar, através de uma breve palestra com tempo aproximado de duração de uma hora
e meia, todo o pessoal a ser entrevistado sobre os respectivos temas em questão. Constatou-se
nesta fase o completo desconhecimento dos assuntos em pauta por parte dos participantes,
98
conforme o já anteriormente previsto pelo Diretor de Informática e responsável pelo DW na
empresa.
Logo após a conscientização e esclarecidas as dúvidas, foram feitas as entrevistas,
estas, pré-agendadas pelo responsável. A aplicação do pré-teste ocorreu sem problemas de
entendimento dos conceitos e direcionamento da metodologia.
Como a metodologia de aplicação do instrumento de pesquisa na empresa A foi
considerada fase de pré-teste, o mesmo procedimento foi aplicado na empresa B, onde
ocorreu inicialmente o trabalho de conscientização e posterior a aplicação da entrevista.
Constatou-se mais uma vez que, sem a referida conscientização, não haveria condições de os
CI responderem o questionário.
5.6 Análise das Informações e Relatório Final
A análise do resultado das entrevistas realizadas nas empresas A e B se dará de forma
descritiva, servindo esta análise de material de apoio para as conclusões e elaboração do
Relatório Final.
99
CAPÍTULO 6
ANÁLISE DO ESTUDO DE CASO
Como forma de possibilitar a verificação e análise do quão importante na perspectiva
do Consumidor de Informação, é a Qualidade da Informação gerada pelo DW, o presente
estudo foi conduzido seguindo-se uma cronologia de três fases, conforme indicadas na
Figura 12 e posteriormente explicadas. Durante o desenvolvimento destas fases, foram
entrevistados CI e Gerência responsável pelo DW ou Sistema de Informação.
Como princípio básico, e para que os entrevistados fossem considerados parte do
estudo, ou seja, CI, ficou estabelecido que eles teriam que ter os dados acessíveis; deveriam
ser capazes de interpretar os dados; os dados deveriam ser relevantes e eles deveriam
encontrar os dados exatos.
Os resultados serão apresentados, de forma independente, na perspectiva do CI e
Gerência, não sendo a intenção do presente estudo fazer uma análise comparativa sobre a
diferença de visão entre os desenvolvedores e CI e entre Empresas.
A estrutura do modelo de análise pretende demonstrar as percepções da QI de forma
prática, atentando-se para o fato de que uma avaliação imprecisa pode tanto resultar em uma
informação recuperada de baixa qualidade ou levar a evitar informações de alta qualidade.
Assim sendo, é importante ter uma descrição detalhada das avaliações disponíveis e repetir a
avaliação regularmente.
100
Figura 12 – Etapas da Análise do Estudo de Caso (Criada pela autora)
101
FASE I - Fatores Limitantes
Conforme revisão da literatura existem variáveis que estão relacionadas a aplicação do
estudo que seriam, o tempo de implantação, o estágio de informatização da empresa e a
motivação para a utilização da ferramenta DW. Por suposição, essas variáveis são limitantes
do estudo, uma vez que, sem um tempo hábil de implementação e conseqüentemente seu
estágio de informatização, não existiria a familiaridade e o domínio da ferramenta.
O tempo de implementação foi destacado por Sakaguchi e Frolick (1997), que
colocam como uma desvantagem as empresas não terem o tempo necessário para a conclusão
de todo o projeto, quer seja pela complexidade e alto custo de desenvolvimento,
administração e treinamento. Neste contexto, o representante regional da desenvolvedora
mundial de software contatado, atribuiu um tempo mínimo para a implementação do DW de
dois anos.
Quanto ao estágio de informatização, conforme a revisão da literatura, a informática
evolui segundo uma seqüência definida de estágios, os quais representam a familiaridade e o
domínio crescentes da tecnologia pela empresa. Cada estágio é caracterizado por um tipo de
aplicação preponderante, forma de planejamento, controle da informática e tecnologia
empregada. Neste sentido, se a organização estiver no estágio de iniciação ou contágio,
dificilmente os SI implantados poderão ser classificados e caracterizados como MIS, SAD, ou
EIS, como é o caso do DW.
Finalmente, o sucesso da implementação da ferramenta DW e sua continuidade
dependem, principalmente, da motivação para que as pessoas responsáveis pela tomada de
decisão o utilizem.
102
FASE II - Informações sobre o Uso do DW
As informações sobre o uso do DW mostram a utilização da ferramenta, o
envolvimento e entendimento do entrevistado, e também o ambiente. Neste sentido, no
presente estudo, serão avaliados: a percepção pelo CI sobre as alterações trazidas ou
condicionadas com a opção de trabalhar com a ferramenta, as vantagens que consideram com
seu uso, os métodos e técnicas estatísticas utilizados, e a utilização da ferramenta
propriamente dita.
Para avaliar as vantagens da utilização do DW, os itens utilizados foram extraídos do
estudo feito sobre vários casos de empresas que já estavam utilizando ou estavam no processo
inicial de construção de um DW. A intenção é conhecer, na percepção do CI, quais vantagens
são consideradas mais importantes.
O levantamento dos métodos e técnicas estatísticas utilizadas nas empresas têm por
objetivo, no presente estudo, capturar o entendimento que o CI tem sobre o processo de
extração de conhecimento com a aplicação da estatística. Importante frisar-se que através da
revisão literária sabe-se, a priori, que estes modelos são freqüentemente subutilizados,
preferindo os usuários, aqui considerados Consumidores de Informação, métodos que, para
guiar suas decisões e ações, exijam menos esforço ou preparo para processar as informações
em seus ambientes.
103
FASE III - Avaliação da QI e do Data Warehouse
Para vários autores, não existe uma definição ou conjunto de critérios comum para a
QI nem para sua avaliação. Como no gerenciamento de produtos físicos, a QI tem múltiplas
dimensões, podendo cada uma delas ser considerada como um indicador compreendendo
várias medidas.
Todo sistema usando ou não recursos de TI, que manipula e gera informação, pode ser
considerado SI. Seu papel é proporcionar uma representação de um domínio de aplicação
conforme percebido pelo usuário, que é o CI, não tendo ele controle sobre a QI disponível.
Portanto, a visão dos consumidores serve de padrão contra o que é definido como qualidade
de dados.
Na avaliação da QI será verificada a existência de uma Qualidade de Dados Pobre a
fim de possibilitar-se fazer um cruzamento dos possíveis problemas que possam estar
afetando a avaliação das dimensões e o grau de importância destas.
Das três aproximações utilizadas na literatura para estudar a QI, será utilizada a
aproximação empírica, utilizando-se a forma funcional da proporção simples. Nesta avaliação
da percepção dos CI quanto a QI, especificamente em relação às dimensões, será utilizada
uma adaptação para o conjunto de avaliações da Escala Likert proposta por Bovee (2004),
descrita na Figura 13.
Embora não exista um consenso quanto à melhor escala a ser utilizada em um
instrumento de pesquisa, a opção pela utilização da Escala Likert de sete pontos no presente
estudo, além de sua facilidade de uso e codificação, deveu-se aos seguintes fatores de ordem
estatística e outros:
a. Idealmente, uma escala de índices deve consistir de pontos suficientes para se extrair a
informação necessária;
104
b. Uma boa escala de respostas é aquela que é fácil de ser entendida pelos respondentes e
possibilita bem discriminar suas “percepções”, é fácil de interpretar, e tem o mínimo de
parcialidade;
c. A pesquisa visa obter dados sobre impressões / percepções individuais dos CI sobre a QI
e, portanto, quanto mais pontos forem utilizados na escala, mais confiáveis os resultados
desta percepção, ou seja, quanto maior o nível de discriminação, maior a consistência dos
resultados;
d. O objetivo é obter uma clara distinção entre respostas positivas e negativas, portanto,
optou-se por uma escala com número ímpar de pontos, sendo um deles neutro;
e. Escalas com menos pontos tendem a prover a muitas pessoas somente uma escolha
binária. A razão para isso é que elas tendem a responder somente do lado positivo da
escala bipolar ‘concordo-discordo’, o que claramente compromete sua capacidade de
discriminação.
Figura 13 – Escala Likert adaptada de Bovee (2004)
105
Para a avaliação do grau de importância de cada uma das dimensões e categorias da QI
será feita a formulação dos objetivos de cada dimensão para a seguinte questão: do ponto de
vista do CI, quanto importante é uma dimensão particular de qualidade comparada às outras
dimensões no contexto da QI, solicitando a ordenação conforme o grau de importância do 1º
ao 5º.
Esse procedimento será avaliado através da aproximação próprio-explicada, onde os
respondentes tacham os níveis de cada atributo de QI do mais para o menos preferido, e
depois avaliam o peso de importância de cada atributo, sendo atribuído para o cálculo do
peso, para o 1º colocado o valor 5, para o 2º o valor 4, para o 3º o valor 3, para o 4º o valor 2 e
para o 5º o valor 1. A soma desses resultados será dividida pelo número de respondentes.
106
6. 1 Avaliação da Empresa A
Para conhecer o processo de implantação da ferramenta DW na Empresa A, foram
entrevistados os responsáveis pela implantação do DW, a Diretoria e as Gerências Setoriais,
gerando-se uma entrevista cujo formato do questionário encontra-se no Anexo II.
As decisões que levaram a compra e adoção da ferramenta foram: a facilidade de uso,
interface em português e o treinamento em Curitiba.
Para o desenvolvimento do projeto de implantação, a solução encontrada pela referida
empresa foi o desenvolvimento interno, com apoio de consultoria externa. Seguiram-se as
seguintes etapas para o desenvolvimento do projeto de implementação: aprendizado sobre a
ferramenta, levantamento das necessidades, desenvolvimento, treinamento dos usuários e
sucessivos aprimoramentos.
Foram elaborados o modelo dimensional e a formação de indicadores, conforme
definição dos usuários. Na fase de desenvolvimento foram aplicadas 8 horas de treinamento
para os usuários e 40 horas para o pessoal do desenvolvimento e Administração.
Atualmente não existem capacitações ou reciclagens, procedimento para avaliação da
QI utilizada pelos CI e, tampouco, existe um planejamento específico para o gerenciamento
das informações.
Na empresa, 13 pessoas estão habilitadas a utilizar o DW, e o perfil desses
consumidores de informação é que, mais de 50% estão na empresa a mais de 8 anos e 100%
são graduados.
107
6.1.1 - Estágio de Informatização e Tempo de Implementação
O tempo de implantação da ferramenta DW na Empresa A é de aproximadamente
cinco anos e o responsável pela implantação do DW classifica o tipo de sistema atualmente
utilizado pela empresa de Especialista. Este sistema é conhecido como "Expert Systems" (ES),
quando fornece, ele mesmo, soluções para determinados problemas, e como "Expert Support
Systems" (ESS), quando fornece informações extraídas das bases de conhecimento a
profissionais e executivos para auxiliá-los no processo de tomada de decisão.
A implementação da informatização ocorreu por iniciativa da Gerência e do pessoal da
TI (Top Down), possuindo redes de computadores com sistemas operacionais Windows XP,
com programas (softwares) desenvolvidos nas áreas contábil, de recursos humanos, de folha
de pagamento e outros destinados aos objetivos do negócio.
Com base nessas informações, conclui-se que a Empresa A encontra-se no estágio de
Integração. Neste estágio, que ocorre em resposta à pressão por melhor gestão e é orientado
para atender às necessidades dos níveis gerenciais, as informações são de melhor qualidade e
é exigida maior integração entre elas.
6.1.2 - Motivação para o Uso DW
Para análise das tabelas que se seguem, deve-se entender que na Empresa A, por parte
da gerência, foi respondido apenas um questionário (Anexo II) e, quanto aos CI, foram
respondidos treze questionários, conforme Anexo III.
Para a interpretação dos resultados, há de ficar claro que, em relação à Gerência, o
resultado é único, e no caso dos CI o resultado é a média das treze entrevistas por item.
Entende-se por item cada linha da tabela.
108
Quanto à interpretação das Tabelas e Gráficos, no que se refere a avaliação, será
aplicada a Escala da Figura 13, onde:
Pela descrição da Tabela 11, verifica-se que, na visão da Gerência, foram melhor
avaliados (concorda plenamente), a interface com o usuário ser fácil e amigável e a imediata
obtenção de informações (internas e externas).
Por seu lado, os CI “concordam em parte” que o modelo construído atende as
necessidades gerais da organização, a interface com o usuário é fácil e amigável bem como
que mudanças são feitas no sistema para atender a novas necessidades para apoio à decisão.
Ainda para os CI, os itens armazenamento e disponibilidade das informações, obtenção de
informações externas e internas serem imediatas e disseminação dos benefícios da utilização,
tiveram avaliação “neutra”, ou seja, não existe concordância nem discordância sobre estes
itens.
Ressaltam-se, porém, alguns pontos que, na visão da Gerência, precisam ser
trabalhados ou melhorados:
a. O armazenamento e disponibilidade das informações sobre decisões tomadas, e
b. A disseminação dos benefícios da utilização (cursos, palestras).
1234567
Discordo
Plenamente Discordo
Discordo
em Parte Neutro
Concordo
em Parte Concordo
Concordo
Plenamente
109
Avaliação da Motivação para o Uso do DW
Gerência
(n=1)
Consumidores
(Média n=13)
a.O modelo construído atende as necessidades gerais da organização
4
5
b
. São feitas as mudanças no sistema para atender a novas necessidades da
informação para apoio à decisão
5 5
c. As informações sobre decisões tomadas são armazenadas e estão disponíveis
para outros processos de decisão
1 4
d. A interface com o usuário é fácil e amigável
7 5
e. A obtenção de informações externas e internas são imediatas
7 4
f. É feita a disseminação dos benefícios da utilização (cursos, palestras)
1 4
Média do item
4
5
Tabela 11 – Avaliação da Motivação para o Uso do DW – Empresa A
A Figura 14 mostra os itens avaliados pelos entrevistados quanto à motivação para o
uso do DW, indicando que, por parte do CI, de forma geral, existe “concordância” em relação
à motivação para o uso da ferramenta DW. Observa-se ainda que, de forma distinta e mais
positiva que a Gerência, o consumidor entende que existe uma disseminação dos benefícios
da utilização do DW e que as informações sobre decisões são armazenadas e disponibilizadas
para utilização futura.
110
Figura 14 – Motivação para o Uso do DW – Empresa A
6.1.3 Alterações Trazidas com a Opção de Trabalhar com o DW
Neste item são apresentadas as avaliações atribuídas pela Gerência e CI para as
alterações percebidas depois da implantação da Ferramenta DW na Empresa A.
Na Tabela 12, observa-se de maneira geral que os CI “concordam” que alterações
foram trazidas com a utilização do DW. Já a Gerência é “neutra” uma vez que “discorda” da
influência nos resultados da empresa após a implantação a utilização do DW.
Motivação para o Uso do DW
01234567
O modelo atende as necessidades
São feitas as mudanças no sistema
As informações sobre decisões são armazenadas e estão
disponíveis
A interface com o usuário é fácil e amivel
A obtenção de informações são imediatas
É feita a disseminação dos benefícios da utilização
Avaliação Geral do item
Consumidores
Gerência
111
Avaliação das Alterações Trazidas com o Uso DW
Gerência
(n=1)
Consumidores
(Média n=13)
a. Influência nos resultados da empresa após a implantação
2
6
b. Melhoria contínua da informação
5 6
c. Aumento do nível de satisfação para o trabalho
4 6
d. Melhoria do processo decisório
4 6
Média do item
4
6
Tabela 12 – Avaliação das Alterações Trazidas com o Uso do DW – Empresa A
A Figura 15 mostra que os CI são mais positivos que a gerência em todos os itens
quanto às alterações trazidas da implantação do DW.
Figura 15 - Avaliação das Alterações Trazidas com o Uso do DW – Empresa A
Alterações Trazidas com o Uso do DW
1234567
Influência nos resultados da empresa após a
implantação
Melhoria contínua da informação
Aumento do nível de satisfação para o trabalho
Melhoria do processo decisório
Avaliação Geral do item
Consumidores
Gerência
112
6.1.4 Vantagens do Uso do DW
Conforme relato da Gerência, a única vantagem trazida pelo uso da ferramenta na
Empresa A foi facilitar a identificação de indícios de não conformidades.
Na tabela 13, estão avaliadas as vantagens de se utilizar o DW. Na Empresa A, os CI
“concordam em parte” que vantagens foram trazidas com o uso da ferramenta DW. Estes
“concordam” com a vantagem dos itens de infra-estrutura computacional e segurança. É
também necessário colocar que conforme relato da Gerência, uma das decisões que levaram a
compra e adoção da ferramenta foi sua facilidade de uso, item percebido como “neutro” pelos
CI.
Consumidores
Avaliação das Vantagens do Uso do DW
(Média n=13)
a. Simplicidade 4
b. Qualidade dos dados 5
c. Acesso rápido 5
d. Facilidade de uso 5
e. Vantagem competitiva 5
f. Custo de operação 5
g. Administração fluxo da informação 5
h. Habilita o processamento paralelo 4
i. Infra-estrutura computacional 6
j. Segurança 6
Média do item
5
Tabela 13 –Avaliação das Vantagens do Uso do DW – Empresa A
113
6.1.5 Métodos e Técnicas Estatísticas Utilizadas
Analisando-se a Tabela 14, abaixo descrita, observa-se que a técnica mais utilizada é a
técnica de Classificação, que associa ou classifica um item a uma ou várias classes categóricas
pré-definidas, sendo uma das técnicas apropriadas para classificação a análise discriminante.
Como a verificação dos métodos e técnicas estatísticas utilizadas não é o objetivo principal do
presente estudo, na conscientização inicial realizada, não foram incluídos seus respectivos
conceitos, gerando assim dúvidas a respeito das respostas dos entrevistados quanto a seu
conhecimento e coerente / correta utilização.
% de Utilização
Consumidores
(n=13)
Métodos e Técnicas Estatísticas Utilizadas
a. classificação 92
b. modelos de relacionamentos entre as variáveis 69
c. análise de agrupamento 77
d. sumarização 77
e. modelo de dependência 31
f. regras de associação 46
g. análise de séries temporais 46
Tabela 14: Avaliação dos Métodos e Técnicas Estatísticas Utilizadas - Empresa A
A soma dos percentuais é superior a 100% uma vez que se trata de uma pergunta com
respostas múltiplas.
114
6.1.6 Aplicação do DW na Rotina de Trabalho
Quanto à aplicação do DW na rotina de trabalho, a Gerência “discorda” da utilização
das informações geradas pela ferramenta para tomada de decisão, pois o processo decisório na
Empresa não é influenciado pelo uso da ferramenta.
Para os CI, a maioria utiliza diariamente a ferramenta DW em sua rotina de trabalho.
A Figura 16 descreve as formas de como é utilizada a ferramenta.
0% 5% 10% 15% 20% 25% 30% 35% 40%
Análise / Seleção
Consulta / Pesquisa / Obtenção
Desenv. e Manut. de Sistemas
Elaboração / Emissão de Relatório
Auditoria / Inspetoria
Encaminhamento de informações
Captação
Consolidação
Seleção
Formas de Utilização do DW na Rotina de Trabalho (%)
Figura 16 - Avaliação das Formas de Utilização do DW na Rotina de Trabalho– Empresa A
A soma dos percentuais é superior a 100% uma vez que se trata de uma pergunta com
respostas múltiplas.
115
6.1.7 Avaliação das Dimensões da QI
Abaixo na Tabela 15, estão relacionadas 16 dimensões distribuídas nas 4 categorias da
QI, descrevendo a avaliação da Gerência e Consumidores de Informação, respectivamente. De
maneira geral existe “concordância” com a QI na Empresa A, com exceção para a Gerência:
nas dimensões Reputação e Representação Concisa (Discorda em Parte) e Facilidade de
Manipulação (Neutro). Nestes três itens respectivamente o CI “concorda em parte” com a QI
das dimensões.
Os entrevistados “concordam plenamente” com a QI nas seguintes dimensões:
Gerência: Segurança no acesso, Integridade, Interpretabilidade, Facilidade de Entendimento e
Representação Consistente.
Consumidor de Informação: Relevância
116
Categoria / Dimensão Gerência
(n=1
Consumidor
(Média n=13)
Intrínseca
Acuracidade / Exatidão (correta e confiável)
6 5
Objetividade (Imparcialidade)
6 6
Credibilidade / Confiabilidade (verdadeira e verossímil)
6 5
Reputação (Fonte e conteúdo)
3 5
Média da categoria
5 5
Acessibilidade
Acessibilidade (disponível e recuperável)
6 5
Segurança no acesso (restrito e seguro)
7 6
Média da categoria 7 6
Qualidade contextual de dados
Relevância (aplicável e útil)
5 7
Valor agregado (benéfica e proporciona vantagens por seu uso)
6 6
Temporalidade / Oportunidade Tempo de resposta (Atualização)
6 5
Integridade / completeza / perfeição (Não está extraviada e é
suficiente)
7 6
Quantidade de informações apropriada (quanto o volume da
informação é apropriado para a tarefa ser executada)
6 6
Média da categoria 6 6
Representação
Interpretabilidade (linguagem apropriada, símbolos e unidades, e
definições claras)
7 6
Facilidade de entendimento (Facilmente compreendida)
7 6
Representação concisa (compactamente apresentada)
3 5
Representação consistente (Mesmo formato)
7 6
Facilidade de manipulação / operação (fácil de ser manipulada e
aplicada em diferentes tarefas)
4 5
Média da categoria 6 6
Média da QI na Empresa A
6
6
Tabela 15 – Avaliação das Dimensões da QI – Empresa A
117
6.1.8 Avaliação da Existência de Qualidade de Dados Pobre
Através da revisão da literatura podem-se definir problemas de qualidade de dados
como qualquer dificuldade encontrada, em uma ou mais dimensões de qualidade, que torna o
dado completamente ou largamente não pronto para uso.
No caso da Empresa A, conforme Tabela 16, os CI avaliaram os seguintes itens abaixo
como uma possível sinalização da existência de uma Qualidade de Dados Pobre (Revisão da
Literatura, Tabela 6), onde é possível relacionar as dimensões afetadas, a fase do processo em
que ocorre e seus possíveis efeitos na organização:
a. Difícil acesso à informação em um tempo razoável:
Dimensões afetadas: Representação Concisa, Temporalidade, Valor Agregado e
Acessibilidade.
Fase do Processo: Armazenagem da Informação.
Efeitos na Organização: Excesso de tempo requerido para extrair e sumarizar informação.
b. Informação não numérica é difícil de indexar:
Dimensões afetadas: Representação Concisa, Valor Agregado e Acessibilidade.
Fase do Processo: Armazenagem da Informação.
Efeitos na Organização: Dispendioso custo de armazenamento da informação, com um
pequeno potencial de benefício.
c. Análise de conteúdo automatizada, em coleções de informação ainda não disponível:
Dimensões afetadas: Representação Consistente, Relevância e Valor Agregado.
Fase do Processo: Utilização da Informação.
118
Efeitos na Organização: A análise de informações de imagem e texto armazenadas de
forma eletrônica é muito limitada.
d. Mudança da informação relevante e útil:
Dimensões afetadas: Relevância, Valor Agregado e Integridade.
Fase do Processo: Utilização da Informação.
Efeitos na Organização: Desenvolvimento de diferenças entre a informação disponível e o
que é necessário para as tarefas.
e. Fácil acesso conflita com requisitos de segurança, privacidade e confidencialidade:
Dimensões afetadas: Segurança, Acessibilidade e Valor Agregado.
Fase do Processo: Utilização da Informação.
Efeitos na Organização: Mecanismos para seguramente barrar o acesso, então a
informação provê menos valor.
f. Falta de fontes suficientes de computação:
Dimensões afetadas: Acessibilidade e Valor Agregado.
Fase do Processo: Utilização da Informação.
Efeitos na Organização: Falta de fontes de computação limita a qualidade da informação.
Convém ressaltar que no item 6.1.2 foi constatado que, na avaliação geral da
motivação, tanto a Gerência quanto os CI classificaram como “neutra”, as informações sobre
o armazenamento e disponibilidade das decisões tomadas, sendo este item identificado como
um dos passíveis de melhoria para a motivação.
119
Consumidores
Avaliação da Existência de Qualidade de Dados Pobre
(Média n=13)
a. Múltiplas fontes da mesma informação 2
b. Informação é produzida utilizando julgamentos subjetivos 2
c. Erros sistêmicos, perda da informação 2
d. Difícil o acesso a informação em um tempo razoável 3
e. Valores, definições e formatos inconsistentes 2
f. Indexação de informação não numérica 3
g. Análise de conteúdo automatizada, em coleções de informação ainda não disponível
3
h. Mudança da informação relevante e útil 3
i. Fácil acesso que conflita com requisitos de segurança, privacidade e confidencialidade 3
j. Falta de fontes suficientes de computação 3
Média do item
3
Tabela 16 Avaliação da Existência de Qualidade de Dados Pobre – Empresa A
6.1.9 Avaliação do Grau de Importância das Dimensões e Categorias da QI
Para a avaliação do grau de importância de cada uma das dimensões e categorias da
QI, foi solicitada à gerência e aos CI, a ordenação conforme o grau de importância do 1º ao 5º.
Para o cálculo do peso foi atribuído um valor para cada posição, onde: para o1º colocado o
valor 5, para o 2º o valor 4, para o 3º o valor 3, para o 4º o valor 2 e para o 5º o valor 1. Cada
valor foi multiplicado por suas respectivas freqüências e a soma dessa multiplicação foi
dividida pelo número de respondentes.
120
A Tabela 17 descreve as freqüências atribuídas às posições e os pesos de cada
Dimensão e, como resultante de cada Categoria, encontramos que as dimensões mais
importantes apontadas pela Gerência foram:
a. Acuracidade / Exatidão: correta e confiável, acurada (livre de erros), e valores reais.
b. Segurança no Acesso: segura, é protegida contra acessos não autorizados, o acesso a
informação é suficientemente restrito, somente acessada por pessoas que devem vê-la.
c. Credibilidade / Confiabilidade: verdadeira e verossímil, tem credibilidade, confiável,
crível, acreditável, fidedigna (merecedora de crédito).
Para os CI, as dimensões mais importantes apontadas foram:
a. Relevância: aplicável e útil para o trabalho, relevante, apropriada, pronta para o uso.
b. Acuracidade / Exatidão: correta e confiável, acurada (livre de erros), confiável e valores
reais.
d. Credibilidade / Confiabilidade: verdadeira e verossímil, tem credibilidade, confiável,
crível, acreditável, fidedigna (merecedora de crédito).
c. Valor Agregado: benéfica e proporciona vantagens por seu uso.
Quanto a importância atribuída às Categorias temos:
Para a Gerência: Categoria Intrínseca
Para os Consumidores de Informação: Categoria Contextual
121
Importância / Peso
Freqüência na posição
Importância
Gerência
(n=1)
Peso da
Importância
Consumidores
(n=13)
5
4
3
2
1
Intrínseca
Acuracidade 2 3 3 3
Objetividade 1 1
Credibilidade 3º 2 2 2 1
Reputação
8 4 5 6 1 1 3
Acessibilidade
Acessibilidade 4º 1 1 4 1
Segurança no acesso 1 1 1
6 2 2 5 1
Contextual
Relevância 3 7 1 1 1
Valor agregado 2 1 4 1 1
Temporalidade 1 1 3 1
Integridade 1 1 4 3
Quantidade 1 1 4
1 8 8 5 6 7 9
Representação
Interpretabilidade
Facilidade de entendimento 1 1
Representação concisa 2
Representação consistente 1
Facilidade de manipulação 1
1 4 1
Tabela 17 – Avaliação do Grau de Importância das Dimensões e Categorias da QI – Empresa A
De forma geral os itens mais importantes para a Gerência e CI na Empresa A são:
Relevância e Acuracidade. (n=14)
122
6.1.10 Avaliação Geral do DW
A qualidade da informação gerada pelo DW na “Empresa A”, conforme relato da
gerência, deve-se ao elevado nível dos profissionais que lá atuam, e por estes estarem
preparados para buscar as informações em diversas fontes. A Gerência e os CI “concordam
em parte” com a ferramenta DW. Existem pontos por eles relatados que são passíveis de
melhorias:
a. Para a Gerência: existe a necessidade de capacitação para a utilização do DW, falta um
setor (ou pessoas) abrangendo a Empresa como um todo, existe fragmentação e falta de
relacionamento e, ainda, falta de ferramentas compartilhadas.
b. Para os Consumidores de Informação: falta definir "gerentes de projeto" de forma integral,
que se responsabilizem por ele e não como respostas às demandas dos usuários. Sentem a
necessidade de um "projeto" no sentido mais amplo: o volume de dados no DW é grande e
é necessário otimizar a utilização desses dados, através de equipes técnicas das diversas
áreas, junto com a TI. É necessário criar-se uma metodologia eficiente de utilização dessas
informações e, o DW é considerada uma boa ferramenta que não está sendo devidamente
utilizada.
6.1.10.1 Pontos Positivos na Utilização do DW
Na entrevista foi solicitada à Gerência e aos CI a descrição individualizada de pontos
considerados positivos (perguntas abertas).
Na visão da Gerência: eliminação de relatórios solicitados, melhora na identificação de
indícios de não conformidades; diminuição do tempo de resposta às necessidades dos
usuários; e mudança de cultura.
123
Visão dos Consumidores de Informação:
a. Automação e informatização das rotinas; integração dos dados;
b. Qualidade da Informação: facilidade no acesso; disponibilidade e ampliação da
informação para o usuário e grupo gerencial; base concisa de informação; confiabilidade
das informações; facilidade de manipulação; coleta e geração de informações para tomada
de decisão; relevância;
c. Agilidade: na análise de dados históricos; na produção de informações; no cumprimento
da missão constitucional; no processamento; processos; procedimentos formais;
conhecimento da situação das entidades; cruzamento das informações com outras fontes
de dados; informações instantâneas e atualizadas; rapidez e eficiência na realização das
tarefas; otimização do trabalho e tempo; produtividade em tempo razoável; obtenção dos
dados;
d. Direcionamento de esforços;
e. Emissão de relatórios conforme necessidade;
f. Melhoria nos resultados;
g. Permite transparência na Gestão Pública; e
h. Possibilidade de gerenciamento dos dados.
6.1.10.2 Pontos Passíveis de Melhoria pelo Uso do DW
Na entrevista foi solicitada à Gerência e aos CI a descrição individualizada de pontos
considerados passíveis de melhoria (perguntas abertas).
124
Na visão da gerência: melhor definição das métricas, uso de servidor próprio mais
robusto, melhora da documentação; e participação mais ativa no processo decisório.
Na visão dos Consumidores de informação:
a. Capacitação / treinamento dos usuários; disseminação dos benefícios; divulgação através
de cursos; estrutura do BD (Informações disponíveis); necessidade de treinamento formal
mais freqüente;
b. Automatização de análises; se tornar mais amigável e integrado com outras diretorias
permitindo mais acesso e atuação de mais profissionais; interligação dos sistemas
existentes; integração entre entidades administrativas no sentido de aprimorar as análises;
maior interação entre os sistemas;
c. Consulta; inclusão de relatórios com buscas rápidas;
d. Documentação; manutenção;
e. Qualidade da informação coletada; duplicidade de fonte de informação; facilitar a
interpretação; facilitar o entendimento dos fluxos; fidelidade da informação; discussão
sobre a informação captada; melhorar a manipulação de dados; tornar a linguagem mais
clara, velocidade de acesso; ampliar os acessos à informação e informações captadas;
carregar mais informações; inclusão de dados importantes; acessibilidade dos dados
(internos externos) ao BD através do sistema; padronização de dados;
f. Necessidade de reestruturar o DW; pensar o DW como um todo;
g. Maior utilização pelo nível executivo da empresa; mesmo os desenvolvedores dos
sistemas tenham domínio sobre as informações constantes no mesmo; e
h. Utilização e disponibilidade de ferramentas para desenvolvimento de análises dos dados,
Ferramentas de controle.
125
6.2 Avaliação da Empresa B
A análise e interpretação dos resultados da Empresa B foram feitas considerando-se os
mesmos critérios anteriormente definidos para Empresa A.
Para a avaliação da QI com a utilização da ferramenta DW, foram entrevistados o
Gerente do Setor de Informática, responsável pela implantação do DW conforme questionário
do Anexo II e os CI conforme questionário do Anexo III.
Segundo a gerência, a decisão que levou a compra e adoção da ferramenta foi a
melhoria no tratamento das informações gerenciais, tendo como dificuldade na implantação a
determinação da carga de dados históricos, sendo que atualmente só está implementado no
setor de Vendas.
Para o desenvolvimento do projeto de implantação, a solução encontrada foi a compra
no mercado com o apoio de consultoria externa, seguindo-se a metodologia SAP para o
desenvolvimento do projeto de implementação.
O modelo dimensional e a formação de indicadores foram elaborados e definidos pelos
gestores. As fases de treinamento ocorreram conforme previsto na metodologia SAP.
Atualmente, as atualizações do DW são feitas pelo responsável ou conforme solicitação dos
usuários, e a reciclagem / treinamento dos CI é feita internamente.
A empresa não possui procedimentos nem indicadores para mensurar a qualidade de
informações do DW e os resultados das decisões tomadas são armazenadas em e-mail ou
documentação de projeto. O setor que demanda pelo uso do DW é o setor de Vendas e o tipo
de tarefa mais utilizado é a emissão de relatórios gerenciais.
Na empresa B, cinco CI foram entrevistados, sendo que a sua média de tempo na
empresa é de 3,6 anos e 100% são graduados. Segundo a gerência, o perfil desses
consumidores é de tomadores de decisão, na função de supervisores e analistas.
126
A utilização do DW no fluxo do processo decisório ocorre: na avaliação da
performance da área de vendas, em campanhas promocionais e definição de visitas que são
realizadas baseadas nas informações geradas.
6.2.1 Estágio de Informatização e Tempo de Implementação
O tempo de implantação da ferramenta DW na Empresa B é de aproximadamente dois
anos e a Gerência responsável pela implantação do DW classifica o tipo de sistema
atualmente utilizado pela empresa de Especialista e Gerencial. O Sistema Especialista, como
já descrito, é conhecido como "Expert Systems" (ES) ou como "Expert Support Systems"
(ESS). O Sistema Gerencial provê material para análise, planejamento e suporte à decisão,
podendo ser chamado também de "Management Information Systems" (MIS).
Com essas informações, conclui-se que a Empresa B encontra-se no estágio de
Integração, onde o usuário é a força propulsora e exige informações em maior quantidade,
menor tempo e com melhor nível de integração. Suas informações auxiliam a Gerência no
processo decisório.
A implementação da informatização ocorreu por iniciativa da Gerência e pessoal da TI
(Top Down). A empresa possui redes de computadores com sistemas operacionais SAP e SW
Especialistas, não existindo resistência aos SI existentes na empresa, pois faz parte de sua
cultura organizacional. A empresa possui sistemas operacionais com programa/ softwares
adquiridos para as áreas de: compras / suprimentos, vendas, contas a pagar e receber, estoque,
contábil e fiscal. As áreas de recursos humanos e folha de pagamento são terceirizadas.
127
6.2.2 Motivação para o Uso DW
Conforme descrito na Tabela 18, a Gerência “concorda” que mudanças são feitas no
sistema para atender a novas necessidades da informação para apoio à decisão e nem
“concorda” nem “discorda” quanto ao armazenamento e disponibilidade das informações
sobre decisões tomadas. Há “discordância” em relação aos demais itens relacionados.
Na melhor avaliação, o CI “concorda em parte” que a obtenção de informações
externas e internas sejam imediatas.
Quanto à avaliação geral da motivação, tanto a Gerência quanto os CI “discordam em
parte” que existe motivação para a utilização do DW. Vê-se que existe motivação por parte do
CI para o uso da ferramenta DW somente no que diz respeito à informação ser imediata e,
conforme a visão da gerência, somente nas mudanças feitas no sistema para atender a tomada
de decisão.
Essa avaliação da motivação pode ser justificada pelo DW só estar implementado no
setor de Vendas.
128
Avaliação da Motivação para o Uso do DW
Gerência
(n=1)
Consumidores
(Média n=5)
a.O modelo construído atende as necessidades gerais da organização
3
2
b. São feitas as mudanças no sistema para atender a novas necessidades da
informação para apoio á decisão
6 2
c. As informações sobre decisões tomadas são armazenadas e estão disponíveis
para outros processos de decisão
4 2
d. A interface com o usuário é fácil e amigável
2 4
e. A obtenção de informações externas e internas são imediatas
2 5
f. É feita a disseminação dos benefícios da utilização (cursos, palestras)
1 2
Média do item
3
3
Tabela 18 – Avaliação da Motivação para o Uso do DW – Empresa B
6.2.3 Alterações Trazidas com a Opção de Trabalhar com o DW
Analisando-se a Tabela 19 temos que, quanto a alterações trazidas com o uso da
ferramenta DW, a visão da gerência é mais positiva, pois “concorda em parte” enquanto os CI
“discordam em parte” .
Os CI “discordam” com o aumento do nível de satisfação para o trabalho e “discordam
em parte” que o DW teve influência nos resultados da Empresa após sua implementação.
129
Avaliação das Alterações Trazidas com o Uso DW
Gerência
(n=1)
Consumidores
(Média n=5)
a. Influência nos resultados da empresa após a implantação
7
3
b. Melhoria contínua da informação
5 4
c. Aumento do nível de satisfação para o trabalho
3 2
d. Melhoria do processo decisório
3 4
Média do item
5
3
Tabela 19 – Avaliação das Alterações Trazidas com o Uso do DW – Empresa B
Conforme descrito na Figura 17, a Gerência “concorda plenamente” que a implantação
do DW teve influência nos resultados da empresa e “concorda em parte” que existe o processo
de melhoria contínua da informação.
Alterações Trazidas com o Uso do DW
1234567
Influência nos resultados da empresa após a
implantação
Melhoria contínua da informação
Aumento do nível de satisfação para o trabalho
Melhoria do processo decisório
Avaliação Geral do item
Consumidores
Gerência
Figura 17 – Alterações Trazidas com o Uso do DW – Empresa B
130
6.2.4 Vantagens do Uso do DW
Os CI, conforme Tabela 20, “concordam plenamente” com a infra-estrutura
computacional e “concordam” com as vantagens do custo de operação e a segurança. Ainda,
“discordam em parte” da simplicidade e da administração do fluxo de informação.
Consumidores
Avaliação das Vantagens do Uso do DW
(Média n=5)
a. Simplicidade 3
b. Qualidade dos dados 5
c. Acesso rápido 5
d. Facilidade de uso 4
e. Vantagem competitiva 4
f. Custo de operação 6
g. Administração fluxo da informação 3
h. Habilita o processamento paralelo 5
i. Infra-estrutura computacional 7
j. Segurança 6
Média do item
5
Tabela 20 – Avaliação das Vantagens do Uso do DW – Empresa B
6.2.5 Métodos e Técnicas Estatísticas Utilizadas
Como na conscientização inicial não foi feita explanação sobre métodos e técnicas
estatísticas utilizadas, este item não será analisado.
131
% de Utilização
Consumidores
(n=5)
Métodos e Técnicas Estatísticas Utilizadas
a. classificação 20
b. modelos de relacionamentos entre as variáveis 20
c. análise de agrupamento 20
d. sumarização 40
e. modelo de dependência 0
f. regras de associação 0
g. análise de séries temporais 0
Tabela 21: Avaliação dos métodos e técnicas utilizadas- Empresa B
A soma dos percentuais é superior a 100% uma vez que se trata de uma pergunta de
respostas múltiplas.
6.2.6 Aplicação do DW na Rotina de Trabalho
A gerência “concorda plenamente” com a utilização das informações do DW no
processo decisório. Justifica que, atualmente, as informações relativas a Vendas só se
encontram disponíveis no DW.
Quanto aos CI, estes responderam que utilizam o DW para fechamento contábil,
sendo que, para tal, solicitam a retirada de relatório no SAP, o transferem para uma planilha
eletrônica e posteriormente extraem as informações de vendas, quantidades e valores por
cliente.
132
6.2.7 Avaliação das Dimensões da QI
A seguir a Tabela 22, relaciona as 16 dimensões distribuídas nas categorias da QI,
descrevendo a avaliação Gerência e CI respectivamente, onde se observa que, na Empresa B,
a gerência “concorda” e os CI “concordam em parte” com a QI.
A Gerência “concorda plenamente” com as dimensões: Credibilidade, Segurança no
acesso, Integridade e Quantidade de Informação apropriada.
Os CI, em sua percepção, “discordaram em parte” na dimensão Integridade e
classificaram como “neutro” ou seja, “nem concordam nem discordam” quanto às dimensões
relativas a Quantidade de Informações Apropriada, Representação Concisa e Facilidade de
Manipulação.
133
Categorias / Dimensões Gerência
(n=1)
Consumidor
(Média n=5)
Intrínseca
Acuracidade / Exatidão (correta e confiável)
6 5
Objetividade (Imparcialidade)
6 6
Credibilidade / Confiabilidade (verdadeira e verossímil
7 5
Reputação (Fonte e conteúdo)
6 5
Média da categoria 6 5
Acessibilidade
Acessibilidade (disponível e recuperável)
5 5
Segurança no acesso (restrito e seguro)
7 6
Média da categoria
6 6
Qualidade contextual de dados
Relevância (aplicável e útil)
5 5
Valor agregado (benéfica e proporciona vantagens por seu uso)
6 5
Temporalidade / Oportunidade Tempo de resposta (Atualização)
6 6
Integridade / completeza / perfeição (Não está extraviada e é
suficiente)
7 3
Quantidade de informações apropriada (quanto o volume da
informação é apropriado para a tarefa ser executada)
7 4
Média da categoria
6 5
Representação
Interpretabilidade (linguagem apropriada, símbolos e unidades, e
definições claras)
6 5
Facilidade de entendimento (Facilmente compreendida)
5 5
Representação concisa (compactamente apresentada)
5 4
Representação consistente (Mesmo formato)
5 5
Facilidade de manipulação / operação (fácil de ser manipulada e
aplicada em diferentes tarefas)
5 4
Média da categoria
5 5
Média da QI na Empresa B
6
5
Tabela 22 – Avaliação das Dimensões da QI – Empresa B
134
6.2.8 Avaliação da Existência de Qualidade de Dados Pobre
A Tabela 23 descreve a existência de sinais para uma possível qualidade de dados
pobre na Empresa B, onde se constata a quase inexistência desses sinais nos itens de
Facilidade de acesso (que conflita com requisitos de segurança), Privacidade e
confidencialidade e, Falta de fontes suficientes de computação.
Os CI sinalizaram os seguintes itens como possível existência de qualidade de dados
pobre, sendo possível relacioná-las com as dimensões afetadas, a fase do processo e seus
possíveis efeitos na organização (Tabela 6):
a. Múltiplas fontes da mesma informação:
Dimensões Afetadas: Consistência e Credibilidade.
Fase do Processo: Produção da Informação.
Efeitos na Organização: Financeiro e problemas legais.
b. A informação é produzida utilizando-se julgamentos subjetivos:
Dimensões Afetadas: Objetividade e Credibilidade.
Fase do Processo: Produção da Informação.
Efeitos na Organização: Financeiro e problemas legais.
c. Mudança de informação relevante e útil.
Dimensões Afetadas: Relevância, valor agregado e Integridade.
Fase do Processo: Utilização da Informação.
Efeitos na Organização: Desenvolvimento de diferenças entre a informação disponível e o
que é necessário para as tarefas.
135
Conforme Revisão da Literatura, as definições de qualidade que têm sido definidas
para uso por provedores de informação, não são apropriadas para os CI. Se existem problemas
de avaliação da QI na perspectiva do CI, como no caso da Empresa B para a dimensão
Integridade, podem-se identificar as causas através de uma análise similar à realizada para a
Tabela 7.
No caso, a dimensão Integridade / completeza / perfeição, se refere à informação não
estar extraviada e ser suficiente, pertencendo a Categoria Contextual. Para essa categoria,
temos os seguintes interesses e possíveis causas respectivamente:
a. Interesses da Qualidade de Dados: Problemas operacionais da produção de dados:
Mudança de necessidade dos consumidores de dados e Computação distribuída.
b. Possíveis causas: Dados incompletos, Representação inconsistente, Inadequação definida
ou dados mensurados. Resultados de dados que não poderiam ser propriamente agregados.
Avaliação da Existência de Qualidade de Dados Pobre Consumidores
(Média n=5)
a. Múltiplas fontes da mesma informação 4
b. Informação é produzida utilizando julgamentos subjetivos 4
c. Erros sistêmicos, perda da informação 2
d. Difícil o acesso a informação em um tempo razoável 2
e. Valores, definições e formatos inconsistentes 3
f. Indexação de informação não numérica 3
g. Análise de conteúdo automatizada, em coleções de informação ainda não disponível 3
h. Mudança da informação relevante e útil 4
i. Fácil acesso que conflita com requisitos de segurança, privacidade e confidencialidade 1
j. Falta de fontes suficientes de computação 1
Média do item
3
Tabela 23 – Avaliação da Existência de Qualidade de Dados Pobre – Empresa B
136
6.2.9 Avaliação do Grau de Importância das Dimensões e Categorias da QI
A avaliação do grau de importância atribuído as Dimensões e Categorias da QI,
encontra-se descrita na Tabela 24. As Dimensões mais importantes para a Gerência são:
a. Reputação (Fonte e Conteúdo): Têm reputação de qualidade, provêm de boas fontes, têm
bons conteúdos, têm credibilidade.
b. Credibilidade / Confiabilidade: verdadeira e verossímil, tem credibilidade, confiável,
crível, acreditável, fidedigna (merecedora de crédito).
c. Acuracidade / Exatidão: correta e confiável, acurada (livre de erros) e valores reais.
Para os consumidores de informação, foram:
a. Acuracidade / Exatidão: correta e confiável, acurada (livre de erros) e valores reais.
b. Credibilidade / Confiabilidade: verdadeira e verossímil, tem credibilidade, confiável,
crível, acreditável, fidedigna (merecedora de crédito).
d. Reputação (Fonte e Conteúdo): Têm reputação de qualidade, provêm de boas fontes, têm
bons conteúdos, têm credibilidade.
c. Interpretabilidade (linguagem apropriada, símbolos, unidades e definições claras): é
facilmente interpretada, é compreensível, fácil de entender, faz sentido, unidades de
medidas claras, apresentados em português.
Quanto à importância atribuída às Categorias, temos:
Para a Gerência e Consumidores de Informação: Categoria Intrínseca
137
Importância / Peso
Freqüência na posição
Categoria / Dimensões
Importância
Gerência
(n=1)
Peso da
Importância
Consumidores
(n=5)
5
4
3
2
1
Intrínseca
Acuracidade 3 2 2 1
Objetividade
Credibilidade 2º 3 1 3
Reputação 2 1 1 1
12 8 4 3 2 1 2
Acessibilidade
Acessibilidade 1
Segurança no acesso 1 1 1
2 1 2 1
Contextual
Relevância 1
Valor agregado 1 1 2
Temporalidade 1 1
Integridade 1 1
Quantidade 1
1 3 1 2 1 3
Representação
Interpretabilidade 2 2
Facilidade de entendimento 1
Representação concisa
Representação consistente
Facilidade de manipulação
2 2 1
Tabela 24 – Avaliação do Grau de importância das Dimensões e Categorias da QI – Empresa B
De forma geral, os itens mais importantes para a Gerência e CI na Empresa B são:
Credibilidade, Acuracidade e Reputação. (n=6)
138
6.2.10 Avaliação Geral do DW
A avaliação da QI gerada pelo DW da “Empresa B” foi justificada por relato da
gerência através do fato de ser uma ferramenta global, onde os filtros precisam ser bem
entendidos para ser feita corretamente a estratificação. A gerência “concorda em parte” com a
ferramenta DW e os CI estão na escala “neutra” ou seja, nem concordam nem discordam com
a ferramenta DW. Para eles o DW é uma boa ferramenta, porém o escopo foi muito limitado e
o investimento ainda não se justificou em virtude da pouca utilização;
6.2.10.1 Pontos Positivos na Utilização do DW
Para a Gerência :
a. Informações centralizadas;
b. Dados históricos e
c. Informações cruzadas;
Para os Consumidores de Informação:
a. Análise de dados históricos;
b. Formas de extrair informação que o sistema transacional não fornecia;
c. Padronização da informação e de indicadores entre as localidades;
d. Evita retrabalho;
e. Informação atualizada a qualquer momento;
f. Facilidade de preparar relatórios conforme as necessidades;
g. Informação disponível para o grupo gerencial;
h. Facilidade no acesso a informação;
139
i. Suporte na tomada de decisão; e
j. Qualidade das informações.
6.2.10.2 Pontos Passíveis de Melhoria pelo Uso do DW
Para a gerência:
a. Entendimento,
b. Autonomia, e
c. Ampliação de sua utilização.
Para os Consumidores de Informação
a. Disseminação dos benefícios (treinamento e divulgação);
b. Implantação em outras áreas do negócio, expansão outros módulos;
c. Maior utilização pelo nível executivo da empresa;
d. Inclusão de dados importantes; e
e. Carregamento de mais informações.
140
CAPÍTULO 7
CONSIDERAÇÕES FINAIS
7.1 Considerações Finais
A seguir serão apresentadas as considerações relativas à análise do presente estudo de
caso, na percepção do Consumidor de Informação, de acordo com as etapas de Análise do
Estudo de Caso (Figura 12).
Tempo de Implementação e Estágio de Informatização
O DW foi implementado há cinco anos na Empresa A e há aproximadamente dois
anos na Empresa B. A Empresa B é considerada no presente estudo como tendo um Sistema
de Informação Coorporativo, onde a ferramenta encontra-se implementada dentro do
processo, apenas no setor de Vendas.
O tipo de Sistema atualmente utilizado por essas empresas é o Sistema Especialista,
sendo que a Empresa B também o denominou como Sistema Gerencial. Ambas empresas se
encontram no estágio de Integração, que segundo a classificação de Nolan, neste estágio, em
resposta à pressão por melhor gestão, os SI passam a ser orientados para atender às
necessidades dos níveis gerenciais, onde as informações são de melhor qualidade sendo
exigida maior integração entre elas. Caso as Empresas se encontrassem no estágio de
141
Iniciação ou Contágio, dificilmente os SI implantados poderiam ser classificados e
caracterizados como MIS, SAD, ou EIS, que é o caso do Data Warehouse.
Motivação para o Uso do DW
Conforme Literatura, quando existe um SAD as informações fornecidas por ele são
incorporadas aos dados históricos e experiências individuais, possibilitando melhores
condições para a tomada de decisão. A saída ou a mudança do usuário poderá causar grande
impacto na organização. Entende-se que a motivação é uma variável fundamental para a
continuidade do colaborador na empresa.
A Tabela 25 descreve o resultado das avaliações relativas à motivação para o uso da
ferramenta, nas Empresas A e B.
Na Empresa A os CI “concordam em parte” que existe motivação para o uso da
ferramenta DW, sendo os seguintes itens os melhor avaliados: o modelo atende as
necessidades da organização, as mudanças que são feitas no sistema e a interface com o
usuário ser fácil e amigável.
Na Empresa B os CI “discordam em parte” quanto à motivação para o uso da
ferramenta. Nas melhores avaliações temos: a obtenção de informações externas / internas
serem imediatas e a interface com o usuário ser fácil e amigável. Esse resultado era esperado
no caso dessa empresa, uma vez que o DW está implementado somente no setor de vendas há
dois anos, e nos outros setores ainda está em início de implantação.
142
Motivação para o Uso do DW Empresa A Empresa B
(Média n=13) (Média n=5)
a. O modelo construído atende as necessidades gerais da organização 5 2
b
. São feitas as mudanças no sistema para atender a novas necessidades da
informação para apoio à decisão
5 2
c. As informações sobre decisões tomadas são armazenadas e estão
disponíveis para outros processos de decisão
4 2
d. A interface com o usuário é fácil e amigável 5 4
e. A obtenção de informações externas e internas são imediatas 4 5
f. É feita a disseminação dos benefícios da utilização (cursos, palestras) 4 2
Média do item
5
3
Tabela 25 - Avaliação da Motivação para o Uso do DW– Considerações Finais
Tanto na Empresa A como na B, não existe gerenciamento das informações, e o tempo
de implantação da ferramenta é diferente, porém verifica-se que, independentemente destes
aspectos, existe a motivação para o uso do DW no que diz respeito a este possuir uma
interface com o usuário fácil e amigável.
Alterações Trazidas com a Opção de Trabalhar com o DW e Aplicação do DW na
Rotina de Trabalho
Na Empresa A, a grande maioria utiliza diariamente a ferramenta DW em sua rotina de
trabalho, principalmente para análise e seleção de informações. Na Empresa B, somente as
informações relativas a Vendas se encontram disponíveis no DW.
143
Conforme descrito na Tabela 26, os CI da Empresa A “concordam”, que alterações
foram feitas ou condicionadas com a opção de trabalhar com o DW. Na empresa B, os CI
“discordam em parte” que alterações foram trazidas.
Alterações Trazidas com o Uso DW
Empresa A
(Média n=13)
Empresa B
(Média n=5)
a. Influência nos resultados da empresa após a implantação
6
3
b. Melhoria contínua da informação
6 4
c. Aumento do nível de satisfação para o trabalho
6 2
d. Melhoria do processo decisório
6 4
Média do item
6
3
Tabela 26 – Avaliação das Alterações Trazidas com o Uso do DW – Considerações Finais
Nas Empresas, a diferença de percepção em relação a alterações trazidas com o uso da
ferramenta DW pode ser justificada pelo tempo de implementação, sendo também que na
Empresa B a ferramenta DW se encontra implementada somente no setor de Vendas.
Vantagens do Uso do DW
Fazendo-se uma análise da Tabela 27, em ambas Empresas os CI “concordam em
parte” com as vantagens do uso do DW. Na percepção dos CI dessas Empresas, as maiores
vantagens da utilização da ferramenta DW estão na infra-estrutura computacional e
segurança.
144
Outra vantagem apontada, esta pela Empresa B, foi o custo da operação. Este item é
interessante, pois como se trata de uma organização coorporativa, existe preocupação quanto
a custos.
Empresa A Empresa B
Vantagens do Uso do DW
(Média n=13) (Média n=5)
a. Simplicidade 4 3
b. Qualidade dos dados 5 5
c. Acesso rápido 5 5
d. Facilidade de uso 5 4
e. Vantagem competitiva 5 4
f. Custo de operação 5 6
g. Administração fluxo da informação 5 3
h. Habilita o processamento paralelo 4 5
i. Infra-estrutura computacional 6 7
j. Segurança 6 6
Média do item 5 5
Tabela 27 - Avaliação das Vantagens do Uso do DW – Considerações Finais
Na Empresa A os CI “não concordam nem discordam” das vantagens do uso da
ferramenta no que diz respeito à simplicidade e habilitação para o processamento paralelo. Já
na Empresa B os CI “discordam em parte” também da simplicidade e da administração do
fluxo da informação.
Para as duas Empresas, a vantagem em relação à simplicidade foi o item menos
percebido pelos CI.
145
Métodos e Técnicas Estatísticas Utilizadas
Na questão que busca obter o nível de utilização de métodos e técnicas estatísticas
utilizadas nas Empresas, entendeu-se que havia desconhecimento conceitual por parte dos
entrevistados. Não sendo este fato inicialmente identificado, conseqüentemente não existiu na
conscientização inicial uma explicação sobre o assunto antes da aplicação do questionário.
Assim sendo, foi considerado que as respostas estão com vieses de interpretação.
Porém, é importante mostrar que um dos desafios está em aumentar a consciência da
necessidade da informação melhorada obtida por modelos complexos. Entende-se que deve o
aprendizado acadêmico se adequar a essas mudanças, uma vez que todas as ferramentas
estatísticas podem ser aplicadas e servem para equacionar qualquer fenômeno, principalmente
no processo decisório.
Dimensões da Qualidade da Informação
Conforme literatura podem-se definir problemas de qualidade de dados como qualquer
dificuldade encontrada, em uma ou mais dimensões de qualidade, que torna o dado
completamente ou largamente não pronto para uso.
Em relação ao aspecto de como é a QI na perspectiva do CI nas empresas que utilizam
DW, foram avaliadas 16 dimensões distribuídas em 4 categorias, conforme resultado descrito
na Tabela 28.
Na Empresa A os CI “concordam” que existe qualidade na informação e, na empresa
B, os consumidores “concordam em parte”, tendo “discordando” na dimensão Integridade.
146
Integridade, Completeza ou Perfeição é a extensão do quanto a informação não está
extraviada e é suficiente para a tarefa em amplitude e profundidade. No DW, os problemas de
Integridade podem ser causados por diversos motivos, tais como, carga incompleta na tabela
de fatos e dimensões incompletas. Outro aspecto importante é a forma como são tratados os
valores nulos.
Empresa A Empresa B
Categoria / Dimensão
(Média n=13) (Média n=5)
Intrínseca
Acuracidade 5 5
Objetividade 6 6
Credibilidade 5 5
Reputação 5 5
Média da categoria
5 5
Acessibilidade
Acessibilidade 5 5
Segurança no acesso 6 6
Média da categoria 6 6
Qualidade contextual de
Dados
Relevância 7 5
Valor agregado 6 5
Temporalidade 5 6
Integridade 6 3
Quantidade de informações 6 4
Média da categoria 6 5
Representação
Interpretabilidade 6 5
Facilidade de Entendimento 6 5
Representação concisa 5 4
Representação consistente 6 5
Facilidade de manipulação 5 4
Média da categoria
6 5
Média da QI 6 5
Tabela 28 – Avaliação das Dimensões da QI – Considerações Finais
Se existem problemas de avaliação da QI na perspectiva do CI, como no caso da
Empresa B na dimensão Integridade, podem-se identificar as causas numa análise feita através
147
da Tabela 7 contida no item Revisão da Literatura. No caso, esta dimensão pertence a
Categoria Contextual, onde os interesses da qualidade de dados e possíveis causas são
respectivamente:
a. Interesses da Qualidade de Dados: Problemas operacionais da produção de dados,
Mudança de necessidade dos consumidores de dados e Computação distribuída.
b. Possíveis causas: Dados incompletos, Representação inconsistente, Inadequação definida
ou dados mensurados. Resultados de dados que não poderiam ser propriamente agregados.
É de interesse ressaltar que na visão ontológica descrita na literatura, a dimensão
Integridade faz parte da visão interna (projeto, operação) de um SI que deve se preocupar com
o uso e efeito desse sistema. Diz respeito ao propósito e justificações do sistema e seu
desdobramento na organização e deve se preocupar com a construção e operação necessárias
para atingir a funcionalidade requerida. Nesse sentido, entende-se a avaliação da motivação
para o uso da ferramenta na Empresa B e a “discordância” com a dimensão Integridade, uma
vez que, atualmente, a ferramenta DW só está implementada no setor de Vendas e em
processo em implantação nos demais setores.
148
Existência de Qualidade de Dados Pobre
Observando-se a Tabela 29, podemos encontrar uma possível existência de dados
pobres nas duas Empresas. Conforme literatura, para cada sinal existente temos uma ou mais
dimensões afetadas, onde pode-se verificar a fase do processo e os respectivos efeitos na
organização. Uma vez localizada a dimensão deste sinal, é possível relacionar através da
Tabela 7 a Categoria a que pertence, identificando os Interesses da QI e suas causas.
No caso da Empresa A, temos os seguintes itens sinalizados e respectiva fase do
processo a que pertencem:
a. Difícil o acesso à informação em um tempo razoável e Informação não numérica é difícil
de indexar – Processo de Armazenagem da Informação;
b. Análise de conteúdo automatizada, em coleções de informação ainda não disponível;
Mudança da informação relevante e útil; Fácil acesso que conflita com requisitos de
segurança, privacidade e confidencialidade; e Falta de fontes suficientes de computação. –
Processo de Utilização da Informação.
Na Empresa B temos:
a. Múltiplas fontes da mesma informação e a informação é produzida utilizando-se
julgamentos subjetivos – Processo de Produção da Informação e
b. Mudança de informação relevante e útil – Processo de Utilização da Informação.
149
Empresa A Empresa B
Existência de Qualidade de Dados Pobre
(Média n=13) (Média n=5)
a. Múltiplas fontes da mesma informação 2 4
b. Informação é produzida utilizando julgamentos subjetivos 2 4
c. Erros sistêmicos, perda da informação 2 2
d. Difícil o acesso a informação em um tempo razoável 3 2
e. Valores, definições e formatos inconsistentes 2 3
f. Indexação de informação não numérica 3 3
g. Análise de conteúdo automatizada, em coleções de informação ainda não
disponível
3 3
h. Mudança da informação relevante e útil 3 4
i. Fácil acesso que conflita com requisitos de segurança, privacidade e
confidencialidade
3 1
j. Falta de fontes suficientes de computação 3 1
Média do item 3 3
Tabela 29 – Avaliação da Existência de Qualidade de Dados Pobre – Considerações Finais
Consumidores de Informação estão na fase do Processo de Utilização da Informação,
acessam e utilizam as informações para suas tarefas. A utilização pode envolver informações
adicionais, agregação e integração. Neste caso específico temos:
a. Análise de conteúdo automatizada, em coleções de informação ainda não está disponível:
Se a informação tem relevância e algum valor agregado, o consumidor deve também ser
capaz de agregar, manipular e utilizar essas informações para computar tendências.
b. A medida em que mudam as tarefas dos CI e o ambiente organizacional, a informação que
é relevante e útil também muda: A informação somente é de alta qualidade se atender as
necessidades das informações dos consumidores; somente eles fazem isso satisfazer o
aspecto contextual da QI.
150
c. Fácil acesso à informação pode conflitar com requisitos de segurança privacidade e
confidencialidade: Para os CI, informação de alta qualidade é informação que é facilmente
acessível. Garantir privacidade, confidencialidade e segurança da informação, entretanto,
requer barreiras ao acesso. Neste caso acessibilidade e segurança tendem a conflito.
d. Falta de fontes suficientes de computação limitam o acesso: Não prover recursos pode no
fim custar mais caro. Uma solução de longo prazo é desenvolver políticas de atualização
tecnológica.
Grau de Importância das Dimensões e Categorias da QI
As dimensões mais importantes para os CI na Empresa A são: Relevância,
Acuracidade, Credibilidade e Valor Agregado. Na empresa B são: Acuracidade, Reputação,
Credibilidade e Interpretabilidade. Observa-se que Acuracidade e Credibilidade são
dimensões importantes para ambas as empresas pesquisadas.
Conforme literatura, “o senso comum aponta a Acuracidade como sendo a própria QI,
sendo esta apenas uma das dimensões” e sendo também para um ambiente coorporativo, no
caso da Empresa B uma das mais importantes e relevantes dimensões da Categoria Intrínseca.
Quanto as categorias da QI, os CI da Empresa A consideram a Categoria Contextual
como sendo a mais importante, fato esse que, verificado na literatura, mostra nessa categoria a
inserção da informação em seu meio de utilização. Essa categoria representa que inexiste ou
deveriam existir poucos problemas operacionais com a produção de dados. São observadas na
literatura três causas básicas para que os consumidores de dados reclamem que os dados
disponíveis não apóiam suas tarefas: falta de dados (incompletos), dados inadequadamente
definidos ou medidos e dados que não puderam ser apropriadamente agregados.
151
Já na Empresa B os CI deram maior importância à Categoria Intrínseca, que pela
literatura mostra o fato de a informação ter qualidade em si mesma. Diferenças entre fontes
dos mesmos dados são causas comuns das preocupações. Inicialmente os consumidores de
dados não sabem a fonte na qual problemas de qualidade devem ser atribuídos. Eles sabem
somente que o dado é conflitante. Essa categoria representa a expectativa da inexistência de
múltiplas referências de um mesmo dado e o julgamento envolvido na produção deste.
Avaliação do Data Warehouse
Apesar dos esforços das Empresas estarem coerentes com a Revisão da Literatura
sobre as decisões que levaram a compra e adoção da ferramenta e quanto ao desenvolvimento
do projeto ser elaborado conforme definição dos usuários, não foi feito planejamento e
atualmente não existe um gerenciamento focado na QI, não existindo assim um plano para a
gestão, capacitação ou reciclagem nem a existência de procedimentos de avaliação.
O DW precisa ser considerado como um organismo vivo, seu processo não se encerra,
tendo sua evolução continuada como sendo o estado do mundo real dinâmico e não estático,
mudando ao longo do tempo. Este processo deverá estar seguidamente alimentando e
orientando as equipes envolvidas com os sistemas operacionais e coleta de informação no
sentido de aprimorar e assegurar a qualidade e disponibilidade dos dados relevantes para a
tomada de decisão da organização.
Ainda são poucas as organizações que adotam práticas estruturadas de gestão de
informação, e sem esta prática, é certa a exposição a riscos e falhas. O propósito para este
gerenciamento será a entrega de produtos de informação de alta qualidade para os CI, uma
vez que as Empresas deveriam atender a premissa de que as “organizações devem tratar
152
informação como um produto que se move através dos sistemas de manufaturas de
informações, de forma muito parecida com a de um produto físico”.
Numa visão geral, os CI da Empresa A “concordam” com a utilização da ferramenta
DW. Para eles, existe a necessidade de capacitação para a utilização do DW, definição de
"gerentes de projeto" que se responsabilizem por ele e não como respostas às demandas dos
usuários. O volume de dados DW é grande, e, portanto, precisa-se otimizar a utilização desses
dados através de equipes técnicas das diversas áreas, junto com a TI, necessitando-se de um
"projeto" no sentido mais amplo, onde se crie uma metodologia eficiente de utilização dessas
informações.
Na empresa B, a gerência “concorda em parte” com a ferramenta DW e os CI estão na
escala “neutra” ,ou seja, nem concordam nem discordam quanto a utilização da ferramenta
DW. Para eles o DW é uma boa ferramenta. Pelo processo estar ainda em fase de
implantação, o escopo é limitado e o investimento ainda não se justificou em virtude da pouca
utilização.
153
7.2 Síntese das Considerações Finais
Fazendo-se uma analogia ao ciclo PDCA, que compreende quatro passos, pode-se
observar que três desses foram aplicados ao presente estudo: 1- a definição dos requisitos de
qualidade e as métricas adotadas, 2- a medição / avaliação da QI no DW e, 3- a identificação
de potenciais causas dos problemas de QI. A quarta fase do ciclo PDCA, ou seja, a aplicação
de ações corretivas ou de melhoria para prevenir eventuais vulnerabilidades, não foi realizada
por não ser este um dos objetivos deste estudo, e, também, porque seriam necessários um
tempo maior e a manifestação de interesse por parte das Empresas para sua implementação.
Na etapa da Avaliação da QI no DW, ficou clara a diferença de visão entre os
Consumidores de Informação e a Gerência, esta podendo ser chamada de desenvolvedora de
SI. Também ficou claro o não conhecimento, por parte dos Consumidores de Informação, a
respeito dos conceitos da ferramenta DW, da QI e dos métodos e técnicas estatística utilizadas
para extração de informação.
A comparação dos resultados das avaliações da QI indica a importância atribuída pelos
Consumidores de Informação às dimensões e Categorias, levando-se em consideração que,
qualidade de dados é o “encontro consistente das "expectativas" dos Consumidores de
Informação” e um dado pronto para uso significa todas as dimensões atendendo ao
consumidor. Pode-se dessa forma inferir que existe uma diferença entre o desejado e o real,
fator que pode não estar atendendo a expectativa do Consumidor de Informação.
Numa manufatura de informação o consumidor de um sistema de informação é parte
do sistema e a matéria prima utilizada no processamento da informação são os dados. Ela
pode ser vista como um sistema agindo em dados brutos para produzir um produto de
informação. Assim sendo, pode-se considerar que o produto final, ou seja, os dados
processados no DW, são um Produto de Informação. Esta consideração baseia-se no simples
fato de que o dado é tratado para ser aplicado pelo DW.
154
Conforme Wand e Wang (1996), a qualidade de dados depende dos processos de
projeto e produção envolvidos na geração do dado. Para projetar uma melhor qualidade, é
necessário primeiro entender o que significa qualidade e como ele á medida.
Tendo em vista a questão inicial do presente Estudo, que é “como é a QI gerada pelo
DW na perspectiva do Consumidor de Informação”, avaliando-se a QI e o grau de
importância atribuído às dimensões e categorias da QI, pode-se concluir que, depois de
efetuada a análise e interpretação dos resultados, os objetivos propostos foram plenamente
atingidos.
155
7.3 Proposta de Trabalhos Futuros
Como propostas para trabalhos futuros tem-se:
a. Medir a diferença de avaliação da QI entre os desenvolvedores e Consumidores de
Informação do DW;
b. Identificar o perfil das Empresas que utilizam o DW;
c. Disseminar o conhecimento acadêmico dos conceitos e aplicações da QI;
d. Avaliar o impacto do DW na QI, na perspectiva de Desenvolvedores e Consumidores de
Informação;
e. Propor uma metodologia para a implantação do TDQM em Empresas que utilizam o DW;
f. Propor uma metodologia de medição da QI, conforme o perfil / cultura da empresa,
focando as dimensões;
g. Verificar as associações e similaridades entre as variáveis qualitativas (análise de
correspondência ou Cluster ) com as dimensões da QI; e
h. Levantar nas Empresas que utilizam o DW a aplicação de métodos e técnicas estatísticas
utilizadas na garimpagem de dados.
156
REFERÊNCIAS BIBLIOGRÁFICAS UTILIZADAS
AL-HAKIM, Latif. Information Quality Function Deployment Proceedings of the Ninth
International Conference on Information Quality (ICIQ 04), p.170-182, 2004.
AMARAL, G. C. M.; CAMPOS, M. L. M. Modelando Metadados de Qualidade no Data
Warehouse. IV Simpósio de Desenvolvimento e Manutenção de Software da Marinha.
Disponível em http://www.sdms.mar.mil.br/artigos/6918.pdf. 2004.
ANGELES, M. P. Detection and Resolution of Data Inconsistencies, and Data Integration
Using Information Quality criteria. Technical Report (17). 2004. Disponível em:
http://www.macs.hw.ac.uk:8080/techreps/docs/files/HW-MACS-TR-0017.pdf
ARNDT, D.; LANGBEIN, N. Data Quality in the Context of Customer Segmentation.
Proceedings of the Seventh International Conference on Information Quality (ICIQ-02),
p. 47-60, 2002.
BERTOLAZZI, P.; SCANNAPIECO M. Introducing Data Quality in a Cooperative Context.
In: Proceedings of the 6th International Conference on Information Quality (IQ2001),
Boston, MA , USA, 2001.
BEUREN, I. M.; GIBBON, A. R. O. Considerações Acerca do Sistema de Informação
Gerencial como Suporte ao Controle de Gestão: Uma Abordagem da Gestão do
Conhecimento. XXI Encontro Nacional de Engenharia de Produção. Salvador, BH, 2001.
BHARGAVA H. K.; SRIDHAR, S.; HERRICK C. Beyond Spreadsheets: Tools for Building.
Decision Support Systems. IEEE , p.31-39, March, 1999.
BISPO, Carlos A. F. Uma Análise da Nova Geração de Sistemas de Apoio à Decisão.
1998. Dissertação (Engenharia da Produção) - Escola de Engenharia de São Carlos. USP, São
Carlos.
BOVEE, Matthew. Empirical Validation of the Structure of in a Information Quality Model.
Proceedings of the Ninth International Conference on Information Quality, (ICIQ-04).
p.358-372, 2004.
157
BURGESS M. S. E.; GRAY W. A.; FIDDIAN N. J. Quality Measures and the Information
Consumer. Proceedings of the Ninth International Conference on Information Quality
2004.
CARNEIRO, A. C A. O. Uso de Estruturas de Metadados na Implementação da Qualidade
dos Dados de um Data Warehouse: Dataware, UFRJ Junho 2001
CASSARRO, Antonio C. Sistemas de Informações para Tomada de Decisões. 3ª ed., São
Paulo, Thomson, 2001.
CASTELLS, Manuel A Sociedade em Rede A Era da Informação: Economia, Sociedade e
Cultura. Vol. 1, Ed. Paz e Terra, 1999.
CELLA, Gilciane. Implantação de Sistemas Integrados de Gestão: Um estudo
exploratório na empresa de Telefonia Telet S.A. 2002. Dissertação (Pós-graduação em
Administração) - UFRS, Porto Alegre.
CERVO, Amado L.; BERVIAN, Pedro A. Metodologia Científica, 4ª edição, São Paulo,
Makron Books, 1996
CHENOWET, T.; DOWLING, K. L.; ST LOUIS, R. D. Convincing DSS Users that
Complex Models are Worth the Effort, Decision Support Systems, v.37, p.71-82, 2004.
COME, Gilberto. Contribuição ao Estudo de Implementação de Data Warehousing: Um caso
no Setor de Telecomunicações. 2001. Dissertação (Departamento de Administração).
Faculdade de Economia Administração e Contabilidade, São Paulo, FEA/USP.
DOHERTY N F; DOIG G - An Analisys of the Anticipadet Cultural Impacts of
Implemementation of Data Warehouse. IEEE Transactions on Engineering Management,
v. 50, n. 1, Feb 2003
FALSARELLA O M; CHAVES, E O. C. Sistemas de Informação e Sistemas de Apoio à
Decisão. Revista de Informática, PUCCAMP, v3 n 01, Jan-Jun1995.
FAVARETTO F.; MATTIODA R. A. A. Medição da Qualidade da Informação: Um
Experimento na Pesquisa em Base de Dados Científicas. XXV Encontro Nacional de
Engenharia de Produção, Porto Alegre, Nov. 2005
158
FAVARETTO, Fábio. Proposta de Medição da Qualidade da Informação – XII Simpósio de
Engenharia da Produção SIMPEP, Bauru, SP, Nov. 2005
FERRO, Wanderson R. Contribuição ao Estudo da Implantação da Gestão do
Relacionamento com o Cliente em Bancos Sediados no Estado de São Paulo. 2003.
Dissertação (Pós-graduação em Administração) - Faculdade de Economia Administração e
Contabilidade, São Paulo.
FREIRE, J. E.; SEIXAS, J A; CAZARINI, E W . Competência na Atual Sociedade da
Informação. XXI Encontro Nacional de Engenharia de Produção – ENEGEP. Salvador,
BH, 2001.
FREITAS JÚNIOR, Olival de Gusmão et al. A Utilização de Agentes Inteligentes no
Desenvolvimento de um Data Warehouse. XXI Encontro Nacional de Engenharia de
Produção – ENEGEP, Salvador, BH, 2001.
GOMES, Luiz F. A.M.; GOMES Carlos F. S.; ALMEIDA, Adiel T. Tomada de Decisão
Gerencial: Enfoque Multicritério. São Paulo, Atlas, 2002.
GRAEML, Alexandre Reis. Sistemas de Informação - O Alinhamento da Estratégia de TI
com Estratégia Coorporativa. São Paulo, Atlas, 2000.
INMON, Willian H. Como Construir o Data Warehouse. 2ª ed. Rio de Janeiro, Campus,
1997.
KAHN, B. K.; STRONG, D. M.; WANG R. Y. Information Quality Benchmarks: Product
and Service Performance. Communication of the ACM. ACM Press, New York, N.Y. USA,
v.45, n.4, p.184-192, 2002.
KIMBALL, Ralf. The Data Warehouse Toolkit – Practical Techniques for Building
Dimensional Data Warehouse. John Wiley & Sons, Inc, 1996.
KWANK, C.; YIH, Y. Data-Mining Approach to Production Control in the Computer-
Integrated Testing Cell. IEEE Transactions on Robotics and Automation, v.20, n.1,
February 2004
LEE Y. W.; PIPINO L; STRONG D. M.; WANG R. Y. Process-Embedded Data Integrity
Journal of Database Management, v.15, n.1; p.87-103, jan-mar 2004.
159
LEE, Y. W. et al. AIMQ: A Methodology for Information Quality Assessment, Information
and Management, v.40, n.2, p.133-146, 2002.
MACHADO FILHO, Claudio A. P. Responsabilidade Social Corporativa e a Criação de
Valor para as Organizações: Um Estudo Multicasos. 2002. Tese (Departamento de
Administração) - Faculdade de Economia, Administração e Contabilidade, São Paulo.
MARTIN, Steven W. Managing Information Technology. 4ed, Prentice-Hall, 2001.
MARTINS, Roberto A. Sistemas de Medição de Desempenho: Um Modelo para
Estruturação do Uso. 1999. Tese (Departamento de Engenharia da Produção) - Escola
Politécnica da Universidade de São Paulo.
NAUMANN, F.; ROLKER C. Assessment Methods for Information Quality Criteria
Proceedings of the Conference on Information Quality, (IQ2000). Cambridge, Mass.,
2000.
NAUMANN, F.; LESER, U.; FREYTAG J. C. Quality-Driven Integration of Heterogeneous
Information Systems Proceedings of the 25
th
Conference. Edinburgh, Scotland, p. 447-458,
1999.
PARK, YONG-TAE, An Empirical Investigation of the Effects of Data Warehousing on
Decision Performance – Information & Management, California State University, v.43,
p.51-61, 2006.
PENNA, R. A. C.; REIS A. S. O Data Warehouse como Suporte à Inteligência de Negócio –
VI Simpósio de Administração da Produção, Logística e Operações Internacionais, São
Paulo, 2003.
PIERCE, Elizabeth M. Developing, Implementing and Monitoring an Information Product
Quality Strategy. Proceedings of the Ninth International Conference on Information
Quality, p.13-26, 2004.
PIPINO, L L ; LEE Y. W.; WANG R. Y. Data Quality Assessment - Communications of
the ACM, ACM Press, New York, N.Y. USA, v.45, n.4, p. 211 - 218, April 2002.
PORTER, Michael. Revolução em Tempo Real. Rio de Janeiro, Editora Campus, 1997.
160
POZZEBON, M.; FREITAS, H. M. R. Pela Aplicabilidade - Com Maior Rigor Científico -
dos Estudos de Caso em Sistemas de Informação, 21º Encontro da Associação Nacional de
Pós-Graduação e Pesquisa em Administração ANPAD, Rio das Pedras, 1997.
REZENDE, D. A.; ABREU, A. F. Tecnologia da Informação - Aplicada a Sistemas de
Informações Empresariais. 2ª Ed., São Paulo, Atlas, 2001.
SANTOS, L.; AMARAL L.; OLIVEIRA J. N. Migração de Dados do Sistema Científico
Português para a Plataforma Lattes. “Actas da III Workshop da comunidade LMPL”, 3,
Florianópolis, 2002.
SAKAGUCHI, T.; FROLICK, M. A. Review of the Data Warehousing Literature. Journal of
Data Warehousing, v.2, n.1, p.34-54, 1997.
SAUTER, Vicki L. Intuitive Decision-Making, Association for Computing Machinery,
Academic Research Library, 1999.
SFERRA H. H. ; CORRÊA A. M. C. J. Conceitos e Aplicações de Data Mining. Revista de
Ciência & Tecnologia. v.11, n22, p.19-34 – Jul 2003.
SHANKAR, G.; WATTS S. A Relevant, Believable Approach for Data Quality Assessment
Proceedings of the Eighth International Conference on Information Quality (ICIQ-03),
2003.
SHANKARANARAYAN G; ZIAD M; WANG R Y Managing Data Quality in Dynamic
Decision Environments: An Information Product Approach: Journal of Data Management .
Oct 2003.
SILVA, Veridiano Lucas da. Diagnóstico do Nível de Tecnologia da Informação e dos
Sistemas de Informações Contábeis Gerenciais no Processo Decisório das Micro e
Pequenas Empresas do Ramo de Confecções do Município de Colatina. 2002. Dissertação
(Mestrado em Engenharia da Produção) - UFSC, Florianópolis.
SINGH, Harry S. Data Warehouse - Conceitos, Tecnologias, Implementação e
Gerenciamento. São Paulo, p. 14, Makron Books, 2001
SLACK, Nigel et al. Administração da Produção. São Paulo, Atlas1999.
161
SPRAGUE, RalphH.; WATSON Hugh J. Sistema de Apoio à Decisão – Colocando a
Teoria em Prática. Rio de Janeiro, Campus, 1991
STRONG, D. M.; LEE, Y. W.; WANG, R. Y 10 Potholes in the Road to Information Quality.
Proceedings of IEEE, 18:9162, p.38-46, Aug 1997a.
STRONG, D. M.; LEE, Y. W.; WANG, R. Y. Data Quality in Context. Communications of
the ACM, v.40, n.5, p.103-110. ACM Press, New York, N.Y. USA. May 1997b.
WAND Y.; WANG R. Y. Anchoring Data Quality Dimensions in Ontological Foundations,
Communications of the ACM, v.39, n.11, p. 86-95, ACM Press, New York, N.Y. USA,
1996.
WANG, Richard Y. A Product Perspective on Total Data Quality Management.
Communications of the ACM, v. 41, n.2, p.58-65, ACM Press, New York, N.Y. USA, 1998.
WANG, R. Y.; ZIAD M.; LEE, Y. W. Data Quality. Kluwer Academic Publishers. Hinghan ,
MA, USA2000.
WANG, R. Y; STRONG, D. M. Beyond Accuracy: What Data Quality means to Data
Consumers – Journal of management information Systems,v.12, n.4, spring 1996.
YIN, Robert K. Estudo de Caso: Planejamento e Métodos. 2ª ed., Porto Alegre, Bookman,
2001.
162
ANEXO I – PROTOCOLO DE PESQUISA
1) Estruturais da Empresa
Enfoque Questões a serem levantadas Respostas
a) Cadastro da
Empresa
Nome, endereço, início das atividades, setor,
número de filiais (se existir), principais
produtos e número de empregados.
Entrevista com o(s)
responsável(is) pelo
DW, Documentos,
registros em arquivos e
observação
participante.
b) Cadastro do
consumidor de
informação
Nome, sexo, idade, grau de instrução,
formação, função, tempo na função, setor,
processos que está envolvido, capacitação e
freqüência da capacitação.
Entrevista,
documentos, registros
e Observação-
participante.
2) Implementação DW
Enfoque Questões a serem levantadas Respostas
a. Decisão para
implantação
Decisão pela adoção do sistema DW e
questões polêmicas que surgiram durante a
implementação.
b.
Desenvolvimento
do projeto
Pronta do mercado ou desenvolvida
internamente, com ou sem consultoria externa;
etapas seguidas para o desenvolvimento do
projeto de implementação; Elaboração do
modelo dimensional; elaboração e julgamento
da formação de indicadores; fase de
treinamento e atualização dos procedimentos do
DW.
Entrevista com o(s)
responsável(is) pelo
DW, Documentos,
registros em arquivos
e observação
participante.
3) Documentação
Enfoque Questões a serem levantadas Respostas
a.
Documentação
procedimento que a empresa utiliza para
mensurar a QI do DW e como é feita e
armazenamento dos resultado das decisões
Entrevista com o(s)
responsável(is) pelo
DW, Documentos,
registros em arquivos e
observação
participante.
163
4) Consumidores de informação
Enfoque Questões a serem levantadas Respostas
a. Informações
sobre os
consumidores de
informações da
empresa
pessoas habilitadas para o uso do DW; perfil;
setores que mais demandam pelo uso do DW;
tarefas que é utilizado e freqüência e
Reciclagem e treinamento dos consumidores de
informação
Entrevista com o(s)
responsável(is) pelo
DW, Documentos,
registros em arquivos e
observação
participante.
b. Avaliação grau de utilização do DW pelos consumidores
de informação; Nível de benefícios com seu
uso qualidade da informação fornecida pelo
DW; qualidade das informações fornecidas
pelos SI;
Entrevista com o(s)
responsável(is) pelo
DW, Documentos,
registros em arquivos e
observação
participante.
5) Estágio de Informatização
Enfoque Questões a serem levantadas Respostas
a) Informatização tipo de implementação, sistemas operacionais
existentes, redes de computadores, avaliação
do nível de informatização existente na
empresa.
b) Classificação
dos Sistemas
transacionais, gerenciais, executivos,
especialistas, de apoio à decisões.
c) Uso de SI percepção do percentual de informatização
existente na empresa, avaliação do grau
resistência ao uso da SI por parte dos usuários
da empresa, Avaliação do grau de utilização
das informações do DW para tomada de
decisão
Entrevista com o(s)
responsável(is) pelo
DW, Documentos,
registros em arquivos e
observação
participante.
164
6) Utilização do DW
Enfoque Questões a serem levantadas Respostas
a) Utilização nos
setores
Fluxo de utilização e métodos e técnicas
utilizadas (classificação, modelos de
relacionamentos entre as variáveis, análise de
agrupamento, sumarização, modelo de
dependência, regras de associação e análise de
séries temporais).
Entrevistas com o(s)
responsável DW e
consumidores de
informação,
documentos e registros
observação
participante
b) Motivação
para sua
utilização
Percepção: se o modelo atende as necessidades
gerais da organização; como são feitas as
mudanças no sistema para atender a novas
necessidades da informação para apoio à
decisão; informações sobre decisões tomadas
são armazenadas e estão disponíveis para
outros processos de decisão; interface com o
usuário deve ser fácil e amigável; obtenção de
informações externas e internas são imediatas e
disseminação dos benefícios da utilização.
Entrevistas com os
consumidores de
informação,
documentos e registros
observação
participante
c) Vantagens
Avaliação: Simplicidade, qualidade dos dados,
acesso rápido, facilidade de uso, vantagem
competitiva, custo de operação, administração
do fluxo da informação, processamento
paralelo, infra-estrutura computacional e
segurança.
Entrevistas com os
consumidores de
informação,
documentos e registros
observação
participante
d) Resultados alterações trazidas pelo uso do DW (influência
nos resultados, melhoria contínua, satisfação,
melhoria processo decisório).
Entrevistas com o(s)
responsável(is) DW e
consumidores de
informação,
documentos e registros
observação
participante
165
8) Existência de sinais de uma Qualidade de Dados Pobre
Enfoque Questões a serem levantadas Respostas
a) Sinais Múltiplas fontes da mesma informação;
Informação que é produzida utilizando
julgamentos subjetivos; Erros sistêmicos,
perda da informação; Difícil o acesso a
informação em um tempo razoável; Valores,
definições e formatos inconsistentes;
Indexação de informação não numérica;
Análise de conteúdo automatizada, em
coleções de informação ainda não disponível;
Mudança da informação relevante e útil; Fácil
acesso à informação que conflitem com
requisitos de segurança privacidade e
confidencialidade; e Falta de fontes suficientes
de computação.
Entrevistas com os
consumidores de
informação,
documentos e registros
observação
participante
9)Avaliação das dimensões da Informação
Entrevistas com o(s) responsável(is) DW e consumidores de informação, documentos e
registros observação participante
9.1 - Acuracidade / Exatidão (correta e
confiável)
correta, acurada (livre de erro), confiável,
valores reais
9.2 - Objetividade (Imparcialidade)
objetivamente coletada, baseada em fatos,
objetiva, ponto de vista imparcial
9.3 - Credibilidade / Confiabilidade
(verdadeira e verossímil)
tem credibilidade, verdadeira, confiável,
crível acreditável, fidedigna (merecedora
de crédito)
9.4 - Reputação (Fonte e conteúdo)
tem reputação de qualidade, provêm de
boas fontes, tem bons conteúdos, têm
credibilidade
9.5 - Acessibilidade (disponível e
recuperável)
é facilmente recuperada, está acessível,
pode ser obtida, disponível, de rápido
acesso, fácil obtenção dos dados
9.6 - Segurança no acesso (restrito e
seguro)
é protegida contra acessos não autorizados,
o acesso a informação é suficientemente
restrito, somente acessada por pessoas que
devem vê-la
9.7 - Relevância (aplicável e útil)
é útil para o trabalho, relevante,
apropriada, aplicável, pronta para o uso
166
9.8 - Valor agregado (benéfica e
proporciona vantagens por seu uso)
é benéfica, traz vantagens por seu uso
9.9 - Temporalidade / Oportunidade
Tempo de resposta (Atualização)
é suficientemente atual para o trabalho,
oportuna e atualizada
9.10 - Integridade / Completeza /
Imperfeição (Não está extraviada e é
suficiente)
inclui todos os valores necessários,
completa, cobre as necessidades das
tarefas, tem suficiente amplitude e
profundidade
9.11 - Quantidade de informações
apropriada (quanto o volume da
informação é apropriado para a tarefa
ser executada)
tem volume suficiente as necessidades das
tarefas
9.12 - Interpretabilidade (linguagem
apropriada, símbolos e unidades, e
definições claras)
é facilmente interpretada, é compreensível,
fácil de entender, faz sentido, unidades de
medidas claras, apresentados em português
9.13 - Facilidade de entendimento
(Facilmente compreendida)
a informação é fácil de entender, clara,
livre de duplos significados
9.14 - Representação concisa
(compactamente apresentada)
concisamente apresentada (breve e
resumida), de forma compactada
9.15 - Representação consistente
(Mesmo formato)
a informação é consistentemente
apresentada no mesmo formato, em
formato conciso
9.16 - Facilidade de manipulação /
operação (fácil de ser manipulada e
aplicada em diferentes tarefas)
a informação é fácil de manipular para
atender nossas necessidades, fácil para
agregar, fácil de combinar com outras
informações
10) Comentário Geral
Enfoque Questões a serem levantadas Respostas
1) Pergunta
aberta para o
parecer do
entrevistado
a) conhecimento do DW; b) pontos positivos
na utilização do DW; c) pontos passíveis de
melhoria e d) avaliação geral DW
167
ANEXO II – QUESTIONÁRIO – NÍVEL GERENCIAL
Nome:______________________________________________________________________
Endereço:___________________________________________________________________
Início das atividades:_________________ Número de filiais (se existir):_________________
Principais produtos:___________________________________________________________
Número de empregados: __________________
Responsabilidade Data Warehouse
Tempo de implementação DW:______________Responsável:_________________________
Função: ____________________________________Tempo na função:_________________
I) Data Warehouse
1) Implantação DW
a) Quais as decisões que levaram a compra e adoção do sistema DW;
b) Quais as questões mais polêmicas que surgiram durante a implementação;
c) Para o desenvolvimento do projeto a solução foi pronta do mercado, desenvolvida
internamente, com ou sem consultoria externa;
d) Quais as etapas seguidas para o desenvolvimento do projeto de implementação;
e) Foi elaborado o modelo dimensional;
f) Como foi julgada e elaborada a formação de indicadores;
g) Como ocorreu a fase de treinamento (carga/participante);
h) Como é feita a atualização dos procedimentos do DW;
2) Documentação
a) Como são armazenados os resultados das decisões tomadas pelo DW
3) Consumidores de informação
a) Quantas pessoas atualmente na empresa, estão habilitadas para utilizar o DW;
b) Qual o perfil desse consumidor de informação;
c) Quais setores mais demandam pelo uso do DW;
d) Em quais tipos de tarefas o DW é utilizado e com que freqüência;
e) Como é feita a reciclagem/treinamento dos consumidores de informação do DW.
ESCALA LIKERT
1234567
Discordo
Plenamente Discordo
Discordo
em Parte Neutro
Concordo
em Parte Concordo
Concordo
Plenamente
168
4) Avaliação do DW e Qualidade da Informação
1) Avalie as motivações dos consumidores de informação para utilização do DW. Conforme
Escala Likert:
a) O modelo construído atende as necessidades gerais da organização ( )
b) São feitas as mudanças no sistema para atender a novas necessidades da informação para
apoio à decisão ( )
c) As informações sobre decisões tomadas são armazenadas e estão disponíveis para outros
processos de decisão ( )
d) A interface com o usuário é fácil e amigável ( )
e) A obtenção de informações externas e internas são imediatas ( )
f) A feita a disseminação dos benefícios da utilização (cursos, palestras) ( )
2) Avalie o grau de utilização do DW pelos consumidores de informações. Conforme Escala
Likert.
( ) Porque? _____________________________________________________________
3) Avalie o nível de benefícios com o uso do DW. Conforme Escala Likert.
( ) Cite alguns:____________________________________________________________
4) Avalie a qualidade das informações fornecidas pelo DW. Conforme Escala Likert.
( ) Justifique: _____________________________________________________________
5) Quais os procedimentos que a empresa utiliza para mensurar a qualidade de informação do
DW e como é feita essa mensuração.
___________________________________________________________________________
6) Avalie a qualidade das informações fornecidas pelos Sistemas de Informação. Conforme
Escala Likert.
( )Justificativa: ___________________________________________________________
7) Avalie as alterações trazidas ou condicionadas com a opção de trabalhar com o DW.
Conforme Escala Likert.
a) Influência nos resultados da empresa após a implantação ( )
b) Melhoria contínua da informação ( )
c) Aumento do nível de satisfação para o trabalho ( )
d) Melhoria do processo decisório ( )
e) Outras: ________________________________________ ( )
169
II) Estágio de Informatização
1) A implementação da informatização. (Marcar “X” – Resposta ùnica)
a) ( ) Top Down - Iniciativa por parte da gerência ou pessoal da TI
b) ( ) Botton Up – Iniciativa por parte dos usuários
2) Quais são os sistemas operacionais existentes:
___________________________________________________________________________
3) A empresa possui redes de computadores. (Marcar “X” – Resposta ùnica)
a) ( )sim b) ( ) não Quais?_________________________________________________
4) Avalie o nível de informatização existente na empresa. Conforme Escala Likert.
( ) Justifique:______________________________________________________________
5) Como você classifica o(s) tipo(s) de sistema(s) atualmente utilizado pela empresa?
(Marcar “X” – Resposta Múltipla)
a) ( ) Transacionais- Sistemas Operacionais não integrados que atendem em geral às áreas
administrativo-financeira, controlam na maioria das vezes, o fluxo de informações
financeiras (contabilidade, folha de pagamento, contas a pagar e a receber, controle físico
de estoques – programas isolados)
b) ( ) Gerenciais – Sistemas que fornecem informações integradas e sumarizadas
provenientes de diversos sistemas transacionais: Controle de estoques, fluxo de caixa,
controle orçamentário – maior integração)
c) ( ) Executivos – São baseados nos EDPS, no MIS e em dados coletados em fontes
externas à organização dirigidos à alta gerencia das empresas ( política de preços,
orçamento, análise de investimentos integrados com os gerenciais)
d) ( ) Especialistas – São os que armazenam e disponibilizam o conhecimento e as
experiências dos especialistas. Podem ser desenvolvidos em qualquer dos estágios
acima(transacionais, gerenciais ou executivos)
e) ( ) De Apoio à Decisões – (SAD) Sistema criado especialmente para dar subsidio às
decisões serem tomadas através da interação constante do usuário com um ambiente
formado por Banco de Dados, Sistema de Gerenciador de BD, Ferramentas de Apoio à
Decisão, Ambiente Aplicativo e Ambiente Operacional.
6) A empresa possui Sistemas Operacionais (informatizados ou não) nas seguintes áreas:
Programa (software)- Manual “M” Desenvolvido “D” Comprado “C” Terceirizado “T”
a) ( ) Compra/Suprimentos
b) ( ) Venda (Pedidos e Faturamento)
c) ( ) Contas a Pagar ( Financeiro)
d) ( ) Contas a Receber (Financeiro )
e) ( ) Estoque
f) ( ) Contábil
g) ( ) Recursos Humanos e Folha de Pagamento
h) ( ) Fiscal
i) ( ) outros__________________________________________________________
170
7) Avalie o grau de resistência aos Sistemas de Informações existentes na empresa. Conforme
Escala Likert.
( ) Justifique: ___________________________________________________________
III) Processo Decisório
1) Descreva o fluxo do processo decisório da empresa, utilizando as informações geradas pelo
DW: ______________________________________________________________________
2) Avalie o grau de utilização das informações do DW para tomada de decisão. Escala Likert.
Justifique: __________________________________________________________________
IV) Dimensões da qualidade de dados
1) avalie QI das dimensões abaixo descritas. Escala Likert.
2) ordene as 5 dimensões que considera mais importante (1º ao 5º), sendo 1º mais importante
ao 5º importante
(1) (2)
Descrição / justificativa
Escala
Likert
Importâ
ncia
1 - Acuracidade / Exatidão (correta e confiável)
correta, acurada (livre de erro), confiável, valores reais
2 - Objetividade (Imparcialidade)
objetivamente coletada, baseada em fatos, objetiva, ponto de vista imparcial
3 - Credibilidade / Confiabilidade (verdadeira e verossímil)
tem credibilidade, verdadeira, confiável, crível acreditável, fidedigna
(merecedora de crédito)
4 - Reputação (Fonte e conteúdo)
tem reputação de qualidade, provêm de boas fontes, tem bons conteúdos, têm
credibilidade
5 - Acessibilidade (disponível e recuperável)
é facilmente recuperada, está acessível, pode ser obtida, disponível, de rápido
acesso, fácil obtenção dos dados
6 - Segurança no acesso (restrito e seguro)
é protegida contra acessos não autorizados, o acesso a informação é
suficientemente restrito, somente acessada por pessoas que devem vê-la
7 - Relevância (aplicável e útil)
É útil para o trabalho, relevante, apropriada, aplicável, pronta para o uso
171
8 - Valor agregado (benéfica e proporciona vantagens por seu uso)
É benéfica, traz vantagens por seu uso
9 - Temporalidade / Oportunidade Tempo de resposta (Atualização)
É suficientemente atual para o trabalho, oportuna e atualizada
10 - Integridade / completeza /perfeição (Não está extraviada e é suficiente)
inclui todos os valores necessários, completa, cobre as necessidades das
tarefas, tem suficiente amplitude e profundidade
11 - Quantidade de informações apropriada (quanto o volume da informação é
apropriado para a tarefa ser executada)
tem volume suficiente as necessidades das tarefas
12 - Interpretabilidade (linguagem apropriada, símbolos e unidades, e
definições claras)
é facilmente interpretada, é compreensível, fácil de entender, faz sentido,
unidades de medidas claras, apresentados em português
13 - Facilidade de entendimento (Facilmente compreendida)
a informação é fácil de entender, clara, livre de duplos significados
14 - Representação concisa (compactamente apresentada)
concisamente apresentada (breve e resumida), de forma compactada
15 - Representação consistente (Mesmo formato)
a informação é consistentemente apresentada no mesmo formato, em formato
conciso
16 - Facilidade de manipulação / operação (fácil de ser manipulada e aplicada
em diferentes tarefas)
a informação é fácil de manipular para atender nossas necessidades, fácil para
agregar, fácil de combinar com outras informações
V – Avaliação Final
1) Cite três pontos positivos na utilização do DW, na sua empresa:
2) Cite três pontos passíveis de melhoria do DW, na sua empresa:
3) Avaliação Geral do DW. Escala Likert ( )
( ) Justifique:_____________________________________________________________
4) Comentário final:
172
ANEXO III – QUESTIONÁRIO - CONSUMIDORES DE INFORMAÇÃO
Nome:__________________________________________________________Sexo:_______
Idade:_______Grau de instrução:____________________Formação:____________________
Função: ___________________________________________Tempo na função: __________
Setor:__________________________Processo(s)___________________________________
Capacitação:_____________________________________Frequência:__________________
1) Descreva quando e como é utilizada a ferramenta DW na sua rotina de trabalho.
Fluxograma / processo.
2) Quais os métodos e técnicas estatísticas utilizadas, no DW, para a geração de informações
na tomada de decisão (Marcar X – Resposta Múltipla):
a) ( ) classificação
b) ( ) modelos de relacionamentos entre as variáveis
c) ( ) análise de agrupamento
d) ( ) sumarização
e) ( ) modelo de dependência
f) ( ) regras de associação
g) ( ) análise de séries temporais
h) Outras:______________________________________________________
ESCALA LIKERT
3) Avalie as suas motivações para utilização do DW na sua empresa. Conforme Escala Likert.
a) o modelo construído atende as necessidades gerais da organização ( )
b) são feitas as mudanças no sistema para atender a novas necessidades da informação para
apoio à decisão ( )
c) as informações sobre decisões tomadas são armazenadas e estão disponíveis para outros
processos de decisão ( )
d) a interface com o usuário é fácil e amigável ( )
e) a obtenção de informações externas e internas são imediatas ( )
f) é feita a disseminação dos benefícios da utilização (cursos, palestras) ( )
1234567
Discordo
Plenamente Discordo
Discordo
em Parte Neutro
Concordo
em Parte Concordo
Concordo
Plenamente
173
4) Avalie as vantagens no uso do DW . Conforme Escala Likert.
a) simplicidade ( )
b) qualidade dos dados ( )
c) acesso rápido ( )
d) facilidade de uso ( )
e) vantagem competitiva ( )
f) custo de operação ( )
g) administração fluxo da informação( )
h) habilita o processamento paralelo ( )
i) infra-estrutura computacional ( )
j) segurança ( )
k) Outras:
l) __________________________________________________________________
5) Avalie as alterações trazidas ou condicionadas com a opção de trabalhar com o DW.
Conforme Escala Likert.
a) Influência nos resultados da empresa após a implantação ( )
b) Melhoria contínua da informação ( )
c) Aumento do nível de satisfação para o trabalho ( )
d) Melhoria do processo decisório ( )
e) Outras: _____________________________________________________ ( )
6) Avalie a existência de sinais de uma qualidade de dados pobre, abaixo apresentados, no uso
rotineiro de informações geradas pelo DW. Conforme Escala Likert
a) Múltiplas fontes da mesma informação ( )
b) Informação é produzida utilizando julgamentos subjetivos ( )
c) Erros sistêmicos, perda da informação ( )
d) Difícil o acesso a informação em um tempo razoável ( )
e) Valores, definições e formatos inconsistentes ( )
f) Indexação de informação não numérica ( )
g) Análise de conteúdo automatizada, em coleções de informação ainda não disponível ( )
h) Mudança da informação relevante e útil ( )
i) Fácil acesso que conflita com requisitos de segurança, privacidade e confidencialidade( )
j) Falta de fontes suficientes de computação ( )
7) Dimensões da qualidade de dados
1) avalie QI das dimensões abaixo descritas. Escala Likert.
2) ordene as 5 dimensões que considera mais importante (1º ao 5º), sendo 1º mais importante
ao 5º importante
174
(1) (2)
Descrição / justificativa (em caso de uma avaliação inferior a 4)
Escala
Like
rt
Import
ância
1 - Acuracidade / Exatidão (correta e confiável)
correta, acurada (livre de erro), confiável, valores reais
2 - Objetividade (Imparcialidade)
objetivamente coletada, baseada em fatos, objetiva, ponto de vista imparcial
3 - Credibilidade / Confiabilidade (verdadeira e verossímil)
tem credibilidade, verdadeira, confiável, crível acreditável, fidedigna
(merecedora de crédito)
4 - Reputação (Fonte e conteúdo)
tem reputação de qualidade, provêm de boas fontes, tem bons conteúdos, têm
credibilidade
5 - Acessibilidade (disponível e recuperável)
é facilmente recuperada, está acessível, pode ser obtida, disponível, de rápido
acesso, fácil obtenção dos dados
6 - Segurança no acesso (restrito e seguro)
é protegida contra acessos não autorizados, o acesso a informação é
suficientemente restrito, somente acessada por pessoas que devem vê-la
7 - Relevância (aplicável e útil)
é útil para o trabalho, relevante, apropriada, aplicável, pronta para o uso
8 - Valor agregado (benéfica e proporciona vantagens por seu uso)
é benéfica, traz vantagens por seu uso
9 - Temporalidade / Oportunidade Tempo de resposta (Atualização)
é suficientemente atual para o trabalho, oportuna e atualizada
10 - Integridade / completeza / perfeição (Não está extraviada e é suficiente)
inclui todos os valores necessários, completa, cobre as necessidades das tarefas,
tem suficiente amplitude e profundidade
11 - Quantidade de informações apropriada (quanto o volume da informação é
apropriado para a tarefa ser executada)
tem volume suficiente as necessidades das tarefas
12 - Interpretabilidade (linguagem apropriada, símbolos e unidades, e
definições claras)
é facilmente interpretada, é compreensível, fácil de entender, faz sentido,
unidades de medidas claras, apresentados em português
13 - Facilidade de entendimento (Facilmente compreendida)
a informação é fácil de entender, clara, livre de duplos significados
175
14 - Representação concisa (compactamente apresentada)
concisamente apresentada (breve e resumida), de forma compactada
15 - Representação consistente (Mesmo formato)
a informação é consistentemente apresentada no mesmo formato, em formato
conciso
16 - Facilidade de manipulação / operação (fácil de ser manipulada e aplicada
em diferentes tarefas)
a informação é fácil de manipular para atender nossas necessidades, fácil para
agregar, fácil de combinar com outras informações
8) Comentários gerais:
a) Conhecimento do DW:
b) Cite três pontos positivos na utilização do DW, na sua empresa:
_________________________________________________________________________
c) Cite três pontos passíveis de melhoria do DW, na sua empresa:
_________________________________________________________________________
9) Avaliação Geral do DW. Escala Likert.
( ) Justifique: __________________________________________________________
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo