Download PDF
ads:
1
Eduardo Pereira da Rocha Thomsen
“Controle de Processo de Produção do Alto Forno por meio
de Técnicas Estatísticas Multivariadas em Tempo Real”
Dissertação apresentada à banca examinadora como parte integrante dos
requisitos para obtenção do título de Mestre em Estatística.
Professora orientadora: Sueli Aparecida Mingoti
Instituto de Ciências Exatas da UFMG
Belo Horizonte MG
Dezembro de 2005
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
2
Agradecimento
Agradeço especialmente à Siderpa, Siderúrgica Paulino Ltda., na pessoa
do grande amigo Márcio Prates Paulino Neto, pelo apoio incondicional durante o
desenvolvimento desta dissertação.
ads:
3
A Marcelo Henrique, João Felipe e Aline.
4
Resumo
A literatura técnica apresenta numerosas técnicas para Controle Estatístico de
processos – CEP.
No entanto, muito pouco existe a respeito da sua utilização no controle da
produção de ferro-gusa em alto-forno a carvão vegetal. São várias as empresas
siderúrgicas no setor, e poucas dispõem de tecnologia de monitoração do processo
produtivo, e as que dispõem desta tecnologia não fazem cartas de controle para
verificação deste processo. Trata-se de um processo produtivo complexo, com muitas
variáveis envolvidas e uma grande variabilidade.
Cartas de controle individuais (univariadas) carregam consigo o problema da
diminuição do nível de significância ao serem analisadas de forma conjunta, além de
pressupor determinadas distribuições de probabilidade para os dados observados, o que
nem sempre ocorre na prática.
No intuito de contribuir para a análise e o controle deste processo produtivo,
dois métodos de controle multivariados serão propostos, a Estatística
2
T
de Hotelling e
a Estatística de Hayter e Tsui, que podem ser implementados sem conhecimento prévio
das distribuições de probabilidade das variáveis utilizadas desde que tenha-se um
conjunto de dados do processo que permitam a construção de distribuições empíricas
com precisão dessas estatísticas.
Paralelamente à implementação das estatísticas de controle, proporemos também
três tipos de gráficos de controle para a variabilidade do processo, o de desvios-padrão
móveis, de diferenças absolutas móveis e o gráfico de controle para a correlação linear
de Pearson. Esses dois últimos gráficos são inovadores e estão sendo propostos e
testados nessa dissertação.
Palavras chaves: Ferro-gusa, alto-forno,
2
T
de Hotelling, Hayter e Tsui, variabilidade,
controle multivariado de processos, correlação linear.
5
Sumário
1. Produção de Ferro-Gusa
1.1 - Introdução 03
1.2 - O Alto-Forno a Carvão Vegetal e Produção de Ferro Fusa 04
1.3 - Monitoração do Processo Produtivo 07
1.4 - Problemas Operacionais 12
1.5 - Objetivos e Organização desta Dissertação 14
2. Controle estatístico de processos
2.1 - Gráficos de Controle Univariados 18
2.2 - A Distribuição Normal Multivariada 19
2.3 - A Estatística
2
T
de Hotelling 25
2.4 - Gráfico de Controle Multivariado Através da Estatística
2
T
de Hotelling 29
2.4.1 - Variáveis com Distribuição Normal k-variada com Parâmetros
Conhecidos 29
2.4.2 - Variáveis com Distribuição Normal k-variada com Parâmetros
Desconhecidos 31
2.4.3 -Variáveis com Distribuição Conjunta Desconhecida 33
2.5 - A Estatística de Hayter e Tsui 37
2.6 - Gráfico de Controle Através da Estatística de Hayter e Tsui 40
2.6.1 - Variáveis com Distribuição Normal k-variada com Parâmetros
Conhecidos 40
2.6.2 - Variáveis com Distribuição Conjunta Desconhecida 42
2.7 - Comparação entre Estatisticas
2
T
de Hotelling e a Estatística
de Hayter e Tsui 47
3. Gráficos de Controle para a Variabilidade
3.1 - Gráfico de Controle Univariado para o Desvio Padrão Móvel 50
3.2 - Gráfico de Controle Multivariado para a Variabilidade do
Processo – A Estatística A 54
3.3 - O Coeficiente de Correlação Linear de Pearson 58
3.3.1 - A Correlação Linear Aplicada ao Controle de Processos 59
6
4. Estratégia de Execução
4.1 - Amostra em Condições Ideais 64
5. Implementação Computacional em Situação Real
5.1 - O Alto-Forno 2 da Siderpa 70
5.2 - O Software de Monitoração e Controle de Processos 71
5.3 - Aplicação / Estudo de Casos 72
5.4 - Discussão Sobre as Estatísticas de Controle 81
6. Considerações Finais 86
7. Referências 90
7
1 Produção de Ferro-Gusa
1.1 Introdução
Segundo (FIEMG, 2005), aproximadamente 40% de todo aço produzido no
Brasil vêm de Minas Gerais.
A indústria siderúrgica no estado de Minas Gerais é responsável por 26% do PIB
industrial do país e pela criação e manutenção de aproximadamente 88.000 empregos
diretos e muitos outros indiretos, assim como a geração de grande riqueza.
A matéria prima básica para a produção de aço é o ferro gusa. Além do aço, o
ferro gusa é matéria prima para muitos outros produtos, principalmente na área de
fundição. É costume dizer que em todos os objetos metálicos ferro gusa. Desde os
óculos que usamos até em quase todos os componentes metálicos de um veículo.
Nos últimos dois anos, com o crescimento da economia, o ferro gusa teve uma
grande recuperação em termos de preços nacionais e internacionais. A indústria voltou a
níveis de cerca de vinte anos atrás em termos de capacidade de produção. Novos altos
fornos estão sendo construídos por todo o estado. Novos empregos gerados, o que
significa crescimento.
Apesar de ser lucrativa, a margem de contribuição representa cerca de 15% do
preço final de venda para o ferro gusa de menor preço no mercado - a produção é feita
da mesma forma que cerca de 100 anos. Muito pouco se inovou em termos de
processo produtivo. Os altos fornos são construídos desde então da mesma forma.
Talvez tenha havido uma ou outra melhora em termos de equipamentos acessórios, tais
como motores industriais, mas como um todo, muito pouco foi inovado. Fazendo uma
analogia com a indústria automobilística, nesta temos robôs e um nível enorme de
automação e principalmente controle, o que não ocorre na indústria do ferro gusa.
muito pouco em termos de automação e controle efetivo da produção.
Em termos de qualidade dois tipos de ferro gusa: o a carvão coque (carvão
mineral) e o a carvão vegetal. O primeiro é utilizado basicamente para a produção de
aço e o segundo para aço e todos os outros produtos a base ferro fundido. Este último
tipo de ferro gusa tem maior preço, sua produção é menor, mais difícil, devido
8
principalmente à variabilidade das matérias primas e exige muita experiência do pessoal
envolvido, além de controles mais complexos no processo produtivo.
1.2 O Alto-Forno a Carvão Vegetal e a Produção de
Ferro-Gusa
Quando o homem conseguiu a quantidade necessária de calor para fundir o
minério de ferro, encerrou a Idade do Bronze e deu início à Idade do Ferro.
Na produção de ferro gusa a necessidade de três matérias primas básicas:
ferro, oxigênio e carbono. O ferro é encontrado em toda crosta terrestre, fortemente
associado ao oxigênio e à sílica. O minério de ferro é um óxido de ferro, misturado com
areia fina. O carbono é também relativamente abundante na natureza e pode ser
encontrado sob diversas formas. Na produção de ferro gusa o carbono é fornecido
através do carvão vegetal. Finalmente, o oxigênio é retirado da atmosfera terrestre.
Durante o processo produtivo, o carbono (carvão vegetal) é colocado juntamente
com o ferro (minério de ferro) e outros fundentes no topo do alto-forno sob constituindo
as cargas. O oxigênio é soprado através das ventaneiras, localizadas na base do alto-
forno. Dentro do alto-forno o processo metalúrgico se dá através de uma reação química
de redução, na qual as cargas descem em contra corrente em relação aos gases
provenientes da queima do carbono (carvão vegetal) com o oxigênio do ar quente
soprado.
O carvão exerce duplo papel na fabricação do ferro-gusa. Como combustível,
permite alcançar altas temperaturas (cerca de
o
1500 Celsius) necessárias à fusão do
minério. Como redutor, associa-se ao oxigênio que se desprende do minério com a alta
temperatura, deixando livre o ferro. O processo de remoção do oxigênio do ferro para
ligar-se ao carbono chama-se redução e ocorre dentro do alto-forno. No processo de
redução, o ferro se liquefaz e é chamado de ferro gusa ou ferro de primeira fusão.
O processo em si gera dois subprodutos que são posteriormente aproveitados. O
primeiro é chamado escória e é formada basicamente por alumina, Cão e sílica A
escória é matéria-prima para a indústria de cimento. O segundo subproduto é um gás
rico em monóxido de carbono, ou CO. Este gás é utilizado na própria siderúrgica como
combustível para geração de energia elétrica em usinas termelétricas e também para o
9
aquecimento do ar soprado dentro do alto-forno, em equipamentos chamados glendons.
O CO é asfixiante e inflamável, porém o poder calorífico é inferior a outros gases, como
o hidrogênio. A produção de energia elétrica a gás de altos-fornos é um processo muito
recente. Poucas siderúrgicas possuem este recurso.
De acordo com o tipo de ferro gusa a ser produzido, outras matérias primas são
utilizadas. Esta utilização pode ser antes do enfornamento ou após a produção do ferro-
gusa. Como exemplo, para aumentar o teor de silício e reduzir o teor de fósforo do
ferro-gusa, algumas siderúrgicas desviam o ferro-gusa produzido ainda sob a forma
líquida para uma panela (chamada panelão) onde recebe um tipo de tratamento. Este
ferro-gusa é chamado “tratado”. Posteriormente o ferro-gusa é lingotado normalmente
ou até vendido ainda sob a forma líquida. O valor agregado a este tipo de ferro-gusa é
bem maior que o produzido de forma dita normal. A Figura 1 mostra de maneira muito
simplificada como funciona um alto-forno e a produção de ferro-gusa.
Figura 1: Esquema de um alto-forno a carvão vegetal.
Para fornecer o oxigênio necessário à produção de ferro-gusa, utiliza-se o ar da
atmosfera com o auxílio de grandes motores. Este ar passa por um equipamento
chamado glendon, onde é pré-aquecido antes de ser soprado dentro do alto-forno. O
glendon é um equipamento dentro do qual passa uma tubulação que leva o ar direto ao
alto-forno. Por fora desta tubulação o glendon recebe o gás CO que é incinerado,
10
gerando calor e aquecendo o ar que será injetado dentro do alto-forno. A Figura 2
mostra de forma simplificada o funcionamento de um glendon.
Figura 2: Glendon.
Coma descida das cargas e a subida do ar aquecido, o alto-forno internamente
fica com o contorno como mostrado na Figura 3.
Figura 3 : Contorno de um alto-forno com cargas.
11
1.3 – Monitoração do Processo Produtivo
No ano de 1997 fomos procurados por técnicos da SiderpaSiderúrgica Paulino
Ltda., localizada em Sete Lagoas, Minas Gerais, para desenvolver um Sistema de
Informações em que se permitisse monitorar parâmetros operacionais dos seus dois alto-
fornos.
Após alguns meses de desenvolvimento e testes conseguimos juntamente com
alguns colaboradores e principalmente o pessoal da área industrial da Siderpa,
desenvolver um equipamento que conseguia ler, armazenar e recuperar dados
operacionais do alto-forno. O início das atividades de monitoração se deu efetivamente
em junho de 1998.
O equipamento desenvolvido é um computador com sistema operacional
Windows montado em um gabinete especial pressurizado e especialmente projetado
para operar em ambientes hostis. O local de operação em geral é na área industrial,
perto da base do alto-forno, onde uma grande concentração de e outros agentes
nocivos ao equipamento. duas placas de aquisição de dados, uma para receber o
sinais externos e outra para tratar os sinais e disponibilizá-los para um programa que
faz a consistência, armazenagem e tratamento posterior dos dados. Para envio dos
dados armazenados, o equipamento possui placa de rede padrão ethernet ou wireless,
para que as informações geradas possam ser compartilhadas na rede corporativa da
empresa e até mesmo na Internet.
Os dados chegam ao equipamento de monitoração através de sensores instalados
no alto-forno. Para temperaturas usam-se termopares, que são equipamentos específicos
para medir a temperatura. Para vazão, pressão e potência de motores são utilizados
sensores específicos. As informações são concentradas em um painel localizado em uma
sala nas imediações do alto-forno, chamada Sala de Pirometria ou simplesmente
Pirometria. Cabos são conectados a este painel e ao equipamento de monitoração.
O software de monitoração está dividido em dois módulos de funcionamento
independentes. O primeiro fica instalado no equipamento e faz a leitura, consistência e
12
armazenagem dos dados. O segundo módulo mostra de forma ininterrupta os
parâmetros lidos sob a forma de gráficos. A Figura 9 mostra um exemplo desta saída.
O equipamento produz duas tabelas diárias de dados, em formato texto. A
primeiro Quadro contém dados lidos a cada segundo e a segunda dados lidos a cada
minuto. O formato das tabelas é o mesmo. Para cada registro (segundo ou minuto) têm-
se a data, hora, temperatura dentro do equipamento e as leituras dos dezesseis
parâmetros.
As Figuras 4, 5 e 6 mostram respectivamente um equipamento pronto para
instalação, e dois equipamentos em operação nas empresas Sicafe Produtos Siderúrgicos
Ltda. e Usipar Siderurgia Ltda., em Sete Lagoas, MG.
Figura 4: Equipamento pronto para ser instalado.
13
Figura 5: Equipamento em funcionamento na Sicafe Produtos Siderúrgicos Ltda. Notar
painel de pirometria (amarelo) ao lado do equipamento.
Figura 6: Equipamento de monitoração em funcionamento na Usipar em Sete Lagoas,
MG. Notar o painel de pirometria do lado direito do equipamento. Nesta siderúrgica, o
equipamento se localiza a cerca de 4 metros da base do alto-forno.
14
Na operação do alto-forno, sem o equipamento de monitoração, os parâmetros
são lidos no painel de pirometria e anotados a cada uma hora em um documento
chamado “planilha de operação”. Através dos dados desta planilha é que se toma
conhecimento de como o alto-forno está sendo operado. O grande problema é o
intervalo de tempo em que se colhem os dados. Veremos a seguir que uma anomalia
operacional grave pode ocorrer em cerca de 10 minutos, tempo muito inferior àquela
uma hora de intervalo entre leituras.
A Figura 7 mostra um alto-forno em construção na Usipar, em Sete Lagoas MG.
Notar o anel” em volta do alto-forno. Este local se chama “coroa” e é por onde o ar
aquecido proveniente dos glendons é soprado no interior do alto-forno.
A Figura 8 mostra um corte esquemático em um alto-forno e os locais onde são
coletados os dados dos parâmetros operacionais.
Figura 7 : Alto-forno em construção na Usipar em Sete Lagoas MG
15
Figura 8: Corte esquemático de um alto-forno com locais de leituras de
parâmetros operacionais.
Como visto, o alto-forno é um local onde ocorre de forma contínua uma reação
química da qual muito calor é liberado. A reação é controlada no sentido de se fornecer
mais ou menos carvão vegetal, que é o “combustível” da reação, assim como a
quantidade de ar dentro do alto-forno. Sendo assim, temperaturas, juntamente com
medidas relacionadas com o ar soprado, tais como pressões e vazões são de grande
importância no controle do processo em si. Os números dispostos na Figura 8
identificam os locais onde estas medidas são coletadas, que são:
1 Temperatura de Topo: temperatura em graus Celsius dos gases que saem
do alto-forno. Em geral tem-se apenas uma temperatura, mas pode se ter até três leituras
de temperaturas em locais diferentes.
2 Temperatura de Coroa: temperatura em graus Celsius do ar quente
soprado dentro do alto-forno.
3 Vazão: quantidade de ar que passa através da carga no alto-forno. Medida
em Normais-Metros Cúbicos por Hora ( hNM /
3
). Uma observação importante é que a
quantidade de ferro-gusa produzida é diretamente proporcional à vazão. Na verdade
esta medida é feita na casa de máquinas, e não dentro do alto-forno.
16
4 e 5
Pressão de coroa (4) e topo(5) Pressão do ar medida em MCA
metros de coluna d’água – na coroa e topo respectivamente.
Figura 9: Exemplo de tela do Sistema de Monitoração.
Várias outras grandezas operacionais importantes podem ser calculadas em
função destas ditas mais básicas, como a “permeabilidade” que basicamente é uma
razão entre vazão e uma função das pressões de topo e coroa.
Uma vez mostrados ao pessoal técnico da operação industrial, os dados sob a
forma de gráficos seqüenciais são de grande importância para aqueles que sabem
interpretá-los. Disponibiliza-se o histórico de todos os parâmetros monitoráveis nas
últimas 12 horas de forma instantânea, de modo que cada turno de operação sabe, ao
começar a trabalhar, como o alto-forno se comportou durante as últimas horas. Outros
fatores importantes são poder rastrear todos os problemas de operação de maneira
imediata, além de viabilizar os dados para, como no caso deste trabalho, estudo
posteriores e rastreabilidade de comportamentos passados.
1.4 Problemas Operacionais
A monitoração do alto-forno está consolidada nas empresas em que existe e
faz parte do cotidiano operacional. No entanto, esta operação é complexa devido ao
17
grande número de fatores que têm que ser verificados e controlados. Problemas ocorrem
a todo instante. Um destes problemas operacionais talvez o maior deles se
quando ocorre uma “gaiola”.
Como visto anteriormente, as cargas, na medida em que ocorre o processo de
redução, vão descendo no interior do do alto-forno. Se por algum motivo as cargas
param de descer, ocorre uma gaiola. dois tipos de gaiola. A gaiola de cuba e a
gaiola de rampa, segundo os locais onde ocorrem (vide Figura 8). O processo de
detecção de uma gaiola é feito verificando-se o aumento da pressão e diminuição da
vazão, visto que o ar continua a ser soprado no alto-forno e não passa pelas cargas
acima, ficando retido. Para contornar o problema o pessoal da operação do alto-forno
faz um “corte de gaiola”, que é o corte no fornecimento de ar que iria para o alto forno.
Ocorre então um “arriamento”, onde a carga presa desce de forma rápida no interior do
alto-forno, que por sua vez fica vazio. O problema maior da gaiola é o posterior
arriamento, que pode danificar a estrutura superior do alto-forno, ocasionando até
mesmo uma interrupção na produção. Com o esvaziamento súbito do alto-forno, novas
cargas devem ser colocadas, para que o alto-forno não fique vazio e produza de maneira
pouco eficaz. O consumo de carvão vegetal, portanto, aumenta drasticamente, pois o
processo torna-se ineficinete.
O gráfico da Figura 9, na gina 12, mostra dados da operação do alto-forno no
dia 22/12/2003 na Siderpa. A última leitura dos dados foi às 16h15min. O gráfico
mostra a ocorrência de uma gaiola de proporções maiores precisamente às 15h15min.
Notar o aumento na pressão de coroa e diminuição na vazão de ar (abaixo à direita na
Figura).
A Figuras 10,11 e 12 mostram gráficos seqüenciais de parâmetros operacionais
em um dia que ocorreu uma gaiola considerada pequena, na cuba do alto-forno (ver
Figura 8 para a região chamada cuba no alto-forno). Observar a diminuição súbita da
vazão de ar no e o aumento da pressão de ar. Por conseqüência, a permeabilidade do
alto-forno diminui drasticamente. O ar está bloqueado e não passa pela carga acima.
Esta gaiola ocorreu em 04/02/2004 às 00h48min na Siderpa e sequer foi observada na
planilha de operações (diário de bordo) do dia. Notar o tempo que leva para que os
parâmetros voltem a níveis anteriores no alto-forno.
18
Figura 10: Ocorrência de uma gaiola. Notar o aumento da pressão de coroa e a
diminuição da vazão.
A Figura 11 mostra a permeabilidade do alto-forno durante uma gaiola. Mede a
facilidade com a qual o ar passa pelas cargas do alto-forno. Quanto maior a
permeabilidade, maior a produtividade.
Permeabilidade
0
0,5
1
1,5
2
2,5
3
3,5
4
1 13 25 37 49 61 73 85 97 109 121 133 145 157 169 181 193 205 217 229 241 253 265 277 289 301 313 325 337 349
Tempo (segundos)
Permeabilidade
Figura11: Permeabilidade durante uma gaiola. Notar a diminuição súbita.
Gaiola - vazão e pressão de Coroa
0
5
10
15
20
25
1
13
25
37
49
61
73
85
97
109
121
133
145
157
169
181
193
205
217
229
241
253
265
277
289
301
313
325
337
349
Tempo (segundos)
Valores parâmetros
Vazao
Pres_Cor
19
Teperaturas de Topo após gaiola
0
10
20
30
40
50
60
70
80
90
1 13 25 37 49 61 73 85 97 109 121 133 145 157 169 181 193 205 217 229 241 253 265 277 289 301 313 325 337 349
Tempo (Segundos)
Temperaturas de Topo
Centro Direito Esquerdo
Figura 12: Temperaturas de topo durante uma gaiola. Notar o aumento dos
valores das três temperaturas após a gaiola. A temperatura de topo alta indica
alto-forno vazio e baixas produtividade e eficiência.
20
1.5 Objetivos e Organização desta Dissertação
O objetivo maior desta dissertação de mestrado é tentar propor a implementação
em nível operacional do controle estatístico de processos (CEP) usando técnicas
estatísticas multivariadas para controle das estruturas de médias e variabilidade do
processo. Para o controle de médias são utilizadas as estatísticas propostas por Hayter
e Tsui (1994) e a
2
T
de Hotelling (1947) que nessa dissertação são implementadas de
forma não-paramétrica em vista do fato de não termos um processo com distribuição
normal multivariada no que se refere a distribuição conjunta das variáveis usadas para
sua monitoração.
Para o controle da variabilidade serão propostas o uso de duas metodologias: a
primeira fundamenta-se na utilização de gráficos de controle univariados para o desvio-
padrão de cada variável de controle do processo, que será chamado de gráfico de
desvios-padrão móveis. A segunda é um gráfico de diferenças absolutas móveis
construído adaptando-se a metodologia de controle multivariado de Hayter e Tsui
(1994). Além disso, propõe-se o uso do gráfico de controle fundamentado na correlação
linear de Pearson entre as variáveis consideradas mais importantes do processo
tentando verificar como a correlação se comporta em situações onde o processo se
encontra sob condições adequadas de operação e fora destas condições. Tanto o gráfico
das diferenças absolutas quanto o de correlações de Pearson são inovadores dentro da
área de controle de processos como um todo e principalmente no controle de operação
do alto-forno e constituem em contribuições novas dessa dissertação para a área de
controle de processos. Além disso, destaca-se como outra contribuição desse trabalho a
implementação em tempo real (on-line) de técnicas de controle de qualidade
multivariadas a um processo considerado de difícil monitoração, que é o caso do alto-
forno mostrando, que seu controle por meio de técnicas de Estatística é viável.
Logicamente os gráficos de controle devem ter a maior sensibilidade possível
à ocorrência de problemas operacionais, principalmente gaiolas. Nesse sentido, fez-se
uma avaliação do comportamento das estatísticas multivariadas de controle propostas
nessa dissertação no intuito de verificar se atendiam a esse requisito e se dentre elas
21
haveria alguma mais apropriada do que outra para a monitoração do processo de
operação do alto-forno.
Analisando o contexto pelo lado prático, existe uma grande base de dados da
empresa Siderpa, visto que dados desde junho de 1998, disponíveis em medições a
cada minuto, sendo que nos últimos dois anos os dados operacionais são lidos e
gravados a cada segundo Assim, devido a esta disponibilidade de informações reais,
temos um número de observações amostrais grande o bastante para estudar o processo
na sua essência, não havendo, a princípio, necessidade de se fazer simulações nesta
dissertação.
Esta dissertação está organizada da seguinte forma: no capítulo 2 (Controle
Estatístico de Processos) e 3 (Gráficos de Controle para a Variabilidade) são
introduzidos os gráficos de controle univariados e multivariados com seus aspectos
metodológicos e que são objetos de discussão desse trabalho; no capítulo 4 (Estratégia
de Execução) apresentamos a estratégia de execução utilizada para implementação do
controle do processo em termos de obtenção de dados, seleção das variáveis de
monitoração e avaliação das estatísticas que seriam utilizadas no controle; no capítulo 5
(Implementação em Situação Real) mostramos a implementação das técnicas estatísticas
de controle no caso real considerando-se os dados que nos foram gentilmente fornecidos
pela empresa Siderpa de Sete Lagoas e discutimos os resultados obtidos. Finalmente no
capítulo 6 (Considerações Finais) colocamos nossos comentários finais e posteriormente
as referências bibliográficas.
22
2 -
Controle Estatístico de Processos.
2.1 - Gráficos de Controle Univariados
A qualidade é inversamente proporcional à variabilidade (Triola, 1998). Em
Controle de Qualidade, o conceito de distância é muito utilizado para estudar a
variabilidade. Tem-se um valor-alvo estabelecido através de padrões pré-determinados e
estuda-se o padrão de comportamento ao longo do tempo de variáveis inerentes ao
processo produtivo. Quanto mais distantes os valores das variáveis estiverem destes
valores-alvo, maior a variabilidade e por conseqüência, maiores as chances do processo
estar fora de controle.
A ferramenta mais utilizada para mostrar o padrão de comportamento de
determinada variável ao longo do tempo chama-se Gráfico de Controle. Trata-se de um
gráfico seqüencial no qual são mostrados um valor-alvo e valores-limite que
estabelecem as fronteiras entre valores normais e excepcionais. Os valores ditos
excepcionais podem ser outliers ou indicação de que o processo está fora de padrões
pré-estabelecidos.
Os limites de controle são calculados de acordo com o comportamento das
distribuições de probabilidade das variáveis utilizadas. Em geral, especifica-se um
limite (superior e/ou inferior) como sendo o valor abaixo ou acima do qual a
probabilidade de ocorrência de um valor nestas regiões devido ao acaso seja tão baixa
que, se acontecer, há fortes indícios de que não seja mero acaso.
O nome genérico atribuído aos gráficos de controle para uma variável resposta é
“Gráfico de Shewhart em homenagem ao engenheiro Walter Andrew Shewhart, que
fez carreira na Bell Laboratories e foi o criador e pioneiro na sua utilização (1939).
Na Figura 13 apresenta-se um exemplo real de um gráfico de controle, no qual a
variável de controle é a vazão de um alto-forno. O valor-alvo é de 20,06 NM3/h e os
limites de controle inferior e superior são respectivamente 19,41 Nm3/h e 20,71 NM3/h.
Estes valores correspondem a 3 desvios-padrão amostrais acima ou abaixo da média. Se
a vazão tiver uma distribuição de probabilidade normal com média 20,06 NM3/h, e
variância conhecida igual a 0,04694 NM3/h, a probabilidade de ocorrência de um valor
23
acima ou abaixo destes limites, devido puramente a uma causa aleatória é de 0,0027 e
esta é a probabilidade de se dizer que o processo está fora de controle quando ele
realmente não está.
Gráfico de Controle para Vazão de ar
18,5
19
19,5
20
20,5
21
1
3
5
7
9
11
13
15
17
19
21
23
25
27
Tempo (Minutos)
Vazão (Nm3/h)
Vazão
LIC
LSC
Alvo
Figura 13: Gráfico de controle para vazão.
Um outro gráfico de controle é apresentado na Figura 14. Desta vez a variável
estudada é o porcentual de potência máxima dos motores na Casa de Máquinas de uma
siderúrgica.
O valor-alvo é de 89,3% e os limites de controle inferior e superior são
respectivamente 88,05% e 90,52%, também correspondentes a 3 desvios-padrão acima
ou abaixo do valor-alvo. Supondo que o porcentual de potência tem distribuição normal
com média 89,3% e variância 0,16538%, a probabilidade de se dizer que o processo está
fora de controle quando ele realmente não está é de 0,0027.
24
Figura 14: Gráfico de controle para Corrente
Nos dois casos os valores das variáveis estudadas estão dentro dos limites de
controle especificados. Portanto, considerando apenas esse aspecto, o processo é
considerado sob controle.
Além da regra de decisão para falta de controle que simplesmente compara o
valor numérico amostral da estatística usada para a construção do gráfico com os
limites de controle estabelecidos, outros critérios. Nesses, a disposição dos pontos
amostrais dentro dos limites de controle é observada para verificar a existência de
tendências ou comportamentos das observações não esperadas com freqüência em
gráficos seqüenciais da distribuição normal quando o processo está sob controle.
(Kume, 1993).
Nesta dissertação esses critérios não serão utilizados para tomada de decisão sob
o controle ou não do processo.
Quando várias características de qualidade sendo monitoradas
simultaneamente, têm-se duas opções: trabalhar com a distribuição conjunta das duas
variáveis construindo-se regiões de confiança ou então traçar gráficos de controle
univariados para cada variável separadamente.
O problema que ocorre com a construção de gráficos de controles separados para
variáveis e posteriormente fazer a análise conjunta refere-se ao valor do vel de
significância global do teste conjunto. Por exemplo, para as duas variáveis grafadas
anteriormente nas Figuras 13 e 14, o nível de significância para cada um é de 0,0027.
Gráfico de controle para % utilizado da potência
máxima
86,5
87
87,5
88
88,5
89
89,5
90
90,5
91
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Tempo (Minutos)
% utilizado
Potencia Alvo LIC LSC
25
Ao fazer a análise simultânea das duas variáveis, a probabilidade de que o processo
esteja sob controle considerando ambas as variáveis é (1-0,0027)(1-0,0027) = 0,9946.
Portanto, o vel de significância do teste conjunto é igual a 0,0054, e é maior do que
aquele usado para cada variável separadamente. Na medida em que se aumenta o
número de variáveis, o vel de significância global aumenta drasticamente pois é dado
por
k
global
)1(1
αα
=
onde k é o número de variáveis sendo analisadas e
α
é o nível de significância usado
para construir os limites de controle para cada variável.
Por exemplo, no caso de k = 10 variáveis, teríamos um nível de significância de
0,0267, ou seja, cerca de 10 vezes maior que o vel se significância utilizado para cada
variável separadamente (
α
= 0,0027).
O problema pode ser contornado utilizando-se a distribuição conjunta das
variáveis, ou seja, levando-se em consideração todas as variáveis simultaneamente de
forma que o nível de significância global do teste conjunto continue sendo o mesmo
para se tomar uma decisão final.
Uma alternativa seria ajustarem-se os níveis de significância de cada gráfico em
separado de forma que ao final se tivesse um teste no nível de significância
α
global
pré-especificado. Uma forma de fazer isto é usar a proposta de Bonferroni (Jonhson e
Wichern, 2002), na qual, para um dado nível de significância
α
, e para k gráficos
separados, para cada gráfico usa-se o nível se significância
k
α
, de modo que na análise
conjunta, tem-se o nível
α
global mantido.
No entanto, a proposta tem o inconveniente de construir gráficos separados com
grande amplitude, dificultando assim a identificação de eventuais falhas no processo
produtivo quando se analisa os intervalos de confiança de cada variável de forma
individual.
Alternativas são apresentadas nos próximos tópicos, levando-se em consideração
a distribuição de probabilidade conjunta das variáveis que caracterizam a qualidade do
processo.
26
2.2 - A Distribuição Normal Multivariada
Seja X uma variável aleatória contínua com média
µ
e variância
2
σ
. Então
dizemos que X tem distribuição de probabilidade normal com média
µ
e variância
2
σ
se a função de densidade tem a forma:
f(x) =
e
x
2
2
2
)(
2
2
1
σ
µ
πσ
(2.1)
para qualquer );(),;(
+∞
−∞
+∞
−∞
µ
x
e
σ
> 0.
É importante notar que o termo no expoente da distribuição normal pode ser
escrito sob a forma:
)()(')(
12
µσµ
xx
(2.2)
Esta quantidade representa a distância Euclidiana ponderada ao quadrado de X à
média
µ
, sendo o fator de ponderação o inverso da variância
2
σ
.
Seja o vetor aleatório X = )'...(
1 k
XX
, com k variáveis, o vetor de médias
µ
=
)'...(
2,1 k
µµµ
, onde
j
µ
é a média da variável
j
X , para todo j= 1,...,k, e a matriz de
variâncias e covariâncias
kxk
Σ , denotada por:
=Σ
kkk
k
kxk
σσ
σ
σσ
...
....
...
1
22
111
(2.3)
onde
jj
σ
= var(
j
X ) =
2
j
σ
e
lj
σ
= cov(
jl
XX , ), para jl
.
27
Dizemos que o vetor X tem distribuição de probabilidade normal k-variada com
vetor de médias
µ
e matriz de covariâncias
kxk
Σ se a função densidade de X puder ser
expressa da forma:
f(x) =
e
xx
k
kxk
Σ
Σ
)(
1
(
2
1
2/12/
||)2(
1
µµ
π
(2.4)
onde ),...(
1
k
xxx = );( +−∞
j
x , );( +−∞
j
µ
, );0( +
ii
σ
,
);( +−∞
jj
σ
,
kxk
Σ uma matriz positiva definida, k é o número de variáveis e
||
kxk
Σ o determinante da matriz
kxk
Σ , j=1,2,..,k.
Os parâmetros
µ
e
kxk
Σ podem ser estimados como descrito a seguir.
Seja
n
XX ,...,
1
uma amostra aleatória do vetor X, onde
i
X = (
iki
XX ...
1
)´, sendo
que
ij
X representa a medida da variável j do elemento i, para qualquer
kjeni ,...,1,...,1
=
=
.
Então, a matriz de covariâncias
kxk
Σ será estimada pela matriz de covariâncias
amostral
kxk
S dada por:
kxk
S =
)((
1
1
__
1
XXXX
n
i
n
i
i
=
(2.5)
onde
)',...,(
__
1
_
k
XXX = é o vetor de médias amostral de X. Desta forma, as variâncias
amostrais são calculadas como:
2
_
1
)(
1
1
j
n
i
ijjj
XX
n
S
=
=
(2.6)
as covariâncias amostrais são calculadas como:
)()(
1
1
_
1
_
kil
n
i
jijlj
XXXX
n
S
=
=
(2.7)
28
Pode ser mostrado (Anderson, 2003) que tanto o vetor de médias amostral
_
X
quanto a matriz de covariâncias amostral
kxk
S são estimadores não tendenciosos de
µ
e
kxk
Σ respectivamente, isto é:
µ
=)(
_
XE e
kxkkxk
SE Σ=)( .
Estes estimadores são obtidos através do método de momentos (Casella e
Berger, 2002).
A matriz de correlação do vetor aleatório X, denotada por
kxk
P , é estimada pela
matriz de correlação amostral
kxk
R , cujo elemento genérico
lj
R é dado por:
2/1
)(
jjll
lj
lj
SS
S
R = ; ]1;1[
lj
R (2.8)
As Figuras 15 e 16 mostram gráficos da distribuição normal bi-variada com
coeficiente de correlação igual a 0,8 e 0,3 respectivamente, com médias iguais a zero e
desvios padrão unitários.
5 , 0
2 , 5
0 , 0
x 1
0 , 0
- 2 , 5
5 , 0
0 , 1
f ( x 1 , y 1 )
2 , 5
0 , 0
- 2 , 5
0 , 2
y 1
0 , 3
D i s t r i b u i ç ã o N o r m a l B i v a r i a d a d e p r o b a b i l i d a d e
C o r r e la ç ã o : 0 , 8
Figura 15: Distribuição normal bi-variada com correlação linear igual a 0,8.
A relação linear entre as variáveis, medida através do coeficiente de correlação
linear
ρ
, é de grande importância dentro da distribuição normal bi-variada. Faz com
que a elipse correspondente à projeção da superfície de resposta, f(x,y), no plano XY
29
tenha valor menor ou maior para a medida de excentricidade na medida em que se tem
uma correlação baixa ou alta entre as variáveis.
5 , 0
2 ,5
0 , 0
x 2
0 ,0 0
0 , 0 5
f ( x 2 , y 2 )
- 2 , 5
5 ,0
2 , 5
0 ,1 0
0 , 0
0 , 1 5
- 2 , 5
y 2
D i s t r i b u i ç ã o N o r m a l B i v a r i a d a d e p r o b a b i l i d a d e
C o r r e la ç ã o : 0 , 3
Figura 16: Distribuição normal bi-variada com correlação linear igual a 0,3.
É importante notar que os valores para os parâmetros média e desvio padrão das
variáveis
i
X também influenciam no aspecto da superfície de resposta. A média tem a
propriedade de alterar o deslocamento da curva no plano XY enquanto que o desvio
padrão altera a escala.
2.3 A Estatística
2
T
de Hotelling.
Seja a estatística univariada t de Student definida como:
ns
x
t
/
µ
= (2.9)
onde
_
x
é o valor da média amostral calculada com base em uma amostra aleatória de
tamanho n obtida de uma população com distribuição normal com média
µ
e variância
2
σ
. Seja
s
o desvio padrão amostral calculado como:
)1(
)(
1
2
_
=
=
n
xx
s
n
i
i
(2.10)
30
A estatística t de Student é utilizada em procedimentos nos quais se deseja testar
a hipótese nula
0
H
:
0
µµ
=
contra hipóteses alternativas do tipo
1
H
:
0
µµ
,
1
H
:
0
µµ
>
ou finalmente
1
H
:
0
µµ
<
.
O valor de
µ
é estimado através do valor de
_
x
. Se a amostra provém de uma
população com distribuição normal, então a estatística t terá distribuição de Student com
(n-1) graus de liberdade. Como se verifica em (2.9), para valores fixos de
s
e n, quanto
maior for a diferença entre
_
x
e
µ
, maior será o valor da estatística t calculada. Por
conseqüência, menor será a probabilidade da amostra ser proveniente de uma população
com média
µ
.
Nos casos em que a variabilidade for grande, ou seja,
s
for grande em relação a
_
x
, mesmo que o valor de (
_
x
-
µ
) seja expressivo, o teste ficará conservador, tendendo a
produzir uma estatística t com valor numérico pequeno, o que levará à não rejeição
de
0
H
.
A forma descrita em (2.9) também poderá ser escrita como:
nsxt
1
_
)(
=
µ
(2.11)
Se elevarmos a expressão (2.11) ao quadrado, obtemos:
n
s
x
t
/
)(
2
2
_
2
µ
= = )()()'(
_
12
_
µµ
xsxn
. (2.12)
O valor obtido para
2
t
é definido como a distância Euclidiana ao quadrado entre
a média amostral
_
x
e
µ
, ponderada pelo inverso da variância amostral. Na medida
em que
_
x
se aproxima de
µ
, o valor de
2
t
se aproxima de zero.
Hotelling (1947) extendeu a utilização da estatística t de Student univariada para
o caso multivariado. O procedimento é descrito a seguir.
31
Seja
n
XX
,...,
1
uma amostra de n observações onde )'...(
1 ikii
XXX
= , i = 1,..,n ,
obtida de uma população com distribuição normal k-variada com vetor de médias
µ
e
matriz de covariâncias
kxk
Σ . Seja a estatística
2
T
definida por
),()'(
12
µµ
=
XSXnT
(2.13)
Seja
0
H
:
0
µµ
= onde )'...(
0010 k
µµµ
= um vetor com valores pré-especificados
e seja
1
H
:
0
µµ
. Então sob
0
H
, a estatística
2
T
tem distribuição
)(,
)(
)1(
knk
F
kn
kn
.
Ou seja,
kn
kn
T
)1(
)(
2
tem distribuição F com k e )( kn
graus de liberdade, onde n é o
tamanho da amostra para se obter
_
X
e
kxk
S e k é o número de variáveis observadas
(Mayson and Young, 2002). Quando
kxk
Σ é conhecida a estatística
2
T
definida em
(2.13), substituindo-se
1
S por
1
Σ
, tem distribuição Qui-quadrado com k graus de
liberdade (Anderson,2003).
É possível mostrar que
2
i
T
= )()'(
0
1
0
µµ
Σ
ikki
XX (2.14)
tem distribuição Qui-quadrado com k graus de liberdade (
k
χ
), quando
kxk
Σ é
conhecida e que
2
i
T
= )()'(
0
1
0
µµ
ii
XSX (2.15)
tem distribuição
)(,
)(
)1(
knk
F
kn
kn
quando
kxk
Σ é desconhecida, sendo
niXXXX
ikiii
,...,1)'...(
21
== . Neste caso a matriz de covariância amostral, S , é
utilizada no lugar de
kxk
Σ (Mayson e Young, 2002).
32
Um caso particular da estatística
2
T
é aquele em que se consideram as variáveis
j
X padronizadas pelas respectivas médias e desvios padrão, j=1,2,...,k. Assim, seja
jj
jj
j
X
Z
σ
µ
)(
=
, onde )'...(
1 k
XXX =
é um vetor aleatório com distribuição normal k-
variada com vetor de médias
µ
e matriz de covariâncias
kxk
Σ
conhecidos. Neste caso,
a matriz de covariâncias do vetor aleatório )'...(
21 k
ZZZZ =
será a matriz de correlação
teórica do vetor X, isto é, a matriz
kk
P
. O vetor aleatório Z terá distribuição normal
com vetor de médias zero. Então, se
n
ZZ
...
1
é uma amostra aleatória de tamanho n da
distribuição do vetor Z, '),...,,(
21 ikiii
ZZZZ =
, a estatística
)()'(
_
1
_
*2
ZPZT
=
(2.16)
terá distribuição Qui-quadrado com k graus de liberdade.
Quando a matriz de correlação
kk
P
é desconhecida, esta pode ser estimada pela
matriz de correlação amostral
kk
R
definida anteriormente e a matriz
kk
P
é substituída
pela matriz
kk
R
na fórmula de
*2
T
dada em (2.16). Neste caso,
*2
T
terá distribuição
)(,
)(
)1(
knk
F
kn
kn
, ou ainda,
kn
kn
T
)1(
)(
*2
tem distribuição F com k e (n-k) graus de
liberdade sendo
_
Z
o vetor de médias amostrais de Z, isto é,
)'...(
__
2
_
1
_
k
ZZZZ =
.
Na prática as variáveis
j
X
são padronizadas pela média amostral e o desvio
padrão amostral, isto é,
jj
j
j
j
s
XX
Z
)(
=
e os resultados para
*2
T
continuam sendo
válidos em termos de distribuição de probablidades.
33
2.4 Gráfico de Controle Multivariado Através da
Estatística
2
T
de Hotelling
Vamos considerar a construção do gráfico de controle utilizando a estatística
2
T
de Hotelling em três situações distintas. Para as três situações consideraremos uma
amostra aleatória de tamanho n com k características de qualidade de um processo
(variáveis) onde cada elemento amostral
ij
x
representa a observação i (i = 1,...,n) da
variável j (j =1,...,k). Na primeira situação as variáveis têm distribuição normal k-
variada com parâmetros conhecidos
µ
e
kxk
Σ
. Na segunda situação consideraremos a
que as variáveis têm distribuição normal k-variada, porém com os parâmetros
µ
e
kxk
Σ
desconhecidos, e finalmente uma situação em que as variáveis de controle não tem
distribuição conhecida.
2.4.1 Variáveis com Distribuição Normal k-variada com
Parâmetros Conhecidos.
Para cada observação i do processo tem-se o vetor )'...,(
1 ikii
xxx =
e calcula-se
a estatística da forma:
2
i
T
= )()'(
1
µµ
Σ
ikki
xx
(2.17)
que tem distribuição qui-quadrado com k graus de liberdade. Para um determinado
nível de significância
α
, o limite acima do qual o processo seconsiderado fora de
controle será dado pelo valor crítico da distribuição qui-quadrado a este nível de
significância. Qualquer valor de
2
i
T
acima do valor crítico indicará que o processo está
fora de controle. O limite inferior de controle é zero (Jiang, 2004).
34
Como exemplo, consideremos os dados a seguir, com três variáveis aleatórias
321
,
XeXX
tendo distribuição normal com vetor de médias '
µ
= (6,04 6,21 5,65) e
matriz de covariâncias
33x
Σ
=
56,217,041,0
17,023,408,0
41,008,033,3
e
1
33
Σ
x
=
25,001,003,0
01,003,007,0
03,027,030,0
Seja uma amostra aleatória de n=10 observações deste processo, nas três
variáveis. Para cada observação a estatística dada em (2.17) será calculada produzindo
os resultados no Quadro 1 a seguir.
Quadro 1 - Valores das Estatísticas
2
T
com parâmetros
µ
e
kxk
Σ
conhecidos
i
1
X
2
X
3
X
2
i
T
1
7,63
6,12
4,45
1,01
2
6,32
5,18
9,85
4,74
3
8,00
9,40
6,82
4,24
4
6,10
8,10
7,39
1,69
5
5,04
3,94
5,13
1,71
6
3,87
8,84
5,38
3,04
7
6,50
4,55
4,97
0,83
8
7,75
8,32
4,44
2,17
9
2,58
5,77
7,43
4,12
10
8,60
5,60
7,14
2,84
O limite superior de controle será dado pelo valor 7,81, que representa o valor
crítico de uma distribuição Qui-quadrado com três graus de liberdade a um nível de
significância de 5%. O gráfico de controle terá a forma como mostrado na Figura 17.
Uma análise do gráfico nos permite dizer que até a ultima observação o processo se
encontra sob controle estatístico, uma vez que o valor da estatística
2
i
T
não ultrapassou
o valor crítico de controle.
35
Figura 17: Gráfico de controle para a estatística
2
T
para o exemplo no
qual com
µ
e
kxk
Σ
conhecidos.
2.4.2 Variáveis com Distribuição Normal k-variada com
Parâmetros Desconhecidos.
Para cada observação j do processo, calcula-se a estatística da forma:
2
i
T
= )()'(
_
1
_
xxSxx
ii
(2.18)
que tem distribuição
)(,
)(
)1(
knk
F
kn
kn
. Para um determinado nível de significância
α
, o
limite acima do qual o processo será considerado fora de controle será dado pelo valor
crítico de
)(,
)(
)1(
knk
F
kn
kn
a este nível de significância. A matriz
S
e o vetor
_
x
são
estimadores de
kxk
Σ
e
µ
respectivamente, calculados com base em uma amostra
aleatória de tamanho n. Qualquer valor de
2
i
T
acima do valor crítico indica que o
processo está fora de controle.
Como exemplo, para a construção do gráfico, consideremos uma amostra
aleatória com n=20 observações do processo apresentado no Quadro 2, nas variáveis
321
,
XeXX
. Com base nesta amostra obtém-se a matriz de covariância amostral
S
e o
vetor de médias amostral
_
x
, dados respectivamente por
_
x
= (6,11 6,21 6,14)’ ,
T2 com parâmetros conhecidos
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
1
2
3
4
5
6
7
8
9
10
T2
Observações
T2
Critico
36
33x
S
=
77,382,016,0
82,047,321,0
16,021,043,3
com
1
33
x
S
=
28,006,001,0
06,030,001,0
01,001,029,0
.
Portanto, para cada observação do processo calcula-se a estatística
2
i
T
como
dado em (2.18). Os valores observados para
2
i
T
estão no Quadro 2.
Tabela 2 – Valores da estatística
2
i
T
para parâmetros
µ
e
kxk
Σ
desconhecidos
i
X1 X2 X3
2
i
T
1
7,63
6,12
4,45
1,54
2
6,32
5,18
9,85
3,67
3
8,00
9,40
6,82
4,73
4
6,10
8,10
7,39
1,83
5
5,04
3,94
5,13
2,56
6
3,87
8,84
5,38
3,25
7
6,50
4,55
4,97
1,51
8
7,75
8,32
4,44
2,63
9
2,58
5,77
7,43
4,22
10
8,60
5,60
7,14
2,04
11
7,13
7,62
6,06
0,94
12
7,95
6,31
7,69
1,63
13
4,93
6,50
7,57
1,08
14
5,27
10,38
8,64
8,55
15
5,66
5,39
4,27
1,45
16
6,06
7,67
9,26
3,97
17
2,55
5,48
3,71
5,69
18
7,25
6,10
8,53
1,90
19
9,73
4,04
8,98
6,29
20
5,80
4,14
7,27
1,41
O limite superior de controle será dado pelo valor 21,88, que representa o valor
crítico de uma distribuição
17,3
)320(
3)120(
F
a um nível de significância de 0,05. O gráfico
de controle é da forma como mostrado na Figura 18. O gráfico mostra um processo sob
controle estatístico, uma vez que nenhum ponto da estatística
2
i
T
ultrapassa o limite de
controle.
37
T2 parâmetros desconhecidos
0,00
5,00
10,00
15,00
20,00
25,00
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Observações
T2
T2_amostra Critico
Figura 18: Gráfico de controle para
2
T
- normal com os parâmetros
µ
e
kxk
Σ
desconhecidos.
2.4.3 Variáveis com Distribuição Conjunta
Desconhecida.
Na situação em que as variáveis de um processo não têm distribuição conjunta
conhecida, os limites do gráfico de controle para a estatística
2
T
podem ser obtidos
com base na distribuição empírica da própria estatística. Para tal escolhe-se um período
de operação dentro do qual o processo esteja sendo operado em condições adequadas,
calcula-se a estatística para todas as observações deste período e com base nestes
valores obtem-se o percentil de ordem (1-
α
), que será o limite de controle para o
gráfico. Notar que para a obtenção destes valores de
2
T
e do limite crítico de controle,
uma amostra de tamanho grande do processo deverá ser obtida.
Para cada observação i da amostra do processo, tem-se o vetor )'...,(
1 ikii
xxx =
e
calcula-se a estatística
2
i
T
da forma:
2
i
T
= )()'(
_
1
_
xxSxx
ii
(2.19)
38
onde
S
é a matriz de covariâncias amostral e
_
x
o vetor de médias amostral. Quando os
parâmetros
µ
e
kxk
Σ
são conhecidos, a estatística dada em (2.19) é calculada
substituindo
_
x
por
µ
e
S
por
kxk
Σ
, respectivamente.
Como exemplo, tomando como base um período considerado em “boas
condições” operacionais de um alto-forno a carvão vegetal, obteve-se n=65534
observações de 4 variáveis de controle , vazão, temperatura de coroa, pressão de topo e
pressão de coroa. Com estas observações foram obtidos o vetor de médias amostral e a
matriz de covariâncias amostral S, dados por :
33x
S
=
0314,0018,0033,0171,0
018,0075,0001,0622,0
033,0001,0006,0103,0
171,0622,0103,0766,76
,
_
x
= (678,84 0,940 21,132 6,024)’ .
Portanto,
1
33
x
S
=
550,43711,12296,26235,0
711,12945,17172,9185,0
296,26172,9226,176370,0
235,0185,0370,0015,0
.
Com base nestes dados obtem-se os valores para da estatística
2
i
T
,i=(1,...,n),
constrói-se a distribuição empírica de
2
i
T
obtendo-se o valor correspondente ao
percentil (1-
α
) que será 9,86, correspondente a um valor de
α
= 0,05. O limite de
controle de 99% será dado pelo valor 16,82 (ver histograma na Figura 19).
Após a obtenção dos valores críticos, passa-se a calcular a estatística
2
i
T
para
cada observação i do dia de operação no qual se deseja verificar o nível de controle do
alto-forno. Para qualquer valor de
2
i
T
que ultrapassar o limite de controle, o alto forno
será considerado como fora de controle para o vel de significância correspondente ao
da construção do gráfico.
39
O Quadro 3 mostra 20 observações de um dia de operação rotineiro do alto-
forno e os valores amostrais da estatística
2
i
T
.
Quadro 3 – Valores de
2
i
T
com parâmetros
µ
e
kxk
Σ
desconhecidos e dados com
distribuição desconhecida.
I
Temperatura
de Coroa
Pressão
Topo
Vazão
Pressão
de
Coroa
2
i
T
1
677,05
1,12
21,21
5,89
2,97
2
676,95
1,12
21,36
5,87
1,52
3
676,47
1,13
21,21
5,91
7,43
4
681,05
1,12
21,21
5,86
2,98
5
677,64
1,11
21,36
5,87
1,30
6
677,64
1,1
21,05
5,87
7,21
7
677,64
1,12
21,21
5,85
2,20
8
681,16
1,13
21,21
5,87
5,86
9
677,64
1,12
21,21
5,83
5,42
10
681,74
1,11
21,36
5,83
3,47
11
678,81
1,11
21,36
5,84
0,26
12
679,4
1,11
21,21
5,83
2,58
13
682,33
1,11
21,36
5,84
4,91
14
680,57
1,1
21,36
5,83
2,82
15
677,05
1,1
21,21
5,84
4,61
16
676,47
1,11
21,51
5,86
2,86
17
678,23
1,09
21,51
5,86
9,05
18
677,05
1,12
21,66
5,83
7,05
19
677,05
1,11
21,51
5,83
2,49
20
677,64
1,11
21,51
5,82
3,01
A Figura 19 mostra um histograma da distribuição empírica da estatística
2
i
T
usado para obter os limites de controle.
As Figuras 19 e 20 mostram respectivamente um histograma da distribuição
empírica da estatística
2
i
T
e um gráfico de controle do processo com limites de controle
de 95% e 99%. Uma análise do gráfico mostra um processo sob controle, mas com uma
observação próxima ao limite de controle de 95%.
40
T2
Frequencia
49423528211470
8000
7000
6000
5000
4000
3000
2000
1000
0
Histograma distribuição empirica da estatistica T2
Figura 19: Histograma da distribuição empírica de .
2
T
Figura 20: Gráfico de
2
i
T
– Dados com distribuição conjunta desconhecida.
Gráfico de Controle para a Estatística T2
de Hotelling
0
5
10
15
20
1 3 5 7 9 11 13 15 17 19
Tempo
Estatistica T2 de
Hotelling
T2 L 95% L 99%
41
O gráfico de controle de
2
i
T
tem o inconveniente de não indicar
diretamente a(s) variável(eis) resposável(eis) pela falta de controle do processo.
Uma sugestão é dada por (Runger,Alt e Montgomery,1996). Quando para uma
observação i o valor de
2
i
T
ultrapassa o valor crítico do gráfico de controle, para
cada variável j da observação i o seguinte cálculo pode ser feito:
22
jiij
TTd
=
onde
2
j
T
é o valor da estatística
2
i
T
sem a observação da variável j. Quando o
vetor aleatório X tem distribuição normal, k-variada,
ij
d
tem distribuição Qui-
quadrado com um grau de liberdade. Assim para um dado nível de significância
α
, o valor de
ij
d
que ultrapassar o valor crítico da distribuição Qui-quadrado
indicará que a variável j é responsável pela falta de controle do processo
(Montgomery, 2004).
2.5 - A Estatística de Hayter eTsui
Hayter e Tsui (1994) propuseram uma estatística para controle de
processos multivariados que é uma alternativa à estatística
2
T
de Hotelling.
Seja = [
k
XX
...
1
] um vetor aleatório contendo k características de qualidade
de interesse, com distribuição normal k-variada, com vetor de médias
µ
e
matriz de covariâncias
kxk
Σ
. Seja a constante
α
,R
C
tal que:
P(
α
σ
µ
,R
j
jj
C
X
, para todo j = 1,...,k) = (1-
α
) , 10
α
. (2.20)
Portanto, a probabilidade do intervalo aleatório dado por
(
αα
σσ
RjjRjj
CXCX
+ ; ) conter o parâmetro
j
µ
, com i=j,...,k é igual a 1-
α
, onde
j
µ
e
j
σ
são a média e desvio padrão de
j
X
, respectivamente.
42
O valor de
α
,R
C
é obtido usando-se uma distribuição normal k-variada e levando-
se em consideração o relacionamento linear existente entre as k variáveis. Portanto, os
valores da matriz de covariâncias
Σ
influenciam diretamente nos tamanhos dos
intervalos aleatórios construídos.
O procedimento garante o nível de significância global do teste como desejado,
pois a equação (2.20) garante que a probabilidade de todos os intervalos conterem os
respectivos valores
j
µ
é igual a (1-
α
). A identificação de quais variáveis causam a
falta de controle do processo é de forma imediata, bastando verificar para qual variável
j
X
o valor
j
jj
X
σ
µ
excedeu o valor de
α
,R
C
pré-estabelecido. Além disso, permite
que se compare o valor de cada variável com o respectivo intervalo de confiança. Para
uma boa operação, um nível mais amplo de controle pode ser razão para não parar o
processo mesmo que em uma variável esteja fora de controle, desde que perto o bastante
dos limites de controle estabelecidos.
A determinação do valor da constante crítica
α
,R
C
depende da distribuição da
coordenada máxima do vetor aleatório X padronizado em valor absoluto.. Existem
tabelas para k = 2 (Bechhofer e Dunnet,1988). No entanto, para um número de variáveis
superior a 2, a determinação de
α
,R
C
é feita computacionalmente através do algoritmo
descrito na Figura 21.
1. Gerar um grande número N de vetores de observações de uma normal k-
variada com vetor de médias zero e matriz de correlações
kxk
P
, denotados por
N
ZZ
,...,
1
.
2. Calcular a estatística M para cada um dos vetores )...(
1
i
N
ii
ZZZ
= , gerados no
passo 1, isto é, para todo i = 1,...,N, calcular:
},...,1,max{ kjZM
i
j
i
==
3. Encontrar o percentil de ordem ( )1
α
da distribuição empírica da amostra
N
MM ,...,
1
e usar o valor encontrado como sendo o valor crítico para
α
,
R
C .
43
Figura 21: Algoritmo para obtenção da estatística
M de Hayter e Tsui.
Em um segundo caso, Hayter e Tsui (1994) propõem a obtenção da estatística M
através de um método dito não-paramétrico. Neste método, os valores de
µ
e
kxk
Σ são
estimados como em (1.5), com base em um número de observações de uma amostra
aleatória de X. Segundo os autores do artigo, se este número de observações é grande,
maior ou igual a 500 observações, então uma aproximação não paramétrica para a
distribuição da estatística M pode ser encontrada, sem a necessidade de se assumir
distribuição normal k-variada, como na Figura 21, para o vetor aleatório X.
O método é implementado de maneira similar ao algorítimo descrito na Figura
17, com a exceção de que os valores da distribuição empírica da estatística M não serão
obtidos sob a hipótese de normalidade, mas sim dos elementos amostrais em si.
Mais especificamente, para cada elemento amostral kjnix
ij
,...,1;,...,1, == ,
calcula-se a estatística:
jjjij
i
sxxM /||max
_
= (2.21)
onde
ij
x representa a observação da variável j para o elemento amostral i,
_
j
x é a média
amostral da variável j,
jj
s é a estimativa do desvio padrão teórico da variável j calculado
como em (1.7), j=1,2,...,k. A distribuição empírica da estatística M é construída com
estes valores e para um dado nível de significância
α
, um valor crítico para
α
,R
C pode
ser obtido escolhendo o valor correspondente ao percentil de ordem (1-
α
).
Para cada novo vetor de observações )'...(
1 k
xxx = obtido do processo, o valor da
estatística M será calculado. Para um vel de significância
α
, o processo será
considerado como fora de controle se M >
α
,R
C .
Se o processo for considerado fora de controle, bastará verificar para quais
variáveis o valor de
jjjij
sxx /||
_
supera o valor de
α
,R
C
Nesta aproximação não-paramétrica uma nova observação é comparada com um
grupo de observações obtidas do processo em sua forma de operação rotineira e não se
assume qualquer distribuição de probabilidade para as variáveis estudadas, enquanto
44
que sob a hipótese de normalidade, um novo vetor de observações é comparado com o
que se espera de uma distribuição normal multivariada com parâmetros conhecidos.
Contudo, esta aproximação não paramétrica poderá ser implementada no caso de se
ter disponível um número grande de observações para obter-se a distribuição empírica
da estatística M.
Mingoti e Glória (2005) no entanto mostram que para a distribuição normal
multivariada, a aproximação não paramétrica com n = 500 observações como sugerido
em (Hayter e Tsui,1994) não é boa, sendo necessário um nimo de 5000 observações
para que esta aproximação seja razoável.
2.6 - Gráfico de Controle Através da Estatística de
Hayter e Tsui
Vamos considerar a construção do gráfico de controle utilizando a estatística de
Hayter e Tsui em duas situações distintas. Para as duas situações consideraremos uma
amostra aleatória de tamanho n com k características de qualidade de um processo
(variáveis) onde cada elemento amostral
i
x representa as observações do elemento
amostral i (i = 1,...,n) da variável j (j =1,...,k). Na primeira situação as variáveis têm
distribuição normal k-variada com parâmetros conhecidos
µ
e
kxk
Σ e no segundo caso
as variáveis não tem distribuição conjunta conhecida.
2.6.1 - Gráfico de Controle de Hayter e Tsui Caso da
Distribuição Normal k-variada com Parâmetros
Conhecidos.
Como exemplo, seja uma amostra aleatória de tamanho n=1000 de com três
variáveis aleatórias com distribuição normal multivariada com os seguintes parâmetros:
33x
P = )'0,0,0(
00,130,030,0
30,000,120,0
30,020,000,1
=
µ
e
45
O Quadro 4 apresenta parte dos dados observados. Para cada elemento amostral
i, calcula-se a estatística
3,..,1max == jXM
ij
i
. Os valores desta estatística estão na
coluna M do Quadro 4 e vão permitir a construção da distribuição empírica da estatística
M de Hayter e Tsui. Os percentis correspondentes aos limites de 95% e 99% seriam
respectivamente 2,33 e 2,91 (ver o histograma na Figura 22).
Tabela 4 – Construção da distribuição empírica da estatística M
i
X1 X2 X3 abs(X1) abs(X2) Abs(X3)
M
1
2,34882
0,70407
1,21282
2,34882
0,70407
1,21282
2,34882
2
1,28561
-0,03513
1,05186
1,28561
0,03513
1,05186
1,28561
3
1,39904
0,19286
-0,52773
1,39904
0,19286
0,52773
1,39904
4
1,10212
0,1376
0,45874
1,10212
0,1376
0,45874
1,10212
5
1,53883
-0,9473
0,18292
1,53883
0,9473
0,18292
1,53883
6
0,4503
0,98879
0,02117
0,4503
0,98879
0,02117
0,98879
7
-0,37727
-1,78677
-1,20253
0,37727
1,78677
1,20253
1,78677
8
0,07371
0,29374
-0,0403
0,07371
0,29374
0,0403
0,29374
9
-1,88771
-0,36214
-0,10162
1,88771
0,36214
0,10162
1,88771
10
-1,32122
-0,88224
-0,48752
1,32122
0,88224
0,48752
1,32122
11
0,29744
-0,62336
-1,81512
0,29744
0,62336
1,81512
1,81512
...
... ... ... ... ... ... ...
1000
-0,20519
-0,90352
0,38367
0,20519
0,90352
0,38367
0,90352
46
M
Frequencia
3,53,02,52,01,51,00,5
80
70
60
50
40
30
20
10
0
Distribuição Empírica da Estatística M de Hayter e Tsui - n=1000
Figura 22: Histograma da distribuição empírica da estatística M de Hayter e Tsui.
Variáveis com distribuição normal k-variada e n=1000
Uma vez obtidos os limites de controle através da distribuição empírica, para
um determinado processo calcula-se a estatística 3,..,1max == jXM
ij
i
para nova
amostra do processo que está sendo monitorado. O processo será considerado como fora
de controle a um determinado nível de confiança se o valor da estatística for superior ao
limite de controle correspondente. A título de ilustração a Figura 23 mostra um gráfico
de controle para uma amostra de 10 observações deste processo. Uma análise do gráfico
mostra um processo fora de controle a um nível de 95% de confiança, visto que uma
observação com valor superior ao referido limite de controle. No entanto, para um nível
de 99%, o processo é considerado sob controle.
47
Gráfico de Controle para a Estatística de Hayter e
Tsui
0
0,5
1
1,5
2
2,5
3
3,5
1 2 3 4 5 6 7 8 9 10
Tempo
Estatistica de Hayter e
Tsui
95% 99% Estatistica de Hayter e Tsui
Figura 23 - Gráfico de controle para a estatística M de Hayter e Tsui.
2.6.2 - Gráfico de Controle Através da Estatística de
Hayter e Tsui Caso da Distribuição
Desconhecida.
Para esta situação vamos supor um alto-forno a carvão vegetal no qual quatro
variáveis de interesse estão sendo observadas e que a distribuição conjunta das variáveis
é desconhecida. As variáveis observadas são vazão, pressão de topo, pressão de coroa e
temperatura de coroa.
Os limites de controle da estatística M de Hayter e Tsui devem ser obtidos com
base em uma distribuição empírica da própria estatística M, calculada em um período de
operação em que o processo seja considerado sob condições adequadas. Para cada
observação da amostra do processo, a estatística
jjjij
i
sxxM /||max
_
= será
calculada. Caso os parâmetros do processo
µ
e
Σ
sejam conhecidos, a estatística M
será calculada como
jjjij
i
xM
σµ
/||max = .
48
O Quadro 5 apresenta parte do conjunto de n = 65534 observações do processo
do alto-forno com os valores da estatística
i
M
calculados, assim como os valores para
_
j
x e
jj
s , j=1,2,3,4.
Quadro 5 Obtenção da distribuição empírica da estatística M distribuição
desconhecida
i
Temperatura
de Coroa
Pressão
de Topo
Vazão
Pressão
de
Coroa
jjjij
sxx /||maxM
_
i
=
1
677,05 1,12 21,21 5,89 2,244472
2
676,95 1,12 21,36 5,87 2,244472
3
676,47 1,13 21,21 5,91 2,369643
4
681,05 1,12 21,21 5,86 2,244472
5
677,64 1,11 21,36 5,87 2,119302
6
677,64 1,1 21,05 5,87 1,994132
7
677,64 1,12 21,21 5,85 2,244472
8
681,16 1,13 21,21 5,87 2,369643
9
677,64 1,12 21,21 5,83 2,244472
10
681,74 1,11 21,36 5,83 2,119302
11
678,81 1,11 21,36 5,84 2,119302
12
679,4 1,11 21,21 5,83 2,119302
13
682,33 1,11 21,36 5,84 2,119302
14
680,57 1,1 21,36 5,83 1,994132
15
677,05 1,1 21,21 5,84 1,994132
16
676,47 1,11 21,51 5,86 2,119302
17
678,23 1,09 21,51 5,86 1,868962
18
677,05 1,12 21,66 5,83 2,244472
19
677,05 1,11 21,51 5,83 2,119302
... ...
...
...
...
...
65534
680,57 1,11 21,36 5,83 2,119302
Média
678,84 0,94 21,13 6,02
Desvio-
Padrão
8,76 0,08 0,27 0,18
Os limites de controle a 95% e 99% de confiança para o processo seriam 2,55 e
3,51 respectivamente. A Figura 24 mostra um histograma da distribuição empírica da
estatística M.
49
Figura 24: Histograma da distribuição empírica da estatística de Hayter e Tsui para
distribuição desconhecida.
A Figura 25 mostra um gráfico de controle para os primeiros 21 valores
observados da estatística
i
M . O gráfico mostra um processo fora de controle, visto que
em uma das observações o valor da estatística
i
M
supera o limite de controle a 95%.
Porém, a uma confiança de 99% o processo continua sob controle estatístico.
Figura 25: Gráfico de controle de Hayter e Tsui em que as variáveis têm distribuição
conjunta desconhecida.
Gráfico de Controle para a Estatistica de Hayte r e Tsui - dados com
distribuição conjunta desconhecida
0
0,5
1
1,5
2
2,5
3
3,5
4
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Observações
Mi
Est.Hayter e Tsui LC 95% LC 99%
M
Frequancia
9,88,47,05,64,22,81,4
12000
10000
8000
6000
4000
2000
0
Distribuiçaõ empírica Estatistica M de Hayter e Tsui - Dist. desconhecida
50
A metodologia de Hayter e Tsui permite que se identifique de forma
precisa qual variável está ocasionando um eventual alarme para processo fora de
controle, que é feito da seguinte forma:
Para cada observação fora de controle o seguinte valor é calculado:
jj
jij
s
XX
_
(2.22)
e verifica-se para quais variáveis este valor ultrapassa o valor de
α
R
C
, ou seja
quais são responsáveis pela falta de controle.
O Quadro 6 mostra o cálculo para identificação das variáveis que causam
o processo ficar fora de controle. Os dados são os mesmos da Fugura 25, com
exceção de 4 valores que foram deliberadamente substituídos por valores
extremos (em negrito). A Figura 26 mostra o gráfico de controle para este
processo simulado. Notar que o gráfico aponta para um processo fora de
controle, mas apenas a visualização do gráfico não permite a identificação de
qual variável causa a falta de controle. Para a identificação das variáveis
utilizaremos o valor do limite de controle a 99% obtido da distribuição empírica
mostrada na Figura 24, que é igual a 3,51.
51
Quadro 6: Identificação das variáveis que indicam processo fora de controle
para a estatística de Hayter e Tsui
i
Temp.
de Coroa
Pressão
Topo Vazão
Pressão
Leito abs(cor) abs(PT) abs(Vaz)
abs(PL)
i
M
1
677,05 1,12 21,21 5,89 0,205296
2,244178
0,283903
0,760798
2,244178
2
676,95 1,12 21,36 5,87 0,216703
2,244178
0,83017 0,87368 2,244178
3
676,47 1,13 21,21 5,91 0,27146 2,369334
0,283903
0,647916
2,369334
4
681,05 1,12 21,21 5,86 0,251007
2,244178
0,283903
0,930121
2,244178
5
677,64 1,11 21,36 5,87 0,137991
2,119022
0,83017 0,87368 2,119022
6
677,64 1,1 21,05 5,87 0,137991
1,993867
0,298783
0,87368 1,993867
7
677,64 1,12 21,21 5,85 0,137991
2,244178
0,283903
0,986563
2,244178
8
681,16 1,13 21,21 7 0,263556
2,369334
0,283903
5,504172
5,504172
9
677,64 1,11 23 5,83 0,137991
2,119022
6,802694
1,099445
6,802694
10
681,74 1,3 21,36 5,83 0,32972
4,496981
0,83017 1,099445
4,496981
11
750 1,11 21,36 5,84
8,116529
2,119022
0,83017 1,043004
8,116529
12
679,4 1,11 21,21 5,83 0,062782
2,119022
0,283903
1,099445
2,119022
13
682,33 1,11 21,36 5,84 0,397024
2,119022
0,83017 1,043004
2,119022
14
680,57 1,1 21,36 5,83 0,196251
1,993867
0,83017 1,099445
1,993867
15
677,05 1,1 21,21 5,84 0,205296
1,993867
0,283903
1,043004
1,993867
16
676,47 1,11 21,51 5,86 0,27146 2,119022
1,376437
0,930121
2,119022
17
678,23 1,09 21,51 5,86 0,070686
1,868711
1,376437
0,930121
1,868711
18
677,05 1,12 21,66 5,83 0,205296
2,244178
1,922705
1,099445
2,244178
19
677,05 1,11 21,51 5,83 0,205296
2,119022
1,376437
1,099445
2,119022
20
677,64 1,11 21,51 5,82 0,137991
2,119022
1,376437
1,155886
2,119022
21
680,57 1,11 21,36 5,83 0,196251
2,119022
0,83017 1,099445
2,119022
Os valores em negrito para
i
M
são de observações que indicam o processo fora
de controle. Observar que para cada observação pelo menos uma variável (também
em vermelho) que tem o valor calculado como em (2.22) que ultrapassa o limite de
controle estabelecido. A Figura 26 mostra o gráfico de controle para este processo,
indicando a falta de controle estatístico.
52
Figura 26: Processo fora de controle estatístico para a estatística de Hayter e Tsui
2.7 Comparação entre as Estatísticas M de Hayter e
Tsui e a
2
T
de Hotelling
Ao fazer uma comparação entre a estatística de Hayter e Tsui e a estatística
2
T
de Hotelling nas mesmas condições, isto é, vetor aleatório
X
com distribuição normal
k
N
(
µ
,
kxk
Σ
), supondo
µ
e
kxk
Σ
conhecidos, no caso da estatística
2
T
, o processo é
considerado fora de controle quando um valor amostral de
i
X
apresenta um valor de
2
i
T
tal que:
2
T
=
(
)
(
)
µµ
Σ
XX
kk
1
' >
2
,
α
χ
k
, (2.23)
onde
2
,
α
χ
k
representa o valor crítico de uma distribuição qui-quadrado com k graus de
liberdade ao vel de significância
α
. No caso da estatística de Hayter e Tsui, o
processo será considerado fora de controle quando:
i
M
= Max (|
i
X
-
i
µ
| /
j
σ
) >
α
,R
C
(2.24)
Gráfico de Controle - Est.de Hayter e Tsui
0
2
4
6
8
10
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Tempo
Est.Hayter e Tsui
Critico Est.Hayter e Tsui
53
onde
i
µ
e
j
σ
são respectivamente a média e desvio-padrão da variável
j
X
.
Nos dois casos a decisão será ao nível de significância
α
e em casos extremos
de falta de controle deverão chegar à mesma conclusão. No entanto, haverá situações
em que uma estatística vai “soar o alarme” para o processo fora de controle e a outra
não.
Como um exemplo, a Figura 27 mostra uma elipse de confiança (Johnson e
Wichern, 2005) para o vetor de médias do processo usando-se
2
T
com nível de
confiança
α
= 0,95 e também os limites de controle usando-se para a estatística
M
ao o
mesmo nível de confiança, com a amostra utilizada na seção 2.1. As variáveis utilizadas
no gráfico são corrente e vazão.
Figura 27: Regiões de confiança usando as estatísticas
2
T
e
M
.
A região de controle usando a estatística
M
é dada pela região retangular
delimitada pelos valores 17,59 e 22,41 para a variável vazão e 84,41% e 77,59% para a
variável corrente. A região de controle usando a estatística
2
T
é dada pela elipse.
Portanto, pontos fora da elipse serão de um processo considerado fora de controle em
relação à estatística
2
T
, enquanto que os pontos fora da região retangular serão
oriundos de um processo considerado fora de controle em relação a estatística
M
.
54
Notar que a região em branco contém pontos de um processo considerado fora de
controle em relação apenas à
2
T
, enquanto que a região em amarelo contém pontos de
um processo considerado fora de controle apenas em relação a estatística
M
. É
importante notar que nos gráficos de controle mostrados nas Figuras 13 e 14, nas
páginas 18 e 19, cada variável de forma isolada indicava um processo sob controle
estatístico. No entanto, na análise conjunta uma observação fora de ambas as regiões
de controle construídas usando-se as duas estatísticas multivariadas. Portanto sob a
análise conjunta, o processo não está sob controle estatístico. Uma outra comparação
sobre o poder dos testes de Hotelling e Hayter e Tsui pode ser encontrado no artigo de
Hayter e Tsui (1994) mostrando que dependendo de como o vetor de médias do
processo se altera, um teste pode ser mais poderoso que o outro e vice-versa.
55
3 -
Gráficos de Controle para a Variabilidade
O controle da variabilidade do processo é importante no contexto univariado,
pois os gráficos de controle para a média são dependentes da variabilidade (Costa et. al,
2004). Sendo assim, se a variabilidade do processo não está sendo controlada, os
gráficos não são informativos. No contexto multivariado é necessário controlar a matriz
de covariâncias, algo mais complexo de ser feito. Em geral este controle é feito através
de medidas que sintetizam a matriz de covariâncias, como determinante e traço da
matriz (Montgomery, 2004).
Nesta dissertação propomos que a variabilidade do processo multivariado seja
inicialmente controlada através do comportamento dos desvios padrão de cada variável.
Isto poderá ser feito utilizando-se os gráficos de controle univariados para o desvio
padrão de cada variável separadamente. Além disso, vamos propor uma nova
metodologia para controlar a variabilidade do processo multivariado de forma conjunta
utilizando-se uma modificação da estatística de Hayter e Tsui (1994).
3.1 Gráfico de Controle Univariado para o Desvio
Padrão Móvel
O gráfico de controle do desvio padrão móvel,
S
, serve para detectar alterações
na dispersão do processo. Os pontos amostrais no gráfico são valores da estatística
S
calculada com base nas m últimas observações. O resultado final, portanto, é uma série
cronológica. Para a construção do gráfico de controle, para cada variável basta obter a
estatística
S
para as últimas m observações desta variável do processo, onde os valores
para
S
são definidos genericamente como:
)1(
)(
1
2
_
,
=
+=
m
xx
S
m
bi
b
j
b
ij
m
bj
(3.1)
56
onde
b
ij
x denota o valor da variável j para o elemento amostral i, que faz parte do
subgrupo b, e
_
j
x denota a média amostral da variável j, considerando-se que m
observações da variável
j
x , que fazem parte do subgrupo b, j=1,...,k.
Os limites para o gráfico de controle de
S
dependem da distribuição amostral de
S
. No entanto, em um processo de produção contínuo não se pode garantir que a
distribuição da variável em estudo é conhecida e o mesmo pode ser dito quanto à
distribuição de
S
. Partindo deste pressuposto, os limites para o gráfico de controle para
S
serão obtidos com base em uma distribuição empírica, em um período em que o
processo esteja trabalhando sob condições consideradas adequadas. Para cada amostra
(subgrupo) de m observações seqüenciais será calculada uma estatística
S
. Notar que o
valor de
_
j
x pode ser substituído por um valor fixo, com base em um conhecimento a
priori do processo.
O Quadro 7 mostra um exemplo numérico para a construção do gráfico
S
, com
o valor de m sendo igual a 4 observações, e o número de subgrupos b = 7.
Quadro 7 - Estatística S com subgrupo m=4.
i
m
ij
x
m
bj
S
,
_
m
j
x
1
7,63 -
2
6,32 -
3
8,00 -
4
6,10 0,9438336
7,01
5
5,04 1,2263884
6,36
6
3,87 1,7545514
5,75
7
6,50 1,1795344
5,38
8
7,75 1,6930742
5,79
9
2,58 2,3663751
5,17
10
8,60 2,6613598
6,36
Em uma distribuição empírica deste processo com 1000 valores de
S
calculados,
o limite de controle a 95% de confiança foi igual a 3,14. O processo será considerado
fora de controle se algum dos valores calculados para S exceder o limite de controle
estabelecido. A Figura 28 apresenta o gráfico de controle para o desvio padrão relativo
aos dados do Quadro 7. Uma rápida análise do gráfico mostra um processo sob controle.
57
Houve um crescimento sistemático no valor de
S
nas últimas 4 observações e uma
possível estabilização.
Gráfico de controle para S
0
0,5
1
1,5
2
2,5
3
3,5
1 2 3 4 5 6 7 8 9
Observações
S
LC 95% S
Figura 28: Gráfico de controle para S – exemplo do Quadro 7.
Neste tipo de gráfico a questão do tamanho do subgrupo móvel usado
para se calcular
S
. Quanto maior for este subgrupo, mais suave será o comportamento
do gráfico. Na Figura 29 são mostrados para um mesmo conjunto de observações de
uma variável, a estatística
S
calculada com tamanhos de subgrupos iguais a 10,20,30 e
50 observações.
Gráfico de S com tamanhos de subgrupos diferentes
0
0,5
1
1,5
2
2,5
3
3,5
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47
tempo
Desvios padrão
b=10 b=20 b=30 b=50
Figura 29: Gráfico de
S
com tamanhos de subgrupos diferentes.
58
Devido ao comportamento mais suave, na medida em que o tamanho do subgrupo
aumenta, os limites de controle têm valores menores conforme mostra o Quadro 8. Os
limites foram obtidos em uma distribuição empírica da estatística
S
com 1000
observações.
Quadro 8 – Valores para limites de controle para a Estatística
S
Tamanho do subgrupo Limite de controle 95%
4 3,14
6 2,82
8 2,63
10 2,44
A Figura 29 mostra uma comparação entre gráficos de controle para
S
com
tamanhos de amostras 4 e 10. Vê-se que tanto para m=4 quanto para m=10 não
pontos que ultrapassam os limites de controle. No entanto, os pontos 37,38 e 39 para
m=4 causam alguma preocupação pois estão muito próximos do limite de controle
correspondente.
Comparação entre gráficos de controle para S
0
0,5
1
1,5
2
2,5
3
3,5
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
Observações
S
m=4 m=10 LC95% m=10 LC95% m=4
Figura 30: Comparação entre gráficos de controle para
S
com tamanho de subgrupos
diferentes.
3.2 Gráfico de Controle Multivariado para a Variabilidade do
Processo – Estatística A
59
A amplitude de um conjunto de dados univariado, definida como a diferença
absoluta entre o maior e o menor valor do conjunto, talvez seja a medida de dispersão
mais intuitiva e fácil de ser implementada.
No caso multivariado, seja um vetor aleatório
[
]
',...,
1 k
XXX =
contendo k
características de qualidade de interesse de um determinado processo. Seja
n
XX
,...,
1
uma amostra aleatória do processo. Então, para cada variável de interesse, teríamos uma
série de n valores e diferenças em valores absolutos como definidas em (3.2) podem ser
calculadas. Para avaliar a dispersão do processo, através de gráficos univariados de
desvio padrão ou amplitude, teríamos que avaliar todas as características ao mesmo
tempo, o que, dependendo do número de características pode se tornar muito difícil ou
tedioso.
No entanto, podemos aplicar a idéia da construção da estatística de Hayter e Tsui
como na seção (2.3.3) com o objetivo de se criar uma estatística que visa resumir toda a
informação conjunta das amplitudes.
Seja a variável aleatória
A
de ordem m,
m
j
A , definida como:
jj
jmiij
m
j
s
xx
A
=
2
,
(3.2)
onde
ij
x
é a observação do elemento i da variável j, i = 1,...,n. O tamanho da
defasagem (lag) é definido por m observações e
jj
s
é o desvio padrão amostral da
variável j, definido em 1.7, j=1,2,...,k. A estatística
m
j
A é, portanto, o valor absoluto
das diferenças entre as observações i e (i-m) da variável
j
X
, ponderado pelo desvio
padrão da diferença
(
)
jmiij
xx
,
, que é dado por
jj
s
2 .
Teoricamente, no caso de uma anomalia operacional no processo, as variáveis
eventualmente afetadas terão valores em diferentes veis, o que levará a estatística
m
j
A
a ter valores maiores. Dado uma amostra de tamanho n teremos um total de n-m+1
valores amostrais de
m
j
A . Assim, por exemplo, se tivéssemos n=20 observações, para
60
m=4 teríamos 17 valores amostrais para
m
j
A . Deste modo, para cada subgrupo
construído de acordo com o valor de m teremos o vetor observado ]...[
21
m
k
mmm
AAAA =
.
Usando-se a idéia proposta por Hayter e Tsui (1994) , podemos definir a estatística A
como sendo:
)(max
,..,2,1
m
j
kj
AA
=
=
(3.3)
A estatística
A
representa o máximo entre as coordenadas do vetor
m
A
e resume
a informação de variabilidade do conjunto de k variáveis aleatórias monitoradas do
processo. Se temos uma amostra de tamanho n, teremos b=n-m+1 valores da estatística
A
e a distribuição empírica da estatística
A
poderá ser calculada. Assim o limite de
controle poderá ser obtido para monitorar-se a variabilidade conjunta do processo.
A amostra utilizada para gerar a distribuição empírica da estatística
A
deverá ser
coletada num período em que o processo esteja operando sob condições consideradas
tecnicamente adequadas.
Como exemplo, para a construção do gráfico de controle para a estatística
A
,
vamos supor um alto-forno a carvão vegetal no qual quatro variáveis de interesse estão
sendo observadas: vazão, pressão de topo, pressão de coroa e temperatura de coroa.
O Quadro 9 mostra um conjunto de 30 observações do processo em um período
considerado adequado e os valores a estatística
m
j
A são calculados, considerando-se uma
defasagem de m=4 observações.
61
Quadro 9 – Cálculo da estatística
m
j
A
i
Temperatura
de Coroa
Pressão
de Topo
Vazão
Pressão
de Coroa
1
A
2
A
3
A
4
A
A
1
677,05
1,12
21,21
5,89
2
676,95
1,12
21,36
5,87
3
676,47
1,13
21,21
5,91
4
681,05
1,12
21,21
5,86
5
677,64
1,11
21,36
5,87
0,251731
0,322575
1,173902
0,820832
1,173902
6
677,64
1,1
21,05
5,87
0,294397
0,64515
2,426064
0
2,426064
7
677,64
1,12
21,21
5,85
0,499195
0,322575
0
2,462497
2,462497
8
681,16
1,13
21,21
5,87
0,046933
0,322575
0
0,410416
0,410416
9
677,64
1,12
21,21
5,83
0
0,322575
1,173902
1,641665
1,641665
10
681,74
1,11
21,36
5,83
1,749316
0,322575
2,426064
1,641665
2,426064
11
678,81
1,11
21,36
5,84
0,499195
0,322575
1,173902
0,410416
1,173902
12
679,4
1,11
21,21
5,83
0,750926
0,64515
0
1,641665
1,641665
13
682,33
1,11
21,36
5,84
2,001047
0,322575
1,173902
0,410416
2,001047
14
680,57
1,1
21,36
5,83
0,499195
0,322575
0
0
0,499195
15
677,05
1,1
21,21
5,84
0,750926
0,322575
1,173902
0
1,173902
16
676,47
1,11
21,51
5,86
1,250121
0
2,347804
1,231249
2,347804
17
678,23
1,09
21,51
5,86
1,749316
0,64515
1,173902
0,820832
1,749316
18
677,05
1,12
21,66
5,83
1,501852
0,64515
2,347804
0
2,347804
19
677,05
1,11
21,51
5,83
0
0,322575
2,347804
0,410416
2,347804
20
677,64
1,11
21,51
5,82
0,499195
0
0
1,641665
1,641665
21
680,57
1,11
21,36
5,83
0,99839
0,64515
1,173902
1,231249
1,231249
22
678,23
1,09
21,36
5,83
0,503462
0,967725
2,347804
0
2,347804
23
687,6
1,11
21,36
5,83
4,501288
0
1,173902
0
4,501288
24
678,23
1,1
21,36
5,83
0,251731
0,322575
1,173902
0,410416
1,173902
25
679,98
1,11
21,21
5,82
0,251731
0
1,173902
0,410416
1,173902
26
678,81
1,03
21,36
5,83
0,247464
1,935449
0
0
1,935449
27
678,13
0,97
21,21
5,81
4,040493
4,516048
1,173902
0,820832
4,516048
28
677,05
1,09
21,36
5,82
0,503462
0,322575
0
0,410416
0,503462
29
677,64
1,08
21,36
5,81
0,99839
0,967725
1,173902
0,410416
1,173902
...
...
...
...
...
...
...
...
...
...
65536
677,05
1,09
21,36
5,81
0,750926
1,935449
0
0,820832
1,935449
Desvios
Padrão 2,343773
0,031001
0,127779
0,024366
O Quadro 31 mostra o gráfico de controle para a estatística A. O limite de
controle de 95% é equivalente a 0,93 , obtido em uma distribuição empírica com 65.000
observações do mesmo processo que gerou os dados do Quadro 9. Uma análise
do gráfico mostra o processo sob controle estatístico, visto que os valores da estatística
A são visivelmente inferiores ao valor do limite de controle a 95% de confiança.
62
Figura 31: Gráfico de controle para a estatística
A
A Figura 32 mostra o comportamento da estatística A calculada para defasagem
de 4, 10 e 30 observações. Pode ser observado que os gráficos apresentam
comportamentos semelhantes, mas os limites de controle são diferentes. Neste exemplo,
os limites de controle foram gerados com base em uma distribuição empírica com
65534 observações e foram iguais a 0,88 para defasagem de 4 observações, 1,11 para
11 observações e 1,40 para 30 observações.
Figura 32: Gráficos de controle para a estatística
m
A com defasagens diferentes.
Gráfico de Controle para a Estatística A
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
5
1 3 5 7 9 11 13 15 17 19 21 23 25
Tempo
Estatistica A
A L 95%
Comparação entre estatisticas Am
0
0,5
1
1,5
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Tempo
Am
Am4 Am10 Am30
LC95%_4 LC95%_10 LC95%_30
63
A Figura 33 mostra os histogramas das distribuições empíricas da estatística
A,
feitos na mesma escala para os valores do eixo horizontal para os três valores. As
distribuições apresentam diferenças na assimetria, o que de certa forma explica a
diferença entre os limites de controle.
Frequencia
1 2 0 0 0
9 0 0 0
6 0 0 0
3 0 0 0
0
5 , 64 , 84 , 03 , 22 , 41 , 60 , 80 , 0
1 2 0 0 0
9 0 0 0
6 0 0 0
3 0 0 0
0
5 , 64 , 84 , 03 , 22 , 41 , 60 , 80 , 0
1 0 0 0 0
7 5 0 0
5 0 0 0
2 5 0 0
0
A m _ 4 A m _ 1 0
A m _ 3 0
H i s to g r a m a s d a d i s t r ib u iç ã o e m p í r i c a d a e s t a tis t i c a A
Figura 33: Histograma das distribuições empíricas da estatística A, m=4, 10 e
30.
3.3 – O Coeficiente de Correlação Linear de Pearson
Diz-se que duas variáveis estão associadas se de alguma forma uma relação
entre elas, relação esta que pode ser de rias formas. Uma das associações de interesse
é a associação linear, também conhecida como correlação linear. A estatística utilizada
para mensurar a relação linear entre duas variáveis é chamada coeficiente de correlação
linear de Pearson (Anderson,2003). Sejam n pares de observações das variáveis
aleatórias X e Y. Seja
yyxx
xy
SS
S
R
=
(3.4)
sendo
1
1
R
.
xy
S é a covariância amostral entre as variáveis X e Y,
xyxx
SeS são as
variâncias amostrais das variáveis X e Y, respectivamente, definidas no capítulo 2.
Então R é chamado de coeficiente de correlação linear amostral de Pearson. O sinal de R
64
indica a forma da correlação, podendo ser direta (sinal positivo), ou inversa (sinal
negativo. Valores iguais a -1 ou 1 indicam relação linear perfeita, enquanto que valores
de R próximos de zero indicam correlação linear fraca.
A Figura 34 apresenta uma ilustração de alguns tipos de relacionamento entre
variáveis e o valor correspondente de R.
Figura 34: Relacionamentos entre variáveis X e Y e o correspondente valor do
coeficiente de correlação linear de Pearson.
3.3.1 – A Correlação Linear Aplicada ao Controle de Processos
Seja um processo com k características de interesse provenientes de uma
distribuição normal k-variada de forma que a um dado instante se tenham m
observações destas características. Então, para este conjunto de m observações podemos
calcular o coeficiente de correlação linear de Pearson entre quaisquer par de variáveis e
podemos construir intervalos de confiança para o coeficiente de correlação teórico
ρ
,
obtendo-se assim uma região de controle para o processo.
Como relações entre as variáveis devido ao próprio processo, reações
químicas ou processos físicos que envolvem variações das quais se sabe a ordem de
grandeza do coeficiente de correlação, os valores amostrais de R poderiam ser
comparados com os valores teóricos.
No entanto, nem sempre a suposição de normalidade multivariada é válida, pois
o processo pode sofrer mudanças diversas, devido a causas atribuíveis ou não. Estas
mudanças podem modificar as distribuições de probabilidade das variáveis. Para o caso
65
em que a distribuição normal multivariada não é válida, uma aproximação da
distribuição de R pode ser obtida de forma empírica. De posse de observações do
processo de um dia em que este esteja sendo operado sob condições adequadas, obtém-
se vários valores para R e a partir daí é possível construir-se a distribuição empírica de
R. Assim, um valor crítico pode ser obtido escolhendo-se o valor correspondente ao
percentil de ordem (1-
α
) desta distribuição.
Nesta dissertação propõe-se a seguinte metodologia para construção do gráfico
de controle através de R. Suponha que se tenha uma amostra aleatória de tamanho n de
duas variáveis, ),(
lj
XX que são medidas em cada elemento amostral i, i=1,...,n.
Define-se o coeficiente de correlação linear de ordem m entre
j
X e
l
X como:
m
ll
m
jj
m
lj
m
lj
SS
S
R
= (3.4)
onde
m
ll
m
jj
m
lj
SeSS , são calculados com o grupo de observações. O primeiro valor de
m
lj
R
é calculado com as primeiras m observações do processo, isto é, ...,
21 m
XXX O
segundo valor é obtido com as observações ...,
132 +m
XXX e assim sucessivamente, para
m<n. Desta forma uma amostra aleatória de tamanho n de ),(
lj
XX gera (n-m+1)
valores amostrais de R. Esses são os valores utilizados na construção da distribuição
empírica de R. O valor de m é chamado de defasagem e a amostra de m observações de
subgrupo.
Como exemplo para a construção do gráfico de controle do processo, vamos
supor um alto-forno a carvão vegetal no qual quatro variáveis de interesse estão sendo
observadas: vazão, pressão de topo, pressão de coroa e pressão de leito. O Quadro 10
mostra um conjunto de observações do processo em um período considerado sob
condições adequadas e no qual a estatística R é calculada. Foram calculados os
coeficientes de correlação para tamanhos de subgrupos diferentes, no caso m=10 e
m=20, para comparações. As variáveis utilizadas como exemplo foram vazão e pressão
de leito. Neste período há 65534 observações, que serão utilizadas para a obtenção da
distribuição empírica de R.
66
Quadro 10 – Valores das variáveis de controle e as estatística R
I
Cor PT Vaz PL
Valor de R
PLxVaz
m=10
Valor de R
PLxVaz
m=20
1
677,05 1,12 21,21 5,89 -0,211786 -0,406956
2
676,95 1,12 21,36 5,87 -0,272678 -0,369844
3
676,47 1,13 21,21 5,91 -0,289577 -0,388523
4
681,05 1,12 21,21 5,86 -0,357988 -0,34948
5
677,64 1,11 21,36 5,87 -0,399363 -0,310574
6
677,64 1,1 21,05 5,87 -0,625347 -0,264781
7
677,64 1,12 21,21 5,85 0,0909091
-0,045469
8
681,16 1,13 21,21 5,87 0,3393208
0,1284705
9
677,64 1,12 21,21 5,83 0,3826432
0,3623177
10
681,74 1,11 21,36 5,83 0,2250041
0,3510382
11
678,81 1,11 21,36 5,84 0,0698857
0,3396298
12
679,4 1,11 21,21 5,83 0,1031879
0,3753886
13
682,33 1,11 21,36 5,84 0,0488765
0,4376678
14
680,57 1,1 21,36 5,83 0,0968549
0,443092
15
677,05 1,1 21,21 5,84 0,0968549
0,4409429
16
676,47 1,11 21,51 5,86 0,3657585
0,5316841
17
678,23 1,09 21,51 5,86 0,3112935
0,4681705
18
677,05 1,12 21,66 5,83 0,4842001
0,3703293
... ...
...
...
...
...
...
65534
677,64 1,11 21,51 5,82 0,3090861
0,2062044
A Figura 35 mostra o histograma da distribuição empírica de R calculada para
m=20. Notar a simetria em torno de um valor de R próximo de zero.
m=20
Frequencia
0,720,480,240,00-0,24-0,48-0,72-0,96
2000
1500
1000
500
0
Histograma da distribuição empírica de R
Figura 35: Distribuição empírica de R para m=20
67
A Figura 36 mostra o gráfico de controle para R com correlações calculadas para
m=10 e m=20 observações. Os limites de controle que formam uma região central de
95% de confiança para a estatística R foram os seguintes: -0,02 e 0,692 para m=10
observações e -0,54 e 0,53 para m = 20 observações, obtidos com os dados mostrados
no Quadro 10 na pagina 60. Observando o gráfico na Figura 36, nota-se que o
comportamento das correlações lineares quando o tamanho da amostra é maior, m=20, é
mais suave. Isto pode ser explicado pela própria fórmula de cálculo do coeficiente de
correlação. Quando a amostra é menor, a influência do valor de uma determinada
observação na estatística final é mais forte. Mudanças no processo são detectadas
rapidamente e a volta a uma eventual situação de adequabilidade seria mais rápida.
Correlaçoes e Limites e controle
-1
-0,5
0
0,5
1
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49
Observações
Correlações
PLxVaz 10 PLxVaz 20 LIC_10
LIC_20 LSC_10 LSC_20
Figura 36: Gráfico de controle para correlações lineares para m=10,20.
No caso de uma subgrupo de tamanho maior, a influência de um determinado
valor de uma observação terá menos efeito, o que causa a atenuação no comportamento
mas, no entanto, como a amostra é maior, esta observação permanecerá no cálculo da
estatística por mais tempo e uma eventual volta a uma situação de normalidade em
termos operacionais do alto-forno será mostrada em um espaço de tempo maior.
Na implementação do gráfico de controle este fato deverá ser levado em
consideração. Tomando como base o exemplo construído, o processo sai da região de
controle estatístico várias vezes quando considerado o contexto com 10 observações e
apenas uma vez com 20 observações.
68
É importante ressaltar que o gráfico de controle para o alto-forno a carvão
vegetal usando a correlação linear R é uma inovação que estamos propondo nesta
dissertação, assim como o de controle de variabilidade do processo via estatística A,
discutida previamente na seção 3.1.
69
4 – Estratégia de Execução
4.1 – Amostra em Condições Ideais.
Como visto nos capítulos 2 e 3, a maior parte dos gráficos de controle que serão
utilizados nesta dissertação têm seus limites fundamentados em distribuições empíricas
das próprias estatísticas. A obtenção destas distribuições empíricas tem de ser feitas
necessariamente em um período de operação em que o alto-forno seja considerado sob
condições adequadas de operação. Este período será considerado uma base de
comparação para outros períodos e será determinado pelo pessoal técnico envolvido na
operação do alto-forno em si.
Para o caso específico do alto-forno a carvão vegetal, as variáveis que mostram
os valores de temperatura de coroa, vazão e pressão de topo e pressão de leito são de
fundamental importância no procedimento de controle de qualidade do processo pelo
fato de mostrarem de forma instantânea o que está ocorrendo dentro do alto-forno. As
temperaturas de dentro dos glendons e as temperaturas de topo não têm a mesma
importância porque no primeiro caso, a temperatura de coroa é resultado direto das
temperaturas dos glendons, e no segundo caso, as temperaturas de topo mostram dados
após a ocorrência de qualquer anomalia. Portanto, em nível deste trabalho apenas as
variáveis pressão de topo e pressão de leito, vazão e temperatura de coroa serão
utilizadas.
A permeabilidade é uma variável importante, mas não foi considerada para
monitoração do processo em nível desta dissertação em vista do fato de que processos
com vazão e pressão diferentes podem apresentar o mesmo valor para permeabilidade.
Assim, eventualmente o processo poderá ter saído de controle e o fato poderá passar
desapercebido ao se observar apenas a permeabilidade.
É importante notar que a amostra deverá um tamanho que possibilite a obtenção
das distribuições empíricas com pesquisa das estatísticas utilizadas para a construção
dos gráficos de controle.
Com base em estudos de diversos períodos, foi selecionado como um período
em que o alto-forno esteve sob controle estatístico as primeiras 18 horas de operação do
70
alto-forno 2 da Siderpa, no dia 13 de junho de 2004. As observações foram realizadas a
cada segundo, desde o início do dia. Portanto, cerca de 65.000 observações para este
período. O período do ano que está entre os meses de maio e outubro é considerado
menos problemático em vel de operação do alto-forno pelo fato de, pelo menos na
região de Sete Lagoas, a época do ano com a menor umidade do ar e com os menores
índices de umidade para as principais matérias primas: o carvão vegetal, minério de
ferro e o próprio ar atmosférico. A umidade causa grande parte dos problemas de
operação do alto-forno. O Quadro 11 mostra um estudo descritivo das variáveis de
controle deste período considerado normal em termos de operação do alto-forno.
A Figura37 mostra os histogramas das variáveis consideradas de controle para o
dia ideal de operação.
Quadro 11: Estatísticas descritivas das variáveis de controle em período
considerado sob condições adequadas de operação.
Temperatura de
Coroa
Pressão de
Topo
Vazão Pessão de
Coroa
Numero de
Observações
65535 65535 65535 65535
Média 678,85 0,94 21,13 6,02
Desvio padrão 8,76 0,08 0,27 0,18
Coeficiente de
Variação
1,29 8,49 1,30 2,94
Mínimo 661,31 0,42 19,78 6,01
Máximo 702,58 1,77 22,26 7,21
Mediana 679,30 0,95 21,05 6,01
Amplitude 41,27 1,35 2,48 1,61
Assimetria -0,06 -0,50 0,03 0,78
Curtose -1,17 4,60 0,55 1,34
71
Frequencia
6
9
8
,
5
6
9
3
,
0
6
8
7
,
5
6
8
2
,
0
6
7
6
,
5
6
7
1
,
0
6
6
5
,
5
2 0 0 0
1 5 0 0
1 0 0 0
5 0 0
0
1
,
6
2
1
,
4
4
1
,
2
6
1
,
0
8
0
,
9
0
0
,
7
2
0
,
5
4
8 0 0 0
6 0 0 0
4 0 0 0
2 0 0 0
0
2
2
,
1
0
2
1
,
7
6
2
1
,
4
2
2
1
,
0
8
2
0
,
7
4
2
0
,
4
0
2
0
,
0
6
1 6 0 00
1 2 0 00
8 0 0 0
4 0 0 0
0
7
,
0
4
6
,
8
2
6
,
6
0
6
,
3
8
6
,
1
6
5
,
9
4
5
,
7
2
3 0 0 0
2 0 0 0
1 0 0 0
0
Te mp e ra tu ra _ C o r o a P re ss a o _ To po
Va zã o P re ss a o _ Le it o
H i s to g r a m a d a s V a r i a v e is d e C o n tr o l e
Figura 37 – Histogramas das variáveis de controle do alto-forno
Notar que não se pode suposição de distribuição normal de probabilidade
verdadeira em nenhuma das variáveis, que os p-valores foram menores que 0,05,
considerando-se o teste de Anderson Darling para normalidade (Anderson e
Darlling,1952). A Figura 38 mostra os gráficos de probabilidade normal para as
variáveis de controle.
Figura 38: Gráfico de probabilidades normais para variáveis de controle
72
A não normalidade nos levou à construção de distribuições empíricas para
obtenção dos limites de todas as estatísticas de controle. Um fator preponderante à
construção de distribuições empíricas é o grande número de observações disponíveis no
processo de produção do alto-forno.
A Figura 39 mostra gráficos seqüenciais univariados das variáveis em um
período em que o processo foi considerado operacionalmente sob controle.
Figura 39: Gráficos seqüenciais no período considerado sob condições
adequadas de operação.
73
A Figura 40 mostra um conjunto de gráficos para as mesmas variáveis em um
período no qual houve anomalias operacionais.
Figura 40: Gráfico de variáveis em período considerado fora de condições
adequadas, em um período não chuvoso
No entanto, não apenas umidade afeta a operação do alto-forno. Na Figura 40 é
apresentado um período fora do período chuvoso também com dificuldade em manter o
alto-forno sob controle operacional. O dia é 21 de agosto de 2004.
Temperatura de Coroa
500
550
600
650
700
750
800
1 95 189 283 377 471 565 659 753 847 941 1035 1129 1223 1317 1411
Minutos
Temperatura
Pressão de Leito
0
0,2
0,4
0,6
0,8
1
1,2
1,4
1,6
1 94 187 280 373 466 559 652 745 838 931 1024 1117 1210 1303 1396
Minutos
Pressão
Vazão
19
19,5
20
20,5
21
21,5
22
22,5
1 96 191 286 381 476 571 666 761 856 951 1046 1141 1236 1331 1426
Minutos
Vazão
Pressão de topo
4
4,5
5
5,5
6
6,5
7
7,5
1 96 191 286 381 476 571 666 761 856 951 1046 1141 1236 1331 1426
Minutos
Pressão Leito
Temperatura de Coroa
500
550
600
650
700
750
800
1 94 187 280 373 466 559 652 745 838 931 1024 1117 1210 1303 1396
Minutos
Temperatura
Pres são de Topo
0
0,2
0,4
0,6
0,8
1
1,2
1,4
1,6
1 99 197 295 393 491 589 687 785 883 981 1079 1177 1275 1373
Minutos
Pressão
Vazão
-2,5
2,5
7,5
12,5
17,5
22,5
1 95 189 283 377 471 565 659 753 847 941 1035 1129 1223 1317 1411
Minutos
Vazão
Pre ssão de Le ito
-0,5
0,5
1,5
2,5
3,5
4,5
5,5
6,5
7,5
1 99 197 295 393 491 589 687 785 883 981 1079 1177 1275 1373
Minutos
Pressão
74
Figura 41: Gráfico de variáveis em dia considerado fora de controle estatístico, em
período chuvoso
O período nos gráficos da Figura 41 foi em 23 de dezembro de 2004. Em geral,
como dito, períodos chuvosos causam grande dificuldade de operação do alto-forno
devido à umidade do ar e de matérias primas.
Notar que as escalas utilizadas para os valores das variáveis foram as mesmas
em todos os gráficos. A diferença entre os comportamentos das variáveis nos três
gráficos é grande.
Nos períodos chuvosos é difícil manter o alto-forno sob condições de operação
semelhantes às dos períodos não chuvosos. Portanto, na medida em que as condições de
operação mudam, os parâmetros operacionais têm que ser revistos no sentido em se
redefinir um novo patamar operacional. Para tal, tem-se que obter neste novo contexto
(períodos chuvosos) amostras em que o alto-forno se encontre em condições
satisfatórias de operação e a partir destes dados, refazer os estudos de forma a se obter
as distribuições (empíricas ou não) das variáveis, para que se tenha os limites de
controle para os gráficos.
Temperatura de Coroa
500
550
600
650
700
750
800
1 95 189 283 377 471 565 659 753 847 941 1035 1129 1223 1317 1411
Minutos
Temperatura
Pressão de Topo
0
0,2
0,4
0,6
0,8
1
1,2
1,4
1,6
1 94 187 280 373 466 559 652 745 838 931 1024 1117 1210 1303 1396
Minutos
Pressão
Vazão
12
14
16
18
20
22
1 96 191 286 381 476 571 666 761 856 951 1046 1141 1236 1331 1426
Minutos
Vazão
Pressão de Leito
2
3
4
5
6
7
8
1 95 189 283 377 471 565 659 753 847 941 1035 1129 1223 1317 1411
Minutos
Pressão
75
5 – Implementação Computacional em Situação Real
5.1 - O Alto-Forno 2 da Siderpa
A Siderpa – Siderúrgica Paulino Ltda. gentilmente cedeu informações de seu
Alto-Forno 2 para implementação das estatísticas de controle a que nos referimos nos
capítulo 1,2 e 3.
O Alto-forno (AF2) foi construído em 1974, tendo sido reformado várias vezes
desde então. Possui volume útil de 164 m3 e uma capacidade de produção de 360 a 380
toneladas-dia de ferro gusa. Atualmente, está equipado para produção de ferro gusa
nodular especial (teores de fósforo e manganês abaixo de 0,050% e de enxofre abaixo
de 0,012%), utilizando para isto duas panelas de tratamento, uma ponte rolante e duas
rodas de lingotamento (também chamados de rodeios). O AF2 possui ainda 8
ventaneiras, 3 glendons, casa de máquina com 4 motores de 250 CV em série (mais 1
reserva), vazão de ar de 21.000 Nm3/h a 8 m.c.a., sistema de corrida contínua, sistema
de carregamento em skip. Na produção de ferro gusa utiliza 100% de carvão vegetal,
proveniente das florestas da empresa (70 a 80%) e de seus fornecedores.
A Figura 42 mostra uma foto panorâmica do AF2 em pleno funcionamento,
tirada em maio de 2005.
Figura 42: Alto-forno 2 (AF2) da Siderpa em maio de 2005.
76
No AF2 são monitoradas a cada segundo as seguintes variáveis: Temperaturas
de topo e coroa do alto-forno, temperatura do ar na entrada, câmara e saída dos
glendons, vazão e pressão de coroa e topo.
Em termos de controle serão consideradas e analisadas as seguintes variáveis:
temperatura de coroa, vazão, pressão de topo e pressão de coroa. A temperatura de
coroa reflete de forma quase que instantânea as temperaturas dos glendons, enquanto
que as temperaturas de topo são afetadas depois de algum tempo após eventualmente
o alto-forno (processo) ter saído de controle.
No caso específico da ocorrência de uma gaiola, as temperaturas de glendons
não sofrem alterações, enquanto que as temperaturas de topo são afetadas após a
ocorrência em si.
5.2 O Software de Monitoração e Controle
O software de monitoração e controle é peça fundamental no contexto desta
dissertação. Sem sua utilização, torna-se praticamente impossível o controle em tempo
real do alto-forno. Todos os valores das variáveis de controle são obtidos a cada
segundo e processados através de gráficos de controle, de modo a se ter uma informação
imediata da situação atual do alto-forno. Outro aspecto de controle dos gráficos em
tempo real é o comportamento anterior do alto-forno, importantíssimo para verificação
de situações do tipo melhorou-piorou. Na falta do software de monitoração os dados
teriam que ser coletados de uma forma o mais sistemática possível e, além disso,
armazenadas de forma a se ter um acesso rápido e confiável.
A construção de distribuições empíricas de probabilidades se torna uma tarefa
extremamente complicada, para não dizer impossível, se os dados disponíveis não
estiverem em meio magnético, de fácil recuperação. Não se pode imaginar a digitação
ou cálculos manuais em um conjunto de dados em que se tem 4 variáveis e 65.000
observações.
Finalmente, havendo o software de monitoração, toda a teoria pode ser aplicada
de uma maneira controlada, isto é, todo o processo de construção e avaliação das
estatísticas de controle podem ser revistas e alteradas de acordo com necessidades que
77
eventualmente apareçam. Novas técnicas podem ser implementadas, novos gráficos
podem ser construídos.
O software desenvolvido para a obtenção das estatísticas de Hotelling (
2
T
), de
Hayter e Tsui, e as demais estatísticas de controle foi inteiramente desenvolvido em
Visual Basic na sua versão 6.0. O sistema operacional utilizado foi Windows XP.
Praticamente todo resultado (saída) do software são gráficos de controle.
5.3 Aplicação / Estudo de Casos
O software de monitoração fica em operação no equipamento de monitoração
instalado no alto-forno. Como dito anteriormente, as medições das variáveis de controle
são feitas a cada segundo. O tempo de um segundo é necessário pelo fato de que
várias formas de anomalias operacionais e algumas delas ocorrem de forma muito
rápida. A gaiola descrita no capítulo 1 teve o tempo de duração inferir a um minuto e
sequer foi registrada no diário de bordo do alto-forno. Mas foi o suficiente para tirar o
alto-forno de controle estatístico por cerca de cinco minutos.
A Figura 43 mostra um esquema no qual são mostrados os gráficos do software
de monitoração e controle e na página seguinte a explicação de cada um deles.
Figura 43: Esquema de gráficos do software de monitoração e controle
78
O Quadro 1 mostra o gráfico seqüencial das quatro variáveis de controle com
seus valores em relação a um máximo teórico. Desta forma, transformamos os valores
absolutos das variáveis em valores relativos, que podem ser mostrados em uma
escala.
O Quadro 2 mostra o gráfico de controle para o processo, utilizando a
correlação linear de Pearson entre as variáveis vazão e pressão de leito.
O Quadro 3 mostra o gráfico de controle para a variabilidade, utilizando o
desvio-padrão móvel para a variável temperatura de coroa.
O Quadro 4 mostra um gráfico seqüencial da permeabilidade, que é a razão entre
a vazão e a diferença entre pressão de leito e pressão de topo. Indica basicamente a
facilidade com que o ar passa pela carga dentro do alto-forno.
O Quadro 5 mostra gráficos seqüenciais das correlações lineares de Pearson
entre a variável coroa e as demais variáveis de controle.
O Quadro 6 mostra o gráfico de controle para a variabilidade, utilizando o
desvio-padrão móvel para a variável pressão de topo.
O Quadro 7 mostra o gráfico de controle para o processo utilizando a estatística
de Hayter e Tsui.
O Quadro 8 mostra o gráfico de controle para o processo, utilizando a estatística
2
T
de Hotelling padronizada.
O Quadro 9 mostra mostra o gráfico de controle para a variabilidade, utilizando
desvio-padrão móvel para a variável vazão.
O Quadro 10 mostra o gráfico de controle para o processo, utilizando a
estatística
2
T
de Hotelling padronizada.
O Quadro 11 mostra o gráfico de controle para a variabilidade do processo
utilizando a estatística A – diferenças móveis.
O Quadro 12 mostra o gráfico de controle para a variabilidade, utilizando
desvio-padrão móvel para a variável pressão de leito.
Cada traço vertical determina múltiplos de 60 segundos, ou seja, entre dois
traços teremos um minuto de monitoração.
Nas próximas páginas vamos mostrar o comportamento do alto-forno em
condições consideradas adequadas de operação, em duas ocorrências de gaiolas, em
uma intervenção branda no funcionamento e uma intervenção mais duradoura no
processo, possivelmente devido a manutenção.
79
Caso 1: Operação em condições adequadas.
A Figura 44 mostra o comportamento do alto-forno em condições consideradas
adequadas de operação. As variáveis de controle praticamente não se alteram durante o
período. As estatísticas de controle multivariadas de Hayter e Tsui e a
2
T
de Hotelling
padronizada indicam que o processo está sob controle estatístico. A estatistica
2
T
de
Hotelling mostra o processo possivelmente saindo de controle ao nível de 99% de
confiança. Os gráficos de controle para a variabilidade do processo (Quadros 3,6,9,11 e
12) mostram que o processo está sob controle estatístico.
Figura 44: Período de operação tranqüilo do alto-forno.
80
Caso 2: Ocorrência de uma gaiola pequena.
A Figura 45 mostra a ocorrência de uma gaiola de pequenas proporções. Notar o
comportamento das variáveis vazão e pressão de leito (Quadro 1). A ocorrência da
gaiola é detectada por todas as estatísticas de controle. Notar o gráfico de controle para
a correlação linear entre as variáveis vazão e pressão de leito, que devido à relação
inversa das variáveis durante a anomalia (a vazão tem seu valor diminuído enquanto que
a pressão de leito aumenta) aponta valores próximos a -0,9. O valor da permeabilidade
diminui no momento exato da gaiola. Notar que a temperatura de coroa não é afetada, o
que pode ser visto no gráfico das variáveis (Quadro 1) e no gráfico de controle para a
variabilidade desta variável. Notar que as correlações lineares entre a temperatura de
coroa e as demais variáveis de controle não se alteram de forma significativa.
Figura 44: Ocorrência de uma gaiola.
81
No mesmo gráfico, observando o comportamento da permeabilidade, podemos
notar que a gaiola ocorreu rapidamente, mas o alto-forno levou cerca de 5 a 6 minutos
para retomar o valor de permeabilidade anterior à gaiola.
Caso 3: Ocorrência de uma gaiola de maiores proporções.
Na Figura 46, notar o tempo em que os valores das variáveis pressão de leito e
vazão ficaram alterados. Todas as estatísticas de controle detectaram a gaiola e o tempo
em que o alto-forno ficou “egaiolado”, cerca de cinco minutos. Nessa situação ocorreu o
corte de gaiola, ou seja, o fluxo de ar para o alto-forno foi desligado.
Figura 46: Gaiola de grandes proporções seguida de um corte de gaiola.
82
Caso4: Intervenção severa.
A Figura 47 mostra o desligamento dos motores que injetam ar no alto-forno.
Neste caso foi necessário parar o alto-forno, possivelmente devido a uma necessidade
de manutenção. Notar que antes da parada as estatísticas de controle multivariadas de
Hayter e Tsui, a
2
T
de Hotelling padronizada e a
2
T
de Hotelling indicavam um
processo fora de controle.
Figura 47: Intervenção severa no alto-forno.
83
Caso 5: Intervenção branda no alto-forno.
A Figura 48 mostra um caso de intervenção branda na operação do alto-forno.
Neste caso o alto forno estava em operação considerada adequada (mas fora de
controle estatístico, de acordo com as estatisticas multivariadas de controle) e
durante cerca de cinco minutos o fluxo de ar para o alto-forno foi diminuído.
Figura 48: Intervenção branda no alto-forno.
84
Voltando ao contexto da ocorrência das gaiolas, mostradas nas Figuras 44 e 45,
nota-se que como o ar tem sua passagem pela carga obstruída, o valor da vazão diminui
e o valor da pressão de coroa aumenta. A correlação entre estas variáveis tem seu valor
decrescido para valores perto de -0,9. A correlação linear entre estas variáveis, portanto,
é sensível à ocorrência da gaiola. Nestes exemplos utilizou-se um tamanho de subgrupo
igual a 120 observações, por ser múltiplo de 60 equivale a dois minutos e foi
considerado pelo pessoal técnico responsável pela operação do alto-forno como o tempo
mínimo para uma intervenção na maioria dos sub-processos envolvidos na produção. Os
limites de controle para este gráfico de controle foram obtidos através de uma
distribuição empírica, feita com base em um período considerado sob controle
estatístico. A Figura 49 mostra um histograma destas correlações. Os valores obtidos,
considerando-se uma distribuição simétrica, delimitando uma área de 95% foram 0,37 e
-0,62 respectivamente.
Figura 49 – Histograma da distribuição empírica da correlações linear entre
as variáveis vazão e pressão de leito
Para a estatística A (Diferenças absolutas móveis), assim como para os gráficos
univariados de controle foi utilizado o valor m=30 para a defasagem e b=30 para
tamanho de subgrupos. A escolha deste valor se deu em função de uma tentativa de se
PLxVaz 120
Frequency
0,660,440,220,00-0,22-0,44-0,66-0,88
2500
2000
1500
1000
500
0
Histograma: Correlações lineares entre Pressão de Leito e Vazão (n=120)
85
ter um intervalo de tempo inferior ao de duração de uma gaiola de pequeno porte (como
mostrado na Figura 44) e ao mesmo tempo fosse intuitiva em termos de operação, uma
vez que o valor m=30 representa 30 segundos ou meio minuto.
Para valores muito altos de m, a estatística A estaria captando uma diferença
entre observações com um espaço de tempo grande entre elas, o que talvez não fizesse
sentido. No caso dos desvios-padrão móveis, a influência de um valor extremo seria
prolongada, ultrapassando talvez até o tempo normal para que o processo volte a uma
situação de normalidade anterior.
No caso de valores muito baixos para m, teríamos a estatística A mostrando
alterações em períodos de tempo muito curtos, e para os desvios-padrão teríamos
gráficos muito sensíveis, como os mostrados no capítulo 3, seção 3.1
Finalmente, o objetivo maior desta dissertação não é fazer um estudo destes
valores específicos de tamanhos de subgrupos ou defasagens. Na verdade o objetivo
maior é propor as estatísticas de controle e mostrar de alguma forma que estas são
sensíveis às variações de comportamento do alto-forno.
A Figura 48 mostra um caso de intervenção na operação do alto-forno. No caso,
menos ar foi injetado dentro do alto-forno, o que pode ser devido a várias causas. Entre
elas podemos citar alguma manutenção que se fez necessária, possivelmente em algum
dos motores na casa de máquinas. Mas o que realmente interessa é que o fato que
causou uma mudança nos níveis das variáveis pressão de coroa, pressão de topo e
vazão. Observar que todas as estatísticas de controle foram sensíveis a ocorrência e os
valores foram além da escala prevista para os respectivos gráficos, ultrapassando os
valores estabelecidos para os limites de controle. Notar que desta vez o coeficiente de
correlação linear entre vazão e pressão de coroa teve o valor aumentado e assumiu
valores positivos, o que indica uma relação direta. No caso de uma gaiola, a relação
entre as duas variáveis, como visto, é inversa, o que causa um valor negativo para o
coeficiente de correlação.
As intervenções no processo de produção sem dúvida se fazem necessárias em
várias circunstâncias. No entanto, mesmo em tais situações, as mudanças nos níveis das
variáveis farão com que as estatísticas de controle extrapolem os respectivos limites e
acusem um processo eventualmente fora de controle estatístico. Um caso de “falso
positivo” ou “alarme falso”. Se a intervenção causar uma mudança mais severa nos
níveis das variáveis, a ponto de modificá-los em nível opercional, novos parâmetros
86
operacionais têm de ser introduzidos nos gráficos para que os limites de controle sejam
adequados à nova realidade operacional. que se verificar com cautela estes novos
parâmetros operacionais (valores alvo, desvios padrão, matrizes de covariâncias
amostral e correlações amostrais) uma vez que os limites serão calculados com base em
distribuições empíricas das estatísticas de controle.
5.4 Discussão sobre Estatísticas de Controle
No contexto desta dissertação foram apresentadas várias estatísticas de controle
para o alto-forno. Nas várias situações de anomalias operacionais ou intervenções, todas
as estatísticas, principalmente as relacionadas às médias do processo foram sensíveis e
mostraram com clareza a diferença de padrão de comportamento do alto-forno como um
todo. No entanto, uma questão importante seria a escolha de uma delas para ser adotada
como uma referência no caso de uma indicação de fora de controle estatístico.
O alto-forno definitivamente não é um equipamento de produção preciso, com
respostas rápidas. Pelo contrário. Como visto, gaiolas que ocorrem rapidamente e
outras mais intensas que demoram até dois minutos. A gaiola seguida de um arriamento
é um problema sério em nível de produção porque o alto-forno demora muito a voltar a
níveis operacionais anteriores. Às vezes o processo de “recuperação” dura um dia
inteiro. Mas em condições normais de operação, cada carga demora em média de seis a
oito horas para “descer”, ou seja, virar ferro-gusa. A intervenção na operação do alto-
forno em nível de matéria prima é um processo demorado. O que se faz em termos de
intervenção rápida é a diminuição ou aumento do fluxo de ar para dentro do alto-forno
ou regular os glendons de forma a alterar a temperatura de coroa. A regulagem de
glendons costuma ser uma ação mais definitiva, não sendo feita com muita freqüência,
enquanto que a alteração no fluxo de ar é feita quando se detecta uma gaiola, através da
verificação de valores de pressão de coroa e vazão.
Portanto, uma estatística a ser utilizada para indicar o nível de controle do alto-
forno não pode ter uma sensibilidade extrema a qualquer alteração. Tem que indicar a
ocorrência de anomalias e a volta ao padrão normal de operação. de se tomar muito
cuidado com os alarmes falsos em termos de controle estatístico.
87
Verificando o comportamento das estatísticas
2
T
(padronizada e a não
padronizada) e a de Hayter e Tsui durante a ocorrência de uma gaiola (Figuras 44 e 45),
observamos que a estatística
2
T
não padronizada fui muito sensível à ocorrência da
anomalia, estando inclusive apontando para um nível fora de controle estatístico
enquanto que as outras estatísticas, a
2
T
padronizada e a de Hayter e Tsui apontavam
um nível de operação considerado dentro de limites de controle, alterando os seus
valores na ocorrência da gaiola. Notar que a estatística de Hayter e Tsui demora cerca
de 2 minutos para apontar a volta a um nível de operação normal, a
2
T
padronizada
cerca de 3 minutos, enquanto a estatística
2
T
não padronizada leva cerca de 5 minutos
para apontar um vel de operação igual ao anterior à gaiola. Observando a Figura 44
antes da ocorrência da gaiola, podemos ver que a estatística
2
T
não padronizada
aponta para um processo fora de controle estatístico enquanto que as outras estatísticas
não. Isto pode ser considerado um falso positivo. Portanto, a escolha entre as estatísticas
multivariadas para controle de médias ficaria entre a estatística
2
T
padronizada e a
estatística de Hayter e Tsui, com uma preferência pela segunda, principalmente pela
possibilidade de se ter uma indicação imediata de quais variáveis causam a indicação de
fora de controle.
O gráfico de controle para a correlação linear entre vazão e pressão de coroa
também deve ser considerado. A sensibilidade à ocorrência de uma gaiola é visível,
como se pode ver nas Figuras 44 e 45. O tempo para se apontar a volta a um nível de
operação anterior à ocorrência da gaiola foi o mais curto: cerca de 1,5 minuto. Mas este
tempo pode ser maior na medida em que se aumenta o tamanho do subgrupo para o
cálculo do coeficiente de correlação amostral R. Na ocorrência da gaiola, os valores de
pressão de coroa aumentam ao mesmo tempo em que ocorre uma queda nos valores da
vazão. Enquanto estes pares de observações fizerem parte do calculo de R, o valor
calculado para a correlação estará fora de limites de controle. No exemplo, utilizou-se
um tamanho de amostra igual a 120, ou seja, 2 minutos de observações. Este tempo é
considerado o tempo mínimo para uma intervenção bem sucedida em nível operacional.
Mais ainda, sabe-se previamente que o comportamento das variáveis vazão e
pressão de coroa é da forma mostrada na Figura 50.
88
Fig. 50 Comportamento de vazão e pressão de coroa
No caso (1), tem-se um determinado vel de operação do alto-forno, enquanto
que (2) tem-se outro nível de operação. Esta mudança de nível de operação também é
chamada de “mudança de marcha” e é feita devido a vários fatores, tais como
necessidade de manutenção, mudança no produto final (ferro gusa com teores
diferentes), que neste caso a mudança é chamada “mudança no leito de fusão” e é feita
utlizando-se matérias primas diferentes. Um outro fator importante para esta mudança é
a escassez de carvão vegetal no mercado. Diminuem-se os níveis de vazão e pressão
para uma economia de carvão vegetal. A mudança de um nível para outro pode ser visto
na Figura 48.
Quando se calcula a correlação linear entre as duas variáveis através de um
processo amostral, observa-se apenas um número determinado de observações, digamos
o que está dentro do polígono (3) dentro da Figura 50. Portanto, apenas uma eventual
mudança de nível de operação será detectada, e não o motivo de se estar em um novo
nível. O mesmo pode ser dito a respeito dos gráficos de controle para a variabilidade do
processo. Apenas a mudança de nível operacional é detectada e não o motivo de se estar
em um novo nível. Portanto, podemos considerar que o gráfico de correlações lineares
entre vazão e pressão de coroa pode ser um gráfico indicativo de mudança na estrutura
de correlação do processo. O nível de controle apresentado por este gráfico não aponta
para uma mudança de médias, mas sim uma mudança na estrutura de relacionamento
entre as variáveis, mudança esta não esperada quando o processo está funcionando sob
condições tecnicamente adequadas.
Os gráficos de variabilidade, (desvios-padrão móveis e diferença absoluta
móvel) são também ferramentas importantes no controle do processo pois mostram
situações em que a variabilidade do processo varia conforme a operação ocorrência de
89
anomalias. Na ocorrência de gaiolas, são sensíveis e mostram a condição de alteração.
Na presença de uma mudança de marcha ou alguma outra intervenção que cause
mudança no nível de operação do alto-forno, a mudança em si também é detectada. As
estatísticas de controle
2
T
(padronizada e a não padronizada) e a de Hayter e Tsui tem
seus valores alterados na presença de alteração na variabilidade do processo. Desta
maneira, de se observar estes valores e tomar decisões apenas após avaliação da
condição de controle da variabilidade do processo.
As estatísticas de controle,
2
T
(padronizada e a não padronizada) e a de Hayter
e Tsui são tão sensíveis à mudança de padrão como a permanência do alto-forno em
outro nível operacional. Isto pode ser visto na Figura 48. Todas estas estatísticas
indicam processo totalmente fora de controle estatístico quando da mudança operacional
no alto-forno.
Foi visto que a operação do alto-forno pode se dar em níveis de operação
distintos, devidos a fatores controláveis ou não. Neste caso da mudança, todas as
estatísticas de controle têm que ser revistas no sentido de que se está trabalhando de
forma completamente diferente. Nova amostra ideal tem que ser obtida nas novas
condições operacionais assim como as distribuições empíricas que determinarão os
limites para as variáveis de controle. Praticamente tudo começa do zero em termos de
controle estatístico.
Outro ponto que pode ser observado é que com as estatísticas de controle
2
T
(padronizada e a não padronizada) e a de Hayter e Tsui pode-se criar uma escala
para mensurar a intensidade das gaiolas. Quanto maior a intensidade da gaiola, maiores
serão os prejuízos operacionais. Esta intensidade pode ser medida através de um
eventual pico das estatísticas de controle e também do tempo levado até que o processo
volte a níveis operacionais pré-gaiola. Desta forma cada gaiola teria uma nota” ou um
índice. Quanto maior a intensidade da gaiola, maiores os prejuízos operacionais e até
mesmo financeiros acarretados. O número de gaiolas ocorridas em um determinado
período de operação também seria um número interessante de ser estudado.
Naturalmente se trata de um variável aleatória que se modelada, poderá indicar “regiões
de operação” nas quais a probabilidade de ocorrência de gaiolas seja menor.
No que diz respeito a alarmes indicadores de falta de controle estatístico do
processo, em todas as vezes que uma gaiola efetivamente ocorreu, os gráficos das
90
estatísticas multivariadas de controle, assim como os gráficos de controle para a
variabilidade detectaram a ocorrência. Porém, uma falta de controle sistemática foi
mostrada na estatística
2
T
não padronizada. Talvez isso se deva a uma sensibilidade
extrema a alterações no processo. A Figura 43 mostra um período em que o alto-forno
se encontra sob controle estatístico sob as estatísticas de Hayter e Tsui e a
2
T
padronizada mas fora de controle sob a
2
T
não padronizada. Notar a tendência de
aumento nos valores desta estatística. Sabe-se de antemão que neste dia e hora o alto-
forno estava trabalhando sob condições normais de operação. Talvez pequenas
mudanças no processo fazem com que a estatística se altere a ponto de indicar falta de
controle estatístico.
Outras técnicas de controle multivariadas, tal como a Análise de Componentes
Principais (Mingoti, 2005) poderiam ser utilizadas. No contexto desta dissertação, no
entanto, essa técnica não se mostrou eficaz. Na sua essência, o uso de componentes
principais tem como objetivo a redução do número de variáveis observadas sem muita
perda (ou com uma perda controlada) de informações. No entanto, no contexto desse
trabalho este fato em si não ocorreu, ou seja, as primeiras componentes principais
calculadas com base na matriz de correlação amostral das variáveis não explicavam
mais do que 30% da variação total em um dia considerado normal de operação. Quando
as componentes eram construídas com base na matriz de covariâncias amostral a
primeira componente era responsável por quase 100% da variação total, mas era
dominada por uma única variável (a temperatura de coroa, devido a maior ordem de
grandeza), o que na prática não fazia sentido, já que o objetivo era ter uma estatística
com informações de todas as variáveis de monitoração. Como a análise de componentes
principais não se mostrou adequada para o problema tratado nessa dissertação, seus
resultados não serão apresentados.
91
6. Considerações Finais
A monitoração em tempo real do alto-forno a carvão vegetal é de grande
importância, principalmente para nos altos-fornos que produzem ferro gusa de alta
qualidade, como os nodulares, cinzentos e especiais. Para estes produtos finais, o alto-
forno monitorado tem maiores chances de produzir o que se espera, desde que a
monitoração seja utilizada como ferramenta de trabalho. A Siderpa faz uso da
monitoração dos dois altos-fornos desde outubro de 1998, quando o primeiro protótipo
do equipamento de monitoração ficou pronto e entrou em funcionamento. Desde então,
segundo os responsáveis pela operação dos altos-fornos, torna-se impossível trabalhar
sem a monitoração. Segundo o engenheiro Ricardo Guedes, responsável pelo setor de
produção da Siderpa, economia diária gerada com o uso intensivo da monitoração dos
altos-fornos é de aproximadamente R$ 2.000,00 (dois mil reais) para cada alto-forno, se
computado apenas a economia de carvão vegetal.
Um fator preponderante na monitoração em tempo real (on-line) do processo é a
democratização das informações do alto-forno. Não apenas os responsáveis diretos pela
produção têm conhecimento de seu comportamento, mas também outras pessoas
envolvidas indiretamente no processo ou mesmo a direção da empresa. que ser
ressaltado que essa democratização das informações sobre o alto-forno em algumas
empresas prejudicou a implantação do processo de monitoração e até a comercialização
do equipamento. Houve casos do equipamento estar sob operação em caráter
experimental e ser desligado deliberadamente em várias ocasiões, por exatamente
mostrar condições inadequadas de operação do alto-forno. De alguma forma não era
permitido que o equipamento funcionasse por mais de duas horas consecutivas. Apesar
do grande número de altos-fornos na região de Sete Lagoas, ainda muitas pessoas
não capacitadas que operam e tomam decisões cruciais em nível de operação do alto-
forno sem ter o menor preparo técnico para tal. O pessoal envolvido na operação de um
alto-forno monitorado tem que usar a monitoração para mostrar que o trabalho de
operação está sendo bem conduzido, e principalmente como uma ferramenta a mais de
trabalho e tomada de decisões. O que aprendemos durante visitas a várias siderúrgicas
nos últimos anos foi que os proprietários (ou pessoa com poder de decisão sobre a
92
implantação do processo de monitoração) tem que ter alguma noção sobre o processo
siderúrgico, e principalmente enxergar que a monitoração tem que ser encarada como
uma ferramenta de trabalho para o seu pessoal que deve ser qualificado o bastante para
tal. A qualificação técnica do pessoal tira o estigma de encararem a monitoração
como uma operação “dedo-duro”.
Como todo procedimento de implementação de técnicas estatísticas, dificuldades
foram encontradas. Talvez a maior delas seja o fato do alto-forno ter grande
variabilidade em termos de processo produtivo, pois esse sofre influência de inúmeros
fatores, alguns conhecidos nos quais se atua e muitos desconhecidos (Castro,Freitas
e Rodrigues, 1999). A teoria estatística descrita na literatura para a construção de
algumas estatísticas de controle de processos o pode ser utilizada de forma ampla,
pois não se tem distribuição normal de probabilidade na maioria das vezes. A estratégia,
quando possível, é a utilização de distribuições empíricas dessas estatísticas para a
obtenção de limites dos gráficos de controle do processo, o que dificulta a obtenção de
novos contextos operacionais quando necessários. Se as variáveis tivessem distribuições
conhecidas, uma eventual mudança no contexto operacional do alto-forno acarretaria
apenas novos ajustes em termos de parâmetros das distribuições envolvidas, e não a
obtenção de novos dados para a construção de distribuições empíricas. Junte a isso o
fato de ser necessário um grande número de observações para a geração de distribuições
empíricas, o que não foi uma limitação pois dispúnhamos de um número muito grande
de amostras.
Uma grande contribuição deste trabalho em nível de operação é que não se
precisa de grandes conhecimentos matemáticos e estatísticos para se verificar o nível de
operação do alto-forno. Basta às pessoas envolvidas na tarefa de monitoração, uma
pequena noção de interpretação de gráficos seqüenciais, o que quase todos praticamente
têm, a fim de que se possa ter uma noção de como o alto-forno está se comportando.
A verificação do nível de operação se resume praticamente em comparar os valores
amostrais de estatísticas com os níveis de controle pré-estabelecidos, sendo esses limites
obtidos com base em períodos considerados pelo pessoal técnico como ideais ou sem
problemas. Desta maneira, toda a metodologia de controle estatístico de processos se
torna mais amigável ao pessoal envolvido na tarefa de monitoração do processo.
Isto de certa forma é muito importante, pois em conversas informais a respeito
da essência da monitoração de altos-fornos mantidas com pessoas de formação
93
avançada na área de metalurgia, consultores e proprietários de empresas siderúrgicas, a
ciência estatística ainda causa algum desconforto e até mesmo medo. ouvimos de
pessoas especialistas em altos-fornos a carvão vegetal que a monitoração do alto-forno
com o estabelecimento de limites de controle não é possível devido ao fato de haver
muita variabilidade não controlável no processo. Podemos creditar esta opinião ao fato
de não terem noção de estatística aplicada ao controle de qualidade, e também ao fato
destas pessoas não terem acesso a uma maneira eficiente de coletar dados operacionais
do alto-forno para análise adequada. A variabilidade existe em qualquer processo
industrial. Não se pode dizer que tal metodologia de controle de qualidade é possível ou
impossível de se implementar até que se façam tentativas válidas para tal. Este trabalho
é uma prova da viabilidade de pelo menos poder estudar esta variabilidade e de certa
forma estabelecer limites para o que é considerado normal ou não em termos de
operação de alto-forno.
Um outro aspecto muito importante a respeito da metodologia proposta é de que
não se aplica apenas a processos que envolvem fabricação de ferro-gusa em altos-fornos
a carvão vegetal. Qualquer processo que tenha rios aspectos de qualidade (variáveis)
mensurados de forma adequada em um espaço de tempo regular poderá ter esta
metodologia aplicada. Até mesmo tendo-se coletas manuais destes dados desde que de
forma correta e sistemática.
Estamos fazendo um estudo para aplicação da metodologia proposta nesta
dissertação às empresas de cerâmicas, mais especificamente em um forno contínuo para
fabricação de tijolos. Neste processo, várias temperaturas são avaliadas ao mesmo
tempo, e o controle principal é feito avaliando-se o aquecimento e posterior esfriamento
em locais específicos do forno contínuo.
Em termos de futuro, a tendência natural de uma monitoração com o objetivo de
se controlar a qualidade do que se produz é a interação com o processo em si, no sentido
de se automatizar as intervenções. No caso específico do alto-forno, uma vez conhecido
o modelo metalúrgico do alto-forno, ou seja, como esse se comporta em determinadas
condições operacionais e de posse de um conjunto de estatísticas que espelham estas
condições, a intervenção pode se tornar viável. Dentro do contexto das estatísticas de
controle abordadas no capítulo 2, como por exemplo a de Hayter e Tsui e a
2
T
padronizada, vê-se que são estatísticas que resumem a informação de várias
variáveis simultaneamente de forma que, se estas estatísticas estiverem seus valores
94
amostrais dentro dos limites de controle, espera-se que o processo esteja sob controle no
que se refere a cada variável individualmente. Quando o gráfico acusa falta de controle
espera-se que pelo menos em uma das variáveis o processo não esteja sendo operado
como esperado. Partindo desta idéia, tomemos como exemplo um contexto em que se
tenha uma situação apontada como fora de controle devido a variável vazão pela
estatística de Hayter e Tsui. Uma atuação específica na vazão, fechando ou abrindo um
registro que regula a passagem de ar para a casa de máquinas e daí para o interior do
alto-forno seria feita até que os valores das estatísticas retornassem aos limites de
controle. Para as outras variáveis (pressão de topo, temperatura de coroa e pressão de
leito), outras formas de atuação teriam que ser viabilizadas. Logicamente o sistema de
atuação teria que prever, além de valores limites e alvos, a interação entre estas
variáveis. Este conjunto de fatores talvez seria o que poderia ser chamado de modelo
metalúrgico. O modelo tem que ser robusto em vários aspectos, levando em
consideração fatores climáticos, como a umidade do ar e tipos de matérias primas
utilizadas, pois o alto-forno tem que estar sob condições adequadas de operação,
independentemente de qualquer situação. Nas conversas mantidas com as pessoas da
área, a dificuldade maior para se construir equipamentos ativos, ou seja, que podem
intervir de forma automática no processo, não é o equipamento em si, mas como a
atuação seria feita.
Outro aspecto a ser estudado no futuro é o da sugestão de se classificar as
gaiolas ocorridas detectadas pelas estatísticas de controle. Modelando as ocorrências e a
intensidade das gaiolas, pode-se talvez, de posse de um modelo metalúrgico adequado e
com intervenções automáticas, fazer com que o alto-forno trabalhe em condições de
forma a minimizar a probabilidade de ocorrência destas gaiolas.
Finalmente, é importante destacar que além do aspecto aplicado dessa dissertação
no que se refere ao desafio de utilização de técnicas estatísticas multivariadas,
existentes na literatura, num processo de difícil monitoração como o alto-forno, essa
também tem sua contribuição no aspecto metodológico pois foram propostos dois novos
gráficos inovadores para controle de processos, o de diferenças absolutas e o de
correlação linear de Pearson que se aplica ao controle multivariado de processos.
95
7.
Referências
MINGOTI, S. A. (2005) Análise de dados através de métodos de estatística
multivariada: uma abordagem aplicada. Belo Horizonte: Editora UFMG
MONTGOMERY, D.C. (2004) Introdução ao controle estatístico da qualidade. Rio de
Janeiro: LTC Livros Técnicos e Científicos Editora S.A.
JOHNSON, R., WICHERN, D.W. (2002) Applied multivariate statistical analysis
New York: Prentice Hall.
CASELLA, G., BERGER, R.L. (2002) Statistical inference- 2
nd
ed. Pacific Grove:
Duxbury /Thomson Learning.
MASON, R., YOUNG, J.C. (2002) Multivariate statistical process control with
industrial applications Philadelphia: ASA-SIAM Series
TRIOLA, M. F., (2005) Introdução à estatística Rio de Janeiro: LTC Livros Técnicos
e Científicos Editora S.A.
HAYTER, A.J., TSUI, K.L. (1994) Identification and quantification in multivariate
quality control problems. Journal of Quality Technology Vol.26 pp.197-209
JIANG,W. (2004) Multivariate control charts for monitoring autocorrelated processes
Journal of Quality Technology, 36, 4 pg. 367-379.
FEAM, 1999 Minas Ambiente Pesquisa Tecnológica para Controle Ambiental em
Unidades Independentes de Produção de Ferro-Gusa: Estado-da-Arte, Belo Horizonte:
CDTN/FEAM, UFMG, 1999. 29p
96
FEDERAÇÃO DAS INDÚSTRIAS DO ESTADO DE MINAS GERAIS – FIEMG
(2005) –
www.fiemg.com.br Visitado em 20/11/2005
HOTELLING, T. (1947) Multivariate quality control in Techniques of statistical
analysis. Edited by Eisenhart, Hastay and Wallis. Mcgraw-Hill, New York, NY.
BECHHHOFER, R.E, DUNNET,C.W (1988) Percentage points of multivariate Student
t Distributions. Selected Tables in Mathematical Statistics, 11, American Mathematical
Society, Providence, RI.
ANDERSON,T.W. (2003) An introduction to multivariate analysis, New York: John
Wiley & Sons
KUME,H. (1993) Métodos estatisticos para melhoria da qualidade. São Paulo: Editora
Gente.
RUNGER,G.C, ALT,F.B, MONTGOMERY,D.C. (1996) Contributions to a
multivariate statistical process control signal. Communications in Statististics – Theory
and methods, vol 25, n.10
ANDERSON,T.W, DARLING,D.A. (1952) Asymptotic theory of certain goodness-of-
fit criteria based on stochastic process in Annals of mathematical Statistics, 23,193-212
97
CASTRO,A.F, FREITAS,M.A, RODRIGUES, M.D. (1995) Controle Estatístico de
Processos para dados autocorrelacionados: aplicação a dados dperacionais de um alto-
forno em ANAIS do XV ENEGEP Ouro Preto-MG, 1153-1158
SOUZA, M. A, SAMOHYL,W.R, MALAVÉ,C.O. (2004) Aplicação de um modelo
paramétrico multivariado para o controle de temperatura de fornos túnel, Revista da
Produção, v.14, n.2, p.82-94
SOUZA, A.M, RIGÃO,M.H. (2005) Identificação de variáveis fora de controle em
processos produtivos multivariados. Revista da Produção,V.15,n.1,74-86
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo