Download PDF
ads:
COMPARAÇÃO ESTATÍSTICA DE DUAS SÉRIES DE
MATERIAL PARTICULADO (MP
10
) NA CIDADE DE
O PAULO
FRANCIELLA MARQUES DA COSTA
2010
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
FRANCIELLA MARQUES DA COSTA
COMPARAÇÃO ESTATÍSTICA DE DUAS SÉRIES DE MATERIAL
PARTICULADO (MP
10
) NA CIDADE DE SÃO PAULO
Dissertação apresentada à Universidade Federal de
Lavras, como parte das exigências do Programa
de Pós-Graduação em Estatística e Experimentação
Agropecuária, área de concentração em Estatística e
Experimentação Agropecuária, para a obtenção do
título de "Mestre".
Orientadora
Profa. Dra. Thelma Sáfadi
LAVRAS
MINAS GERAIS -BRASIL
2010
ads:
fantasma
Ficha Catalográfica Preparada pela Divisão de Processos Técnicos da
Biblioteca Central da UFLA
Costa, Franciella Marques da.
Comparação estatística de duas séries de material particulado
(MP
10
) na cidade de São Paulo / Franciella Marques da Costa.
Lavras : UFLA, 2010.
57 p. : il.
Dissertação (mestrado) – Universidade Federal de Lavras, 2010.
Orientador: Thelma Sáfadi.
Bibliografia.
1. Séries temporais. 2. Testes de comparação. 3. Séries de
valores máximos de poluição por MP
10
. I. Universidade Federal de
Lavras. II. Título.
CDD - 519.55
FRANCIELLA MARQUES DA COSTA
COMPARAÇÃO ESTATÍSTICA DE DUAS SÉRIES DE MATERIAL
PARTICULADO (MP
10
) NA CIDADE DE SÃO PAULO
Dissertação apresentada à Universidade Federal de
Lavras, como parte das exigências do Programa
de Pós-Graduação em Estatística e Experimentação
Agropecuária, área de concentração em Estatística e
Experimentação Agropecuária, para a obtenção do
título de "Mestre".
APROVADA em 19 de fevereiro de 2010
Prof. Dr. Denismar Alves Nogueira
Prof. Dr. João Domingos Scalon
Prof. Dr. Marcelo Angelo Cirillo
UNIFAL-MG
UFLA
UFLA
Profa. Dra. Thelma Sáfadi
UFLA
(Orientadora)
LAVRAS
MINAS GERAIS-BRASIL
A minha querida família:
meus pais, Cleuza e Orlando;
meus irmãos, Kelle e Orlando Júnior;
meus avós, Irene e Joaquim;
(in memoriam), aos avós Maria Antônia e José
e meu esposo, Ronivon.
DEDICO
AGRADECIMENTOS
A Deus, por iluminar e guiar a minha vida, dando-me forças para realizar
meus objetivos.
Aos meus pais, imprescindíveis em minha vida e responsáveis por tudo
que sou, agradeço pelo apoio, carinho e amor.
Aos meus irmãos, Kelle e Orlando Júnior, pelo carinho, incentivo e ami-
zade.
Aos avós, Irene e Joaquim e, (in memoriam), aos avós Maria Antônia e
José, pela atenção e carinho a mim dedicados.
Ao meu esposo, Ronivon, com quem compartilho todos os momentos de
minha vida, por seu carinho, amor, compreensão e apoio incondicional para a
realização deste sonho.
À Universidade Federal de Lavras e ao Departamento de Ciências Exatas,
pela oportunidade de cursar o Mestrado.
Ao CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnoló-
gico), pela concessão da bolsa de estudos.
À professora Dra. Thelma Sáfadi, pela orientação.
Aos professores e demais funcionários do Departamento de Ciências Exa-
tas.
Aos membros da banca examinadora, pelas sugestões e contribuições.
A todos os meus amigos, pelo apoio e carinho. Em especial, aos amigos:
Lindson, Gabriella, Flávia, Edmilza, Patrícia, Nádia, Imaculada, Rosiana, Simone
e Deyse.
Às amigas e companheiras de estudo do "Clube da Luluzinha": Flávia,
Simone, Rosiana e Deyse, e também, aos demais colegas da Pós-Graduação em
Estatística.
Ao Fábio, pela ajuda com a rotina no software R.
A todos aqueles, que de alguma forma , acreditaram e contribuíram para a
realização deste sonho, meu sincero agradecimento.
Página
SUMÁRIO
LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 REFERENCIAL TEÓRICO . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1 Poluição do ar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Séries Temporais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2.1 Processos estocásticos . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1.1 Processos estocásticos estacionários . . . . . . . . . . . . . . . . 8
2.2.2 Função de autocovariância e autocorrelação . . . . . . . . . . . . . 9
2.2.3 Decomposição clássica de uma série temporal . . . . . . . . . . . . 11
2.2.4 Estacionariedade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.4.1 Teste do sinal (Cox-Stuart) . . . . . . . . . . . . . . . . . . . . . 13
2.2.5 Análise espectral . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.6 Teste de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.7 Modelos autorregressivos de ordem p (AR(p)) . . . . . . . . . . . . 16
2.2.7.1 Função de autocorrelação . . . . . . . . . . . . . . . . . . . . . . 17
2.2.7.2 Função de autocorrelação parcial . . . . . . . . . . . . . . . . . . 19
2.3 Teste de Box-Pierce . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4 Teste de Kolmogorov-Smirnov . . . . . . . . . . . . . . . . . . . . . . 21
2.5 Testes para comparação de séries temporais . . . . . . . . . . . . . . . 22
2.5.1 Teste das Somas Acumuladas (Coates & Diggle, 1986) . . . . . . . 23
2.5.2 Teste de Igualdade das Funções de Autocorrelação (Quenouille, 1958) 25
2.5.3 Método para comparação de séries temporais . . . . . . . . . . . . . 26
3 MATERIAL E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . . . 28
4 RESULTADOS E DISCUSSÃO . . . . . . . . . . . . . . . . . . . . . . 30
4.1 Análise da série diária de valores máximos de poluição, por partículas
inaláveis (MP
10
), na Estação Centro, na cidade de São Paulo . . . . . . 30
4.2 Análise da série diária de valores máximos de poluição, por partículas
inaláveis (MP
10
), na Estação Santo Amaro, na cidade de São Paulo . . 35
4.3 Teste de Coates & Diggle (1986) aplicado às séries estacionárias da
Estação Santo Amaro e da Estação Centro, ambas na cidade de São Paulo 39
4.4 Teste de Quenouille (1958) aplicados às séries estacionárias da Estação
Santo Amaro e da Estação Centro, ambas na cidade de São Paulo . . . 41
4.5 Comparação das séries estacionárias da Estação Santo Amaro e da Es-
tação Centro, ambas na cidade de São Paulo . . . . . . . . . . . . . . . 46
5 CONCLUSÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
REFERÊNCIAS BIBLIOGRÁFICAS . . . . . . . . . . . . . . . . . . . . 50
ANEXOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Página
LISTA DE FIGURAS
1 Um processo estocástico interpretado como uma família de variá-
veis aleatórias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Um processo estocástico interpretado como uma família de traje-
tórias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3 Série diária de valores máximos de poluição por MP
10
na Estação
Centro, na cidade de São Paulo. . . . . . . . . . . . . . . . . . . 30
4 Série diária de valores máximos de poluição por MP
10
na Estação
Centro, na cidade de São Paulo: amplitude vs média. . . . . . . . 31
5 Série diária do ln dos valores máximos de poluição por (MP
10
) na
Estação Centro, na cidade de São Paulo: amplitude vs média. . . . 32
6 Série diária do ln dos valores máximos de poluição por MP
10
na
Estação Centro, na cidade de São Paulo. . . . . . . . . . . . . . . 32
7 Periodograma da série diária do ln dos valores máximos de polui-
ção por MP
10
na Estação Centro, na cidade de São Paulo. . . . . . 33
8 Série estacionária de poluição por MP
10
na Estação Centro, na
cidade de São Paulo. . . . . . . . . . . . . . . . . . . . . . . . . 34
9 Função de autocorrelação da série estacionária da Estação Centro,
na cidade de São Paulo. . . . . . . . . . . . . . . . . . . . . . . . 34
10 Série diária de valores máximos de poluição por MP
10
na Estação
Santo Amaro, na cidade de São Paulo. . . . . . . . . . . . . . . . 35
11 Série diária de valores máximos de poluição por MP
10
na Estação
Santo Amaro, na cidade de São Paulo: amplitude vs média. . . . . 36
12 Série diária do ln dos valores máximos de poluição por MP
10
na
Estação Santo Amaro, na cidade de São Paulo: amplitude vs média. 37
13 Série diária do ln dos valores máximos de poluição por MP
10
na
Estação Santo Amaro, na cidade de São Paulo. . . . . . . . . . . . 37
i
14 Periodograma da série diária do ln dos valores máximos de polui-
ção por MP
10
na Estação Santo Amaro, na cidade de São Paulo. . 38
15 Série estacionária de poluição por MP
10
na Estação Santo Amaro,
na cidade de São Paulo. . . . . . . . . . . . . . . . . . . . . . . . 39
16 Função de autocorrelação da série estacionária da Estação Santo
Amaro, na cidade de São Paulo. . . . . . . . . . . . . . . . . . . 39
17 Periodograma da série estacionária de poluição por MP
10
na Esta-
ção Centro, na cidade de São Paulo. . . . . . . . . . . . . . . . . 40
18 Periodograma da série estacionária de poluição por MP
10
na Esta-
ção Santo Amaro, na cidade de São Paulo. . . . . . . . . . . . . . 40
19 Função de autocorrelação da série estacionária da Estação Santo
Amaro, na cidade de São Paulo. . . . . . . . . . . . . . . . . . . 42
20 Função de autocorrelação da série estacionária da Estação Centro,
na cidade de São Paulo. . . . . . . . . . . . . . . . . . . . . . . . 42
21 Função de autocorrelação comum estimada. . . . . . . . . . . . . 43
22 Função de autocorrelação parcial comum estimada
ˆ
Φ(k). . . . . . 43
23 Função de autocorrelação da série residual da Estação Centro, na
cidade de São Paulo. . . . . . . . . . . . . . . . . . . . . . . . . 44
24 Função de autocorrelação da série residual da Estação Santo Amaro,
na cidade de São Paulo. . . . . . . . . . . . . . . . . . . . . . . . 44
25 Função de autocorrelação parcial da série residual da Estação Cen-
tro, na cidade de São Paulo. . . . . . . . . . . . . . . . . . . . . . 45
26 Função de autocorrelação parcial da série residual da Estação Santo
Amaro, na cidade de São Paulo. . . . . . . . . . . . . . . . . . . 45
27 Gráfico da diferença entre as séries estacionárias da Estação Santo
Amaro e da Estação Centro. . . . . . . . . . . . . . . . . . . . . 46
ii
28 Função de autocorrelação da diferença entre as séries estacionárias
da Estação Santo Amaro e da Estação Centro. . . . . . . . . . . . 47
29 Função de autocorrelação parcial da diferença entre as séries esta-
cionárias da Estação Santo Amaro e da Estação Centro. . . . . . . 47
30 Periodograma da diferença entre as séries estacionárias da Estação
Santo Amaro e da Estação Centro. . . . . . . . . . . . . . . . . . 48
iii
RESUMO
COSTA, Franciella Marques da. Comparação estatística de duas séries de ma-
terial particulado (MP
10
) na cidade de São Paulo. 2010. 57 p. Dissertação
(Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal
de Lavras, Lavras, MG.
*
Os grandes centros urbanos vêm enfrentando problemas relacionados à
poluição do ar. As partículas inaláveis (MP
10
) são um tipo de poluente atmosférico
que afeta a maioria desses centros urbanos, entre os quais, a cidade de São Paulo. O
MP
10
é considerado um indicador da qualidade do ar, o que ressalta a importância
de estudá-lo. Assim, o objetivo deste trabalho consiste em verificar se as séries de
valores máximos de poluição diários, por partículas inaláveis (MP
10
) observadas
na estação Centro e na estação Santo Amaro, ambas localizadas em São Paulo, para
o período de 01/01/2007 a 19/12/2009, estão sendo geradas pelo mesmo processo
estocástico. Para a análise, foram utilizados o teste das somas acumuladas, o teste
de igualdade das funções de autocorrelação e um procedimento de diferença de
séries, concluindo que as duas séries analisadas não foram geradas pelo mesmo
processo estocástico. Desta maneira, os dados de poluição obtidos em uma das
estações em estudo não são suficientes para explicar a poluição na outra estação.
Palavras-chave: séries temporais, testes de comparação, séries de valores
máximos de poluição, MP
10
*
Orientadora: Profa. Dra. Thelma Sáfadi - UFLA
iv
ABSTRACT
COSTA, Franciella Marques da. Statistical comparison of two series of particu-
late matter (PM
10
) in the city of São Paulo. 2010. 57 p. Dissertation (Master
in Statistics and Agricultural Experimentation) - Federal University of Lavras, La-
vras, MG.
*
Large urban centres have had to handle problems related to the air pollu-
tion. The inhaled particles (PM
10
) are an atmospheric pollutant that affects most of
such urban centres, among which, the city of São Paulo. The (PM
10
) is regarded
as an indicator of the air quality, a characteristic that highlights the relevance in
studying it. Thus, the aim of this study was to investigate whether a time series
of maximum daily pollution values of inhaled particles (PM
10
) observed at the
Centro and Santo Amaro stations both located in the city of São Paulo - have
been generated from the same stochastic process. The data were collected for the
period from January, 1
st
, 2007 to December, 19
th
, 2009. The following statistical
methods were applied: the test for the equality of autocorrelation functions, the
cumulative sum test, and a procedure of time series subtraction. The conclusion
drawn by this study was that the two data series analysed were not generated by
the same stochastic process. Hence, the data on air pollution levels obtained in one
of the stations studied are not enough to explain the same type of data obtained in
the other one.
Key words: time series, comparison tests, series of maximum pollution values,
PM
10
*
Adviser: Profa. Dra. Thelma Sáfadi - UFLA
v
1 INTRODUÇÃO
A poluição atmosférica tem sido uma preocupação mundial. O crescente
desenvolvimento urbano e industrial tem aumentado significativamente a emissão
de poluentes, sendo os veículos automotores e as industrias um dos principais
responsáveis.
O estado de São Paulo é um grande centro urbano que vem sofrendo as
consequências da poluição do ar. A Companhia Ambiental do Estado de São Paulo
(CETESB) é um orgão responsável pelo monitoramento da poluição do ar no es-
tado de São Paulo. A CETESB possui várias estações de monitoramento localiza-
das na região metropolitana da cidade de São Paulo, no interior e no litoral.
O MP
10
é um dos poluentes atmosféricos que ocorrem com grande frequên-
cia, causando efeitos adversos ao meio ambiente, tais como danos à vegetação,
contaminação do solo e deteorização da visibilidade. Além disso, ele pode causar
prejuízo à saúde da população.
Utilizando métodos estatísticos e a partir de dados de poluição obtidos em
uma determinada estação pode-se verificar se estes são suficientes para explicar
o comportamento da poluição em outra estação viabilizando custo menores e re-
duzindo o tempo gasto na coleta e análise de dados. Para tais análises, podem
ser utilizados testes de comparação de séries temporais, tais como o teste das So-
mas Acumuladas (Coates & Diggle, 1986), o teste de Igualdade das Funções de
Autocorrelação (Quenouille, 1958) e um procedimento aplicado por Silva et al.
(2000).
Dessa forma, este trabalho teve por objetivo comparar as séries de valo-
res máximos de poluição diária observadas na Estação Centro e na Estação Santo
Amaro, ambas localizadas em São Paulo. Esta comparação entre as duas séries
1
temporais foi realizada com o intuito de verificar se os dados de poluição por MP
10
obtidos em uma das estações são suficientes para explicar a poluição por MP
10
na
outra estação.
Este trabalho está organizado em cinco seções, da seguinte forma:
Primeira seção - Introdução;
Segunda seção - Referencial Teórico, no qual são abordados alguns con-
ceitos sobre poluição, séries temporais e os testes para comparação entre
duas séries temporais estacionárias;
Terceira seção - Material e metódos, que descreve as séries utilizadas na
análise e os passos seguidos para realizar a comparação entre as séries em
estudo;
Quarta seção - Resultados e discussão, os testes para verificar se as séries
em estudo foram geradas pelo mesmo processo estocástico são aplicados;
Quinta seção - Conclusões, são apresentadas as conclusões referentes à
comparação realizada entre as séries.
2
2 REFERENCIAL TEÓRICO
2.1 Poluição do ar
A poluição do ar é um problema grave enfrentado principalmente pelos
grandes centros urbanos. É notável a preocupação da população quanto aos possí-
veis danos causados à saúde, em consequência da exposição à poluição do ar.
Segundo Gouveia et al. (2003), os níveis de poluição aos quais a população
de São Paulo é submetida são suficientes para provocar agravos respiratórios e
cardiovasculares em crianças e idosos.
Sáfadi & Peña (2007) , considerando o modelo fatorial dinâmico encon-
traram uma forte associação entre os poluentes atmosféricos (MP
10
), umidade e
mortalidade por doenças respiratórias para a cidade de São Paulo, no período de
1994 a 1997.
O nível de poluição do ar é determinado pela quantificação das substâncias
poluentes existentes no mesmo (Companhia Ambiental do Estado de São Paulo -
CETESB, 2009). Segundo a resolução do Conselho Nacional do Meio Ambiente
- CONAMA (1990) :
Entende-se como poluente atmosférico qualquer forma de
matéria ou energia com intensidade e em quantidade, concen-
tração, tempo ou características em desacordo com os níveis
estabelecidos, e que tornem ou possam tornar o ar:
I - impróprio, nocivo ou ofensivo à saúde;
II - inconveniente ao bem-estar público;
III - danoso aos materiais, à fauna e flora;
IV - prejudicial à segurança, ao uso e gozo da propriedade e
às atividades normais da comunidade.
Vale ressaltar que as condições meteorológicas influenciam na qualidade
do ar, mesmo mantidas as quantidades de emissão, pois favorecem uma maior ou
3
menor diluição dos poluentes. Devido a esse fato, a qualidade do ar piora em
relação aos parâmetros material particulado, dióxido de enxofre e monóxido de
carbono, no período de inverno, quando as condições meteorológicas são desfavo-
ráveis à dispersão e diluição dos poluentes na atmosfera (CETESB, 2009) .
O material particulado é composto por um conjunto de poluentes encontra-
dos em suspensão na atmosfera, tais como fumaça, poeira e todo tipo de partículas
de material líquido e sólido. As diversas fontes de emissão deste poluente são:
processos industriais, veículos automotores, ressuspensão de poeira do solo, entre
outros. A formação do material particulado também pode ocorrer na atmosfera,
por meio de gases, tais como dióxido de enxofre, óxidos de nitrogênio e compos-
tos orgânicos voláteis. Emitidos essencialmente em atividades de combustão, esses
gases podem sofrer reações químicas no ar e transformar-se em partículas. O po-
tencial das partículas para causar problemas à saúde está diretamente ligado ao seu
tamanho. Quanto menor o seu tamanho, maiores os danos provocados (CETESB,
2010).
Conforme CETESB (2010), o material particulado pode ser classificado da
seguinte forma:
Partículas Totais em Suspensão: são aquelas cujo diâmetro aerodinâmico é
menor que 50 µm (micrômetro, equivale à milésima parte do milímetro).
Parte destas partículas são inaláveis e podem causar danos à saúde, e a outra
parte pode prejudicar a qualidade de vida da população como, por exemplo
interferindo na estética do ambiente.
Partículas Inaláveis (MP
10
): são aquelas em que o diâmetro aerodinâmico é
menor que 10 µm.
Fumaça (FMC): resultante do processo de combustão.
4
As partículas inaláveis (MP
10
) podem ser classificadas em partículas ina-
láveis finas (MP
2,5
) que apresentam diâmetro aerodinâmico menor que 2,5 µm e
partículas inaláveis grossas possuindo diâmetro de 2,5 a 10 µm.
As partículas inaláveis (MP
10
), causam problemas de visibilidade, além de
estarem fortemente relacionadas a problemas de saúde, associadas principalmente,
aos sistemas cardiovasculares e respiratórios (CETESB, 2008). Tal poluente at-
mosférico também provoca contaminação do solo e causa prejuízo a vegetação.
O poluente partículas inaláveis (MP
10
) é um dos poluentes considerados
como indicadores da qualidade do ar devido aos efeitos desfavoráveis causados ao
meio ambiente e por ocorrerem com muita frequência (CETESB, 2009).
A Companhia Ambiental do Estado de São Paulo (CETESB), ligada à Se-
cretaria do Meio Ambiente, mantém uma rede de monitoramento da qualidade do
ar no estado de São Paulo, sendo constituída por 45 estações de monitoramento
automático, das quais 4 são móveis e outros 47 locais de amostragem da rede ma-
nual.
2.2 Séries Temporais
Também denominada série histórica ou cronológica, uma série temporal é
um conjunto de observações coletadas sequencialmente ao longo do tempo. En-
tretanto, além do tempo, uma série pode estar em função de outra variável, por
exemplo, volume, profundidade ou espaço. A dependência entre as observações
adjacentes restringe a aplicabilidade de metodologias estatísticas clássicas, que
dependem do pressuposto de independência entre os dados. Sendo assim, o proce-
dimento mais usual a ser utilizado são as técnicas de séries temporais.
As observações ordenadas no tempo podem ser classificadas em séries dis-
cretas como, por exemplo, valores mensais de temperatura na cidade de Lavras -
5
MG, ou séries contínuas, como o registro de um eletrocardiograma. Para anali-
sar uma série temporal contínua, pode-se transformá-la em uma série discreta, por
meio de uma amostragem em intervalos de tempo iguais. Frequentemente, o valor
da série em um determinado instante é obtido acumulando-se valores ou, então,
pela média das observações, em intervalos de tempo iguais.
A análise de uma série temporal pode ser desenvolvida no domínio do
tempo ou no domínio da frequência, sendo os modelos propostos, paramétricos e
não paramétricos, respectivamente. No domínio da frequência, tem-se a análise
espectral, que possui aplicação em diversas áreas do conhecimento.
Dados de séries temporais surgem em várias áreas do conhecimento tais
como medicina, meteorologia, oceanografia, economia, epidemiologia, astrono-
mia, entre outras.
A seguir, são apresentados alguns conceitos, definições e teoremas de sé-
ries temporais necessários ao desenvolvimento dos testes para a comparação de
séries temporais, objetivo deste trabalho. Tais conceitos, definições e teoremas
estarão de acordo com o exposto em Morettin & Toloi (2006).
2.2.1 Processos estocásticos
Os fenômenos estatísticos controlados por leis probabilísticas são denomi-
nados processos estocásticos. Séries temporais são trajetórias ou realizações de
um processo estocástico.
Definição: Um processo estocástico é uma família Z = {Z(t), t T }, em que,
para cada t T , Z(t) é uma variável aleatória, sendo T um conjunto arbitrário.
A variável aleatória Z(t) é uma função de dois argumentos, ou seja, Z(t, ω),
com t T e ω . Deste modo, para cada t T fixado, Z(t, ω) é uma variável
6
aleatória. Observa-se na Figura 1 um processo estocástico interpretado como uma
família de variáveis aleatórias.
FIGURA 1 Um processo estocástico interpretado como uma família de variáveis
aleatórias.
Fonte: Morettin & Toloi (2006).
Outra forma de interpretar um processo estocástico é fixando ω . Desta
maneira, Z(t, ω), é uma realização ou trajetória do processo estocástico, ou seja,
uma série temporal. A Figura 2 mostra um processo estocástico interpretado como
uma família de trajetórias.
7
FIGURA 2 Um processo estocástico interpretado como uma família de trajetó-
rias.
Fonte: Morettin & Toloi (2006).
Definição: A função de distribuição finito-dimensionais das variáveis aleatórias
Z(t) é definida por:
F (z
1
, . . . , z
n
; t
1
, . . . , t
n
) = P {Z(t
1
) z
1
, . . . , Z(t
n
) z
n
}
para todo n 1 e t
1
, t
2
, . . . , t
n
elementos quaisquer de T .
2.2.1.1 Processos estocásticos estacionários
"A idéia básica de estacionariedade é a de que as leis probabilísticas que
regem o comportamento do processo não mudam ao longo do tempo. Assim, o
processo está em equilíbrio estatístico"(Cryer & Chan, 2008, p. 16) . Existem
duas formas de estacionariedade: fraca (de segunda ordem ou ampla) e estrita
(ou forte). Na sequência, serão definidos os processos estocásticos estritamente
estacionários e fracamente estacionários, segundo Morettin & Toloi (2006).
Definição: Um processo estocástico Z = {Z(t), t T } é definido como es-
tritamente estacionário se todas as distribuições finito-dimensionais continuam as
8
mesmas sob translações no tempo, isto é,
F (z
1
, . . . , z
n
; t
1
+ τ, . . . , t
n
+ τ ) = F (z
1
, . . . , z
n
; t
1
, . . . , t
n
), (2.1)
para quaisquer t
1
, . . . , t
n
, τ de T .
Na prática, é difícil avaliar a estacionariedade estrita, sendo assim, é co-
mum que estacionariedade seja definida com base nos momentos de primeira e
segunda ordem de uma série temporal. Dessa maneira, define-se a estacionarie-
dade fraca.
Definição: Um processo estocástico Z = {Z(t), t T } é definido como fraca-
mente estacionário se e somente se:
i) E{Z(t)} = µ(t) = µ, constante, para todo t T ;
ii) E{Z
2
(t)} < , para todo t T ;
iii) γ(t
1
, t
2
) = Cov{Z(t
1
), Z(t
2
)} é uma função de |t
1
t
2
|.
2.2.2 Função de autocovariância e autocorrelação
A função de autocovariância de um processo estacionário real discreto, de
média zero é definida por:
γ
τ
= E[Z
t
Z
t+τ
]
em que τ, denominado de lag, representa a defasagem no tempo.
A função de autocovariância mede a covariância entre as observações de
uma série temporal em períodos diferentes. Essa função satisfaz as seguintes pro-
priedades:
9
i) γ
0
> 0,
ii) γ
τ
= γ
τ
,
iii) |γ
τ
| γ
0
,
iv) γ
τ
é não negativa definida, no sentido de que:
n
j=1
n
k=1
a
j
a
k
γ
τ
j
τ
k
0,
para quaisquer a
1
, . . . , a
n
R e τ
1
, . . . , τ
n
Z.
A estimativa da função de autocovariância γ
τ
, é dada por:
c
τ
=
1
N
Nτ
t=1
[(Z
t
¯
Z)(Z
t+τ
¯
Z)], τ = 0, 1, . . . , N 1,
em que
¯
Z =
1
N
N
t=1
Z
t
e c
τ
= c
τ
.
Definição: A função de autocorrelação (fac) de um processo estacionário é defi-
nida por:
ρ
τ
=
γ
τ
γ
0
, τ Z
Para a função de autocorrelação são válidas as seguintes propriedades:
i) ρ
o
= 1
ii) ρ
τ
= ρ
τ
iii) |ρ
τ
| ρ
0
= 1
iv) ρ
τ
é não negativa definida
10
A estimativa da função de autocorrelação (ρ
τ
) é dada por:
r
τ
=
c
τ
c
0
, τ = 0, 1, . . . , N 1
sendo c
τ
a estimativa da função de autocovariância. Tem-se r
τ
= r
τ
e c
τ
=
c
τ
.
2.2.3 Decomposição clássica de uma série temporal
Um modelo de decomposição para séries temporais supõe que a série
{Z
t
, t = 1, 2, . . . , N} pode ser escrita como a soma de três componentes não
observáveis, conforme expressão (2.2).
Z
t
= T
t
+ S
t
+ a
t
, t = 1, 2, . . . , N (2.2)
em que:
T
t
é uma componente de tendência,
S
t
é uma componente sazonal,
a
t
é uma componente aleátoria com média zero e variância constante σ
2
a
.
Se {a
t
} for um ruído branco, então E(a
t
a
s
) = 0, s = t. Porém pode-se,
eventualmente, relaxar esta suposição, tomando {a
t
} como um processo estacio-
nário.
O modelo (2.2) é chamado modelo aditivo. Sua utilização é apropriada
quando a componente sazonal é independente das outras componentes. Mas se
as amplitudes sazonais variam conforme a tendência, o modelo multiplicativo é o
mais adequado e pode ser escrito da seguinte forma:
Z
t
= T
t
S
t
a
t
, t = 1, 2, . . . , N (2.3)
11
Aplicando-se logaritmo ao modelo (2.3), obtém-se um modelo aditivo,
conforme pode ser visto a seguir:
log(Z
t
) = log(T
t
S
t
a
t
)
log(Z
t
) = log(T
t
) + log(S
t
) + log(a
t
), t = 1, 2, . . . , N
2.2.4 Estacionariedade
Segundo Morettin & Toloi (2006), uma série temporal é considerada es-
tacionária quando ela se desenvolve no tempo aleatoriamente em torno de uma
média constante, mostrando alguma forma de equilíbrio estável. Frequentemente,
supõe-se que a série temporal é estacionária. Entretanto, na prática, a maioria das
séries temporais encontradas não são estacionárias. Os componentes tendência e
sazonalidade são formas de não estacionariedade.
A maioria das técnicas estatísticas utilizadas na análise de séries temporais
partem do pressuposto de que a série é estacionária. Contudo, se a série não for
estacionária, será necessário transformar os dados originais.
O procedimento mais simples utilizado para tornar uma série temporal es-
tacionária consiste em tomar diferenças consecutivas na série original até obter
uma série estacionária. Normalmente, uma ou duas diferenças são suficientes para
retirar a tendência. Para retirar sazonalidade, deve-se fazer uma diferença com lag
do tamanho da periodicidade da série em estudo.
A primeira diferença de uma série temporal Z(t) é definida por:
Z(t) = Z(t) Z(t 1)
A segunda diferença é dada por:
2
Z(t) = ∆[∆Z(t)] = ∆[Z(t) Z(t 1)]
12
2
Z(t) = Z(t) 2Z(t 1) + Z(t 2)
Consequentemente, a n-ésima diferença de Z(t) é definida por:
n
Z(t) = ∆[∆
n1
Z(t)]
No caso de algumas séries temporais, poderá ser necessário aplicar uma
transformação não linear, como a logarítmica, para estabilizar a variância. Esta
transformação deverá ser aplicada à série original. Para verificar se há necessidade
de se fazer a transformação, utiliza-se o gráfico que apresenta a média no eixo das
abscissas e a amplitude no eixo das ordenadas. Para o cálculo da média e ampli-
tude, a série original deverá ser dividida em subconjuntos. Se o gráfico mostrar
pontos espalhados em torno de uma reta paralela ao eixo das abscissas, é uma in-
dicação de que não será necessário fazer a transformação. Porém, se a amplitude
for diretamente proporcional à média, seria um indicativo de que a transformação
logarítmica é adequada (Morettin & Toloi, 2006).
Na análise de séries temporais, a construção do gráfico é essencial, visto
que ele revela características importantes, tais como tendência, sazonalidade, entre
outras. Como a inspeção visual é muito subjetiva, existem testes de hipóteses
estatísticos para verificar a presença das componentes tendência e sazonalidade. A
seguir, são apresentados o teste do sinal de Cox-Stuart, a análise espectral e o teste
de Fisher.
2.2.4.1 Teste do sinal (Cox-Stuart)
O teste de Cox-Stuart é utilizado para verificar a existência de tendência
em séries temporais. Serão testadas as seguintes hipóteses:
H
0
: P (Z
i
< Z
i+c
) = P (Z
i
> Z
i+c
),
i
: não existe tendência;
H
1
: P (Z
i
< Z
i+c
) = P (Z
i
> Z
i+c
),
i
: existe tendência.
13
Conforme visto em Morettin & Toloi (2006), o procedimento para testar a
existência de tendência é dado pelos seguintes passos:
1. Agrupam-se as observações em pares (Z
1
, Z
1+c
), (Z
2
, Z
2+c
), . . ., (Z
Nc
,
Z
N
), sendo que N é o número de observações da série e c =
N
2
, caso N
seja par e c =
N+1
2
, se N for ímpar;
2. Associa-se a cada par (Z
i
, Z
i+c
) um sinal de ou +. Se Z
i
< Z
i+c
,
associa-se um sinal de + e se Z
i
> Z
i+c
, utiliza-se o sinal de . Desconside-
ram-se os pares em que Z
i
= Z
i+c
. Seja n o número de pares em que
Z
i
= Z
i+c
,
3. Seja T
2
o número de pares com sinal +;
4. Seja t o valor encontrado em uma tabela da distribuição binomial, com pa-
râmetros p =
1
2
e n, caso n 20. Se n > 20 utiliza-se a distribuição normal
com média np e variância npq;
5. Se T
2
n t, rejeita-se H
0
, ou seja, a série apresenta tendência.
2.2.5 Análise espectral
De acordo com Morettin & Toloi (2006), considere {Z
t
, t Z} um pro-
cesso estocástico estacionário de média zero e função de autocovariância obede-
cendo a uma condição de independência assintótica, no sentido em que, valores
do processo bastante separados no tempo, sejam pouco dependentes, podendo ser
expressos na forma:
τ=−∞
|γ(τ)| < .
Sob essas condições, a função densidade espectral de Z
t
é definida por:
14
f(λ) =
1
2π
τ=−∞
γ(τ)e
iλτ
, −∞ λ
em que e
= cos λ + isenλ e i =
1.
A função de densidade espectral ou espectro de Z
t
é definida como a trans-
formada de Fourier de γ(t).
A função de densidade espectral f(λ) é períodica de período 2π, sendo
então suficiente considerar o intervalo [π, π]. Como f(λ) é uma função par,
pode-se representá-la no intervalo [0, π].
Seja {Z
t
, t = 0, 1, . . . , N} um processo estacionário com média zero. A
transformada de Fourier finita dos valores (Z
1
, Z
2
, . . . , Z
N
) é dada pela expressão:
d
(N)
(λ) =
1
2πN
N
t=1
Z
t
e
iλt
, −∞ < λ < .
Se λ
j
=
2πj
N
e [
N1
2
] j [
N
2
], obtém-se a transformada de Fourier
discreta:
d
(N)
j
=
1
2πN
N
t=1
Z
t
e
i2πjt/N
,
=
1
2πN
N
t=1
Z
t
cos(
2πjt
N
) + i
1
2πN
N
t=1
Z
t
sen(
2πjt
N
), j = 0, 1, . . . , [
N
2
].
Suponha uma realização de um processo estacionário {Z
t
, t = 1, . . . , N}.
Então,
I
(N)
j
= |d
(N)
j
|
2
=
1
2πN
|
N
t=1
Z
t
e
j
t
|
2
é denominado periodograma, cuja distribuição assintótica é apresentada pelo teo-
rema a seguir.
Teorema 1: As ordenadas do periodograma I
(N)
j
são variáveis aleatórias assinto-
ticamente independentes e possuem distribuição assintótica múltipla de uma va-
riável aleatória qui-quadrado, ou seja,
15
I
(N)
j
D
1
2
f(λ
j
)χ
2
2
, j = 0, N/2,
f(λ
j
)χ
2
1
, j = 0, N/2.
A demonstração do teorema 1 pode ser encontrada em Priestley (1988).
2.2.6 Teste de Fisher
Para testar a existência de sazonalidade na série temporal, utiliza-se o teste
de Fisher (Morettin & Toloi, 2006). Serão testadas as hipóteses:
H
0
: não existe sazonalidade;
H
1
: existe sazonalidade.
Considere a estatística dada por:
g =
maxI
p
N/2
p=1
I
p
em que I
p
é o valor do periodograma no período p, e N é o número de observações
da série.
A estatística do teste é dada por:
z
α
= 1 (
α
n
)
1
n1
em que α é o nível de significância do teste e n =
N
2
.
Se g > z
α
, rejeita-se H
0
, isto é, a série apresenta sazonalidade no período
p.
2.2.7 Modelos autorregressivos de ordem p (AR(p))
O modelo autorregressivo pertence à família dos modelos autorregressivos
e de médias móveis (ARMA). Esta classe de modelos é bastante utilizada na aná-
lise de séries temporais.
16
O processo autorregressivo de ordem p, denotado por AR(p) é definido
por:
˜
Z
t
= φ
1
˜
Z
t1
+ φ
2
˜
Z
t2
+ . . . + φ
p
˜
Z
tp
+ a
t
(2.4)
em que,
˜
Z
t
= Z
t
µ e µ é a média da série,
φ
i
são parâmetros do modelo, com i = 1, ..., p,
a
t
é independente e identicamete distribuído, com média zero e variância cons-
tante, ruído branco.
Isolando a
t
, tem-se:
a
t
=
˜
Z
t
φ
1
˜
Z
t1
. . . φ
p
˜
Z
tp
(2.5)
O operador translação para o passado, denominado B é dado por,
B
˜
Z
t
=
˜
Z
t1
, B
m
˜
Z
t
=
˜
Z
tm
(2.6)
Substituindo a expressão (2.6) em (2.5) tem-se,
a
t
=
˜
Z
t
φ
1
B
˜
Z
t
... φ
p
B
p
˜
Z
t
= (1 φ
1
B ... φ
p
B
p
)
˜
Z
t
em que,
φ(B) = (1 φ
1
B ... φ
p
B
p
)
é o operador autorregressivo estacionário de ordem p. Assim,
a
t
= φ(B)
˜
Z
t
2.2.7.1 Função de autocorrelação
Considere o processo autorregressivo de ordem p definido por:
17
˜
Z
t
= φ
1
˜
Z
t1
+ φ
2
˜
Z
t2
+ . . . + φ
p
˜
Z
tp
+ a
t
A função de autocovariância pode ser obtida multiplicando-se ambos os
lados desta equação por
˜
Z
tj
e tomando a esperança. Deste modo, tem-se:
E(
˜
Z
t
˜
Z
tj
) = φ
1
E(
˜
Z
t1
˜
Z
tj
) + φ
2
E(
˜
Z
t2
˜
Z
tj
) + . . .
+φ
p
E(
˜
Z
tp
˜
Z
tj
) + E(a
t
˜
Z
tj
)
Como E(
˜
Z
t
˜
Z
tj
) = γ
j
, E(a
t
˜
Z
tj
) = 0 e j > 0, obtém-se a função de
autocovariância dada pela expressão:
γ
j
= φ
1
γ
j1
+ φ
2
γ
j2
+ ... + φ
p
γ
jp
Dividindo ambos os lados por γ
0
= V ar(Z
t
), obtém-se a função de auto-
correlação:
ρ
j
= φ
1
ρ
j1
+ φ
2
ρ
j2
+ ... + φ
p
ρ
jp
(2.7)
Considerando j = 1, 2, . . . , p na equação (2.7), e lembrando que ρ
0
= 1 e
ρ
τ
= ρ
τ
, obtém-se:
ρ
1
= φ
1
+ φ
2
ρ
1
+ ... + φ
p
ρ
p1
ρ
2
= φ
1
ρ
1
+ φ
2
+ ... + φ
p
ρ
p2
.
.
.
ρ
p
= φ
1
ρ
p1
+ φ
2
ρ
p2
+ ... + φ
p
que são chamadas de equações de Yule-Walker. Na forma matricial, tem-se:
1 ρ
1
. . . ρ
p1
ρ
1
1 . . . ρ
p2
. . . . . . . . . . . .
ρ
p1
ρ
p2
. . . 1
φ
1
φ
2
.
.
.
φ
p
=
ρ
1
ρ
2
.
.
.
ρ
p
.
18
Os coeficientes φ
1
, φ
2
, . . . , φ
p
do modelo AR(p) podem ser estimados utili-
zando-se as equações de Yule-Walker e substituindo as fac ρ
j
por suas estimativas
r
j
.
2.2.7.2 Função de autocorrelação parcial
Segundo Box et al. (1994), a função de autocorrelação parcial (facp) ajuda
na identificação da ordem do processo autorregressivo, que se adequa à série tem-
poral em estudo.
Considere φ
kj
o j-ésimo coeficiente do modelo AR(k) e φ
kk
como sendo
o último coeficiente.
Sabendo que,
ρ
j
= φ
k1
ρ
j1
+ φ
k2
ρ
j2
+ ... + φ
kk
ρ
jk
, j = 1, . . . , k
logo, obtém-se as equações de Yule-Walker:
1 ρ
1
ρ
2
. . . ρ
k1
ρ
1
1 ρ
1
. . . ρ
k2
. . . . . . . . . . . . . . .
ρ
k1
ρ
k2
ρ
k3
. . . 1
φ
k1
φ
k2
.
.
.
φ
kk
=
ρ
1
ρ
2
.
.
.
ρ
k
.
Resolvendo as equações de Yule-Walker para k = 1, 2, 3, . . . tem-se:
φ
11
= ρ
1
φ
22
=
1 ρ
1
ρ
1
ρ
2
1 ρ
1
ρ
1
1
19
φ
33
=
1 ρ
1
ρ
1
ρ
1
1 ρ
2
ρ
2
ρ
1
ρ
3
1 ρ
1
ρ
2
ρ
1
1 ρ
1
ρ
2
ρ
1
1
a formúla geral do φ
kk
é dada por:
φ
kk
=
P
k
P
k
,
em que φ
kk
é chamada de função de autocorrelação parcial, P
k
é a matriz de
autocorrelação e P
k
é a matriz de autocorrelação com a última coluna substituída
pelo vetor de autocorrelação.
O processo autorregressivo de ordem p (AR(p)) tem função de autocor-
relação parcial (facp) φ
kk
= 0, para k p e φ
kk
= 0 para k > p.
Considerando que o processo é AR(p), tem-se:
V ar(
ˆ
φ
jj
)
1
N
, j > p (2.8)
Segundo Morettin & Toloi (2006), sob a hipótese de que o processo é
AR(p) e se N for suficientemente grande, a função de autocorrelação parcial φ
kk
possui distribuição aproximadamente normal, com média zero e variância con-
forme equação (2.8). Deste modo, φ
kk
será significativamente diferente de zero
se:
|
ˆ
φ
kk
| >
2
N
, j > p
20
2.3 Teste de Box-Pierce
Um teste para as autocorrelações dos resíduos estimados foi sugerido por
Box & Pierce (1970). Este teste utiliza as k primeiras autocorrelações dos resíduos
ˆr
k
. O teste de Box-Pierce (1970) é utilizado para verificar se os resíduos são um
ruído branco, ou seja, independentes e identicamente distribuídos, com média zero
e variância constante. A estatística do teste de Box-Pierce é dada por:
Q(k) = N(N + 2)
k
j=1
ˆr
2
j
(N j)
Se Q > χ
2
kpq
, rejeita-se a hipótese de ruído branco. O valor k é o
número de "lags", p é a parte autorregressiva do modelo e q a parte de médias
móveis.
2.4 Teste de Kolmogorov-Smirnov
O teste de Kolmogorov-Smirnov verifica se uma amostra observada é pro-
veniente de uma distribuição específica.
Segundo Bussab & Morettin (2003), a função de distribuição empírica é
definida por:
F
N
(x) =
N(x)
N
em que N é o número de observações, x é um número real qualquer e N (x) é o
número de observações menores ou iguais a x.
A hipótese a ser testada é dada por:
H
0
: F(x) = F
0
(x), para todo x,
H
1
: F(x) = F
0
(x), para algum x,
21
em que F
0
(x) é a função de distribuição especificada e F (x) é a função de distri-
buição acumulada.
A estatística do teste é dada por:
D = max
1iN
|F (x
i
) F
n
(x
i
)|
Se D for maior que o valor tabelado proveniente da distribuição em ques-
tão, rejeita-se H
0
.
2.5 Testes para comparação de séries temporais
Em séries temporais, um problema importante é verificar se duas séries ou
partes de uma mesma série foram geradas por um mesmo processo estocástico. Se
isso ocorrer, pode-se analisar apenas uma ou parte de uma delas, dependendo do
objetivo do pesquisador. Desse modo, em determinadas situações isso proporcio-
nará um menor custo e redução do tempo gasto em coleta e análise de dados.
Para verificar se duas séries foram geradas pelo mesmo processo, Que-
nouille (1958) e Coates & Diggle (1986) propuseram o teste de igualdade das
funções de autocorrelação e o teste das somas acumuladas, respectivamente.
Echeverry & Toloi (2000) aplicaram esses testes em séries de temperatura
e salinidade, ambas medidas no fundo e na superfície da estação de monitoramento
Boca de Caño Grande, da Ciénaga Grande de Santa Marta.
Os testes propostos por Quenouille (1958) e Coates & Diggle (1986) são
testes univariados fundamentados na comparação da função de autocorrelação e
na função de densidade espectral, respectivamente. Esses testes requerem que as
séries temporais sejam estacionárias e univariadas. A seguir, estão descritos os
testes para comparação de séries temporais.
Também será descrito um procedimento para comparar séries temporais
utilizado por Silva et al. (2000) para comparar a série de índices de preços ao
22
consumidor de Lavras e a série do Distrito Federal.
2.5.1 Teste das Somas Acumuladas (Coates & Diggle, 1986)
Considere I
1
(λ) e I
2
(λ) como periodogramas das séries temporais inde-
pendentes Z
1
(t) e Z
2
(t), do teorema 1 tem-se que:
I
j
(λ)
f
j
(λ)χ
2
2
2
, com 0 < λ < π. (2.9)
em que f
j
(λ) é a função de densidade espectral da série Z(t).
Define-se as razões espectrais por:
J(λ) =
I
1
(λ)
I
2
(λ)
e u(λ) =
f
1
(λ)
f
2
(λ)
0 < λ < π
Da independência assumida entre Z
1
(t) e Z
2
(t) e de (2.9) tem-se que:
J(λ) =
I
1
(λ)
I
2
(λ)
u(λ)F
2,2
e
lnJ(λ) logística {ln u(λ), 1}
em que F é a distribuição de Fisher-Snedecor e logística (α, 1) denota a distribui-
ção logística cuja função de distribuição é definida por:
F (x) = 1 + e
(xα)
1
, −∞ < x < .
Note que, para Z logística (α, 1) tem-se
E(Z) = α e V ar(Z) =
π
2
3
Portanto, lnJ(λ) é um estimador não viesado, mas inconsistente para o
log da razão espectral (ln u(λ)) e sua variância assintótica independe de λ.
23
Assintoticamente, os valores z
i
= ln(1 + J
1
(λ
i
))(i = 1, ..., m), em que
m = (N 1)/2, são amostras aleatórias de uma distribuição exponencial. Deste
modo, se c
j
=
j
i=1
z
i
então o
j
= c
j
/c
m
é o vetor das estatísticas de ordem da
distribuição uniforme.
Segundo Echeverry & Toloi (2000), o teste proposto por Coates & Diggle
(1986) consiste em obter a estatística o
j
e aplicar o teste de Kolmogorov-Smirnov
para verificar o afastamento da distribuição uniforme (0,1).
Sejam f
1
(λ) e f
2
(λ) as funções de densidade espectral das séries tempo-
rais Z
1
(t) e Z
2
(t), respectivamente. Serão testadas as hipóteses:
H
0
: f
1
(λ) = f
2
(λ) para todo 0 < λ < π;
H
1
: f
1
(λ) = f
2
(λ) para algum 0 < λ < π.
O procedimento de Coates & Diggle (1986) para testar as funções de den-
sidade espectral é dado pelos passos seguintes:
1. Calcular os periodogramas I
1
(λ
i
) e I
2
(λ
i
) com i = 1, ..., m das séries Z
1
(t)
e Z
2
(t), respectivamente.
2. Calcular a razão dos periodogramas, J(λ
i
) =
I
1
(λ
i
)
I
2
(λ
i
)
com i = 1, ..., m;
3. Calcular z
i
= ln(1 + J
1
(λ
i
)) com i = 1, ..., m;
4. Calcular c
j
=
j
i=1
z
i
com j = 1, ..., m;
5. Obter as estatísticas o
j
=
c
j
c
m
com j = 1, ..., m;
6. Comparar a distribuição dos o
j
com a distribuição U(0, 1), utilizando o teste
de Kolmogorov-Smirnov. Se o p-valor for maior que α, não rejeita-se a hi-
pótese H
0
, ao nível de significância α.
24
Uma desvantagem deste teste é que ele pode variar dependendo da escolha
da razão do periodograma. Segundo Coates & Diggle (1986), o teste é mais fraco
para a escolha da razão do periodograma que produz um número maior de valores
negativos de lnJ(λ).
2.5.2 Teste de Igualdade das Funções de Autocorrelação (Quenouille, 1958)
Decidir se duas séries temporais ou duas seções de uma série temporal tem
a mesma estrutura de correlação é um problema encontrado na prática. Quenouille
(1958) propôs um teste para essa comparação. Esse teste é desenvolvido no do-
mínio do tempo e não requer que as séries temporais utilizadas para comparação
tenham o mesmo número de observações.
Considere ρ
1
(j) e ρ
2
(j) as funções de autocorrelação das séries Z
1
(t) e
Z
2
(t), respectivamente. Serão testadas as hipóteses:
H
0
: ρ
1
(j) = ρ
2
(j) para todo j = ±1, ±2, ...;
H
1
: ρ
1
(j) = ρ
2
(j) para algum j = ±1, ±2, ....
Segundo Echeverry & Toloi (2000), o método de Quenouille para testar as
funções de autocorrelação pode ser descrito pelos passos seguintes:
1. Calcular a função de autocorrelação ρ
1
(j) e ρ
2
(j), com j = 0, 1, ..., J, das
séries Z
1
(t) e Z
2
(t), respectivamente;
2. Calcular a função de autocorrelação comum às duas séries, utilizando a fór-
mula, ρ(j) =
n
1
ρ
1
(j)+n
2
ρ
2
(j)
n
1
+n
2
, em que n
1
e n
2
são o número de observações
das séries Z
1
(t) e Z
2
(t), respectivamente;
3. Calcular a função de autocorrelação parcial comum estimada (
Φ(k)), utili-
25
zando a função de autocorrelação comum (ρ(j));
4. Utiliza-se o
Φ(k), para identicar a ordem autorregressiva p;
5. Resolvendo as equações de Yule-Walker, estimar os p coeficientes do mo-
delo autorregressivo;
6. Ajustar para as séries Z
1
(t) e Z
2
(t) o modelo autorregressivo com os coefi-
cientes obtidos no passo 5, obtendo assim as séries residuais a
1
e a
2
;
7. Calcular as funções de autocorrelação parcial v
j
e v
j
para as séries residuais
a
1
e a
2
, respectivamente;
8. Obter a estatística do teste, dada por:
SQ =
J
j=1
(v
j
v
j
)
2
1
n
1
j
+
1
n
2
j
9. Se SQ > C
α
, em que C
α
é tal que P (χ
2
j
> C
α
) = α, rejeita-se H
0
ao
nível de significância α.
2.5.3 Método para comparação de séries temporais
Além dos testes mostrados na seção 2.5.1 e seção 2.5.2, pode-se utilizar o
procedimento encontrado em Silva et al. (2000) para comparar séries temporais.
O procedimento é apresentado nos passos seguintes:
1. Primeiramente, efetua-se a diferença entre as duas séries temporais em es-
tudo;
2. Na série obtida no passo 1, aplica-se o teste de Cox-Stuart (Morettin & Toloi,
2006) para verificar a existência de tendência;
26
3. Aplica-se o teste de Fisher (Morettin & Toloi, 2006) para verificar a existên-
cia de sazonalidade na série obtida no passo 1;
4. Utiliza-se o teste de Box & Pierce (1970) para verificar se os resíduos são
ruído branco, ou seja, são independentes e identicamente distribuídos, com
média zero e variância constante.
Se a série - - gerada pela diferença das duas séries - - não apresentar ten-
dência e sazonalidade, isto é, for estacionária e se o resíduo for um ruído branco,
conclui-se que as duas séries são iguais no período analisado.
27
3 MATERIAL E MÉTODOS
O conjunto de dados utilizados neste trabalho foi fornecido pela Compa-
nhia Ambiental do Estado de São Paulo (CETESB), através do website www.cetesb.
sp.gov.br.
As séries temporais fornecidas pela CETESB são séries de valores horá-
rios. Porém, neste trabalho serão utilizadas as séries de valores máximos diários
de MP
10
.
As séries temporais utilizadas foram:
série de poluição, por partículas inaláveis (MP
10
), coletadas na Estação
Centro localizada na R. da Consolação, 94 - Consolação - Biblioteca Mário
de Andrade, no período de 01/01/2007 a 19/12/2009.
série de poluição, por partículas inaláveis (MP
10
), observadas na Estação
Santo Amaro localizada na R. Padre José Maria, 355 - Centro Educ. Esp.
Mun. Joerg Bruder, no período de 01/01/2007 a 19/12/2009.
A metodologia aplicada para comparar as duas séries temporais será de
acordo com os passos seguintes:
1. analisar o gráfico da amplitude em função da média, verificando se ne-
cessidade de transformar os dados;
2. analisar as séries, através da representação gráfica, verificando indícios de
tendência e sazonalidade;
3. aplicar o teste do sinal e o teste de Fisher, para verificar tendência e sazona-
lidade, respectivamente;
28
4. caso, a série apresente tendência e/ou sazonalidade, tomar diferenças para
torná-la estacionária;
5. aplicar os métodos estatísticos para comparação de séries temporais.
Para realizar as análises estatísticas, será utilizado o software R (R De-
velopment Core Team, 2009) . A rotina usada na aplicação do teste de Quenouille
(1958) será conforme Echeverry (1999), porém convertida da linguagem de S-Plus
para R, anexo B.
29
4 RESULTADOS E DISCUSSÃO
As séries temporais utilizadas neste trabalho foram os valores máximos
diários das séries de poluição do ar, por partículas inaláveis (MP
10
), coletadas na
Estação Centro e na Estação Santo Amaro, ambas localizadas na cidade de São
Paulo. O período analisado foi de 01/01/2007 a 19/12/2009.
4.1 Análise da série diária de valores máximos de poluição, por partículas
inaláveis (MP
10
), na Estação Centro, na cidade de São Paulo
A análise da série em estudo foi iniciada a partir de uma inspeção visual de
seu gráfico. Observa-se na Figura 3, a série diária de valores máximos de poluição
por MP
10
na Estação Centro na cidade de São Paulo.
Tempo
MP_10 Centro
0 200 400 600 800 1000
50 100 150 200 250 300
FIGURA 3 Série diária de valores máximos de poluição por MP
10
na Estação
Centro, na cidade de São Paulo.
A série foi dividida em grupos de 7 observações consecutivas. Para cada
grupo foram calculadas a média e a amplitude, com o objetivo de verificar a ne-
cessidade ou não de uma transformação na série, para estabilizar a variância. O
30
resultado pode ser observado na Figura 4. Nota-se que a amplitude é diretamente
proporcional à média, indicando a necessidade de uma transformação logarítmica
para estabilizar a variância da série temporal em estudo.
50 100 150
50 100 150 200 250
Média
Amplitude
FIGURA 4 Série diária de valores máximos de poluição por MP
10
na Estação
Centro, na cidade de São Paulo: amplitude vs média.
Aplicou-se o logaritmo natural ln aos dados originais. Na Figura 5, pode-
se observar que a amplitude independe da média, indicando que a transformação
foi adequada.
A Figura 6 apresenta o gráfico da série diária do ln dos valores máximos
de poluição por MP
10
na Estação Centro.
31
3.8 4.0 4.2 4.4 4.6 4.8 5.0 5.2
0.5 1.0 1.5
Média
Amplitude
FIGURA 5 Série diária do ln dos valores máximos de poluição por (MP
10
) na
Estação Centro, na cidade de São Paulo: amplitude vs média.
Tempo
ln (MP_10 Centro)
0 200 400 600 800 1000
3.5 4.0 4.5 5.0 5.5
FIGURA 6 Série diária do ln dos valores máximos de poluição por MP
10
na
Estação Centro, na cidade de São Paulo.
Aplicou-se o teste do sinal (Cox-Stuart) para verificar a existência de ten-
dência na série transformada. Considerando que a série possui 1084 observa-
ções, tem-se c = 542 e n = 537. O número de sinais positivos T
2
é igual a
32
294 e t = 287, 56. Como T
2
> 249, 44, rejeita-se H
0
ao nível de significância
α = 0, 05, logo a série transformada apresenta tendência.
Observa-se no periodograma da série transformada (Figura 7) um pico
aproximadamente no período de 365 dias. Aplicou-se o teste de Fisher para veri-
ficar a existência do efeito sazonal no período 365. Como g = 0, 118 > z
0,05
=
0, 017, rejeita-se H
0
ao nível de significância α = 0, 05, isto é, a série transfor-
mada apresenta sazonalidade no período analisado.
0 200 400 600 800 1000
0 2 4 6 8
Períodos
Valores do Periodograma
FIGURA 7 Periodograma da série diária do ln dos valores máximos de poluição
por MP
10
na Estação Centro, na cidade de São Paulo.
Para tornar a série diária do ln dos valores máximos de poluição por MP
10
na Estação Centro, na cidade de São Paulo estacionária, aplicou-se uma diferença
na série para remover tendência e uma diferença de 365 para retirar sazonalidade.
Nas Figuras 8 e 9, observa-se a série estacionária e sua função de autocorrelação,
respectivamente.
33
Tempo
ln (MP_10 Centro)
400 500 600 700 800 900 1000 1100
−2 −1 0 1 2
FIGURA 8 Série estacionária de poluição por MP
10
na Estação Centro, na ci-
dade de São Paulo.
0 10 20 30 40
−0.2 0.0 0.2 0.4 0.6 0.8 1.0
Lag
fac
FIGURA 9 Função de autocorrelação da série estacionária da Estação Centro, na
cidade de São Paulo.
34
4.2 Análise da série diária de valores máximos de poluição, por partículas
inaláveis (MP
10
), na Estação Santo Amaro, na cidade de São Paulo
Apresenta-se na Figura 10, o gráfico da série diária de valores máximos de
poluição, por partículas inaláveis (MP
10
), na Estação Santo Amaro, na cidade de
São Paulo, para o período de 01/01/2007 a 19/12/2009.
Tempo
MP_10 Santo Amaro
0 200 400 600 800 1000
0 50 100 150 200 250 300 350
FIGURA 10 Série diária de valores máximos de poluição por MP
10
na Estação
Santo Amaro, na cidade de São Paulo.
Inicialmente, a série foi dividida em grupos de 7 observações consecuti-
vas. Para cada grupo, foram calculadas a média e a amplitude. A representação
gráfica desse procedimento pode ser observada na Figura 11. O comportamento do
gráfico indica que uma transformação logarítmica será necessária para estabilizar
a variância da série temporal em estudo.
35
40 60 80 100 120 140 160
50 100 150 200 250 300
Média
Amplitude
FIGURA 11 Série diária de valores máximos de poluição por MP
10
na Estação
Santo Amaro, na cidade de São Paulo: amplitude vs média.
Aplicou-se o logaritmo natural aos dados originais. Pode-se observar no
gráfico da amplitude em função da média dos dados transformados, mostrado na
Figura 12, que a amplitude independe da média, mostrando que a transformação
foi apropriada. Na Figura 13, é mostrado o gráfico da série diária do ln dos valores
máximos de poluição por MP
10
na Estação Santo Amaro.
36
3.5 4.0 4.5 5.0
0.5 1.0 1.5 2.0 2.5
Média
Amplitude
FIGURA 12 Série diária do ln dos valores máximos de poluição por MP
10
na
Estação Santo Amaro, na cidade de São Paulo: amplitude vs média.
Tempo
ln (MP_10 Santo Amaro)
0 200 400 600 800 1000
3 4 5 6
FIGURA 13 Série diária do ln dos valores máximos de poluição por MP
10
na
Estação Santo Amaro, na cidade de São Paulo.
Para verificar se a série transformada apresenta tendência, foi aplicado o
teste do sinal, em que foram obtidos c = 542 e n = 539. O número de sinais
positivos T
2
é igual a 241 e t = 288, 60. Como T
2
= 241 < 250, 4, não rejeita-
37
se H
0
ao nível de significância α = 0, 05. Portanto, a série transformada não
apresenta tendência.
O periodograma da série transformada (Figura 14) mostra um pico apro-
ximadamente no período de 365 dias. Aplicou-se o teste de Fisher para verificar
sazonalidade no período 365. Como g = 0, 101 > z
0,05
= 0, 017, rejeita-se H
0
,
ou seja, a série transformada apresenta sazonalidade no período estudado, ao nível
de significância α = 0, 05.
0 200 400 600 800 1000
0 5 10 15
Períodos
Valores do Periodograma
FIGURA 14 Periodograma da série diária do ln dos valores máximos de polui-
ção por MP
10
na Estação Santo Amaro, na cidade de São Paulo.
Tomou-se uma diferença de 365 para retirar sazonalidade, deixando a série
diária do ln dos valores máximos de poluição por MP
10
na Estação Santo Amaro
na cidade de São Paulo estacionária. A série estacinária pode ser observada na
Figura 15 e o gráfico da sua função de autocorrelação, na Figura 16.
38
Tempo
ln (MP_10 Santo Amaro)
400 500 600 700 800 900 1000 1100
−2 −1 0 1 2 3
FIGURA 15 Série estacionária de poluição por MP
10
na Estação Santo Amaro,
na cidade de São Paulo.
0 10 20 30 40
0.0 0.2 0.4 0.6 0.8 1.0
Lag
fac
FIGURA 16 Função de autocorrelação da série estacionária da Estação Santo
Amaro, na cidade de São Paulo.
4.3 Teste de Coates & Diggle (1986) aplicado às séries estacionárias da Es-
tação Santo Amaro e da Estação Centro, ambas na cidade de São Paulo
Na aplicação deste teste, serão utilizadas as séries estacionárias da Estação
Santo Amaro e da Estação Centro, observadas de 01/01/2007 a 19/12/2009. O
39
teste de Coates & Diggle (1986) utiliza o periodograma das séries estacionárias
que podem ser observados nas Figura 18 e 17.
0 100 200 300 400 500 600 700
0.0 0.5 1.0 1.5 2.0 2.5
Períodos
Valores do Periodograma
FIGURA 17 Periodograma da série estacionária de poluição por MP
10
na Esta-
ção Centro, na cidade de São Paulo.
0 100 200 300 400 500 600 700
0 2 4 6 8
Períodos
Valores do Periodograma
FIGURA 18 Periodograma da série estacionária de poluição por MP
10
na Esta-
ção Santo Amaro, na cidade de São Paulo.
Foram obtidos os valores do periodograma da séries estacionárias em es-
tudo, calculou-se a razão entre os periodogramas considerando o periodograma da
40
série estacionária da Estação Santo Amaro como numerador e, como denominador,
o periodograma da série da Estação Centro. Desta forma, obteve-se um número
menor de valores negativos para o ln(J(λ)), melhorando a qualidade do teste. Os
valores de z
i
, c
j
e o
j
foram calculados.
Foi utilizado o teste de Kolmogorov-Smirnov para comparar a estatística
o
j
do teste das somas acumuladas com distribuição U(0, 1). O teste forneceu um
p-valor = 2, 2e
16
, levando a rejeitar a hipótese de igualdade das funções de
densidade espectral, ao nível de significância α = 0, 01. Assim, conclui-se que as
séries em estudo não são geradas pelo mesmo processo estocástico.
4.4 Teste de Quenouille (1958) aplicados às séries estacionárias da Estação
Santo Amaro e da Estação Centro, ambas na cidade de São Paulo
Para a aplicação deste teste, foram usadas as séries estacionárias da Es-
tação Santo Amaro e da Estação Centro, observadas no período de 01/01/2007 a
19/12/2009. O teste de Quenouille (1958) utiliza a função de autocorrelação (fac)
das séries estacionárias, que podem ser observadas nas Figura 19 e 20.
41
0 10 20 30 40
0.0 0.2 0.4 0.6 0.8 1.0
Lag
fac
FIGURA 19 Função de autocorrelação da série estacionária da Estação Santo
Amaro, na cidade de São Paulo.
0 10 20 30 40
−0.2 0.0 0.2 0.4 0.6 0.8 1.0
Lag
fac
FIGURA 20 Função de autocorrelação da série estacionária da Estação Centro,
na cidade de São Paulo.
A função de autocorrelação estimada comum e a função de autocorrelação
parcial estimada comum
ˆ
Φ(k), podem ser observadas nas Figuras 21 e 22. A
Figura 22 mostrou que deve-se ajustar um modelo autorregressivo de ordem 11.
42
0 10 20 30 40
0.0 0.2 0.4 0.6 0.8 1.0
Lag
fac
FIGURA 21 Função de autocorrelação comum estimada.
0 10 20 30 40
−0.05 0.00 0.05 0.10
Lag
facp
FIGURA 22 Função de autocorrelação parcial comum estimada
ˆ
Φ(k).
O modelo ajustado AR(11) pode ser escrito como:
Z
t
= 0, 0628Z
t1
0, 0162Z
t2
0, 0276Z
t3
+ 0, 0071Z
t4
+0, 0513Z
t5
+ 0, 0430Z
t6
+ 0, 0531Z
t7
+ 0, 0385Z
t8
0, 0342Z
t9
0, 0098Z
t10
0, 0770Z
t11
+ a
t
(4.1)
Ajustou-se o modelo 4.1 às séries estacionárias da Estação Santo Amaro e
da Estação Centro, obtendo as séries residuais a
1
e a
2
. As funções de autocorrela-
43
ção (fac) das séries residuais podem ser observadas nas Figuras 23 e 24.
0 10 20 30 40
−0.4 −0.2 0.0 0.2 0.4 0.6 0.8 1.0
Lag
fac
FIGURA 23 Função de autocorrelação da série residual da Estação Centro, na
cidade de São Paulo.
0 10 20 30 40
0.0 0.2 0.4 0.6 0.8 1.0
Lag
fac
FIGURA 24 Função de autocorrelação da série residual da Estação Santo
Amaro, na cidade de São Paulo.
Foram calculadas as funções de autocorrelação parcial (facp) das séries
residuais, que podem ser observadas nas Figuras 25 e 26.
44
0 10 20 30 40
−0.3 −0.2 −0.1 0.0
Lag
facp
FIGURA 25 Função de autocorrelação parcial da série residual da Estação Cen-
tro, na cidade de São Paulo.
0 10 20 30 40
−0.1 0.0 0.1 0.2 0.3 0.4
Lag
facp
FIGURA 26 Função de autocorrelação parcial da série residual da Estação Santo
Amaro, na cidade de São Paulo.
Calculou-se a estatística do teste de Quenouille (1958), obtendo SQ =
339, 0173. Com o p-valor
=
0, a hipótese de igualdade das funções de autocor-
relação deve ser rejeitada. Deste modo, conclui-se que as duas séries não são
geradas pelo mesmo processo estocástico.
45
4.5 Comparação das séries estacionárias da Estação Santo Amaro e da Es-
tação Centro, ambas na cidade de São Paulo
Incialmente, foi realizada uma diferença entre as duas séries estacionárias,
com o objetivo de comparar as séries da Estação Santo Amaro e da Estação Centro,
ambas na cidade de São Paulo, no período de 01/01/007 a 19/12/2009. O gráfico
da diferença entre as séries é mostrado na Figura 27.
Tempo
Diferença
0 100 200 300 400 500 600 700
−3 −2 −1 0 1 2 3
FIGURA 27 Gráfico da diferença entre as séries estacionárias da Estação Santo
Amaro e da Estação Centro.
Observa-se nas Figuras 28 e 29, o gráfico da função de autocorrelação (fac)
e autocorrelação parcial (facp) da série da diferença.
46
0 10 20 30 40
0.0 0.2 0.4 0.6 0.8 1.0
Lag
fac
FIGURA 28 Função de autocorrelação da diferença entre as séries estacionárias
da Estação Santo Amaro e da Estação Centro.
0 10 20 30 40
−0.1 0.0 0.1 0.2 0.3
Lag
facp
FIGURA 29 Função de autocorrelação parcial da diferença entre as séries esta-
cionárias da Estação Santo Amaro e da Estação Centro.
Aplicou-se o teste do sinal, obtendo T
2
= 178, n = 359 e t = 195, 08.
Como T
2
= 178 > 163, 92, conclui-se que a série da diferença apresenta tendên-
cia, ao nível de significância α = 0, 05. A Figura 30 apresenta o periodograma
da série da diferença. O teste de Fisher foi aplicado para verificar sazonalidade de
47
aproximadamente 7 dias. Tendo como resultado g = 0, 03 > z = 0, 02 logo, a
série apresenta periodicidade semanal.
0 200 400 600
0 2 4 6
Períodos
Valores do Periodograma
FIGURA 30 Periodograma da diferença entre as séries estacionárias da Estação
Santo Amaro e da Estação Centro.
Para verificar se a série é um ruído branco, aplicou-se o teste de Box-
Pierce. Rejeitou-se a hipótese de que a série é ruído branco, pois p-valor =
2, 2e
16
.
Portanto, as séries temporais da Estação Santo Amaro e da Estação Centro
em São Paulo não são geradas pelo mesmo processo estocástico, já que a série da
diferença apresentou tendência, sazonalidade e a série não é um ruído branco.
48
5 CONCLUSÕES
Ao nível de significância α = 0, 01, as três metodogias aplicadas estão
rejeitando a hipótese de que a série de valores máximos de poluição diários por
MP
10
na Estação Santo Amaro e na Estação Centro - - ambas localizadas na cidade
de São Paulo - - estão sendo geradas pelo mesmo processo estocástico. Desta
maneira, os dados de poluição obtidos em uma das estações em estudo não são
suficientes para explicar a poluição na outra estação.
49
REFERÊNCIAS BIBLIOGRÁFICAS
BOX, G. E. P.; JENKINS, G. M.; REINSEL, G. C. Time series analysis:
forecasting and control. New York: Prestice Hall, 1994. 598 p.
BOX, G. E. P.; PIERCE, D. A. Distribution of residual autocorrelations in
autoregressive-integrated moving average time series models. Journal of the
American Statistical Association, New York, v. 65, n. 332, p. 1509–1526, Dec.
1970.
BUSSAB, W. O.; MORETTIN, P. A. Estatística básica. São Paulo: Saraiva,
2003. 526 p.
COATES, D. S.; DIGGLE, P. J. Tests for comparing two estimated spectral
densities. Journal of Time Series Analysis, Clevedon, v. 7, n. 1, p. 7–20, Feb.
1986.
COMPANHIA AMBIENTAL DO ESTADO DE O PAULO. Material
particulado inalável fino (MP
2,5
) e grosso (MP
2,510
) na atmosfera da região
metropolitana de São Paulo (2000 - 2006). São Paulo, 2008. Disponível em:
<http://www.cetesb.sp.gov.br/Ar/publicacoes.asp>. Acesso em: 10 jan. 2010.
COMPANHIA AMBIENTAL DO ESTADO DE O PAULO. Poluentes. São
Paulo, 2010. Disponível em: <http://www.cetesb.sp.gov.br/Ar/ar
saude.asp>.
Acesso em: 10 jan. 2010.
COMPANHIA AMBIENTAL DO ESTADO DE O PAULO. Relatório de
qualidade do ar no estado de São Paulo 2008. São Paulo, 2009. Disponível em:
<http://www.cetesb.sp.gov.br/Ar/publicacoes.asp>. Acesso em: 10 jan. 2010.
CONSELHO NACIONAL DO MEIO AMBIENTE. Resolução n. 003, de
28 de julho de 1990. Estabelece padrões de qualidade do ar determinando
as concentrações de poluentes atmosféricos. Brasília, 1990. Disponível em:
<http://www.mma.gov.br/port/conama/res/res90/res0390.html>. Acesso em: 15
dez. 2009.
CRYER, J. D.; CHAN, K. S. Time series analysis with applications in R.
Madison: Springer, 2008. 491 p.
ECHEVERRY, G. E. S. Métodos de comparação de séries temporais. 1999.
131 p. Dissertação (Mestrado em Estatística) — Universidade de São Paulo, São
Paulo.
50
ECHEVERRY, G. E. S.; TOLOI, C. M. C. Testes para comparação de séries
temporais: uma aplicação a séries de temperatura e salinidade da água, medidas
em profundidades diferentes. Revista Brasileira de Estatística, Rio de Janeiro,
v. 61, n. 215, p. 51–80, 2000.
GOUVEIA, N.; MENDONÇA, G. A. S.; LEON, A. P.; CORREIA, J. E. M.;
JUNGER, W. L.; FREITAS, C. U.; DAUMAS, R. P.; MARTINS, L. C.;
GIUSSEPE, L.; CONCEIÇÃO, G. M. S.; MANERICH, A.; CUNHA-CRUZ, J.
Poluição do ar e efeitos na saúde nas populações de duas grandes metropóles
brasileiras. Epidemiologia e Serviços de Saúde, Brasília, v. 12, n. 1, p. 29–40,
jan./mar. 2003.
MORETTIN, P. A.; TOLOI, C. M. C. Análise de séries temporais. São Paulo:
E. Blucher, 2006. 538 p.
PRIESTLEY, M. B. Non-linear and non-stationary time series analysis. New
York: Academic, 1988. 237 p.
QUENOUILLE, M. H. The comparison of correlations in time-series. Journal of
the Royal Statistical Society, London, v. 20, n. 1, p. 158–164, 1958.
R DEVELOPMENT CORE TEAM. R: a language and environment for statistical
computing. Vienna: R Foundation for Statistical Computing, 2009. Software.
SÁFADI, T.; PEÑA, D. Bayesian analysis of dynamic factor models: an
application to air pollution and mortality in São Paulo, Brazil. Environmetrics,
Chichester, v. 19, n. 3, p. 582–601, Dec. 2007.
SILVA, R. B. V.; FERREIRA, D. F.; SÁFADI, T. Modelos de séries temporais
aplicados à série dos índices de preços ao consumidor na região de Lavras, MG,
no período de 1992 a 1999. Organizações Rurais e Agroindústriais, Lavras,
v. 2, n. 2, p. 44–55, jul./dez. 2000.
51
ANEXOS
ANEXO A Rotina para dividir a série em subconjuntos e fazer o gráfico da
amplitude versus a média.
e s t a t s < f u n c t i o n ( vs , n ){
i n i < 1
fim < n
media < NULL
ampl < NULL
i f ( ( l e n g t h ( vs)%%n )= =0){
fo r ( i i n 1 : ( l e n g th ( vs ) / n ) ) {
media [ i ] < mean ( vs [ i n i : fim ] , na . rm=TRUE)
ampl [ i ]< (max ( vs [ i n i : fim ] , na . rm=TRUE) min ( vs [ i n i : fim ] , na . rm=TRUE ) )
i n i < i n i +n
fim < fim+n
}
media < media [ 1 : ( l e n g th ( vs ) / n ) ]
ampl < ampl [ 1 : ( l e n gt h ( vs ) / n ) ]
}
e l s e {
fo r ( i i n 1 : ( ( l e n g t h ( vs ) / n ) + 1 ) ){
media [ i ] < mean ( vs [ i n i : fim ] , na . rm=TRUE)
ampl [ i ]< (max ( vs [ i n i : fim ] , na . rm=TRUE) min ( vs [ i n i : fim ] , na . rm=TRUE ) )
i n i < i n i +n
fim < fim+n
}
}
l i s t ( media=media , ampl=ampl )
}
dados < r ea d . t a b l e ( "maxsantoamaro . t x t " , h=T)
52
names ( dados )
r e s u l t < e s t a t s ( ( dados$MP10santoamaro ) , 7 )
r e s u l t
p l o t ( re s ul t $m e di a , r es u lt $ am pl , x la b ="Média" , y la b="Amplitude" )
53
ANEXO B Rotina para aplicação do teste proposto por Quenouille (1958). Este
programa será conforme Echeverry (1999), porém convertido da linguagem de S-
Plus para R.
s1 < r ea d . t a b l e ( " c ent r o est a c i on a r i a . t x t " )
s2 < r ea d . t a b l e ( "s antoa mar oes tac ionar ia . t x t " )
dados2 < d a ta . frame ( s1 , s2 )
colnames ( dados2 ) < c ( "sx" , "sy" )
n1 < nrow ( dados2 )
n2 < nrow ( dados2 )
P < 40
t l a g < 40
sx < a c f ( dados2$sx , l ag . max= t la g , p l o t =FALSE)
sy < a c f ( dados2$sy , l ag . max= t la g , p l o t =FALSE)
a cf co < ( ( n1 sx $ ac f ) + ( n2 sy $ ac f ) ) / ( n1+n2 )
a cf c < c ( r ep ( 0 , t l a g ) , a cf co )
ph i < NULL
ve tmat < num eri c ( t l a g )
ve tmat [1]< l i s t ( 1 )
l i b r a r y ( m a t r i x c a l c )
t e s t e < a cf co [ , , 1 ] [ 2 : 3 1 ]
matau < a s . m at ri x ( di ag ( t l a g ) )
matau [ 2 : t l a g ,1]< t e s t e [ 1 : ( t l ag 1)]
matau [ 1 , 2 : t l a g ]< t e s t e [ 1 : ( t l a g 1)]
lim1 < 2
fo r ( i i n 1 : t l a g ) {
matau [ ( i + 1) : tl a g , i ] < t e s t e [ 1 : ( t l a g i ) ]
matau [ i , ( i + 1 ): t l a g ] < t e s t e [ 1 : ( t l ag i ) ]
}
54
# Achar a fu nção de a u t o c o r r e l a ç ã o p a r c i a l
fo r ( i i n 2 : t l a g ) {
mat1 < m at ri x ( i i , i , i )
fo r ( j i n 1 : i ) {
lim1 < t l a g +2 j
lim2 < t l a g + i +1 j
mat1 [ j , ] < a cf c [ lim1 : lim2 ]
}
matden < mat1+ t ( mat1 )
matden < matdend ia g ( i )
ve tmat [ i ] < l i s t ( matden )
denom < de t ( matden )
lim3 < t l a g +2
lim4 < t l a g + i +1
co lu < m a tr ix ( a c fc [ lim3 : lim4 ] , i , 1 )
mat2 < matden [ , c ( i ) ]
mat3 < c bin d ( mat2 , c ol u )
num < d e t ( mat3 )
ph i [ i ] < num / denom
}
ph i [ 1 ] < a cf c o [ 2 ]
ph i
w r i t e ( phi , "facp . t x t " , n co l =40)
# En cont ran do a ordem a u t o r r e g r e s s i v a do modelo
n1 < dim ( dados2 ) [ 1 ]
n2 < dim ( dados2 ) [ 1 ]
55
maximo < max ( n1 , n2 )
i n t e r < 2 (1 / s q r t ( maximo ) )
fa cp < re ad . t a b l e ( " facp . t x t " )
V < c ( seq ( 1 , 4 0 , by =1 ))
p l o t (V, facp , t yp e="h" , xl ab ="Lag" , y lab =" facp" )
a b l i n e ( h =0)
a b l i n e ( h= i n t e r , l t y =2 , c o l = "blue" )
a b l i n e ( h= i n t e r , l t y =2 , c ol = "blue ")
p < 11 # ordem a u t o r r e g r e s s i v a do modelo
# C al cul and o os c o e f i c i e n t e s do modelo AR( p )
lim1 < t l a g +2
lim2 < t l a g +1+p
r < m at ri x ( a cf c [ li m 1 : l im2 ] , p , 1 )
R < ve tmat [ [ p ] ]
p hi p a r < s o lv e (R)%%r
p hi p a r
# A jus tan do o modelo a u t o r r e g r e s s i v o a cada s é r i e
p1 < p+1
np1 < n1p
np2 < n2p
x < da d os2$sx [ p1 : n1 ]
y < da d os2$sy [ p1 : n2 ]
xmat < m at ri x (0 , np1 , p )
ymat < m at ri x (0 , np2 , p )
lim1 < p1
56
lim2 < n1
lim3 < n2
fo r ( i i n 1 : p ) {
lim1 < lim1 1
lim2 < lim2 1
lim3 < lim3 1
xmat [ , i ] < da do s2$sx [ lim1 : lim2 ]
ymat [ , i ] < da do s2$sy [ lim1 : lim3 ]
}
r es 1 < xxmat%%p hi p a r
r es 2 < yymat%%p hi p a r
# Obtendo a e s t a t í s t i c a SQ do t e s t e de Q ue no u il le ( 19 58 )
fap 1 < a c f ( r e s1 , P , ty pe =" p a r t i a l " , p l o t =FALSE)
fap 2 < a c f ( r e s2 , P , ty pe =" p a r t i a l " , p l o t =FALSE)
s < f ap 1 $l a g
fap 1 < f a p1 $ ac f
fap 2 < f a p2 $ ac f
denom2 < ( 1 / ( n1s ) ) + ( 1 / ( n2s ) )
numer2 < ( fap1fap 2 )^2
sq < sum ( numer2 / denom2 )
pv1 < 1 p c hi sq ( sq , P )
sq
pv1
57
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo