Download PDF
ads:
Universidade Federal do Rio de Janeiro
Estima¸ao de Popula¸ao em N´ıvel Municipal via Mo de los
Hier´arquicos e Espaciais
Debora Ferreira de Souza
2004
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Estima¸ao de Popula¸ao em N´ıvel Municipal via Mo de los
Hier´arquicos e Espaciais
Debora Ferreira de Souza
Disserta¸ao de Mestrado apresentada ao Programa
de os-Gradua¸ao em Estat´ıstica, Instituto de
Matem´atica, da Universidade Federal do Rio de
Janeiro, como parte dos requisitos necess´arios `a
obten¸ao do t´ıtulo de Mestre em Estat´ıstica.
Orientadores: Fernando A. S. Moura
H´elio dos S. Migon
Rio de Janeiro
Junho /2004
ads:
iii
Estima¸ao de Popula¸ao em N´ıvel Municipal via Mo de los
Hier´arquicos e Espaciais
Debora Ferreira de Souza
Orientadores:
Fernando A. S. Moura
H´elio dos S. Migon
Disserta¸ao de Mestrado submetida ao Programa de os-Gradua¸ao em Estat´ıstica,
Instituto de Matem´atica, da Universidade Federal do Rio de Janeiro, como parte dos
requisitos necess´arios `a obten¸ao do t´ıtulo de Mestre em Estat´ıstica.
Aprovada por:
Presidente, Prof. H´elio S. Migon, Ph.D.
Prof. Fernando A. S. Moura, Ph.D.
Prof. Dani Gamerman, Ph.D.
Prof. Cristiano A. C. Fernandes, Ph.D.
Rio de Janeiro
Junho /2004
iv
Souza, Debora Ferreira de.
Estima¸ao de Popula¸ao em N´ıvel Municipal via Modelos Hier´arquicos
e Espaciais/ Debora Ferreira de Souza. - Rio de Janeiro: UFRJ/IM, 2004.
xiv,151f.: il.; 31 cm.
Orientadores: Fernando Antonio da Silva Moura; H´elio dos Santos Migon
Disserta¸ao (mestrado) - UFRJ/IM/Programa de os-Gradua¸ao
em Estat´ıstica, 2004.
Bibliografia: f. 94-98.
1. Estima¸ao em Pequenas
´
Areas. 2. Modelos Hier´arquicos e Espaciais. I.
Moura, Fernando Antonio da Silva; Migon, H´elio dos Santos. II. Universidade
Federal do Rio de Janeiro, Instituto de Matem´atica, Programa de os-Gradua¸ao
em Estat´ıstica. III. Estima¸ao de Popula¸ao em N´ıvel Municipal via Modelos
Hier´arquicos e Espaciais.
v
RESUMO
Estima¸ao de Popula¸ao em N´ıvel Municipal via Modelos
Hier´arquicos e Espaciais
Debora Ferreira de Souza
Orientadores:
Fernando A. S. Moura
H´elio dos S. Migon
Resumo da Disserta¸ao de Mestrado submetida ao Programa de os-Gradua¸ao em
Estat´ıstica, Instituto de Matem´atica, da Universidade Federal do Rio de Janeiro, como
parte dos requisitos necess´arios `a obten¸ao do t´ıtulo de Mestre em Estat´ıstica.
Devido `a demanda crescente por informa¸oes detalhadas e atualizadas, sobretudo
para pequenas ´areas geogr´aficas, tais como munic´ıpios, torna-se necess´aria a obten¸ao
de estimativas que atendam `as necessidades de pesquisa e de planejamento, apresen-
tando boa precis˜ao.
Neste trabalho, ao aplicados ao problema de estima¸ao em pequenas ´areas modelos
hier´arquicos e espaciais com curva de crescimento exponencial. Pretende-se, com e stes
modelos, obter as estimativas populacionais dos munic´ıpios ao selecionados para a
amostra da Pesquisa Nacional por Amostra de Domic´ılios (PNAD) e aumentar a pre-
cis˜ao daquelas fornecidas pelo estimador derivado do plano amostral da pesquisa para
os munic´ıpios selecionados.
Al´em da PNAD, ao utilizados os dados dos Censos Demogr´aficos de 1991 e 2000 e
da Contagem Populacional de 1996.
Palavras-chave: Estima¸ao em pequenas ´areas, previs˜ao populacional, modelos
hier´arquicos, modelos espaciais.
Rio de Janeiro
Junho /2004
vi
ABSTRACT
Small Area Population Estimation via Hierarchical and Spatial
Models
Debora Ferreira de Souza
Advisors:
Fernando A. S. Moura
H´elio dos S. Migon
Abstract da Disserta¸ao de Mestrado submetida ao Programa de os-Gradua¸ao
em Estat´ıstica, Instituto de Matem´atica, da Universidade Federal do Rio de Janeiro,
como parte dos requisitos necess´arios `a obten¸ao do t´ıtulo de Mestre em Estat´ıstica.
The growing demand for detailed information, mainly for the geographic small
areas, such as counties, has created the necessity of obtaining reliable estimates for
researching and planning.
Hierarchical and spatial models with exponential growth curves are applied in the
context of small area estimation. The main aim is to obtain population prediction for
the non-selected counties in the Brazilian Household Demographic Survey (PNAD), as
well as to increase precision of the design-based estimators obtained for the selected
counties.
In addition to PNAD data, it is used Census data collected in 1991 and 2000, as
well as a completed counting of the 1996 population.
Key words: Small area estimation, population prediction, hierarchical models, spatial
models.
Rio de Janeiro
Junho /2004
Sum´ario
Lista de Figuras ix
Lista de Tabelas xiii
Introdu¸ao 1
1 Revis˜ao Bibliogr´afica 4
1.1 Revis˜ao de estima¸ao em pequenas ´areas . . . . . . . . . . . . . . . . . 4
1.2 T´ecnicas de proje¸ao populacional . . . . . . . . . . . . . . . . . . . . . 24
1.2.1 M´etodo das componentes demogr´aficas . . . . . . . . . . . . . . 24
1.2.2 M´etodo dos coeficientes . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.3 M´etodo de rela¸ao de coortes . . . . . . . . . . . . . . . . . . . 29
2 Fontes de Dados Demogr´aficos 32
2.1 Censo Demogr´afico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.2 Registro Civil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3 Sistemas de Informa¸oes de Nascidos Vivos e de
Mortalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4 Pesquisa Nacional por Amostra de Domic´ılios - PNAD . . . . . . . . . 37
3 Especifica¸ao dos Modelos 41
3.1 Fam´ılia exponencial modificada de curvas . . . . . . . . . . . . . . . . . 44
3.2 Modelo hier´arquico de crescimento exponencial . . . . . . . . . . . . . . 45
3.2.1 Estima¸ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2.2 Modelagem da variˆancia das observoes . . . . . . . . . . . . . 48
3.3 Modelo hier´arquico espacialmente estruturado . . . . . . . . . . . . . . 50
3.4 Simula¸ao estoastica: diagn´ostico de convergˆencia . . . . . . . . . . . 52
3.5 Crit´erios de sele¸ao de modelos . . . . . . . . . . . . . . . . . . . . . . 57
vii
viii
3.5.1 Desvio preditivo esperado - EPD . . . . . . . . . . . . . . . . . 57
3.5.2 Crit´erio de informa¸ao baseado no desvio - DIC . . . . . . . . . 59
4 Aplica¸ao e Resultados 63
4.1 Descri¸ao e an´alise preliminar dos dados . . . . . . . . . . . . . . . . . 63
4.2 Modelagem dos dados de densidades municipais . . . . . . . . . . . . . 69
4.2.1 Modelando os dados de munic´ıpios selecionados pela PNAD . . 70
4.2.2 Modelando os dados de munic´ıpios selecionados e ao
selecionados pela PNAD . . . . . . . . . . . . . . . . . . . . . . 78
4.3 Previs˜oes Bayesianas como etodo de calibra¸ao . . . . . . . . . . . . . 83
5 Conclus˜oes e Trabalhos Futuros 88
Referˆencias 94
A Estimador para a popula¸ao municipal 99
B Distribui¸oes condicionais completas 100
C Densidades demogr´aficas 103
D Diag´ostico de convergˆencia 111
E Resumo das distribui¸oes a posteriori dos parˆametros a, b e c 130
F Compara¸ao entre as edias a posteriori das verdadeiras
densidades e os valores observados. 133
G Previs˜oes populacionais anuais para os munic´ıpios selecionados e ao
selecionados pela PNAD 141
Lista de Figuras
3.1 Densidade dos munic´ıpios do Estado de ao Paulo em 1991. . . . . . . 51
4.1 Munic´ıpios selecionados pela PNAD no Estado de ao Paulo segundo a
classifica¸ao no processo de amostragem. . . . . . . . . . . . . . . . . . 64
4.2 Boxplot dos coeficientes de varia¸ao dos munic´ıpios ao longo dos anos
em que ao utilizados os dados da PNAD. . . . . . . . . . . . . . . . . 65
4.3 Densidade demogr´afica anual do Estado de ao Paulo nos censos, na
contagem populacional e na PNAD. . . . . . . . . . . . . . . . . . . . . 66
4.4 Distribui¸ao das densidades edias dos munic´ıpios. . . . . . . . . . . . 67
4.5 Densidade m´edia por munic´ıpio. . . . . . . . . . . . . . . . . . . . . . . 68
4.6 Densidade m´edia por munic´ıpio, retirando-se os de densidade maior que
2000. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.7 Compara¸ao entre os valores observados e a m´edia a posteriori da den-
sidade demogr´afica dos munic´ıpios Americana e Apia´ı. . . . . . . . . . 75
4.8 Mapa do Estado de ao Paulo com o parˆametro a de cada munic´ıpio
classificado pelas m´edias a posteriori obtidas pelo modelo 2. . . . . . . 77
4.9 Mapa do Estado de ao Paulo com o parˆametro b de cada munic´ıpio
classificado pelas m´edias a posteriori obtidas pelo modelo 2. . . . . . . 77
4.10 Mapa do Estado de ao Paulo com o parˆametro c de cada munic´ıpio
classificado pelas m´edias a posteriori obtidas pelo modelo 2. . . . . . . 78
4.11 Mapa do Estado de ao Paulo destacando a regi˜ao de aplica¸ao do mo-
delo espacial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.12 Compara¸ao entre as popula¸oes estimadas pelo modelo 2 e as po-
pula¸oes calibradas pelo uso de estima¸ao de raz˜ao, mais as observadas
nos censos e na contagem, para a regi˜ao metropolitana do Estado de ao
Paulo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
ix
x
4.13 Compara¸ao entre as popula¸oes estimadas pelo modelo 2 e as po-
pula¸oes projetadas pelo etodo dos coeficientes, mais as observadas
nos censos e na contagem, para os munic´ıpios Cubat˜ao e Diadema sele-
cionados pela PNAD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.14 Compara¸ao entre as popula¸oes estimadas pelo modelo 2 e as po-
pula¸oes projetadas pelo m´etodo dos coeficientes, mais as observadas
nos censos e na contagem, para os munic´ıpios arzea Paulista e Vo-
torantim ao selecionados pela PNAD. . . . . . . . . . . . . . . . . . . 87
D.1 Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, σ
2
e γ, no
modelo 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
D.2 Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
, τ
2
c
, no
modelo 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
D.3 Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada
parˆametro, no modelo 1. . . . . . . . . . . . . . . . . . . . . . . . . . . 112
D.4 Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas
amostras de cada parˆametro, no modelo 1. . . . . . . . . . . . . . . . . 113
D.5 Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ e η
0
, no
modelo 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
D.6 Tra¸co, auto-correla¸ao e histograma dos parˆametros η
1
, τ
2
a
, τ
2
b
e τ
2
c
,
no modelo 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
D.7 Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada
parˆametro, no modelo 2. . . . . . . . . . . . . . . . . . . . . . . . . . . 114
D.8 Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas
amostras de cada parˆametro, no modelo 2. . . . . . . . . . . . . . . . . 115
D.9 Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ, no modelo 3.115
D.10 Tra¸co, auto-correla¸ao e histograma dos parˆametros η
0
, η
1
e k, no modelo
3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
D.11 Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
e τ
2
c
, no
modelo 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
D.12 Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada
parˆametro, no modelo 3. . . . . . . . . . . . . . . . . . . . . . . . . . . 117
D.13 Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas
amostras de cada parˆametro, no modelo 3. . . . . . . . . . . . . . . . . 118
xi
D.14 Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ e k, no
modelo 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
D.15 Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
e τ
2
c
, no
modelo 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
D.16 Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada
parˆametro, no modelo 4. . . . . . . . . . . . . . . . . . . . . . . . . . . 119
D.17 Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas
amostras de cada parˆametro, no modelo 4. . . . . . . . . . . . . . . . . 120
D.18 Tra¸co, auto-correla¸ao e histograma dos parˆametros α
0
, α
1
, β
0
, β
1
, no
modelo 2 com vari´avel dummy. . . . . . . . . . . . . . . . . . . . . . . 120
D.19 Tra¸co, auto-correla¸ao e histograma dos parˆametros γ
0
, γ
1
, η
0
, η
1
, no
modelo 2 com vari´avel dummy. . . . . . . . . . . . . . . . . . . . . . . 121
D.20 Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
e τ
2
c
, no
modelo 2 com vari´avel dummy. . . . . . . . . . . . . . . . . . . . . . . 121
D.21 Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada
parˆametro, no modelo 2 com vari´avel dummy. . . . . . . . . . . . . . . 122
D.22 Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas
amostras de cada parˆametro, no modelo 2 com vari´avel dummy. . . . . 122
D.23 Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ e η
0
, no
modelo 2 com os mesmos dados aplicados ao modelo espacial e com
fra¸ao amostral igual a zero para os ao selecionados. . . . . . . . . . . 123
D.24 Tra¸co, auto-correla¸ao e histograma dos parˆametros η
1
, τ
2
a
, τ
2
b
e τ
2
c
,
no modelo 2 com os mesmos dados aplicados ao modelo espacial e com
fra¸ao amostral igual a zero para os ao selecionados. . . . . . . . . . . 123
D.25 Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada
parˆametro, para o modelo 2 com os mesmos dados aplicados ao modelo
espacial e com fra¸ao amostral igual a zero para os ao selecionados. . . 124
D.26 Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman, ao longo das itera¸oes, para
o modelo 2 com os mesmos dados aplicados ao modelo espacial e com
fra¸ao amostral igual a zero para os ao selecionados. . . . . . . . . . . 124
D.27 Tra¸co, auto-correla¸ao e histograma dos parˆametros α
0
, α
1
, β
0
, β
1
, para
o modelo 2 com vari´avel dummy e mesmos dados aplicados ao modelo
espacial, com fra¸ao amostral igual a zero para os ao selecionados. . . 125
xii
D.28 Tra¸co, auto-correla¸ao e histograma dos parˆametros γ
0
, γ
1
, η
0
, η
1
, para
o modelo 2 com vari´avel dummy e mesmos dados aplicados ao modelo
espacial, com fra¸ao amostral igual a zero para os ao selecionados. . . 125
D.29 Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
e τ
2
c
, para
o modelo 2 com vari´avel dummy e mesmos dados aplicados ao modelo
espacial, com fra¸ao amostral igual a zero para os ao selecionados. . . 126
D.30 Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada
parˆametro, para o modelo 2 com vari´avel dummy e mesmos dados apli-
cados ao modelo espacial, com fra¸ao amostral igual a zero para os ao
selecionados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
D.31 Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas
amostras de cada parˆametro, para o modelo 2 com vari´avel dummy e
mesmos dados aplicados ao modelo espacial, com fra¸ao amostral igual
a zero para os ao selecionados. . . . . . . . . . . . . . . . . . . . . . . 127
D.32 Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ, η
0
, no mo-
delo espacial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
D.33 Tra¸co, auto-correla¸ao e histograma dos parˆametros η
1
, τ
2
a
, τ
2
b
e τ
2
c
,
no modelo espacial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
D.34 Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada
parˆametro, no modelo espacial. . . . . . . . . . . . . . . . . . . . . . . 129
D.35 Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas
amostras de cada parˆametro, no modelo espacial. . . . . . . . . . . . . 129
Lista de Tabelas
4.1 Estat´ısticas descritivas da densidade m´edia . . . . . . . . . . . . . . . . 67
4.2 Resumo dos modelos adotados . . . . . . . . . . . . . . . . . . . . . . . 70
4.3 Resumo da distribui¸ao a posteriori dos parˆametros do modelo 1 . . . . 71
4.4 Resumo da distribui¸ao a posteriori dos parˆametros do modelo 2 . . . . 72
4.5 Resumo da distribui¸ao a posteriori dos parˆametros do modelo 3 . . . . 72
4.6 Resumo da distribui¸ao a posteriori dos parˆametros do modelo 4 . . . . 73
4.7 Medidas de sele¸ao de modelos para a densidade demogr´afica . . . . . . 73
4.8 Resumo das distribui¸oes preditivas para os munic´ıpios Americana e
Apia´ı de 1991 a 2000, excetuando-se o ano 1994. . . . . . . . . . . . . . 74
4.9 Resumo das distribui¸oes a posteriori do parˆametro que representa a
densidade demogr´afica verdadeira para os munic´ıpios Americana e Apia´ı
de 1991 a 2000, excetuando-se o ano 1994. . . . . . . . . . . . . . . . . 75
4.10 Resumo da distribui¸ao a posteriori dos parˆametros do modelo 2 com
vari´avel dummy em a, b e c. . . . . . . . . . . . . . . . . . . . . . . . . 76
4.11 Resumo dos modelos adotados . . . . . . . . . . . . . . . . . . . . . . . 79
4.12 Resumo da distribui¸ao a posteriori dos parˆametros do modelo hier´arquico
sem vari´avel dummy para os dados da regi˜ao selecionada . . . . . . . . 80
4.13 Resumo da distribui¸ao a posteriori dos parˆametros do modelo hier´arquico
com vari´avel dummy em a, b e c para os dados da regi˜ao selecionada. . 80
4.14 Resumo da distribui¸ao a posteriori dos parˆametros do modelo espacial 81
4.15 edia e desvio a posteriori da verdadeira densidade π
it
para o munic´ıpio
Guararema sob os modelos com e sem vari´avel dummy e o modelo espacial. 81
4.16 edia e desvio da distribui¸ao preditiva para o munic´ıpio Guararema
sob os modelos com e sem a vari´avel dummy e o modelo espacial. . . . 82
4.17 Medidas de sele¸ao de modelos para a densidade demogr´afica . . . . . . 82
xiii
xiv
4.18 Limites do intervalo de 95% de credibilidade, m´edia e desvio a posteriori,
em cada ano, valores observados na contagem e nos censos e popula¸oes
divulgadas pela PNAD para a regi˜ao metropolitana do Estado de ao
Paulo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.19 Limites do intervalo de 95% de credibilidade, m´edia e desvio a posteriori,
em cada ano, valores observados na contagem e nos censos e popula¸oes
projetadas para os munic´ıpios Cubat˜ao e Diadema selecionados pela
PNAD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.20 Limites do intervalo de 95% de credibilidade, m´edia e desvio a posteriori,
em cada ano, valores observados na contagem e nos censos e popula¸oes
projetadas para os munic´ıpios arzea Paulista e Votorantim ao sele-
cionados pela PNAD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
E.1 Resumo da distribui¸ao a posteriori do parˆametro a no modelo 2 (continua)130
E.1 Resumo da distribui¸ao a posteriori do parˆametro a no modelo 2 (con-
clus˜ao) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
E.2 Resumo da distribui¸ao a posteriori do parˆametro b no modelo 2 . . . . 131
E.3 Resumo da distribui¸ao a posteriori do parˆametro c no modelo 2 . . . . 132
Introdu¸ao
Nos ´ultimos anos, vem crescendo a demanda por informa¸oes estat´ısticas populacio-
nais detalhadas e atualizadas, sobretudo para pequenas ´areas geogr´aficas, tais como
munic´ıpios, ou para pequenos dom´ınios como, por exemplo, pessoas do sexo feminino
de um dado grupo ´etnico. Esse crescimento observado deve-se, por um lado, `a neces-
sidade das autoridades locais de conhecer a realidade das ´areas de sua competˆencia
com maior exatid˜ao, objetivando a identifica¸ao de ´areas menos desenvolvidas para a
implementa¸ao de pol´ıticas p´ublicas regionalizadas. Um exemplo da necessidade de
estimativas confi´aveis ´e a distribui¸ao de verbas federais pelo Fundo de Participa¸ao
dos Munic´ıpios, definida a partir de crit´erios que levam em considera¸ao os tamanhos
das popula¸oes municipais e institu´ıda por legisla¸ao federal.
´
E preciso, ent˜ao, obter
estimativas que atendam `as necessidades de pesquisa e de planejamento, apresentando
boa precis˜ao.
As informa¸oes mais desagregadas est˜ao dis pon´ıveis somente quando da ocorrˆencia
de um censo demogr´afico cuja periodicidade ´e, na maioria das vezes, decenal, tornando
as informa¸oes defasadas. Pesquisas por amostragem constituem uma forma alternativa
de obter, com maior rapidez, informa¸oes estat´ısticas num per´ıodo intercensit´ario. No
entanto, essas pesquisas por amostragem ao, em sua maioria, de ˆambito nacional e de
m´ultiplos prop´ositos, como no caso da Pesquisa Nacional por Amostra de Domic´ılios
(PNAD), realizada pelo Instituto Brasileiro de Geografia e Estat´ıstica (IBGE), com
tamanho de amostra dentro das p equenas ´areas e/ou dos pequenos dom´ınios bastante
reduzido para que estimativas baseadas somente no desenho amostral apresentem pre-
cis˜ao aceit´avel. O que se faz ´e produzir estat´ısticas para n´ıveis geogr´aficos maiores
formados por agrega¸oes das pequenas ´areas. Muitas vezes, nem todas as pequenas
´areas dentro desses n´ıveis ao pesquisadas ocorrendo mais um problema: mesmo que
se desejasse obter estimativas para o n´ıvel mais desagregado, ao haveria informa¸ao
para algumas ´areas por ao terem sido amostradas. No caso espec´ıfico da obten¸ao de
2
estimativas das popula¸oes das pequenas ´areas, ao realizadas proje¸oes populacionais
em que, primeiro, ´e feita a proje¸ao para uma ´area maior, considerando sua evolu¸ao
populacional, baseando-se em hip´oteses sobre a natalidade, a mortalidade e a migra¸ao
e, depois, o resultado ´e repartido de alguma forma entre as pequenas ´areas. Isso ´e feito
pelo etodo de rela¸ao de coortes (Assun¸ao, 2001), por exemplo. Algumas ecnicas
de proje¸ao caracterizam-se por ao apresentar o erro das estimativas, como aquela
conhecida por m´etodo dos coeficientes (IBG E, 2002a).
As fontes de dados utilizadas na aplica¸ao foram os Censos Demogr´aficos de 1991 e
2000, a Contagem de Popula¸ao ocorrida em 1996 e a PNAD entre os anos de 1991 e
2000. A PNAD possui trˆes est´agios de sele¸ao, sendo a unidade prim´aria o munic´ıpio,
assumido como pequena ´area.
O objetivo deste trabalho ´e obter as estimativas dos tamanhos populacionais dos mu-
nic´ıpios ao inclu´ıdos na amostra da PNAD. Ainda, pretende-se corrigir os valores esti-
mados, atrav´es do estimador direto derivado do plano amostral, para os munic´ıpios que
foram selecionados, utilizando o censo como calibrador. Para tal, ao propostos alguns
modelos, estudando-se seus desempenhos, quanto a capacidade preditiva e de ajuste,
quando aplicados `a estima¸ao da popula¸ao de pequenas ´areas. Caso seja poss´ıvel,
pretende-se eleger o melhor modelo dentre os estudados. Acredita-se, nesse contexto,
que modelos hier´arquicos possam apresentar boa performance por permitirem a troca
de informa¸c ˜oes entre as diversas ´areas, compensando o tamanho de amostra reduzido e
diminuindo o erro das estimativas. A inclus˜ao de uma componente espacial ao modelo
tamb´em ´e considerada, uma vez que o crescimento e a concentra¸ao populacionais de
uma dada ´area podem ter rela¸ao c om o desenvolvimento de regi˜oes pr´oximas. Toda a
an´alise ´e realizada sob abordagem Bayesiana. Espera-se que a aplica¸ao desses modelos
possa reduzir o erro das estimativas dos munic´ıpios selecionados obtidas a partir do
estimador direto. Na aplica¸ao, ´e utilizada a densidade populacional dos munic´ıpios do
Estado de ao Paulo. O uso da densidade ´e uma tentativa de evitar que a hip´otese de
permutabilidade associada aos modelos hier´arquicos seja violada, objetivando tornar
similares os parˆametros de popula¸ao inicial dos diversos munic´ıpios.
No Cap´ıtulo 1, ´e feita uma revis˜ao das principais t´ecnicas de estima¸ao em pequenas
´areas e de proje¸ao populacional. No Cap´ıtulo 2, ao descritas as principais fontes
de dados utilizadas neste trabalho e em pesquisas demogr´aficas. No Cap´ıtulo 3, ao
apresentados os modelos propostos e os crit´erios de sele¸ao de modelos considerados.
3
No Cap´ıtulo 4, tem-se a aplica¸ao e os resultados. No Cap´ıtulo 5 ao apresentadas a
conclus˜ao e propostas de trabalhos futuros com uma breve discuss˜ao.
4
Cap´ıtulo 1
Revis˜ao Bibliogr´afica
A crescente demanda por informa¸oes mais detalhadas em n´ıvel de pequenas ´areas fez
com que crescessem na literatura as propostas de etodos de estima¸ao que pudessem
produzir estimativas com boa precis˜ao. No caso de prever a popula¸ao, ao utilizadas
t´ecnicas de proje¸ao demogr´afica cujo objetivo ´e prever a evolu¸ao populacional futura.
Neste cap´ıtulo, ´e feita uma revis˜ao da literatura de estima¸ao em pequenas ´areas, bem
como das principais t´ecnicas de proje¸ao populacional.
1.1 Revis˜ao de estima¸ao em pequenas ´areas
O termo pequenas ´areas ´e comumente utilizado para de nominar ´areas geogr´aficas
pequenas, tais como munic´ıpios, distritos e bairros. Entretanto, pode s er utilizado para
descrever um pequeno dom´ınio, o qual ´e resultado da classifica¸ao cruzada de duas ou
mais vari´aveis, como por exemplo, uma subpopula¸ao obtida a partir da sele¸ao de
pessoas do sexo feminino com idades entre 15 e 49 anos.
Estima¸ao em pequenas ´areas ´e um problema que vem crescendo em importˆancia
devido `a demanda por informa¸oes estat´ısticas cada vez mais detalhadas e precisas para
os setores p´ublico e privado. As estimativas podem servir, por exemplo, como base
para a implementa¸ao de diversas pol´ıticas p´ublicas, definindo as popula¸oes alvo de
programas sociais. No Brasil, o IBGE apresenta, anualmente, estimativas de popula¸ao
por munic´ıpio para subs idiar a defini¸ao do Fundo de Participa¸ao dos Munic´ıpios por
for¸ca de lei do Tribunal de Contas da Uni˜ao. No setor privado, pode-se utilizar como
exemplo, empresas que necessitem conhecer as condi¸oes socioeconˆomicas locais.
As informa¸oes para pequenas ´areas podem ser obtidas a partir de censos e enu-
mera¸oes populacionais nessas ´areas, com a popula¸ao sendo inteiramente investi-
5
gada, ou atrav´es de pesquisas por amostragem. Nas ´ultimas d´ecadas, as pesquisas
por amostragem com m´ultiplos prop´ositos tomaram grande impulso por apresentarem
menor custo em rela¸ao aos censos e contagens, al´em de possibilitarem a obten¸ao
de informa¸oes de interesse com periodicidade menor que a dos censos. No entanto,
essas pesquisas ao caracterizadas por tamanhos de amostras reduzidos nas pequenas
´areas, ou at´e mesmo pela ausˆencia de unidades amostrais em algumas ´areas, ao sendo
poss´ıvel obter estimativas com boa precis˜ao a partir de estimadores diretos, baseados
unicamente no desenho da amostra.
Dessa forma, destacam-se duas quest˜oes importantes ao considerarmos o problema
de estima¸ao em pequenas ´areas: a primeira diz respeito a como produzir es timati-
vas confi´aveis das caracter´ısticas de interesse investigadas, baseando-se na informa¸ao
proveniente de amostras muito pequenas obtidas a partir das pequenas ´areas ou pe-
quenos dom´ınios; a segunda est´a relacionada a como obter o erro de estima¸ao. Com
raras exce¸oes, o desenho e o tamanho da amostra ao escolhidos de maneira que a
amostra forne¸ca estimativas com boa precis˜ao para n´ıveis geogr´aficos maiores, forma-
dos pela agrega¸ao das pequenas ´areas, ou para grupos demogr´aficos mais amplos,
optando-se, como exemplo, por ao apresentar es timativas por faixas de idade, mas
sim para o agregado. a casos tamb´em, em que os dom´ınios de interesse ao especi-
ficados somente ap´os a pesquisa ter sido planejada. Existindo somente uma amostra
pequena para uma particular ´area, uma solu¸ao poss´ıvel para o problema de estima¸ao
´e pedir emprestada informa¸ao de outros dados relacionados. As fontes de dados com
potencial para isso podem ser divididas em duas categorias: dados obtidos para a
caracter´ıstica de interesse em outras ´areas consideradas ”similares” `a ´area em quest˜ao
e dados obtidos para a caracter´ıstica em ocasi˜oes anteriores (Pfeffermann, 2002).
Os fatos apresentados fizeram com que crescessem na literatura as propostas de
t´ecnicas baseadas em estimadores indiretos onde ocorre a troca de informa¸ao entre
as ´areas na tentativa de elevar o tamanho efetivo das amostras e, por conseq¨encia,
aumentar a precis˜ao das estimativas.
Em Pfeffermann (2002), encontra-se uma revis˜ao dos principais estimadores e mo-
delos que apareceram recentemente na literatura relacionados ao problema de estima¸ao
em pequenas ´areas, utilizando dados obtidos a partir de pesquisas por amostragem. O
autor apresenta um estimador sint´etico de regress˜ao para a m´edia da caracter´ıstica de
interesse, y, em cada pequena ´area. Sup onha que y
ij
denote o valor obtido da carac-
6
ter´ıstica y para a unidade j pertencente `a ´area i e que deseja-se estimar a verdadeira
m´edia,
¯
Y
i
=
N
i
j=1
y
ij
/N
i
, onde i = 1, . . . , m, j = 1, . . . , N
i
e N
i
´e o tamanho da ´area
i. Caso ao exista nenhuma informa¸ao adicional, o estimador direto com base no
desenho da amostra (considerando amostragem aleat´oria simples, sendo o tamanho da
amostra n
i
aleat´orio) e sua variˆancia ao
¯y
i
=
n
i
j=1
y
ij
/n
i
e V
D
[¯y
i
|n
i
] = (
˜
S
2
i
/n
i
)[1 (n
i
/N
i
)] = S
2
i
onde
˜
S
2
i
=
N
i
j=1
(y
ij
¯
Y
i
)
2
/(N
i
1). A variˆancia aumenta `a medida que o tamanho da
amostra torna-se pequeno.
Supondo que, al´em das medidas de y obtidas a partir de uma pesquisa por amostra-
gem, houvesse a informa¸ao x
ij
de p vari´aveis x(1), . . . , x(p) provenientes de censo
recente, ou de algum registro administrativo, para cada unidade amostrada, e que o
vetor de m´edias
¯
X
i
=
N
i
j=1
x
ij
/N
i
fosse conhecido, poderia ser calculado o estimador
de regress˜ao dado por
¯y
reg,i
= ¯y
i
+ (
¯
X
i
¯x
i
)
β
i
e V
D
(¯y
reg,i
|n
i
) = S
2
i
(1 R
2
i
)
onde ¯x
i
=
n
i
j=1
x
ij
/n
i
e β
i
e R
i
ao, respectivamente, o vetor de coeficientes de regress˜ao
e o coeficiente de correla¸ao ultipla entre y e as vari´aveis x(1), . . . , x(p) calculado com
base em todas as N
i
medidas da ´area i. A variˆancia do estimador ´e reduzida pelo fator
(1R
2
i
), mostrando a importˆancia da utiliza¸ao de informa¸ao auxiliar com bom poder
de previs˜ao em estima¸ao em pequenas ´areas. Quanto maior a correla¸ao entre y e as
demais vari´aveis, menor ser´a a variˆancia V
D
(¯y
reg,i
|n
i
). A informa¸ao auxiliar tem uso
bastante conhecido nos casos de estimador de raz˜ao e de os-estratifica¸ao.
Quanto `a estima¸ao do coeficiente β
i
, o tamanho reduzido da amostra na ´area i torna
sua estimativa de m´ınimos quadrados pouco precisa, o que compromete a utiliza¸ao
do estimador
¯
Y
reg,i
. Se sabemos que os β
i
’s podem ser considerados similares entre as
´areas, um estimador poss´ıvel ´e o sint´etico de regress˜ao
¯y
sin
reg,i
= (¯y ¯x
b) +
¯
X
i
b
onde: (¯y, ¯x)
=
m
i=1
n
i
j=1
(y
ij
, x
ij
)
/
m
i=1
n
i
ao as m´edias amostrais globais de x e
y e b =
m
i=1
n
i
j=1
(x
ij
¯x
i
)(x
ij
¯x
i
)
1
m
i=1
n
i
j=1
(x
ij
¯x
i
)(y
ij
¯y
i
). No caso de
intercepto igual a zero e do uso de uma ´unica vari´avel auxiliar, temos o estimador
sint´etico de raz˜ao ¯y
sin
razao,i
=
¯
X
i
¯y/¯x.
O termo sint´etico refere-se ao fato de que um estimador obtido para uma ´area
maior ´e usado para cada regi˜ao pertencente `aquela ´area, assumindo-se que as regi˜oes
7
ao homogˆeneas com respeito `a quantidade que est´a sendo estimada. Neste sentido,
po de- se considerar que estimadores sint´eticos em a propriedade de pedir informa¸ao
emprestada das ´areas similares.
A principal vantagem da estima¸ao sint´etica ´e o potencial para uma redu¸ao da
variˆancia. No entanto, se a hip´otese de homogeneidade dentro do dom´ınio maior ´e
violada, Pfeffermann (2002, p. 128) alerta que a estima¸ao sint´etica pode levar a um
vi´es grande. Uma proposta para redu¸ao do vi´es ´e utilizar um estimador composto
igual `a soma ponderada dos estimadores sint´etico e direto (obtido a partir do desenho
amostral). Ent˜ao o estimador composto tem a forma geral
ˆ
θ
com,i
= w
i
˜
θ
i
+ (1 w
i
)
ˆ
θ
i
sin
onde
ˆ
θ
com,i
,
˜
θ
i
e
ˆ
θ
i
sin
ao os estimadores composto, direto e sint´etico, respectivamente.
A principal dificuldade na utiliza¸ao do estimador composto est´a na escolha dos pesos
w
i
. Uma poss´ıvel escolha para os pesos w
i
seria aquela em que w
i
= f
i
= (n
i
/N
i
),
onde f
i
´e a iesima fra¸ao amostral. Neste caso, mais peso seria dado ao estimador
direto quando a fra¸ao amostral f
i
crescesse, mas deve-se ter em mente que as fra¸oes
amostrais ao, em geral, muito pequenas e seu uso como peso pode levar, praticamente,
ao estimador sint´etico. O ideal seria obter os pes os de modo a minimizar o erro edio
quadr´atico (MSE). Entretanto, o MSE do estimador sinetico ´e, em geral, desconhecido.
Al´em do que a foi apresentado em termos de estimadores, temos, na literatura, esti-
madores obtidos a partir de modelos, dentre os quais destacam-se os modelos de efeitos
mistos, contendo efeitos fixos e aleat´orios. Rao (1999) faz uma revis˜ao da literatura
de estima¸ao em pequenas ´areas, cobrindo o per´ıodo de 1994 a 1998, concentrando-se
na estima¸ao baseada em modelos. Os opicos abordados ao mo de los para estima¸ao
em pequenas ´areas e os etodos denominados empirical best linear unbiased predic-
tion (EBLUP), empirical Bayes (EB) e hierarchical Bayes (HB), com exemplos de
aplica¸oes. Segundo o autor, esses modelos podem ser subdivididos em modelos no
n´ıvel de ´area e no n´ıvel de unidade.
Nos modelos em n´ıvel de ´area, sup˜oe-se que esteja dispon´ıvel informa¸ao auxiliar,
denotada por x
i
, para as ´areas amostradas i, assim como para as ao amostradas. As
informa¸oes auxiliares ao provenientes de censo recente ou de registros administrativos,
tais como o Registro Civil e o Sistema de Informa¸oes sobre Mortalidade que ao
apresentados no Cap´ıtulo 2. Um modelo asico em n´ıvel de ´area assume que a m´edia
populacional verdadeira da pequena ´area i,
¯
Y
i
, ou alguma fun¸ao θ
i
= g(
¯
Y
i
) desta
8
m´edia, esteja relacionada a x
i
atrav´es de um modelo linear com efeito aleat´orio da ´area
i, denotado ν
i
, como a seguir:
θ
i
= x
i
β + ν
i
, i = 1, . . . , m (1.1)
onde β ´e um vetor de parˆametros de regress˜ao de dimens˜ao p e os ν
i
’s ao ao correla-
cionados, com m´edia 0 e variˆancia σ
2
ν
. Freq¨uentemente, adota-se normalidade para ν
i
.
O modelo (1.1) permanece alido para as ´areas ao amostradas. Assume-se, tamb´em,
que estejam dispon´ıveis estimadores diretos
ˆ
¯
Y
i
de
¯
Y
i
sempre que o tamanho da amostra,
n
i
, de uma dada ´area seja maior ou igual a 1. Al´em disso, assume-se que
ˆ
θ
i
= θ
i
+
i
, (1.2)
onde
ˆ
θ
i
= g(
ˆ
¯
Y
i
) ´e uma fun¸ao do estimador direto
ˆ
¯
Y
i
de
¯
Y
i
. Os erros amostrais
i
ao
independentes, com distribui¸ao N(0, ψ
i
) onde os ψ
i
’s ao conhecidos. Combinando
este modelo com aquele dado em (1.1), obtemos o modelo linear misto em n´ıvel de ´area
de Fay e Herriot (1979):
ˆ
θ
i
= x
i
β + ν
i
+
i
. (1.3)
Vale notar que (1.3) envolve tanto as vari´aveis aleat´orias
i
relacionadas ao desenho
amostral quanto as ν
i
’s relacionadas ao modelo em n´ıvel de ´area. O modelo (1.3) leva
em considera¸ao os pesos amostrais atrav´es dos estimadores diretos
ˆ
θ
i
. As variˆancias
amostrais ψ
i
raramente ao conhecidas e uma forma de lidar com o fato ´e suavizar as
variˆancias estimadas
ˆ
ψ
i
, de modo a obter maior estabilidade das estimativas de ψ
i
, e
trat´a-las como verdadeiras.
Na literatura, o modelo asico em n´ıvel de ´area foi estendido de forma a comportar
erros amostrais correlacionados, dependˆencia espacial dos efeitos aleat´orios das peque-
nas ´areas, caso de θ
i
multivariado, dados de s´eries temporais e outros. Como exemplo,
consideremos o caso de s´eries temporais. Suponha que θ
it
denota o parˆametro de inte-
resse para a pequena ´area i no tempo t e que
ˆ
θ
it
seja um estimador direto de θ
it
. Assuma
um modelo tal que
ˆ
θ
it
|θ
it
N(θ
it
, ψ
it
), com variˆancias amostrais, ψ
it
, conhecidas e
θ
it
|u
t
N(x
it
β + z
it
u
t
, σ
2
t
) (1.4)
e
u
t
|u
t1
N(u
t1
, W ). (1.5)
O modelo (1.4) ao inclui efeitos espec´ıficos de ´area. Um outro exemplo envolvendo
observoes no tempo e contendo esses efeitos ´e dado por
ˆ
θ
i
|θ
i
N(θ
i
, ψ
i
)
9
θ
it
= x
it
β + ν
i
+ u
it
com ν
i
N(0, σ
2
ν
) e indep endentes dos u
it
’s para os quais assume-se um modelo AR(1):
u
it
= ρu
i,t1
+
it
, |ρ| < 1
com
it
N(0, σ
2
) onde θ
i
= (θ
i1
, . . . , θ
iT
)
e
ˆ
θ
i
= (
ˆ
θ
i1
, . . . ,
ˆ
θ
iT
)
.
O modelo apresentado permite correla¸ao entre os erros amostrais sobre o tempo,
al´em de incluir efeitos aleat´orios espec´ıficos de ´area, ν
it
e efeitos aleat´orios espec´ıficos
de ´area atrav´e s do tempo, u
it
. Modelos deste tipo ao freq¨uentemente utilizados em
econometria.
Modelos em n´ıvel de ´area tˆem sido utilizados tamb´em no contexto de mapeamento de
doen¸cas, estimando taxas de incidˆencia e de mortalidade regionais. Um exemplo disso,
´e um modelo que assume distribui¸ao de Poisson para o n´umero de casos observados
de uma certa doen¸ca numa dada pequena ´area tal que y
i
|θ
i
P (n
i
θ
i
), onde n
i
´e
o n´umero de expostos na ´area i e θ
i
´e a verdadeira taxa de incidˆencia da doen¸ca,
seguindo uma distribui¸ao gama de parˆametros a e b. Uma alternativa proposta na
literatura foi considerar β
i
= log(θ
i
) N(µ, σ
2
), estabe lecendo para os β
i
’s um modelo
de dependˆencia espacial atrav´es de auto-regress˜ao condicional (CAR), relacionando β
i
ao conjunto de vizinhos da ´area i. Um modelo para o n´umero de doentes por grupo
et´ario numa ´area espec´ıfica, y
ij
, consiste em assumir que y
i.
=
j
y
ij
|θ
i
P (e
i
θ
i
) e
θ
i
G(a, b), onde e
i
=
j
ψ
j
n
ij
´e o n´umero esperado de mortes na ´area i, ψ
j
´e o efeito
do j-´esimo grupo, assumido como conhecido, e n
ij
´e o n´umero de expostos `a doen¸ca
na ´area i e grupo et´ario j.
Outro tipo de modelo para estima¸ao em pequenas ´areas ´e o modelo em n´ıvel de
unidade. Suponha que existam os valores de p vari´aveis, x(1), . . . , x(p) concomitan-
temente para cada unidade amostral e que sejam conhecidas as verdadeiras m´edias
populacionais dessas vari´aveis. Denote por x
ij
os valores concomitantes na unidade j
da ´area i. Um modelo asico em n´ıvel de unidade assume que os valores y
ij
associados
`a jesima unidade da ´area i ao relacionados `as vari´aveis auxiliares x
ij
atrav´es de um
modelo de regress˜ao encaixado (nested) da forma
y
ij
= x
ij
β + ν
i
+
ij
, j = 1, . . . , N
i
; i = 1, . . . , m (1.6)
onde os ν
i
’s e os
ij
’s ao erros mutuamente independentes normalmente distribu´ıdos
com m´edia zero e variˆancias dadas, respectivamente, por σ
2
ν
e σ
2
. A quantidade N
i
´e o
n´umero de unidades na iesima ´area. As quantidades de interesse ao os totais Y
i
e as
10
m´edias
¯
Y
i
. O termo aleat´orio u
i
representa o efeito conjunto de todas as caracter´ısticas
de ´area que as vari´aveis concomitantes ao levam em conta.
O modelo em (1.6) ´e apropriado para vari´aveis y cont´ınuas. No caso de vari´aveis
de contagens ou categ´oricas, existem exemplos nos quais se utiliza modelos lineares
generalizados mistos com efeitos aleat´orios ν
i
de cada pequena ´area. Assim, considera-
se que: dados θ
ij
’s, os y
ij
’s ao independentes e pertencem `a fam´ılia exponencial com
parˆametro θ
ij
; o modelo de liga¸ao ´e dado por g(θ
ij
) = x
ij
β + ν
i
onde ν
i
N(0, σ
2
ν
)
e g(.) ´e uma fun¸ao estritamente crescente. O modelo linear misto (1.6) ´e um caso
especial desta classe com g(a) = a. Por exemplo, para dados bin´arios, utiliza-se , com
freq¨encia, a transforma¸ao g(a) = log[a/(1 a)].
arias extens˜oes do modelo asico (1.6) foram realizadas na literatura, sendo uma
delas a de Moura e Holt (1999) que permitia que os coeficientes de regress˜ao fossem con-
siderados aleat´orios e que covari´aveis pudessem ser introduzidas para explicar algumas
diferen¸cas entre as pequenas ´areas.
Quanto `a inferˆencia, os etodos E BLUP, EB e HB tornaram-se proeminentes na
estima¸ao em pequenas ´areas a partir de modelos. O EBLUP ´e aplic´avel aos modelos
lineares mistos, enquanto o EB e o HB ao alidos tamb´em para outros modelos.
Freq¨uentemente, assume-se normalidade dos efeitos aleat´orios para estima¸ao do MSE
dos estimadores.
Sob o modelo (1.6), as edias verdadeiras das pequenas ´areas ao
¯
Y
i
=
¯
X
i
β + ν
i
+
¯
i
. Como ¯
i
=
N
i
j=1
ij
/N
i
0 para N
i
grande, os parˆametros alvo ao comumente
definidos como θ
i
=
¯
X
i
β + ν
i
. Para variˆancias σ
2
v
e σ
2
conhecidas o previsor BLUP de
θ
i
, sob o modelo ´e
ˆ
θ
i
= γ
i
¯y
i
+ (
¯
X
i
¯x
i
)
ˆ
β
GLS
+ (1 γ
i
)
¯
X
i
ˆ
β
GLS
(1.7)
onde
ˆ
β
GLS
´e o estimador de m´ınimos quadrados generalizados de β a partir de todos os
dados observados e γ
i
= σ
2
ν
/(σ
2
ν
+ σ
2
/n
i
). Para uma ´area k sem dados y amostrados,
tem-se
ˆ
θ
k
=
¯
X
i
ˆ
β
GLS
. O coeficiente γ
i
po de ser interpretado como um fator de redu¸ao,
fornecendo o grau de importˆancia da variˆancia do previsor ¯y
i
+ (
¯
X
i
¯x
i
)
ˆ
β
GLS
e do
vi´es do estimador sint´etico
¯
X
i
ˆ
β
GLS
para um dado valor θ
i
. Segue de (1.7) que o
previsor BLUP ´e uma combina¸ao ponderada do estimador direto
ˆ
θ
i
e do estimador
sint´etico de regress˜ao x
i
˜
β(σ
2
ν
). O resultado (1.7) ao requer a normalidade de ν
i
e
i
.
O previsor resultante ´e genericamente denominado EBLUP. Como σ
2
ν
´e desconhecido,
o substitu´ımos por um estimador ˆσ
2
ν
que pode ser obtido atraes de etodos, tais como
11
o de axima verossimilhan¸ca ou de axima verossimilhan¸ca restrito (REML).
Uma medida de variabilidade associada ao EBLUP ´e o MSE, que ´e aproximado, em
muitos casos, por ao existir forma fechada. Conseq¨uentemente, consider´avel aten¸ao
foi dispensada para obten¸ao de aproxima¸oes do MSE do EBLUP (Rao, 1999).
Na abordagem do EB, para o modelo asico em n´ıvel de ´area, dado por (1.1) e
(1.2), primeiramente obt´em-se a distribui¸ao de θ
i
dado
ˆ
θ
i
e os parˆametros do modelo,
β e σ
2
ν
, denotada por f(θ
i
|
ˆ
θ
i
, β, σ
2
ν
). Os parˆametros do modelo ao estimados a partir
da marginal dos
ˆ
θ
i
e inferˆencias ao baseadas na distribui¸ao condicional estimada (ou
posteriori) de θ
i
, f (θ
i
|
ˆ
θ
i
,
ˆ
β, ˆσ
2
ν
). Em particular, a m´edia da distribui¸ao condicional
estimada ´e o estimador EB,
˜
θ
EB
i
. Sob normalidade
˜
θ
EB
i
´e idˆentico ao previsor EBLUP
˜
θ
i
, por´em o EB ´e geralmente aplic´avel a qualquer distribui¸ao conjunta. Vale notar que
o etodo EB ´e essencialmente freq¨uentista porque utiliza somente os modelos amostral
e de liga¸ao que podem ser validados a partir dos dados, al´em de nenhuma distribui¸ao
a priori ser atribu´ıda a qualquer parˆametro.
A variˆancia da distribui¸ao condicional estimada ´e utilizada como medida de va-
riabilidade do
˜
θ
EB
i
. Sob normalidade, ´e dada por g
1i
(ˆσ
2
ν
) = ˆγ
i
ψ
i
que leva a uma
subestima¸ao da verdadeira variabilidade quando medida pelo MSE. Diversas propostas
foram feitas objetivando corrigir a subestima¸ao e as referˆencias podem ser vistas em
Rao (1999).
O m´etodo HB tem sido utilizado extensivamente em estima¸ao em pequenas ´areas,
principalmente por ser poss´ıvel trabalhar com problemas complexos. Uma distribui¸ao
a priori para os parˆametros do modelo ´e es pecificada e a distribui¸ao a posteriori
f(θ
i
|y, X) dadas as obsevoes de todas as ´areas ´e enao obtida. Inferˆencias ao
baseadas na distribui¸ao a posteriori. Em particular, Y
i
ou θ
i
´e estimado pela sua
m´edia a posteriori e sua precis˜ao ´e medida por sua variˆancia a posteriori. Uma van-
tagem do procedimento ´e a possibilidade de obter estimativas pontuais e o erro asso-
ciado medido com base na variˆancia a posteriori. Quando a distribui¸ao a posteriori ´e
ao trat´avel, por ao possuir forma f echada, recorre-se a etodos de Monte Carlo via
Cadeias de Markov (MCMC) para obter uma amostra da distribui¸ao dos parˆametros
das pequenas ´areas.
Para o modelo asico em n´ıvel de ´area, definido por (1.1) e (1.2), supondo normali-
dade de ν
i
e e
i
, a edia a posteriori E(θ
i
|
ˆ
θ) e a variˆancia a posteriori V (θ
i
|
ˆ
θ) ao obti-
das em dois est´agios onde
ˆ
θ = (
ˆ
θ
1
, . . . ,
ˆ
θ
m
)
. No primeiro est´agio, obtemos E(θ
i
|
ˆ
θ, σ
2
ν
)
12
e V (θ
i
|
ˆ
θ, σ
2
ν
) para σ
2
ν
fixo, assumindo uma priori impr´opria, f(β) const. A m´edia
a posteriori condicional dado σ
2
ν
´e idˆentica ao previsor BLUP,
˜
θ
i
(σ
2
ν
) e a variˆancia a
posteriori condicional ´e igual g
1i
(σ
2
ν
) + g
2i
(σ
2
ν
). No segundo est´agio, levamos em conta
a incerteza sobre σ
2
ν
, calculando sua distribui¸ao a posteriori f(σ
2
ν
|
ˆ
θ), assumindo uma
distribui¸ao a priori em σ
2
ν
e independˆencia a priori de β e σ
2
ν
. Ent˜ao a edia e a
variˆancia a posteriori ao obtidas como
˜
θ
HB
i
= E(θ
i
|
ˆ
θ) = E
σ
2
ν
|
ˆ
θ
[
˜
θ
i
(σ
2
ν
)] (1.8)
V (θ
i
|
ˆ
θ) = E
σ
2
ν
|
ˆ
θ
[g
1i
(σ
2
ν
) + g
2i
(σ
2
ν
)] + V
σ
2
ν
|
ˆ
θ
[
˜
θ
i
(σ
2
ν
)] (1.9)
onde E
σ
2
ν
|
ˆ
θ
e V
σ
2
ν
|
ˆ
θ
denotam, respectivamente, a esperan¸ca e a variˆancia com respeito
a f(σ
2
ν
|
ˆ
θ). ao a forma fechada para (1.8) e (1.9). Em casos complexos, existe a
necessidade da utiliza¸ao de m´etodos, tais como Metropolis-Hastings e Gibbs sampler,
para obten¸ao da posteriori indiretamente. Rao (1999) apresenta um exemplo em que
faz-se uso do Gibbs sampler.
Existem exemplos na literatura em que os dados observados y
ij
ao categ´oricos ou
discretos e as quantidades de interesse nas pequenas ´areas ao contagens ou propor¸oes.
Em tais casos, os modelos de efeitos mistos a tratados ao ser˜ao adequados. Considere
o seguinte modelo para o caso de medi¸oes do tipo bin´arias (Macgibbon e Tomberlin
apud Pfeffermann, 1989)
P (y
ij
= 1|p
ij
) = p
ij
; P (y
ij
= 0|p
ij
) = 1 p
ij
logit(p
ij
) = log [p
ij
/(1 p
ij
)] = x
ij
β + u
i
, u
i
N(0, σ
2
u
).
(1.10)
Os valores y
ij
ao assumidos condicionalmente independentes e da mesma forma os
efeitos aleat´orios u
i
. A proposta ´e predizer as verdadeiras propor¸oes p
i
=
N
i
j=1
y
ij
/N
i
.
Os autores consideraram y
ij
definindo a participa¸ao na popula¸ao ativa para o in-
div´ıduo j da regi˜ao i e x
ij
definindo sexo e idade. Assumindo uma priori vaga para β
e variˆancia conhecida σ
2
u
= V ar(u
i
), os autores aproximaram a distribui¸ao conjunta
a posteriori de β e {u
i
, i = 1, . . . , m} dado os dados pela distribui¸ao normal multiva-
riada com edia igual a moda da verdadeira p osteriori e matriz de covariˆancias igual
a inversa da matriz de informa¸ao calculada na moda. Denotando as modas de β e
u
i
, respectivamente, por
˜
β e ˜u
i
, p
ij
´e estimada por ˜p
ij
=
1 + exp
(x
ij
˜
β + ˜u
i
)

1
e
para fra¸oes amostrais n
i
/N
i
pequenas, ˆp
i
=
N
i
j=1
˜p
ij
/N
i
. O caso de σ
2
u
desconhecida
´e tratado repetindo-se a an´alise com σ
2
u
substitu´ıdo por seu estimador de axima
verossimilhan¸ca (EMV), enao resultando no estimador EB.
13
Ghosh et al. (1998) apud Pfeffermann (2002) desenvolveram uma metodologia geral
de inferˆencia usando HB sob modelo linear generalizado com efeitos aleat´orios, que
inclui o modelo dado em (1.10) como um caso especial. A classe de modelos HB
estudadas por eles consiste nas seguintes equa¸oes:
y
ij
|θ
ij
, β, u
i
, σ
2
u
, σ
2
ind
GLM
h(θ
ij
)|β, u
i
, σ
2
u
, σ
2
ind
N(x
ij
β + u
i
, σ
2
), u
i
|β, σ
2
u
, σ
2
ind
N(0, σ
2
u
)
β Uniforme(R
k
); (σ
2
u
)
1
Gama(a, b); (σ
2
)
1
Gama(c, d)
(1.11)
com β, σ
2
u
e σ
2
mutuamente independentes e (a, b, c, d) denotando valores de parˆametros
fixos. A distribui¸ao a posteriori conjunta dos parˆametros θ
ij
ou de fun¸oes deles, tais
como E(y
ij
|θ
ij
), ´e obtida atrav´es do Gibbs sampler.
´
E essencial, entretanto, que a
posteriori resultante seja pr´opria e os autores es tabelecem condi¸oes suficientes para
isso. No caso do modelo (1.10), as condi¸oes requerem que as medidas y
ij
para uma
dada ´area i ao sejam todas iguais a zero ou um. Quando y
ij
´e Poisson, a condi¸ao ´e
y
i
=
n
i
j=1
y
ij
> 0. Aplica¸oes podem ser vistas em Pfeffermann (2002).
Al´em de dados administrativos, uma valiosa fonte de informa¸ao ´e aquela prove-
niente de dados medidos para a caracter´ıstica de interesse em ocasi˜oes anteriores. Os
estimadores diretos obtidos a partir de pesquisas por amostragem ao usualmente cor-
relacionados mesmo quando amostras independentes ao se lecionadas em diferentes
ocasi˜oes por causa da correla¸ao entre os verdadeiros valores das caracter´ısticas sobre
o tempo, o que sugere uma abordagem de eries temporais. Um modelo de s´eries tem-
porais t´ıpico para dados de pesquisa por amostragem consiste basicamente em duas
partes: um modelo ajustado para a quantidade populacional de interesse e outro para
os erros amostrais. Considere o seguinte modelo de eries temporais para uma ´area i
no tempo t:
y
it
= θ
it
+ e
it
= x
it
β
it
+ e
it
; e
it
ARMA(a, b)
β
it
= T
t
β
i,t1
+ η
it
(1.12)
onde β
it
´e um vetor de estados aleat´orio p × 1, T
t
´e uma matriz de transi¸ao fixa
p × p e e
it
e η
it
= (η
it1
, . . . , η
itp
)
ao erros aleat´orios independentes c om V ar(e
it
) = σ
2
e V ar(η
it
) = Q, respectivamente. Assume-se que E(η
it
η
i,tj
) = 0 para j > 0. Na
equa¸ao (1.12), y
it
´e a estimativa (direta) para a ´area i no tempo t e θ
it
= x
it
β
it
´e a
quantidade de interesse, modelado como uma combina¸ao linear de vari´aveis concomi-
tantes com coeficientes aleat´orios de tal forma que e
it
= (y
it
θ
it
) ´e o erro amostral.
A nota¸ao ARMA(a, b) define o modelo auto-regressivo de m´edias oveis de ordem
(a, b). O modelo (1.12) leva em considera¸ao as rela¸oes temporais entre as quantidades
14
verdadeiras de cada ´area atrav´es do modelo formulado para os vetores de espa¸cos de
estados e para as autocorrela¸oes entre os erros amostrais. Para alguns casos especiais
do modelo (1.12) e aplica¸oes, ver Pfeffermann (2002).
Na pr´atica, o processo de sele¸ao da amostra freq¨uentemente envolve probabilidades
de sele¸ao desiguais em pelo menos um de seus est´agios. Quando as probabilidades de
sele¸ao ao est˜ao relacionadas aos valores da vari´avel resposta, os modelos alidos
para a popula¸ao permanecem alidos para os dados amostrais e o processo de sele¸ao
po de ser ignorado. Entretanto, se as probabilidades de sele¸ao est˜ao relacionadas
aos valores da vari´avel resposta, mesmo ap´os condicionar nos valores das vari´aveis
explicativas inclu´ıdas no modelo, o desenho amostral torna-se informativo e o modelo
utilizado para os dados amostrais difere daquele da popula¸ao. Ignorar o processo
amostral nestes casos pode resultar em previsores viesados para as caracter´ısticas de
interesse. Como um exemplo de plano amostral informativo, suponha que a resposta
y
ij
em cada unidade j de uma ´area i ´e bin´aria com P (y
ij
= 1) = p. Considere que a
amostra foi selecionada com base nas probabilidades P (j s
i
|y
ij
= k) = π
k
, k = 0, 1.
Aplicando-se o teorema de B ayes, temos P(y
ij
= 1|j s
i
) = π
0
p/[π
0
p+π
1
(1p)] = p
s
.
Claramente, p = p
s
, com exce¸ao do caso em que π
0
= π
1
. Ignorando o plano amostral,
ou seja, considerando π
0
= π
1
significa que ao inferirmos sobre p estaremos inferindo
tamb´em sobre p
s
(Pfeffermann, 2002).
Uma aplica¸ao comum para levar em conta poss´ıveis efeitos de amostragem ´e pon-
derar as medidas amostrais por pesos amostrais, definidos como o inverso das pro-
babilidades de sele¸ao, como no exemplo de Pfeffermann (2002, p. 137). No contexto
de pequenas ´areas, Kott (1989) e Prasad e Rao (1999) apud Pfeffermann (2002) con-
sideraram um modelo em n´ıvel de unidade y
ij
= µ + u
i
+
ij
= θ
i
+
ij
, com u
i
e
ij
normais independentes com edia zero e variˆancias σ
2
u
e σ
2
, respectivamente, propondo
substituir as edias ¯y
i
pelas m´edias ponderadas ¯y
iw
=
n
i
i=1
w
ij
y
ij
/
n
i
i=1
w
ij
como os
estimadores diretos de entrada, onde w
ij
= 1
ij
, com π
ij
= P (j s
i
). Em ambos
os artigos, o previsor
ˆ
θ
i
tem a forma do estimador composto
ˆ
θ
i
= ˆα
i
¯y
iw
+ (1 ˆα
i
)ˆµ
w
onde ˆµ
w
´e a m´edia ponderada das m´edias amostrais ao p onderadas ¯y
i
em Kott (1989)
e a edia ponderada das edias ponderadas ¯y
iw
em Prasad e Rao (1999). Os coefi-
cientes ˆα
i
e o vetor de coeficientes definindo ˆµ
w
ao fun¸oes dos pesos amostrais e dos
estimadores ao ponderados das variˆancias do modelo.
Uma alternativa proposta por Arora e Lahiri (1997) ´e a modelagem das m´edias pon-
15
deradas das ´areas num contexto Bayesiano, utilizando-se Gibbs sampler para obter as
m´edias e variˆancias a posteriori.
´
E poss´ıvel permitir variˆancias diferentes para cada ´area
fazendo k
i
σ
2
i
= V ar(¯y
iw
|θ
i
), atribuindo-se priori σ
2
i
Gamma(a, b). Numa aplica¸ao
com os dados coletados na pesquisa de gastos governamentais, foi observada melhor
performance do estimador HB em compara¸ao ao previsor EBLUP e ao estimador
direto das m´edias ponderadas.
Segundo Pfeffermann (2002, p. 137), ponderar medidas amostrais pelos pesos
amostrais ao protege contra os efeitos de planos amostrais informativos quando so-
mente algumas das ´areas foram selecionadas para amostra. Em rela¸ao a isso, note que
sob os modelos (1.6) e (1.3), os previsores EBLUP e EB para as ´areas ao inclu´ıdas na
amostra ao os estimadores sint´eticos
¯
X
i
ˆ
β
GLS
e ¯x
i
ˆ
β
GLS
, respectivamente. Estes es ti-
madores podem ser severamente viesados se a sele¸ao das ´areas ´e informativa, pois ao
´e necessariamente verdadeiro que E(u
i
|i / s) = 0, uma condi¸ao que valida o uso de
estimadores sint´eticos sob amostragem ao informativa, onde s representa a amostra.
Uma forma diferente de se proteger contra planos informativos ´e basear a inferˆencia
na fun¸ao de densidade de probabilidade (f.d.p.) amostral, definida, para amostragem
com ´unico est´agio de sele¸ao, como
f
s
(y
k
|x
k
) = f(y
k
|x
k
, k s) = P (k s|y
k
, x
k
)f
p
(y
k
|x
k
)/P (k s|x
k
) (1.13)
onde f
p
(y
k
|x
k
) define a f.d.p. populacional. Denote as probabilidades de inclus˜ao
amostral por π
k
= P (k s). Estas probabilidades dependem, em geral, de todos os
valores populacionais de y e x, e possivelmente tamb´em dos valores populacionais das
vari´aveis do desenho usadas para sele¸ao da amostra, mas ao inclu´ıdas no modelo.
Entretanto, considerando os valores populacionais como realiza¸oes aleat´orias sob o
modelo, as probabilidades π
k
ao tamb´em aleat´orias e a f.d.p. em (1.13) pode ser
escrita, alternativamente, como
f
s
(y
k
|x
k
) = E
p
(π
k
|y
k
, x
k
)f
p
(y
k
|x
k
)/E
p
(π
k
|x
k
) (1.14)
Note que E
p
(π
k
|y
k
, x
k
) ao ´e, em geral, o mesmo que π
k
= P (k s) que pode depen-
der de todas as medidas populacionais. Segue de (1.14) que para uma dada popula¸ao, a
f.d.p. amostral ´e completamente especificada por E
p
(π
k
|y
k
, x
k
) = 1/E
s
(w
k
|y
k
, x
k
), onde
E
s
define a esperan¸ca com respeito a distribui¸ao amostral. A esperan¸ca amostral pode
ser identificada e estimada a partir dos dados amostrais e do conhecimento do desenho
amostral. Foi estabelecido que para medi¸oes populacionais independentes, as medidas
16
amostrais ao assintoticamente independentes com respeito a distribui¸ao amostral sob
esquemas amostrais comumente utilizados para sele¸ao com probabilidades desiguais.
A independˆencia assint´otica assume que N , com n permanecendo fixo, onde N
e n ao, respectivamente, os tamanhos da popula¸ao e da amostra.
Considere como exemplo de uso da distribui¸ao amostral em estima¸ao em pequenas
´areas, o modelo de efeito aleat´orio ao n´ıvel de unidade y
ij
= µ + u
i
+
ij
= θ
i
+
ij
. O
correspondente mo delo amostral ´e
f
s
(y
ij
|θ
i
) = E
p
(π
j|i
|y
ij
, θ
i
)f
p
(y
ij
|θ
i
)/E
p
(π
j|i
|θ
i
) (1.15)
f
s
(θ
i
) = E
p
(π
i
|θ
i
)f
p
(θ
i
)/E
p
(π
i
) (1.16)
onde π
j|i
´e a probabilidade de sele¸ao amostral condicional dado que a ´area i est´a
na amostra, π
i
= P (i s) e f
p
(y
ij
|θ
i
) e f
p
(θ
i
) ao as densidades populacionais cor-
respondentes.
´
E poss´ıvel obter os previsores, dependentes do modelo, das edias das
pequenas ´areas, modelando-se as esperan¸cas que definem as distribui¸oes amostrais
em (1.15) e (1.16) a partir dos m´etodos a mencionados. Como exemplo, suponha
que a sele¸ao das ´areas ´e realizada com probabilidades π
i
tais que E
p
(π
i
|θ
i
) = P (i
s) = k exp (a
0
+ a
1
θ
i
) onde k ´e alguma constante e que o processo de amostragem ´e
informativo. Para variˆancias conhecidas (σ
2
u
, σ
2
) os previsores ´otimos EBLUP e HB
das m´edias das pequenas ´areas dentro e fora da amostra ao, respectivamente
ˆ
θ
s,i
= E(θ
i
|i s, y) =
ˆ
θ
i
+ a
1
σ
2
γ
i
ˆ
θ
c,i
= E(θ
i
|i / s, y) =
ˆ
θ
i
a
1
σ
2
γ
i
k exp (a
0
+d
i
)
1k exp (a
0
+d
i
)
(1.17)
onde y denota os dados amostrais, γ
i
= σ
2
u
/(σ
2
u
+ σ
2
/n
i
), d
i
= a
1
ˆ
θ
i
+ (a
2
1
/2)σ
2
γ
2
i
e
ˆ
θ
i
= γ
i
¯y
i
+ (1 γ
i
)¯y ´e o previsor ´otimo sob sele¸ao ao informativa das ´areas. Como
po de ser visto a partir de (1.17), os previsores ´otimos para ´areas dentro da amostra ao
maiores que aqueles sob amostragem ao informativa, pois sob o processo de sele ¸ao
considerado, as ´areas selecionadas tendem a ter edias maiores. Para as ´areas fora
da amostra ocorre o contr´ario: os previsores ao menores que aqueles sob amostragem
ao informativa. Enao o uso de previsores
ˆ
θ
i
que ignoram o processo de amostragem
resultar´a em previs˜oes viesadas.
At´e aqui, estamos supondo que os efeitos aleat´orios das pequenas ´areas ao inde-
pendentes. Seria razo´avel, entretanto, supor que os efeitos relacionados a ´areas con-
sideradas vizinhas fossem correlacionados. A vizinhan¸ca poderia ser determinada por
alguma medida de distˆancia, ao necessariamente geogr´afica, em que as correla¸oes
17
decrescessem `a medida que as distˆancias aumentassem. Considere como exemplo o
”modelo de trabalho” seguinte c om a simplifica¸ao de que n
i
= n
¯y
i
= µ + u
i
+ e
i
= θ
i
+ e
i
; V ar
D
(e
i
) = σ
2
e
/n = σ
2
; V ar(u
i
) = σ
2
u
com (u
i
, e
i
) independentes. Considere σ
2
e σ
2
u
conhecidos e µ desconhecido. Sob este
modelo, o previsor ´otimo da edia da pequena ´area ´e
ˆ
θ
i
= γ ¯y
i
+ (1 γ)¯y; ¯y =
m
i=1
¯y
i
/m; γ = σ
2
u
/(σ
2
u
+ σ
2
). (1.18)
Suponha, agora, que sob o ”modelo correto” Corr(u
i
, u
k
) = ρ > 0, para i = k.
Neste caso, o previsor e o MSE ao dados por
θ
i
= ˜γ¯y
i
+ (1 ˜γ)¯y; ˜γ = [σ
2
u
(1 ρ)]/[σ
2
u
(1 ρ) + σ
2
]
MSE(θ
i
) = ˜γ
2
δ
2
+ (1 ˜γ
2
)[δ
2
+ (m 1)ρσ
2
u
]/m
+(1 2˜γ)σ
2
u
2(1 ˜γ)[σ
2
u
+ (m 1)ρσ
2
u
]/m
(1.19)
onde δ
2
= σ
2
u
+ σ
2
= V ar(¯y
i
). O estimador
ˆ
θ
i
´e ao viesado sob o modelo correto e seu
MSE ´e obtido a partir de (1.19) substituindo-se ˜γ por γ. O limite
lim
m→∞
MSE(θ
i
)/MSE(
ˆ
θ
i
) = [˜γ]/[1 ρ(1 γ)]
decresce para zero quando ρ cresce para um, mostrando que com muitas ´areas e cor-
rela¸oes grandes a perda na eficiˆencia pode ser substancial se utilizamos
ˆ
θ
i
em vez de
θ
i
.
Agora, considere um segundo exemplo igual ao primeiro, exceto pelo fato de que
Corr(u
i
, u
k
) = ρ
|ik|
para representar as verdadeiras correla¸oes entre os efeitos aleat´o-
rios das ´areas. Esta correla¸ao corresponde ao caso em que as m´edias ¯y
i
referem-se a
diferentes pontos no temp o e os efeitos das ´areas seguem um modelo AR(1),
u
i
= ρu
i1
+
i
; V ar(
i
) = σ
2
; V ar(u
i
) = σ
2
u
= σ
2
/(1 ρ
2
). (1.20)
Se i = m temos o ´ultimo ponto do tempo com observoes e o previsor ´otimo de θ
m
´e obtido pela aplica¸ao das equa¸oes recursivas do filtro de Kalman. Para m grande o
MSE do previsor ´otimo ´e dado por
MSE(θ
m
) = {[(1 ρ
2
)
2
δ
4
+ 4σ
2
u
σ
2
ρ
2
(1 ρ
2
)]
1/2
(1 ρ
2
)δ
2
}/2ρ
2
. (1.21)
Como no exemplo anterior, o previsor
ˆ
θ
i
definido por (1.18) ´e ao viesado sob o
modelo (1.20) e quando m , MSE(
ˆ
θ
i
) γσ
2
tanto para o modelo de trabalho
18
quanto para o modelo verdadeiro. A conclus˜ao principal a que se chega com base nesses
exemplos e no estudo que foi feito ´e que a perda na eficiˆencia a partir da utiliza¸ao do
modelo de trabalho ´e pequena, a ao ser que as correla¸oes entre os efeitos aleat´orios
das ´areas se jam grandes. O objetivo do estudo era verificar o quanto se ganhava ao
levar em conta as correla¸oes entre os efeitos aleat´orios (Pfeffermann, 2002).
No que segue, ao apresentados trˆes exemplos de aplica¸oes de mode los em estima¸ao
em pequenas ´areas.
Moura e Holt (1999) propuseram um modelo de m´ultiplos n´ıveis com o objetivo de
fornecer estimativas de pequenas ´areas utilizando dados obtidos a partir de pesquisa
por amostragem. Este modelo constitui-se numa extens˜ao daquele dado por (1.6). O
uso de modelos de m´ultiplos n´ıveis ´e justificado pelo fato desses modelos permitirem a
varia¸ao entre as ´areas a partir de: diferen¸cas na distribui¸ao das vari´aveis no n´ıvel das
unidades; diferen¸cas na distribui¸ao das vari´aveis no n´ıvel das ´areas; e a inclus˜ao de
componentes de variˆancia espec´ıficos de cada ´area para varia¸oes locais que ao podem
ser explicadas por covari´aveis dos n´ıveis de unidade e de ´area. No modelo, todos os
coeficientes de regress˜ao podem variar aleatoriamente entre as pequenas ´areas.
O modelo de m´ultiplos n´ıveis considerado para previs˜ao de edias em pequenas
´areas ´e dado por
Y
i
= X
i
β
i
+
i
β
i
= Z
i
γ + ν
i
, i = 1, . . . , m
(1.22)
onde Y
i
´e o vetor de tamanho n
i
da caracter´ıstica de interesse para as unidades
amostrais da iesima pequena ´area, X
i
´e a matriz de vari´aveis explicativas no n´ıvel
da unidade amostral, Z
i
´e a matriz de planejamento das vari´aveis no n´ıvel das ´areas, γ
´e o vetor de tamanho q de coeficientes fixos e ν
i
= (ν
i0
, . . . , ν
ip
)
´e o vetor de tamanho
(p+1) de efeitos aleat´orios para a i-´esima pequena ´area. Foram assumidas as seguintes
distribui¸oes para os vetores aleat´orios: os ν
i
’s ao independentes entre as pequenas
´areas e em distribui¸ao conjunta tal que E(ν) = 0 e V (ν) = Ω; e os
i
’s ao indepen-
dentes entre si com distribui¸ao conjunta tal que E() = 0 e V () = σ
2
I. Os ν
i
’s e os
i
’s ao considerados independentes.
Uma vantagem do modelo (1.22) ´e a integra¸ao de vari´aveis em n´ıvel de unidade e
de ´area em um ´unico modelo. Al´em disso, o uso de coeficientes de regress˜ao aleat´orios
propicia maior flexibilidade em situa¸oes nas quais ao ´e apropriado considerar que
todas as ´areas possuem a mesma inclina¸ao. O modelo do intercepto aleat´orio ´e um
caso especial daquele dado em (1.22).
19
No artigo, ´e tamb´em apresentado o previsor EBLUP da edia de cada pequena
´area e uma aproxima¸ao para o alculo do MSE. Conclui-se, ap´os a realiza¸ao de com-
para¸oes num´ericas que: os modelos de comp onentes de variˆancia mais complexos que
o de intercepto aleat´orio podem ser ben´eficos; o uso de covari´aveis pode melhorar as
estimativas das pequenas ´areas; e modelos de m´ultiplos n´ıveis podem ser preferidos
em lugar de regress˜oes separadas. Deve-se lembrar que ´e importante avaliar a quali-
dade do ajuste e o diagn´ostico do modelo, uma vez que a aplica¸ao de um modelo de
efeitos mistos em situa¸oes onde sua contribui¸ao para o ajuste ´e baixa, pode produzir
resultados insatisfat´orios no sentido de redu¸ao da variabilidade.
Moura e Migon (2002) apresentam um modelo hier´arquico log´ıstico para previs˜ao
de propor¸oes em pequenas ´areas, levando-se em conta as possibilidades de efeitos
espaciais e heterogeneidade estruturada para efeitos de pequenas ´areas. Al´em disso,
foi proposto um crit´erio de sele¸ao de modelos baseado no Desvio Preditivo Esperado
(EPD). Trabalhou-se com dados do Censo Escolar Brasileiro de Educa¸ao asica para
o Estado do Rio de Janeiro em 1996. Os dados consistem nos graus obtidos por
15288 alunos no exame de matem´atica. Foram consideradas como pequenas ´areas 34
regi˜oes, sendo que em cada uma foi retirada uma amostra de 10% dos estudantes. As
quantidades de interesse eram as propor¸oes de alunos com baixa proficiˆencia em cada
uma das m = 34 regi˜oes. Entende-se como tendo proficiˆencia baixa, o aluno que obt´em
grau D ou menor numa escala de conceitos que varia de A at´e E. A retirada de uma
amostra possibilitava a compara¸ao da estimativa obtida em cada pequena ´area com
o respectivo valor verdadeiro da propor¸ao. A abordagem de estima¸ao em pequenas
´areas apresentada no artigo assume a existˆencia de covari´aveis que podem ser obtidas
para todos os estudantes a partir dos registros das escolas. Assim, o objetivo ´e fazer
inferˆencia sobre a iesima propor¸ao, i = 1, . . . , m, que pode ser escrita como
θ
i
= N
1
i
js
i
y
ij
+
j /s
i
y
ij
onde: y
ij
´e vari´avel bin´aria, indicando se o j-´esimo indiv´ıduo da pequena ´area i possui
a caracter´ıstica de interesse; s
i
´e a amostra da pequena ´area i; N
i
e n
i
ao, respec-
tivamente, o tamanho da popula¸ao e o n´umero de unidades amostradas da iesima
pequena ´area.
Note que a informa¸ao y
ij
´e conhecida somente para as unidades amostrais (j s
i
).
A abordagem consistia em construir um modelo que relacionasse y
ij
ao conjunto de
vari´aveis dispon´ıveis para todas as unidades populacionais. A distribui¸ao a posteriori
20
para cada propor¸ao θ
i
po de ser obtida a partir da distribui¸ao preditiva de y
ij
para
j / s
i
, as unidades ao amostradas. Esta abordagem pode ser vista como um caso
particular de prever observoes em unidades ao investigadas.
Um modelo hier´arquico log´ıstico de dois n´ıveis com estrutura espacial e heterogˆenea
foi considerado para relacionar a resposta y
ij
`as covari´aveis, sendo o segundo n´ıvel a
pequena ´area e o primeiro a unidade amostral.
Assume-se que as vari´aveis aleat´orias y
ij
ao independentes com distribui¸ao de
Bernoulli de parˆametros π
ij
. Al´em disso, dados o vetor de covari´aveis x
ij
= (1, x
1,ij
, . . . ,
x
p,ij
) de dimens˜ao p + 1 e o vetor de parˆametros de regress˜ao β
i
= δ
i
+ φ
i
, enao
log
π
ij
1 π
ij
= x
ij
β
i
onde o vetor δ
i
tem uma dis tribui¸ao a priori ao estruturada, enquanto φ
i
tem uma
priori espacialmente estruturada.
Considera-se que os vetores δ
i
, i = 1, . . . , m ao condicionalmente independentes
dado a edia δ e matriz de precis˜ao e em distribui¸ao δ
i
N(δ,
1
). Al´em disso,
considera-se que o parˆametro δ tem distribui¸ao normal multivariada de dimens˜ao p+1
com m´edia d
0
e matriz de precis˜ao D
0
e que tenha distribui¸ao Wishart de parˆametros
n
e R
. Uma priori refletindo a estrutura espacial do parˆametro φ = (φ
1
, . . . , φ
m
)
´e
dada por
P (φ|Φ) |Φ|
m/2
exp
0.5
m
i,j1
w
ij
(φ
i
φ
j
)
Φ (φ
i
φ
j
)
(1.23)
onde w
ij
ao pesos associados a estrutura de vizinhan¸ca.
A estrutura espacial pode ser representada por diferentes escolhas da fun¸ao peso.
No caso do artigo em quest˜ao, w
ij
= 1 se i e j eram ´areas cont´ıguas e w
ij
= 0, caso
contr´ario. Assim, a equa¸ao (1.23) se reduz para a seguinte representa¸ao equivalente
φ
i
|(φ
k
, k i, Φ) N(
¯
φ
i
, k
1
i
φ
1
)
onde i denota o conjunto de vizinhos da iesima pequena ´area,
¯
φ
i
= k
1
i
ki
φ
k
,
com k
i
sendo o n´umero de vizinhos da iesima pequena ´area. Ao hiperparˆametro Φ
atribuiu-se priori Wishart, com Φ W (n
Φ
, R
Φ
).
O crit´erio de sele¸ao de modelos adotado ´e uma adapta¸ao daquele apresentado
por Gelfand e Gosh (1998), mostrado na se¸ao (3.5), para o contexto de pequenas
´areas. A fun¸ao perda quadr´atica foi escolhida e no caso de estima¸ao de propor¸oes
em pequenas ´areas, sob o modelo l, fica
L(θ
i
, a
l
|¯y
i
) = (θ
i
a
l
)
2
+ k(¯y
i
a
l
)
2
. (1.24)
21
Tomando-se o valor esperado de (1.24), tem-se sob to das as ´areas,
D(k, l) =
m
i=1
σ
2(l)
i
+
k
k + 1
m
i=1
(µ
(l)
i
¯y
i
)
2
(1.25)
onde σ
2(l)
i
= V ar(θ
i
|y(s), l) e µ
(l)
i
= E(θ
i
|y(s), l) ao respectivamente a variˆancia e a
m´edia da distribui¸ao a posteriori de θ
i
sob o modelo l.
Considerando k , obt´em-se a partir de (1.25) a medida de ajuste
D(l) =
m
i=1
σ
2(l)
i
+
m
i=1
(µ
(l)
i
¯y
i
)
2
.
proposta para ajudar a selecionar dentre modelos competitivos no contexto de es-
tima¸ao em pequenas ´areas.
Bernardo e Mu˜noz (1993) ajustaram um modelo dinˆamico linear Bayesiano para
dezesseis regi˜oes do Estado de Valˆencia, Espanha, com o intuito de utilizar toda in-
forma¸ao dispon´ıvel para produzir previs˜oes da evolu¸ao populacional esperada de cada
uma dessas regi˜oes. Os autores utilizaram dados dos censos populacionais entre 1900
e 1991, sendo de periodicidade decenal de 1900 a 1960, q¨uinq¨uenal de 1960 a 1975
e de 1981 a 1991. Al´em dessas informa¸oes, dispunham dos totais de nascimentos e
mortes entre 1965 e 1990, sendo que no per´ıodo de 1965 a 1979 e para 1989 e 1990,
esses totais estavam dispon´ıveis somente para trˆes prov´ıncias que compunham o Es-
tado de Valˆencia, ao desagregados para as regi˜oes em estudo. ao havia informa¸oes
confi´aveis para migra¸oes. O modelo proposto considerava a varia¸ao populacional
decomposta em suas componentes de nascimentos, mortes e migra¸oes. Al´em disso,
tornava poss´ıvel a incorpora¸ao seq¨uencial de toda informa¸ao dispon´ıvel.
Para entender o modelo de Bernardo e Mu˜noz (1993), primeiro considere p
it
a po-
pula¸ao obtida a partir de um censo ou pesquisa por amostragem para a regi˜ao i, no
tempo t. O verdadeiro tamanho p opulacional, π
it
, ´e seq¨uencialmente atualizado com os
valores verdadeiros totais de nascimentos, β
it
, e de mortes, δ
it
, e dos saldos migrat´orios
verdadeiros totais, µ
it
. Quando dispon´ıveis, os valores observados correspondentes ao
b
it
, d
it
e m
it
, respectivamente, com erros de observao dados por τ
it
. Ent˜ao, para
cada regi˜ao i, a evolu¸ao populacional pode ser modelada pelas seguintes equa¸oes de
observoes
p
it
= π
it
+ τ
pit
b
it
= β
it
+ τ
bit
d
it
= δ
it
+ τ
dit
m
it
= µ
it
+ τ
mit
22
e equa¸oes do sistema
π
it
= π
i,t1
+ β
i,t1
δ
i,t1
+ µ
i,t1
+ ω
πit
β
it
= β
i,t1
+ ω
βit
δ
it
= δ
i,t1
+ ω
δit
µ
it
= µ
i,t1
+ ω
µit
onde os τ ’s e os ω’s ao independentes e normalmente distribu´ıdos com edia zero e
variˆancias seq¨uencialmente estimadas utilizando as equa¸oes de atualiza¸ao do modelo
dinˆamico linear que podem ser vistas em West e Harrison (1997).
As equa¸oes de observoes, acima, podem ser reescritas na forma matricial como
p
it
b
it
d
it
m
it
=
f
pit
0 0 0
0 f
bit
0 0
0 0 f
bit
0
0 0 0 f
mit
π
it
β
it
δ
it
µ
it
+
τ
pit
τ
bit
τ
dit
τ
mit
onde f
pit
, f
bit
, f
dit
e f
mit
ao zero, ou um, dependendo da disponibilidade da observao
correspondente, no temp o t. Ass im, as equa¸oes tomam a forma
y
it
= F
it
θ
it
+ τ
it
onde F
it
´e a matriz identidade de ordem 4 se todas as observoes da ´area i estiverem
dispon´ıveis no tempo t,
y
it
=
p
it
b
it
d
it
m
it
e θ
it
=
π
it
β
it
δ
it
µ
it
.
Analogamente, as equa¸oes do sistema podem ser escritas da seguinte forma:
π
it
β
it
δ
it
µ
it
=
1 1 1 1
0 1 0 0
0 0 1 0
0 0 0 1
π
i,t1
β
i,t1
δ
i,t1
µ
i,t1
+
ω
πit
ω
βit
ω
δit
ω
µit
ou
θ
it
= G
θ
i,t1
+ ω
it
.
Enao para a ´area i, temos o seguinte modelo dinˆamico
y
it
= F
it
θ
it
+ τ
it
τ
it
N
4
(0, V
it
)
θ
it
= G
θ
i,t1
+ ω
it
ω
t
N
4
(0, W
t
)
,
23
ou
y
it
|θ
it
, V
it
N
4
(F
it
θ
it
, V
it
)
θ
it
|θ
i,t1
, W
it
N
4
(G
θ
i,t1
, W
it
)
onde y
it
condicional a θ
it
´e independente de y
ik
dado θ
ik
para t = k.
Podemos reunir to das as ´areas fazendo
y
t
= F
t
θ
t
+ τ
t
, τ
t
N
4m
(0, V
t
)
θ
t
=
t1
+ ω
t
, ω
t
N
4
(0, W
t
)
onde F
t
´e uma matriz bloco diagonal cujos blocos ao F
1t
,..., F
mt
, com m igual ao
n´umero de regi˜oes sob estudo, θ
t
= (θ
1t
, ..., θ
mt
)
T
, τ
t
= (τ
1t
, ..., τ
mt
)
T
e G ´e matriz bloco
diagonal cujos blocos ao iguais a G
=
1 1 1 1
0 1 0 0
0 0 1 0
0 0 0 1
.
Para algumas ´areas i, no tempo t, os valores de p
it
, b
it
, d
it
e m
it
po dem ao estar
dispon´ıveis ou, para um dado tempo t, podemos ter somente a informa¸ao agregada
para o conjunto das ´areas. Essa informa¸ao pode ser incorporada facilmente ao modelo,
modificando-se a matriz F
t
e o vetor y
t
, apropriadamente. Por exemplo, suponha que
o saldo das migra¸oes esteja dispon´ıvel somente de forma agregada e m = 2. Ent˜ao y
t
e F
t
ao dados por
y
t
=
p
1
b
1
d
1
.
.
.
p
m
b
m
d
m
m
i
t
e F
t
=
1 0 0 0 . . . 0 0 0 0
0 1 0 0 . . . 0 0 0 0
0 0 1 0 . . . 0 0 0 0
.
.
.
0 0 0 0 . . . 1 0 0 0
0 0 0 0 . . . 0 1 0 0
0 0 0 0 . . . 0 0 1 0
0 0 0 1 . . . 0 0 0 1
.
Supondo que as matrizes de variˆancias V
t
e W
t
ao conhecidas, a distribui¸ao a
posteriori de θ
t
´e obtida utilizando as equac¸oes de atualiza¸ao. Bernardo e Mu˜noz
(1993) obtiveram a posteriori considerando as variˆancias V
t
e W
t
conhecidas.
24
1.2 T´ecnicas de proje¸ao populacional
A necessidade de conhecer as caracter´ısticas demogr´aficas de uma popula¸ao, assim
como prever a sua evolu¸ao futura, justificam a elab ora¸ao de proje¸oes demogr´aficas.
Estimativas e proje¸oes de popula¸ao auxiliam a tomada de decis˜ao de administradores
p´ublicos e privados quando necessitam definir oes de interesse da sociedade.
Segundo Waldvogel (1997), as metodologias de proje¸oes demogr´aficas poderiam
constituir dois grandes grupos, os quais ao: M´etodos de Extrapola¸ao Matem´atica
e eto dos dos Componentes Demogr´aficos. O primeiro grupo compreende modelos
de proje¸ao que procuram rela¸ao entre o tamanho da popula¸ao e o tempo, en-
quanto o segundo grupo engloba modelos que procuram relacionar o tamanho e a
composi¸ao da popula¸ao com o comportamento das vari´aveis demogr´aficas fecundi-
dade, mortalidade e migra¸ao atrav´es do tempo. Na classe de modelos de extrapola¸ao
matem´atica, o objetivo ´e obter uma fun¸ao matem´atica que se ajuste `a evolu¸ao do
tamanho populacional atrav´es do tempo. Esses modelos se sustentam na suposi¸ao de
que a tendˆencia da popula¸ao observada no passado permanecer´a alida no futuro. As
fun¸oes matem´aticas mais utilizadas para descrever o comportamento da popula¸ao
ao as lineares, geom´etricas ou exponenciais e as log´ısticas. ”Enquanto a fun¸ao linear
sup˜oe um total constante de aumento ou de decr´escimo da popula¸ao, a geom´etrica e
a exponencial presumem uma porcentagem constante de aumento ou de diminui¸ao.
a a curva log´ıstica ´e um tipo especial de extrapola¸ao de tendˆencia que possui duas
ass´ıntotas: uma inferior e outra superior, supondo que a popula¸ao, em um primeiro
momento, apresentar´a uma evolu¸ao acelerada e, posteriormente, sofrer´a uma redu¸ao
em seu ritmo de crescimento at´e se aproximar de um limite” (Waldvogel p. 14, 1997).
Dentre os m´etodos de extrapola¸ao matem´atica para projetar popula¸oes de pequenas
´areas ´e poss´ıvel citar o m´etodo dos coeficientes (IBGE, 2002a).
Segue uma revis˜ao das ecnicas mais conhecidas para proje¸ao populacional.
1.2.1 M´etodo das componentes demogr´aficas
O etodo comumente utilizado para realizar proje¸oes populacionais de ´areas maiores
´e o etodo das componentes demogr´aficas, o qual incorpora informa¸oes relativas `as
tendˆencias da mortalidade, da fecundidade e da migra¸ao para uma ´area considerada.
O etodo das componentes demogr´aficas ´e amplamente aceito por ser um processo
de proje¸ao que se adapta aos prop´ositos de fornecer, ao o o volume e ritmo de
25
crescimento da popula¸ao total, como tamb´em das vari´aveis que comp˜oem a dinˆamica
demogr´afica, avaliando seu comportamento no passado e no presente e formulando
hip´oteses sobre sua atua¸ao no futuro. Neste m´etodo ´e necess´ario que sejam produzidas
estimativas e proje¸oes dos n´ıveis e padr˜oes de cada uma das componentes.
O m´etodo consiste em dividir a popula¸ao inicial em grupos homogˆeneos q¨uinq¨ue-
nais de idade e sexo, que pela influˆencia das vari´aveis fecundidade, mortalidade e
migra¸ao, resulta na popula¸ao do q¨uinq¨enio seguinte, a qual ser´a a popula¸ao inicial
do per´ıodo posterior (CODEPLAN e IBGE, 1999). Vale ressaltar que uma proje¸ao
populacional elaborada pelo etodo das componentes proporciona, aos formuladores de
pol´ıticas p´ublicas, subs´ıdios para a aplica¸ao dessas oes em se guimentos populacionais
espec´ıficos, tais como crian¸cas em idade escolar e idosos.
O m´etodo das componentes demogr´aficas para projetar as popula¸oes por sexo e
idade tem sua origem na equa¸ao de balan¸co ou equa¸ao de equil´ıbrio populacional,
cuja express˜ao pode ser escrita da seguinte forma (Brass, 1975):
P (t + n) = P (t) + B(t, t + n) D(t + n) + M(t + n)
onde:
P (t + n) ´e a popula¸ao no ano t + n;
P (t) ´e a popula¸ao no ano t;
B(t, t + n) ´e o umero de nascimentos ocorridos entre t e t + n;
D(t, t + n) ´e o n´umero de ´obitos ocorridos entre t e t + n;
M(t, t + n) ´e o saldo migrat´orio entre t e t + n;
t ´e o tempo inicial da proje¸ao; e
n ´e o intervalo projetado.
A equa¸ao de balan¸co mostra como as componentes demogr´aficas interferem na po-
pula¸ao futura. A fecundidade gera entradas na popula¸ao atrav´es dos nascimentos, a
mortalidade gera sa´ıdas atrav´es de ´obitos e a migra¸ao estabelece entradas ou sa´ıdas
dependendo do sinal do saldo migrat´orio no per´ıodo. O m´etodo ´e tamb´em conhecido
como ”das coortes de sobreviventes”. A utiliza¸ao da metodologia requer informa¸oes
sobre a evolu¸ao dessas vari´aveis demogr´aficas que atuam sobre a dinˆamica da po-
pula¸ao, possibilitando a constru¸ao de hip´oteses sobre o seu comportamento no futuro
e as conseq¨uentes varia¸oes populacionais ao longo do tempo.
26
Para se elaborar a proje¸ao de uma popula¸ao para o q¨uinq¨enio seguinte pelo
M´etodo dos Componentes Demogr´aficas, toma-se a popula¸ao base dividida por sexo e
faixas et´arias q¨uinq¨uenais. Considere P
t
x
a popula¸ao do grupo q¨uinq¨uenal x no tempo
t e S
t
x
a propor¸ao de pessoas sobreviventes no per´ıodo, pertencentes ao grupo x. O
grupo q¨uinq¨uenal x ser´a, em cinco anos, o grupo q¨uinq¨uenal x + 5 cuja popula¸ao ´e
dada por
P
t+5
x+5
= P
t
x
S
t
x
+ M
t
x
onde M
t
x
´e o saldo migrat´orio da faixa et´aria.
Enao a estimativa das popula¸oes futuras das coortes hoje existentes pode ser
obtida estimando-se a propor¸ao de sobreviventes com base nas tendˆencias futuras
da fecundidade e da mortalidade, acrescentando-se o saldo migrat´orio estimado no
per´ıodo. Cada um desses grupos et´arios resultante passar´a a constituir a faixa et´aria
imediatamente superior, ao final de cada per´ıodo q¨uinq¨uenal projetado. Aqueles que
nascer˜ao no per´ıodo e que sobreviver˜ao at´e o seu final constituir˜ao uma nova coorte.
A proje¸ao de uma popula¸ao depende, portanto, da capacidade de prever a evolu¸ao
e a intera¸ao entre os trˆes componentes demogr´aficos: fecundidade, mortalidade e
migra¸ao.
O etodo deve ser aplicado distintamente para cada sexo. Na determina¸ao das
popula¸oes de partida das proje¸oes, leva-se em considera¸ao as s eguintes informa¸oes
obtidas atraes do Censo Demogr´afico mais recente: as estruturas et´arias, por sexo, das
popula¸oes residentes enumeradas; os n´ıveis e padr˜oes de fecundidade e mortalidade
estimados; e os saldos migrat´orios anuais.
Para projetar o n´ıvel da mortalidade, primeiro constr´oi-se abuas de mortalidade
com informa¸oes provenientes de censos e de registros oficiais contendo estat´ısticas
vitais, como aquelas referentes `a mortalidade fornecidas pelo Registro Civil ou pelo
SIM. Em CODEPLAN e IBGE (1999), utilizou-se os dados do Registro Civil, aplicando-
se fatores de corre¸ao no n´umero de ´obitos devido `a existˆencia de subnotifica¸ao. Uma
metodologia para projetar o n´ıvel da mortalidade atrav´es da esperan¸ca de vida ao
nascer foi tamb´em utilizada. Ap´os a identifica¸ao de como seria a evolu¸ao futura
do n´ıvel da mortalidade, s eparadamente por sexo, utilizou-se uma curva da forma
e
0
(t) = exp(a + b/t
2
) para representar a evolu¸ao da esperan¸ca de vida ao nascer.
Na mesma referˆencia, a an´alise do comportamento futuro da fecundidade consistiu em
avaliar, primeiramente, a tendˆencia no n´ıvel da fecundidade, anualmente, calculando-
27
se as Taxas de Fecundidade Total (TFT). Adotou-se a seguinte fun¸ao log´ıstica para
representar a evolu¸ao da TFT:
T F T(t) = k
1
+
k
2
k
1
1 + e
a+bt
onde k
1
e k
2
ao as ass´ıntotas inferior e superior, respectivamente, a e b ao parˆametros
estimados por m´ınimos quadrados e t ´e o tempo.
O saldo migrat´orio ´e normalmente obtido de forma direta, a partir de uma per-
gunta espec´ıfica do question´ario do Censo Demogr´afico ou da Contagem Populacional,
indagando qual o lugar de residˆencia anterior numa data fixa.
As estimativas das fun¸oes de fecundidade, mortalidade e migra¸ao ao mais pre-
cisas quando realizadas para ´areas maiores, pois nestas regi˜oes ´e poss´ıvel encontrar in-
forma¸oes mais detalhadas, tal como ´obitos por idade e se xo, que auxiliam a formula¸ao
de hip´oteses para as fun¸oes das trˆes vari´aveis demogr´aficas. Waldvogel (1997) cita um
procedimento de adapta¸ao do m´etodo dos componentes em p equenas ´areas: o m´etodo
dos parˆametros demogr´aficos proporcionais. O princ´ıpio do etodo fundamenta-se na
id´eia de considerar a participa¸ao de cada ´area menor no comportamento dos compo-
nentes demogr´aficos da ´area maior, ou seja, estimar a participa¸ao proporcional das
sub´areas nas fun¸oes de fecundidade, mortalidade e migra¸ao estimadas da ´area maior.
Enao ao obtidos os componentes proporcionais para as ´areas menores, permitindo
a utiliza¸ao do etodo das componentes. Sup˜oe-s e que a tendˆencia esperada para a
regi˜ao como um todo seja resultante das tendˆencias espec´ıficas de cada ´area menor. As
´unicas informa¸oes requeridas das ´areas maiores para a implementa¸ao do m´etodo ao:
total de nascidos vivos, taxa de mortalidade infantil ou n´umero total de ´obitos gerais,
saldo migrat´orio total e popula¸ao por idade e sexo.
Freire e Assun¸ao (2002) aplicaram uma abordagem Bayesiana, levando-se em con-
sidera¸ao a configura¸ao espacial das taxas de fecundidade total, de mortalidade in-
fantil e l´ıquida de migra¸ao. O objetivo era diminuir a variabilidade dessas taxas e
enao incorporar suas medidas suavizadas ao m´etodo das componentes demogr´aficas
proporcionais para realizar a proje¸ao p opulacional de cada pequena ´area.
1.2.2 M´etodo dos coeficientes
O m´etodo conhecido como etodo dos coeficientes ou A
i
B
i
´e utilizado para estimar
popula¸oes de ´areas menores em rela¸ao `a uma ´area maior. O m´etodo foi introduzido,
no Brasil, por Madeira e Sim˜oes (1972) e c onsiste em subdividir uma ´area maior, para
28
a qual a existe uma estimativa populacional, em n ´areas menores de tal maneira que
se reproduza a estimativa da ´area maior atrav´es da soma das estimativas das ´areas
menores. Considere P
i
(t), i = 1, . . . , n, a popula¸ao estimada da pequena ´area i, no
tempo t e P (t) a popula¸ao estimada da ´area maior. Devemos ter
P (t) =
n
t=1
P
i
(t).
Suponha que a popula¸ao da pequena ´area i, P
i
(t), se relacione com a popula¸ao da
´area maior, seguindo a equa¸ao
P
i
(t) = a
i
P (t) + b
i
(1.26)
onde a
i
´e denominado coeficiente de proporcionalidade do incremento da popula¸ao da
pequena ´area i em rela¸ao ao incremento da popula¸ao da ´area maior e b
i
´e o coeficiente
linear de corre¸ao. A partir da equa¸ao (1.26), temos que o m´etodo dos coeficientes
projeta a popula¸ao das ´areas menores, supondo que estas sigam a tendˆencia de cresci-
mento da ´area maior. Para obter os coeficientes a
i
e b
i
, considere t
1
e t
2
as datas de
referˆencia de dois censos demogr´aficos. Substituindo as respectivas popula¸oes da ´area
maior e da pequena ´area, para os tempos t
1
e t
2
na equa¸ao (1.26), tem-se que
P
i
(t
1
) = a
i
P (t
1
) + b
i
P
i
(t
2
) = a
i
P (t
2
) + b
i
.
Resolvendo o sistema de equa¸oes, obt´em-se
a
i
=
P
i
(t
2
) P
i
(t
1
)
P (t
2
) P (t
1
)
e b
i
= P
i
(t
1
) a
i
P
i
(t
1
).
O etodo dos coeficientes possui algumas limita¸oes. Ele pode gerar proje¸oes de
a qualidade quando existe diferen¸ca grande entre a tendˆencia de crescimento da ´area
maior e da pequena ´area. Como Waldvogel (p. 16, 1997) afirma: ”Primeiramente,
ao pode s er aplicado a sub´areas onde o sinal de crescimento populacional (positivo ou
negativo) for diferente daquele referente `a ´area maior como um todo. Em segundo lugar,
tamb´em ao pode ser utilizado se a dire¸ao do crescimento da ´area maior, no per´ıodo
da proje¸ao, diferir daquela correspondente ao per´ıodo base. Caso estas condi¸oes ao
sejam cumpridas, poder˜ao surgir inconsistˆencias como, por exemplo, a ocorrˆencia de
popula¸oes negativas quando a ´area maior cresce a taxas positivas e a sub´area a taxas
negativas e vice-versa.”
29
1.2.3 M´etodo de rela¸ao de coortes
Outro m´etodo conhecido para projetar popula¸ao de pequenas ´areas ´e o etodo de
rela¸ao de coortes. Assim como no m´etodo A
i
B
i
, ´e preciso que exista uma estimativa
confi´avel da popula¸ao da ´area maior. Essa estimativa ´e normalmente f ornecida pelo
m´etodo das componentes demogr´aficas. No etodo de rela¸ao de coortes, sup˜oe-se
que o comportamento m´edio das ´areas menores reflita o da ´area maior, utilizando um
fator que leva em considera¸ao a discrepˆancia entre as ´areas menor e maior. O etodo
considera o crescimento temporal das coortes q¨uinq¨uenais da ´area maior. Al´em disso,
a estrutura da popula¸ao por idade e sexo deve ser conhecida e completamente obtida
a partir dos dois Censos Demogr´aficos mais recentes. A proje¸ao das ´areas menores
deve ser feita separadamente para cada sexo.
Sup˜oe-se, primeiramente, que a popula¸ao da ´area maior tenha sido estimada por
algum m´etodo demogr´afico, comumente o m´etodo das componentes, para gerar a estru-
tura populacional da ´area maior nos anos de interesse. Com base na nota¸ao utilizada
em Assun¸ao (2001), seja
5
R
t
x
a popula¸ao do grupo q¨uinq¨uenal [x, x + 5] de um dado
sexo, no ano t e
5
R
t+5
x+5
a popula¸ao com idade no intervalo [x + 5, x + 10] no ano t + 5.
A raz˜ao entre esses dois valores fornece um coeficiente de crescimento, CR, de cada
coorte e sexo
5
CR
t+5
x
=
5
R
t+5
x+5
5
R
t
x
.
Para a ´area i, i = 1, . . . , n onde n ´e o n´umero de pequenas ´areas contidas na
´area maior, a popula¸ao no grupo de idade [x, x + 5] ´e representada por
5
N
t
x
(i). Se
supusermos que o crescimento por coorte ´e idˆentico para todas as ´areas, a proje¸ao da
pequena ´area i, exceto para o grupo de 0 a 5 anos, seria dada por
5
N
t+5
x+5
(i) =
5
CR
t,t+5
x
5
N
t
x
(i) (1.27)
garantindo que a soma das proje¸oes sobre todas as ´areas de uma dada coorte seria
igual ao valor projetado da popula¸ao da ´area maior.
No entanto, as pequenas ´areas podem diferir entre si e m cada coorte. Para que
este fato seja levado em considera¸ao, aplica-se um fator de crescimento diferenciado,
multiplicativo, K, para corrigir ou ajustar a equa¸ao (1.27), como na seguinte equa¸ao
5
N
t+5
x+5
(i) =
5
K
x
(i)
5
CR
t,t+5
x
5
N
t
x
(i) (1.28)
onde
5
K
x
(i) ´e o fator de corre¸ao da ´area i. O fator de corre¸ao ´e obtido comparando-
se a varia¸ao temporal de uma coorte na ´area menor com a varia¸ao dessa coorte
30
considerando a ´area maior, sendo definido a partir das popula¸oes encontradas em dois
censos demogr´aficos, como segue
5
K
x
(i) =
5
N
t
2
x+5
(i)
5
N
t
1
x
(i)
/
5
R
t
2
x+5
5
R
t
1
x
onde t
1
t
2
ao as datas de realiza¸ao dos censos.
O valor de K vai variar em torno de um. Um valor de K inferior a um indicar´a
crescimento da pequena ´area menor do que o crescimento da ´area maior, enquanto que
um valor superior a um indicar´a um crescimento da pequena ´area mais acelerado do
que o da ´area maior. O coeficiente de crescimento projetado CR
t+5
x
da ´area maior ´e
modificado de acordo com o fator de crescimento local (de cada ´area) baseado nos dois
censos mais recentes dispon´ıveis. Note que o fator K de uma coorte da ´area menor ´e um
valor calculado usando as estruturas populacionais, por faixa et´aria e sexo, existentes
nos censos e que ele ao varia ao longo do tempo. a, tamb´em, a possibilidade de
permitir que K varie ao longo do processo de proje¸ao populacional, em cada coorte.
Na ormula do fator K, as faixas et´arias para as quais as proje¸oes ao realizadas,
devem ter um n´umero de anos igual ao n´umero de anos entre as estruturas populacionais
conhecidas, ou seja, igual a distˆancia entre os censos. No caso de grupos q¨uinq¨uenais,
os anos com estruturas conhecidas devem ter cinco anos de distˆancia temporal, da´ı
o uso de t e t + 5. Por´em, na maioria das situa¸oes as estruturas populacionais ao
obtidas a partir de censos demogr´aficos que se realizam de dez em dez anos, o que torna
necess´aria uma corre¸ao nas ormulas anteriormente apresentadas. Para a popula¸ao
masculina de menores de cinco anos, considere a ormula
5
N
t+5
0
(i) = K
0
(i)
5
P
t,t+5
b
B
t,t+5
(i)(IMN)
onde B
t,t+5
(i) ´e o n´umero de nascimentos ocorridos na pequena ´area i entre os anos t
e t + 5, P
t,t+5
b
´e a raz˜ao de sobrevivˆencia masculina ao nascimento da ´area maior no
per´ıodo t e t + 5, IMN ´e o ´ındice de masculinidade ao nascimento e K
0
(i) ´e o fator de
crescimento diferencial dos nascimentos estimados para cada ´area menor e dado por
5
K
0
(i). A popula¸ao feminina tem ormula an´aloga. A ormula para a popula¸ao de
80 anos e mais ´e dada por
N
t+5
80+
(i) = K
75+
(i)CR
t,t+5
75+
N
t
75+
(i)
onde CR
t,t+5
75+
= R
t+5
80+
R
t
75+
.
A soma das popula¸oes projetadas das ´areas menores deve ser igual `a popula¸ao
31
projetada da ´area maior. Para que isto seja garantido, faz-se um rateio das estimativas
das pequenas ´areas.
Em Assun¸ao (2001), ´e feita uma decomposi¸ao da variabilidade dos fatores K como
sendo a soma das parcelas associadas `as faixas et´arias, `as pequenas ´areas e mais um
erro aleat´orio com variˆancia dependente do tamanho populacional da pequena ´area.
Foi considerado um modelo em que o efeito de ´area ´e espacialmente estruturado.
Uma dificuldade encontrada na utiliza¸ao do fator K ocorre quando ao ermino do
alculo dos fatores K de cada ´area menor ao identificados valores extremos causados
por crescimento ou perdas muito elevadas de popula¸ao. O uso desses fatores extremos
nas proje¸oes poderia perpetuar as tendˆencias de crescimento ou perdas elevadas, a
que as proje¸oes tomam como base o ritmo de crescimento anterior. O efeito em al-
gumas ´areas, dependendo do horizonte de proje¸ao poderia levar a aumento brusco de
popula¸ao, em caso de crescimento elevado, ou `a popula¸ao tendendo a zero, em caso
de perdas acentuadas. Para evitar situa¸oes desse tipo, aplica-se um fator redutor ou
multiplicador no fator K, normalmente uma fun¸ao de K. A aplica¸ao de altera¸oes
no fator K depende da identifica¸ao dos valores de K extremos, os quais ao definidos
arbitrando-se dois pontos de corte. A escolha destes pontos de corte ´e bastante dis-
cutida, principalmente porque pode sofrer influˆencias subjetivas e sabe-se que deve
ser levado em considera¸ao o conhecimento da pequena ´area, evitando-se interferˆencias
subjetivas amparadas em interesses econˆomicos e/ou pol´ıticos.
´
Areas de cria¸ao recente
e as ´areas desmembradas constituem-se em exemplos onde podemos obter fatores K
considerados incoerentes ou extremos (Assun¸ao, 2001).
32
Cap´ıtulo 2
Fontes de Dados Demogr´aficos
No presente trabalho ao apresentados, sobretudo na revis˜ao da literatura, m´etodos
de estima¸ao que fazem uso de dados censit´arios, de registros administrativos e de
pesquisas por amostragem. Torna-se necess´aria uma descri¸ao de exemplos de fontes
de dados utilizadas por essas ecnicas, tendo em vista que o ponto de partida de
uma pesquisa demogr´afica ´e saber onde e em que forma os dados necess´arios ser˜ao
encontrados, tomando precau¸oes na sua manipula¸ao, avaliando a qualidade e a com-
patibilidade das fontes utilizadas. Aqui, faz-se uma breve descri¸ao das fontes de
dados demogr´aficos utilizadas na literatura e neste trabalho, seus principais problemas
e limita¸oes. Algumas dessas fontes de dados podem ser vistas com mais detalhes em
Hakkert (1996).
Os dados utilizados neste trabalho ao provenientes dos censos demogr´aficos de 1991
e 2000, da contagem populacional de 1996 e da Pesquisa Nacional por Amostra de
Domic´ılios (PNAD). Neste cap´ıtulo, destacam-se as apresenta¸oes do plano amostral
da P NAD e de um estimador do tamanho populacional derivado diretamente deste
plano.
2.1 Censo Demogr´afico
´
E o principal instrumento para se obter dados de popula¸ao, caracterizando-se como
o processo total de coleta, processamento, avalia¸ao, an´alise e divulga¸ao de dados
demogr´aficos, econˆomicos e sociais referentes a todas as pessoas dentro de uma regi˜ao
territorial pr´e-fixada, num momento espec´ıfico. O censo ocorre com respaldo legal,
tendo uma data de referˆencia pr´e-estabelecida a qual toda enumera¸ao deve remeter-
se.
´
E realizada a enumera¸ao individual de todas as pessoas, evitando-se qualquer
33
referˆencia a finalidades fiscais ou militares para que a qualidade da informa¸ao ao
seja comprometida, resguardando-se sempre o sigilo. Os resultados do censo devem
estar dispon´ıveis dentro de prazos compat´ıveis com as aplica¸oes previstas.
O Censo Demogr´afico caracteriza-se por ser a ´unica pesquisa domiciliar capaz de
abranger a totalidade da popula¸ao, independente do n´ıvel de desagrega¸ao. Outro
aspecto relevante em rela¸ao ao censo diz respeito aos quantitativos e estimativas
de popula¸ao, na me dida em que fornece as tendˆencias e parˆametros demogr´aficos
necess´arios `a elabora¸ao de estimativas e proje¸oes populacionais, em diversos n´ıveis
de desagrega¸ao, que orientam as pol´ıticas p´ublicas. A partir dessas estimativas, o
IBGE fornece os elementos necess´arios a defini¸ao dos Fundos de Participa¸ao dos Mu-
nic´ıpios por for¸ca de lei do Tribunal de Contas da Uni˜ao. Al´em disso, quando essas
estimativas ao realizadas por sexo e faixas et´arias ´e poss´ıvel definir a popula¸ao alvo de
diversos programas sociais, tais como aqueles realizados nas ´areas de sa´ude e educa¸ao.
O censo compreende basicamente trˆes etapas: o pr´e-recenseamento, o recenseamento
e o os-recenseamento. O pr´e-recenseamento consiste na cria¸ao de condi¸oes para a
realiza¸ao da coleta de dados, tais como o levantamento cartogr´afico, o recrutamento
e o treinamento dos entrevistadores e a defini¸ao do question´ario. O recenseamento
consiste no trabalho de campo. O os-recenseamento compreende as fases de supervis˜ao
e cr´ıtica (para verificar inconsistˆencias e omiss˜oes), o processamento e a divulga¸ao.
A viabilidade pr´atica ´e, muitas vezes, uma barreira a divulga¸ao de informa¸oes
em n´ıvel mais desagregado, fazendo com que as unidades menores tenham, somente,
divulgadas suas caracter´ısticas demogr´aficas principais, enquanto as informa¸oes mais
espec´ıficas ao disponibilizadas para unidades mais abrangentes, como ´e o caso das
migra¸oes.
As informa¸oes censit´arias consideradas essenciais ao:
(a) Nome e sobrenome;
(b) Idade e sexo;
(c) Rela¸ao de parentesco com o chefe do domic´ılio ou da fam´ılia;
(d) Estado civil;
(e) Ocupa¸ao e demais caracter´ısticas econˆomicas;
(f) Alfabetiza¸ao e demais caracter´ısticas educacionais;
34
(g) Lugar de nascimento e/ou nacionalidade; e
(h) Residˆencia habitual ou lugar de enumera¸ao.
No Brasil, o censo ´e realizado com base em dois question´arios: o asico e o da
amostra. O primeiro ´e aplicado a todos os domic´ılios (e seus moradores), ao seleciona-
dos para a amostra e cont´em perguntas asicas que s er˜ao feitas a cada indiv´ıduo da
popula¸ao. O segundo cont´em quest˜oes mais espec´ıficas para investigar determinadas
caracter´ısticas populacionais, tais como a fecundidade e a migra¸ao, sendo apresen-
tado `aquelas pessoas moradoras dos domic´ılios selecionados para a amostra. Como
essas caracter´ısticas mais detalhadas ao investigadas apenas para uma parcela da
popula¸ao, componentes da dinˆamica populacional ou outras vari´aveis investigadas no
question´ario da amostra ao divulgadas somente sob a forma de estimativas. Para cada
munic´ıpio, uma amostra ´e obtida, respeitando-se a fra¸ao amostral estabelecida. Nos
Censos Demogr´aficos de 1991 e 2000 foram adotadas duas fra¸oes amostrais: de 20%
dos domic´ılios para munic´ıpios com at´e 15000 habitantes e de 10% dos domic´ılios para
os demais munic´ıpios. O n´umero de habitantes ´e medido como fun¸ao da popula¸ao
projetada para a data de referˆencia do censo. Os domic´ılios ao selecionados siste-
maticamente em cada setor censit´ario. Os setores censit´arios ao parti¸oes geogr´aficas
definidas de forma que seus limites respeitem as divis˜oes internas dos munic´ıpios em
zonas urbanas e rurais, e em distritos e subdistritos, caso existam. O setor censit´ario
´e planejado de forma que um entrevistador consiga realizar a opera¸ao de coleta no
per´ıodo de realiza¸ao do Censo. Mais detalhes em Bianchini e Albieri (2003).
Os erros mais comuns encontrados nos censos ao os de subenumera¸ao, superenu-
mera¸ao e classifica¸ao errˆonea. O erro de subenumera¸ao surge, normalmente, quando
uma parcela da popula¸ao ao ´e contada, ou por falhas na organiza¸ao do censo ou
por vontade pr´opria, como ´e o caso de imigrantes clandestinos. Erros como este podem
ser verificados a partir de um levantamento amostral os-censit´ario, denominado de
pesquisa de avalia¸ao da cobertura da coleta. Com esta pesquisa ´e p oss´ıve l quantificar
o erro de cobertura do censo demogr´afico. A superenumera¸ao ocorre quando certos
indiv´ıduos ao enumerados mais de uma vez. Os erros de classifica¸ao podem ocorrer
devido a, por exemplo, a declara¸ao da idade, subdeclara¸ao de renda, omiss˜ao de
filhos por parte de ae solteira etc.
35
2.2 Registro Civil
O Registro Civil visa acompanhar as ocorrˆencias de eventos que modificam o tamanho
ou a composi¸ao da popula¸ao ao longo do tempo. A unidade de enumera¸ao do
Registro Civil ´e, portanto, o evento demogr´afico, enquanto a unidade do Censo De-
mogr´afico ´e o indiv´ıduo. Al´em de suas finalidades estat´ısticas, o Registro Civil cumpre
uma fun¸ao legal, uma vez que os eventos registrados modificam a situa¸ao das pessoas
perante leis que variam de pa´ıs para pa´ıs e tˆem uma maior especificidade e durabilidade
do que a legisla¸ao referente aos censos.
A informa¸ao do Registro Civil ´e usada em diversos ambientes, desde o puramente
jur´ıdico at´e a prepara¸ao de diagn´osticos em sa´ude e estudos demogr´aficos, tanto para
o governo quanto para agˆencias privadas.
Enquanto o censo implica um esfor¸co peri´odico e concentrado, a manuten¸ao de
um sistema de Registro Civil exige um grau muito elevado de organiza¸ao ao longo do
tempo em todos os n´ıveis administrativos. Isso se deve ao fato de que o Registro Civil
concentra informa¸oes, continuamente atualizadas, a respeito do n´ume ro de nascidos
vivos, de nascidos mortos, de ´obitos, de ´obitos fetais, casamentos, div´orcios, ado¸oes
e legitima¸oes, acompanhando a dinˆamica populacional, al´em de elaborar e publicar
perio dicamente, relat´orios estat´ısticos sobre os eventos registrados, contabilizando os
registros em informes estat´ısticos. O Registro Civil pertence ao Poder Judici´ario e o
IBGE ´e o ´org˜ao encarregado de apurar as estat´ısticas dele provenientes.
O registro caracteriza-se por um eficit, principalmente no n´umero de nascimentos
devido ao registro tardio do nascimento, prejudicando a derivao de estat´ısticas de
fecundidade e de mortalidade infantil. Um problema que tamb´em merece aten¸ao diz
respeito ao local onde os eventos (mortes, nascimentos etc) ao registrados. De acordo
com a lei, os eventos devem ser registrados no cart´orio mais pr´oximo de sua ocorrˆencia.
Essa pr´atica eleva artificialmente o n´umero de nascimentos e ´obitos ocorridos em dis-
tritos ou munic´ıpios onde se concentram as maternidades e hospitais. Esta situa¸ao
faz com que ao seja poss´ıvel comparar as taxas demogr´aficas de pequenas ´areas sem
uma pr´evia reclassifica¸ao dos eventos registrados por residˆencia da ae da crian¸ca,
no caso de um nascimento, ou do f alecido, no caso de um ´obito. As estat´ısticas vitais
por lugar de residˆencia constituem, hoje, um acervo de dados rico em detalhes e ´uteis
para as atividades de planejamento (Hakkert, 1996).
36
2.3 Sistemas de Informa¸oes de Nascidos Vivos e de
Mortalidade
Um sistema paralelo de processamento de dados sobre ´obitos e nascimentos ´e mantido
pelo Minist´erio da Sa´ude. O Sistema de Informa¸oes sobre Mortalidade (SIM) cont´em
informa¸oes mais extensas do que aquelas coletadas pelo IBGE, principalmente quanto
`a causa morte.
O SIM foi criado pelo Minist´erio da Sa´ude em 1975 com o objetivo de obter re-
gularmente dados sobre mortalidade, de forma abrangente e confi´avel, servindo como
instrumento para direcionar suas oes de sa´ude. O sistema proporciona a produ¸ao
de estat´ısticas de mortalidade e a constru¸ao dos principais indic adores de sa´ude, per-
mitindo estudos dos pontos de vista estat´ıstico, epidemiol´ogico e ociodemogr´afico.
O documento padr˜ao para capta¸ao de dados sobre mortalidade em todo o pa´ıs ´e a
Declara¸ao de
´
Obito (DO), que ´e o resultado da padroniza¸ao efetuada em 1975.
O Sis tema de Informa¸oes de Nascidos Vivos (SINASC), implantado oficialmente em
1990, foi montado `a semelhan¸ca do SIM, com o objetivo de coletar dados de nascime ntos
a partir de um documento asico, padronizado, que deveria ser gerado nos hospitais,
assim como em outras institui¸oes de sa´ude onde se realizavam partos (para os partos
hospitalares), e nos Cart´orios de Registro Civil para os partos ocorridos em domic´ılio.
Seu formul´ario de entrada de dados padr˜ao ´e a Declara¸ao de Nascido Vivo (DN)
cuja emiss˜ao tamb´em ´e de competˆencia exclusiva do Minist´erio da Sa´ude. A DN
deve ser preenchida para todos os nascidos vivos. Sua implanta¸ao foi acontecendo de
forma gradual, e hoje, em pelo menos um estado (Piau´ı), ela ao est´a completamente
efetivada. Apesar disso, vem apresentando em muitos munic´ıpios, desde o ano de 1994,
um volume maior de registros do que o publicado em anarios do IBGE com base nos
dados de Cart´orios de Registro Civil, e possibilita a constru¸ao de indicadores ´uteis
para o planejamento e gest˜ao dos servi¸cos de sa´ude. Embora a legisla¸ao determine
que o registro do nascimento seja feito no local da ocorrˆencia do evento, o dado que
mais interessa aos profissionais de sa´ude ´e o relacionado ao local de residˆencia. Nas
Secretarias Estaduais de Sa´ude, os dados ao criticados e processados por munic´ıpio
de residˆencia.
37
2.4 Pesquisa Nacional por Amostra de Domic´ılios - PNAD
A Pesquisa Nacional por Amostra de Domic´ılios (PNAD) tem como finalidade a produ-
¸ao de informa¸oes asicas para o estudo do desenvolvimento socioeconˆomico do pa´ıs.
A unidade de investiga¸ao da PNAD ´e o domic´ılio, onde ao investigadas caracter´ısticas
socio econˆomicas, sendo algumas de car´ater permanente, como por exemplo, p opula¸ao
residente, por faixa et´aria e sexo, educa¸ao, trabalho, rendimento e habita¸ao e ou-
tras com periodicidade vari´avel, como migra¸ao, fecundidade, sa´ude, nutri¸ao e outros
temas de acordo com as necessidades de informa¸ao do pa´ıs. A vantagem de realizar
pesquisas domiciliares, c omo a PNAD, ´e a obten¸ao de informa¸oes mais atualizadas
sobre a popula¸ao em per´ıodos intercensit´arios. Uma desvantagem ´e a possibilidade
do surgimento de problemas de representatividade e erros de estima¸ao elevados decor-
rentes do tamanho reduzido das amostras e da falta de cobertura de algumas ´areas.
A pesquisa ao ´e realizada em anos de censos e ao foi realizada no ano de 1994.
A PNAD na ecada de 1990 e no ano de 2001 cobriu todo o territ´orio nacional, com
exce¸ao das ´areas rurais de Rondˆonia, Acre, Amazonas, Roraima, Par´a e Amap´a. A
amostra de domic´ılios da PNAD ´e obtida em trˆes est´agios de sele¸ao, considerando os
munic´ıpios como unidades prim´arias, os setores censit´arios como unidades secund´arias
e os domic´ılios como unidades terci´arias. Al´em disso, o plano amostral da PNAD ´e
autoponderado, ou seja, a probabilidade de que uma unidade perten¸ca `a amostra ´e
constante e igual `a fra¸ao de amostragem geral de um dado n´ıvel geogr´afico.
A unidade prim´aria, definida pelo munic´ıpio, foi escolhida levando-se em conta as-
pectos como limites f´ısicos bem identific´aveis em campo, o tamanho da unidade e a
existˆencia de estat´ısticas recentes que pudessem ser utilizadas nos processos de estra-
tifica¸ao, sele¸ao e outras opera¸oes. Os munic´ıpios que pertenciam `a mesma micror-
regi˜ao geogr´afica foram alocados em estratos, constru´ıdos de forma que possu´ıssem, na
medida do poss´ıvel, um mesmo tamanho, relativamente a sua popula¸ao total.
No primeiro est´agio de sele¸ao, os munic´ıpios ou unidades prim´arias ao classifica-
dos em auto-representativos, probabilidade um de pertencer `a amostra, e ao auto-
representativos, em cada unidade da federa¸ao. Os munic´ıpios das regi˜oes metropoli-
tanas, os das capitais e aqueles cuja popula¸ao ultrapassou a metade do tamanho edio
do estrato constituem o grupo dos munic´ıpios auto-representativos, f ormando assim,
cada um deles, um estrato isolado dentro da unidade da federa¸ao a qual pertenciam,
garantindo-lhes a inclus˜ao na amostra e permitindo, ao n´ıvel te´orico, estimativas mais
38
precisas para esses munic´ıpios. Os demais munic´ıpios constitu´ıram o grupo dos ao
auto-representativos, passando por um processo de estratifica¸ao e, em cada estrato,
foram s elecionados dois munic´ıpios com probabilidade proporcional `a popula¸ao resi-
dente obtida no ´ultimo Censo Demogr´afico. No modelo utilizado pela PNAD, somente
os munic´ıpios foram estratificados. Mais detalhes em Menezes et al. (1991) e Bianchini
e Albieri (2003).
Os setores censit´arios foram definidos como unidades secund´arias porque formam um
cadastro de ´areas com limites bem definidos, suficientemente mapeados para serem uti-
lizados como ´areas de controle e execu¸ao da coleta do Censo Demogr´afico. As unidades
secund´arias ao selecionadas em cada munic´ıpio pertencente `a amostra, com reposi¸ao
e probabilidade proporcional ao tamanho, utilizando como medida de tamanho o
n´umero de domic´ılios existentes no setor na ocasi˜ao do ´ultimo Censo Demogr´afico rea-
lizado. Foram selecionados cinco setores em cada munic´ıpio ao auto-representativo
selecionado para a amostra.
Finalmente, no terceiro est´agio de sele¸ao, ao selecionadas as unidades domiciliares,
em cada setor inclu´ıdo na amostra, com probabilidades iguais, sistematicamente, a
partir de uma listagem obtida ao in´ıcio de c ada realiza¸ao da pesquisa, a fim de se
manter atualizado o cadastro de domic´ılios e por conseq¨encia o tamanho do setor.
Nas pesquisas realizadas em uma mesma ecada, ao mantidos na amostra os mes-
mos munic´ıpios e setores, enquanto as unidades domiciliares ao renovadas anual-
mente. Como o intervalo de sele¸ao de domic´ılios ´e fixo devido `a autopondera¸ao
da amostra, o n´umero de domic´ılios selecionados pode variar de ano para ano, depen-
dendo do tamanho atualizado do setor, dado pela opera¸ao de lis tagem. Paralelamente
`a opera¸ao de listagem, realiza-se o Cadastro de Novas Constru¸oes, preparado de forma
a conter os projetos que provocaram erias altera¸oes no tamanho dos setores. Uma
´area de novas constru¸oes ´e tratada em separado no momento da sele¸ao de domic´ılios.
O pro ces so de estima¸ao adotado pelo IBGE para a PNAD ´e baseado em estima¸ao
de raz˜ao. As regi˜oes metropolitanas formam o n´ıvel mais desagregado para o qual o
IBGE considera que as estimativas fornecidas possuem boa precis˜ao. Inic ialmente, o
peso de cada domic´ılio ´e obtido a partir do plano amostral adotado sem tratamento
para a ao resposta. Em seguida, esse peso ´e ajustado por um fator, calculado in-
dependentemente, para cada regi˜ao metropolitana e para o restante de cada unidade
da federa¸ao. Esse fator ´e dado pela raz˜ao entre a proje¸ao de popula¸ao, realizada
39
anualmente e que independe da PNAD, e pela estimativa de popula¸ao proveniente da
amostra. Os pesos associados `as pessoas ao iguais `aqueles calculados para os domic´ılios
onde ao moradoras. Bianchini e Albieri (2003, p. 10) descrevem como ao calculadas
as precis˜oes das es timativas.
Menezes et al. (1991) lembram que a PNAD ´e uma pesquisa de m´ultiplos prop´ositos,
e sua amostra ´e constru´ıda de maneira que: estimativas precisas sejam obtidas quando
estamos trabalhando na investiga¸ao de temas variados e seus correlatos; baixos custos
de obten¸ao e apura¸ao de cada vari´avel estudada sejam atingidos e que o trabalho
de campo seja facilitado. Nem sempre ´e poss´ıvel satisfazer a todos os aspectos.
´
E
dimensionada uma ´unica amostra para investigar vari´aveis com diferentes graus de
dificuldade de obten¸ao.
Neste trabalho, a expans˜ao da amostra da PNAD foi realizada para os munic´ıpios se-
lecionados utilizando um estimador derivado diretamente do plano amostral da pesquisa.
O estimador utilizado ´e apresentado em Klein e Moura (1998). Para entender o pro-
cesso de expans˜ao, considere a se guinte nota¸ao:
ˆ
Y
(d)
o estimador do total da popula¸ao do domin´ıo geogr´afico d;
H
d
n´umero de estratos no dom´ınio geogr´afico d;
l
h
n´umero de munic´ıpios selecionados no hesimo estrato;
P
hi
probabilidade de sele¸ao do iesimo munic´ıpio do h-´esimo estrato;
m
hi
n´umero de setores selecionados no iesimo munic´ıpio do hesimo estrato;
P
hij
probabilidade de sele¸ao do jesimo setor do iesimo munic´ıpio do h-´esimo
estrato;
N
hij
n´umero de domic´ılios particulares no jesimo setor do iesimo munic´ıpio do
h-´esimo estrato;
n
hij
n´umero de domic´ılios entrevistados no j-´esimo setor do i-´esimo munic´ıpio do
h-´esimo estrato;
y
hijk
total de moradores no kesimo domic´ılio entrevistado do j-´esimo setor do
i-´esimo munic´ıpio do hesimo estrato;
O total populacional no dom´ınio d ´e estimado por
40
ˆ
Y
(d)
=
H
(d)
h=1
1
l
h
l
h
i=1
1
m
hi
P
hi
m
hi
j=1
N
hij
n
hij
P
hij
n
hij
k=1
y
hijk
. (2.1)
A variˆancia de
ˆ
Y
(d)
po de s er obtida pela equa¸ao
ˆ
V (
ˆ
Y
(d)
) =
ˆ
V
1
+
ˆ
V
2
onde
ˆ
V
1
=
h
˜
A
d
1
l
h
(l
h
1)
l
h
i=1
ˆ
Y
hi
P
hi
ˆ
Y
h
2
e
ˆ
V
2
=
h,iA
d
1
m
hi
(m
hi
1)
m
hi
j=1
ˆ
Y
hij
P
hij
ˆ
Y
hi
2
com A
d
munic´ıpios auto-representativos pertencentes ao dom´ınio de interesse d,
˜
A
d
estratos formados por munic´ıpios ao auto-representativos pertencentes ao dom´ınio de
interesse d e,
ˆ
Y
h
=
1
l
h
l
h
i=1
ˆ
Y
hi
P
hi
ˆ
Y
hi
=
1
m
hi
m
hi
i=1
ˆ
Y
hij
P
hij
ˆ
Y
hij
=
N
hij
n
hij
n
hij
k=1
y
hijk
.
41
Cap´ıtulo 3
Especifica¸c˜ao dos Modelos
Como visto no Cap´ıtulo 1, o problema de estima¸ao em pequenas ´areas vem recebendo
aten¸ao cada vez maior de pesquisadores, com diversas propostas de modelos desen-
volvidas, objetivando aumentar a precis˜ao das estimativas, e, por conseq¨encia, mel-
horar sua qualidade, possibilitando que sirvam de base para a tomada de decis˜ao. Este
trabalho se insere neste contexto, tamb´em utilizando modelos e dados obtidos a partir
de pesquisa por amostragem para estima¸ao em pequenas ´areas, sendo que a vari´avel
de interesse ´e o tamanho populacional da pequena ´area. No que segue, o munic´ıpio ´e
tratado como pequena ´area.
A PNAD ´e uma pesquisa por amostragem que se constitui numa valiosa fonte de
dados, sendo capaz de atualizar as informa¸oes populacionais mais rapidamente que
os censos, uma vez que estes ao realizados com periodicidade decenal, enquanto a
pesquisa ocorre anualmente, exceto em anos censit´arios. No entanto, como visto na
se¸ao 2.4 do Cap´ıtulo 2, a pesquisa tem um plano amostral que determina a sele¸ao
de pequenas ´areas, o que impossibilita a obten¸ao direta das estimativas para as ´areas
que ao foram selecionadas para a amostra da pesquisa. Al´em disso, os tamanhos
de amostras de segundo e terceiro est´agios dentro das ´areas selecionadas ao ao su-
ficientemente grandes para que as estimativas obtidas atrav´es de estimador derivado
diretamente do plano amostral apresentem precis˜ao aceit´avel no n´ıvel de munic´ıpios.
Como resultado, os dados da PNAD ao ao utilizados para estimar as popula¸oes
municipais. As estimativas de tamanhos populacionais das pequenas ´areas ao obti-
das a partir de alguma t´ecnica de proje¸ao, tal como uma daquelas descritas na se¸ao
1.2 do Cap´ıtulo 1, onde as proje¸oes ao realizadas primeiro para um n´ıvel geogr´afico
maior, formado por agrega¸ao das pequenas ´areas, e depois para as ´areas menores.
42
Essas t´ecnicas de proje¸ao fornecem estimativas pontuais sem informa¸oes sobre o erro
associado, fazendo uso ap enas dos dados de c ensos rece ntes.
Seria interessante se pud´essemos utilizar, al´em dos dados censit´arios, as informa¸oes
coletadas pelas pesquisas por amostragem realizadas entre censos atrav´es da aplica¸ao
de um modelo estoc´astico que relacionasse os diversos munic´ıpios. Poder´ıamos corrigir
as estimativas fornecidas pelo estimador derivado do desenho amostral, apresentando o
erro associado e ainda produzindo as estimativas populacionais das pequenas ´areas ao
selecionadas para a amostra. A proposta ´e semelhante `aquelas mencionadas na se¸ao
1.1, no sentido de fazer uso de modelos que permitem a troca de informa¸ao e ntre as
´areas na tentativa de elevar o tamanho efetivo das amostras e com isso aumentar a
precis˜ao das estimativas.
Modelos hier´arquicos tˆem potencial para descrever rela¸oes entre as ´areas, explo-
rando suas similaridades e aumentando a precis˜ao das estimativas. O uso de modelos
hier´arquicos se encaixa em situa¸oes em que a popula¸ao de interesse apresenta uma
estrutura hier´arquica. No caso dos dados de popula¸ao aqui utilizados, essa estrutura
aparece no n´ıvel de munic´ıpio. Exemplos de dados com estrutura hier´arquica podem
ser vistos em Goldstein (1995).
´
E importante introduzir, tamb´em, uma componente
espacial, uma vez que o crescimento e a concentra¸ao populacionais podem ter rela¸ao
com o que o corre nas ´areas pr´oximas. A modelagem espacial pode ser feita atrav´es da
inclus˜ao de uma estrutura de dependˆencia entre vizinhos. No presente trabalho, ser˜ao
ajustados modelos hier´arquicos ao estruturados e modelos hier´arquicos com estrutura
espacial.
Considere os munic´ıpios do Estado de ao Paulo. Suponha que dispomos dos taman-
hos e das densidades populacionais de todos os seus m munic´ıpios em anos censit´arios.
No per´ıodo entre censos, dispomos daquelas quantidades estimadas para k pequenas
´areas (k < m), selecionadas para a amostra de primeiro est´agio da PNAD. Como o
n´ıvel de munic´ıpio ao faz parte do dom´ınio de divulga¸ao da PNAD, os tamanhos
populacionais dos munic´ıpios foram estimados atrav´es de adapta¸ao do estimador de
Klein e Moura (1998), derivado diretamente do plano amostral da pesquisa e mostrado
na equa¸ao (2.1) do Cap´ıtulo 2. Em seguida, as densidades foram obtidas, dividindo-se
os totais populacionais estimados dos munic´ıpios por suas respectivas ´areas geogr´aficas.
O estimador adaptado ´e apresentado no Anexo A. Assim, temos, no total, n pontos
de tempo, representando os dados dos censos e da PNAD.
43
Modelos hier´arquicos est˜ao diretamente ligados ao conceito de permutabilidade.
Quantidades aleat´orias θ
1
, θ
2
, . . . , θ
n
ao permut´aveis se sua distribui¸ao conjunta
p(θ
1
, θ
2
, . . . , θ
n
) ´e a mesma para qualquer permuta¸ao dos ´ındices 1, 2, . . . , n. Isso sig-
nifica que os parˆametros de cada subpopula¸ao podem ser tratados como unidades
permut´aveis. Uma forma simples ´e aquela em que cada parˆametro ´e tratado como uma
amostra independente de uma distribui¸ao controlada por um vetor de parˆametros
desconhecidos Θ, ou seja,
p(θ
1
, θ
2
, . . . , θ
n
|Θ) =
n
i=1
p(θ
i
|Θ).
De maneira geral, podemos tamb´em condicionar nos dados dispon´ıveis de cada
subpopula¸ao. A distribui¸ao conjunta pode ser escrita como
p(θ
1
, θ
2
, . . . , θ
n
, Θ)p(Θ)
e pelo teorema de Bayes, obtemos a posteriori
p(θ
1
, θ
2
, . . . , θ
n
, Θ|Y )
onde Y ´e o vetor de dados. Trabalhar com a densidade demogr´afica em vez da
popula¸ao ´e justamente uma tentativa de aumentar a similaridade entre os parˆametros,
de forma a garantir permutabilidade.
Enao denote por y
it
a densidade observada (quando censo) ou estimada (quando
PNAD) da pequena ´area i no tempo t e por π
it
o verdadeiro valor da densidade,
para i = 1, . . . , m e t = 1, . . . , n. O interesse ´e fazer inferˆencia sobre as densidades
populacionais π
it
de todos os m munic´ıpios.
Adota-se a abordagem Bayesiana, sob a qual as previs˜oes ao descritas atrav´es de
distribui¸oes de probabilidade, propiciando ao tomador de decis˜ao ou ao usu´ario das
previs˜oes examinar as incertezas envolvidas. Esse fato constitui-se numa vantagem da
utiliza¸ao desse tipo de abordagem.
Os modelos apresentados nas pr´oximas se¸oes ao do tipo hier´arquico com curva de
crescimento exponencial para π
it
, considerando a existˆencia de efeito espacial. Assume-
se que as vari´aveis aleat´orias y
it
tenham distribui¸ao normal com m´edia π
it
e variˆancia
σ
2
it
. Antes da descri¸ao do modelo asico e suas varia¸oes, ´e apresentada a fam´ılia
exponencial mo dificada de curvas.
44
3.1 Fam´ılia exponencial modificada de curvas
Considere que as observoes obtidas a partir de um processo y
t
ao modeladas a partir
de uma distribui¸ao de probabilidade na fam´ılia exponencial com fun¸ao resposta edia
µ
t
= E(y
t
|θ
t
)
onde θ
t
´e um vetor de parˆametros.
Uma ampla classe de modelos de crescimento exponencial, caracterizados pela para-
metriza¸ao (α, β, γ, φ) ´e definida como
µ
t
= [α + β exp (γt)]
1
. (3.1)
Alguns casos especiais e bem conhecidos na literatura ao:
(1) Log´ıstica: para φ = 1, µ
1
t
= α + β exp (γt);
(2) Gompertz: para φ = 0, define-se (3.1) como log (µ
t
) = α + β exp (γt);
(3) Exponencial modificada: para φ = 1, µ
t
= α + β exp (γt).
A principal vantagem de utilizar (3.1), ´e a possibilidade de manter as medi¸oes
y
t
na escala original, transformando apenas a trajet´oria de µ
t
, o que torna a inter-
preta¸ao mais simples. Al´em disso, os intervalos de tempo ao precisam ser igualmente
espa¸cados, permitindo que se trabalhe com dados provenientes de pesquisas com datas
de referˆencia distintas atrav´es de uma codifica¸ao da vari´avel t de tempo, como pode
ser visto no Cap´ıtulo 4. Quando ψ = exp(γ) < 1, ´e caracterizado um processo ao
explosivo, significando que µ
t
converge para α
1
quando t , com a conven¸ao de
que, para φ = 0, aquela quantidade ser´a igual a log (α). Quando ψ > 1, as curvas
ao c ˆoncavas para φ 0 e β > 0, caracterizando um processo explosivo. A express˜ao
(3.1) ´e ao-linear nos parˆametros quando ψ ´e desconhecido para qualquer valor de φ.
Esta classe ´e chamada de modelos de crescimento exponencial generalizado e sua cor-
respondˆencia com os modelos dinˆamicos lineares pode ser vista em Migon e Gamerman
(1993).
45
3.2 Modelo hier´arquico de crescimento exponencial
Dados hierarquizados aparecem em diversas situa¸oes, tais como em ciˆencias sociais,
onde as medi¸oes de uma dada vari´avel de interesse ao realizadas em diferentes n´ıveis
de agrega¸ao, como por exemplo, de acordo com o local de residˆencia, com o grupo
social ou com a ra¸ca de um indiv´ıduo. Modelos hier´arquicos prop orcionam uma forma
de compartilhar a informa¸ao entre diferentes grupos, sem a necessidade de supor que
estes perten¸cam a uma mesma popula¸ao. Alguns modelos hier´arquicos foram apresen-
tados na revis˜ao bibliogr´afica do Cap´ıtulo 1, como o de Fay e Herriot (1979), na agina
8. No caso dos dados populacionais, as densidades nos n per´ıodos de temp o aparecem
por munic´ıpio. Se a densidade no tempo inicial e o seu crescimento forem similares
entre as ´areas, podemos supor um modelo hier´arquico para estes parˆametros. Com
o objetivo de melhorar a similaridade entre os parˆametos, utilizou-se a densidade ao
inv´es do tamanho populacional. ao seria razo´avel supor que as popula¸oes municipais
fossem similares.
Enao, suponha que y
it
, a densidade observada do munic´ıpio i, i = 1, . . . , m, no
tempo t, t = 1, . . . , n, possa ser modelada segundo o modelo hier´arquico ao estrutu-
rado (3.2):
y
it
= π
it
+
it
,
it
N(0, σ
2
it
)
π
it
= {a
i
+ b
i
exp (c
i
t)}
φ
a
i
= α + ξ
ai
, ξ
ai
N(0, τ
2
ai
)
b
i
= β + ξ
bi
, ξ
bi
N(0, τ
2
bi
)
c
i
= γ + ξ
ci
, ξ
ci
N(0, τ
2
ci
)
(3.2)
onde as distribui¸oes a priori de α, β e γ ao tais que α N(µ
α
, σ
2
α
), β N(µ
β
, σ
2
β
),
γ N(µ
γ
, σ
2
γ
). No modelo definido em (3.2), para prever a densidade de uma pequena
´area particular, ao utilizadas as informa¸oes de todas as outras ´areas.
Nos censos demogr´aficos, ap e sar do objetivo ser investigar inteiramente a popula¸ao,
ocorrem omiss˜oes ou inclus˜oes indevidas que se constituem no erro de cobertura. Ent˜ao
faz sentido, para anos censit´arios, considerar o valor observado como sendo igual `a
popula¸ao verdadeira mais um erro, da forma que est´a descrito na primeira equa¸ao
do modelo. Por sua vez, a PNAD ´e uma pesquisa por amostragem e, portanto,
it
representa a principal componente do erro de estima¸ao. Al´em disso, assume-se que a
fun¸ao edia π
it
seja dada por uma curva de crescimento exponencial.
46
Supondo que a fun¸ao edia, π
it
, ´e ao explosiva, o parˆametro α
φ
po de ser inter-
pretado como o ponto de estabiliza¸ao populacional. Os parˆametros β e γ controlam
o crescimento da densidade. As distribui¸oes a priori de α, β e γ podem ser escolhidas
aproveitando-se algum conhecimento da demografia.
Neste trabalho, faz-se uso de um modelo de crescimento exponencial em que φ = 1,
ou seja, a m´edia do process o y
it
´e dada por uma curva do tipo exp onencial modificada.
No modelo (3.2), quando t = 0, a edia da popula¸ao inicial do munic´ıpio i ´e dada por
a
i
+ b
i
. O crescimento do munic´ıpio i no tempo ´e dado por exp (c
i
), que juntamente
com b
i
, constitui um fator de acr´escimo ou de redu¸ao populacional. A hierarquia em
a e b mostra que, em m´edia, a popula¸ao inicial dos munic´ıpios ´e α + β, sofrendo deslo-
camento devido aos efeitos de munic´ıpio ξ
ai
e ξ
bi
. Considerar c
i
hier´arquico equivale a
dizer que os munic´ıpios experimentam crescimentos populacionais diferenciados, mas
similares, dependendo de um efeito ξ
ci
. Como os c
i
’s ao desconhecidos, no modelo
(3.2), a fun¸ao edia ´e ao linear. Em todos os modelos derivados de (3.2), assume-
se que: τ
2
ai
= τ
2
a
, τ
2
bi
= τ
2
b
e τ
2
ci
= τ
2
c
, com distribui¸oes a priori τ
2
a
G(α
a
, β
a
),
τ
2
b
G(α
b
, β
b
), τ
2
c
G(α
c
, β
c
).
No caso dos munic´ıpios ao selecionados, as equa¸oes do modelo (3.2) permanecem
as mesmas. Os valores de y
it
nos anos ao censit´arios ao considerados como parˆametros
a estimar, com o censo funcionando como calibrador.
Caso consider´assemos no modelo a popula¸ao, estar´ıamos dizendo que, no tempo
inicial, a popula¸ao m´edia dos diversos munic´ıpios seria dada por α + β e ao seria
razo´avel, a que as popula¸oes de partida variam muito entre si. Como forma de
amenizar essas diferen¸cas, utilizou-se as densidades demogr´aficas.
3.2.1 Estima¸ao
Num contexto Bayesiano, combinamos a informa¸ao proveniente dos dados, represen-
tada pela fun¸ao de verossimilhan¸ca, com aquela fornecida por algum conhecimento
a priori da loca¸ao ou da variabilidade do que se deseja estimar, resumido na dis -
tribui¸ao a priori. A distribui¸ao resultante da combina¸ao das duas informa¸oes ´e
dita posteriori, na qual toda a inferˆencia se baseia. Para obter a posteriori, sob o
modelo (3.2), sejam: D o conjunto de toda a informa¸ao dispon´ıvel, ou seja, D =
{ys, T}, onde ys = (y
11
, . . . , y
kn
)
´e o vetor de observoes dos munic´ıpios da amostra e
T = (t
1
, . . . , t
n
)
´e o vetor de tempos; yp = (y
11
, . . . , y
mk,n
)
o vetor das observoes
47
de munic´ıpios ao amostrados que ser˜ao previstas; Σ a matriz de variˆancias das ob-
servoes; a = (a
1
, . . . , a
m
)
; b = (b
1
, . . . , b
m
)
; e c = (c
1
, . . . , c
m
)
.
Enao, assumindo que os y
it
’s, com i na amostra, ao condicionalmente indepen-
dentes dados a, b, c e Σ e que y
it
depende somente de a
i
, b
i
, c
i
e σ
2
it
, temos que a
fun¸ao de verossimilhan¸ca ´e dada por
p(ys|a, b, c, Σ) =
k
i=1
n
j=1
p(y
ij
|a
i
, b
i
, c
i
, σ
2
ij
).
Para facilitar a nota¸ao, seja θ = (a, b, c, α, β, γ, Σ, τ
2
a
, τ
2
b
, τ
2
c
)
. A posteriori
conjunta de todos os parˆametros e das quantidade ao amostradas ´e dada por
p(θ, yp|D) p(ys|a, b, c, Σ)p(θ, yp). (3.3)
A distribui¸ao a posteriori em (3.3) ao ´e trat´avel, sob o modelo (3.2) com as
prioris a apresentadas, sendo necess´ario recorrer a etodos de simula¸ao indireta
para gerar uma amostra de tal distribui¸ao e fazer inferˆencias com base na mesma.
Como as distribui¸oes condicionais completas de cada parˆametro, dadas as observoes
e todos os demais parˆametros, eram conhecidas, a ao ser para o vetor c, foi ado-
tado o eto do de simula¸ao conhecido por Gibbs sampler, introduzindo-se um passo
de aceita¸ao/rejei¸ao para gerar da distribui¸ao a posteriori de c. No Anexo B, ao
apresentadas as distribui¸oes condicionais completas de cada parˆametro envolvido na
an´alise, no caso particular em que σ
2
it
= σ
2
. Foi utilizado o software Winbugs vers˜ao
1.4 (Spiegelhalter, 2004) para gerar as amostras da posteriori.
A distribui¸ao a posteriori do parˆametro que representa a verdadeira densidade π
it
´e dada por
p(π
it
|D) =
Θ
p(π
it
|θ)p(θ|D).
e as previs˜oes das observoes de um munic´ıpio i ao selecionado ao baseadas na
distribui¸ao preditiva de y
it
, i / s, a qual ´e dada por
p(y
it
|D) =
Θ
p(y
it
|θ)p(θ|D).
onde s ´e a amostra de munic´ıpios e Θ representa o espa¸co de valores poss´ıveis para o
conjunto de parˆametros θ.
Para um particular tempo t de um munic´ıpio i ao selecionado pela PNAD, a
amostra da distribui¸ao preditiva de y
it
e da posteriori de π
it
ser˜ao obtidas pelo seguinte
processo:
48
Gerar a
(l)
i
, b
(l)
i
, c
(l)
i
, α
(l)
, β
(l)
, γ
(l)
, τ
2(l)
a
, τ
2(l)
b
, τ
2(l)
c
e σ
2(l)
it
, l = 1, . . . , M, com base
nas distibui¸oes condicionais completas, onde M ´e o umero de itera¸oes do Gibbs
sampler;
Calcular π
(l)
it
= a
(l)
i
+ b
(l)
i
exp (c
(l)
i
t) para i / s;
Gerar y
(l)
it
N(π
(l)
it
, σ
2(l)
it
).
Seja µ
it
a popula¸ao do i-´esimo munic´ıpio no tempo t. A posteriori de µ
it
´e obtida
incluindo-se no Gibbs sampler o passo
µ
(l)
it
= π
(l)
it
A
i
onde A
i
´e a ´area do munic´ıpio i.
Na se¸ao 3.4, ao apresentadas as ecnicas utilizadas neste trabalho para diagnosticar
a convergˆencia dos parˆametros.
3.2.2 Modelagem da variˆancia das observoes
As variˆancias das observoes σ
2
it
po dem ser modeladas numa tentativa de obter variˆan-
cias das estimativas finais, resultantes do ajuste dos modelos, menores que aquelas
estimadas no censo e na PNAD. O modelo dado por (3.2) pode ser modificado de
forma que σ
2
it
= σ
2
, i, t, para i = 1, ..., m e t = 1, ..., n. A distribui¸ao a priori ´e dada
em termos da precis˜ao: σ
2
G(α
φ
, β
φ
). O modelo com esta hip´otese constitui-se na
primeira proposta para a modelagem das densidades populacionais.
Como neste trabalho ao utilizados os dados de duas pesquisas com diferentes vari-
abilidades e tipos de erros, uma alternativa ´e considerar as variˆancias das observoes
como sendo diferentes entre os anos. Ainda, as variˆancias podem ser tratadas como
distintas entre as pequenas ´areas.
Enao ´e proposto um segundo modelo em que se acrescenta uma equa¸ao para mode-
lagem das variˆancias das observoes tal que: log (σ
2
it
) = η
0
+η
1
f
i
, se no ano t utiliza-se
o dado da PNAD, onde f
i
´e a fra¸ao amostral de setores da pequena ´area i, sendo
dada por n
i
/N
i
, com n
i
e N
i
representando, respectivamente, o n´umero de setores sele-
cionados pela PNAD e o n´umero total de setores no munic´ıpio; e log(σ
2
it
) = log(varc
it
)
onde varc
it
´e a variˆancia do censo no munic´ıpio i no tempo t, calculada em fun¸ao do
erro de cobertura do censo, considerado como sendo de 5% para todos os munic´ıpios.
Enao a verdadeira popula¸ao (e tamb´em a densidade, sob a hip´otese de que a ex-
tens˜ao territorial do munic´ıpio permanece inalterada no per´ıodo em estudo) estaria
49
localizada no intervalo dado pela popula¸ao observada no censo mais ou menos 5% de
seu valor. Uma estimativa do desvio padr˜ao ´e a diferen¸ca entre o extremo superior do
intervalo menos a popula¸ao observada, dividindo-se a diferen¸ca por dois. A variˆancia
da densidade ´e ent˜ao obtida, dividindo-se a variˆancia da popula¸ao pelo quadrado da
´area geogr´afica do munic´ıpio. Estabelecer variˆancias conhecidas nos anos de censos
´e uma forma de dar mais peso a suas observoes, uma vez que se espera que um
censo pro duza informa¸oes mais confi´aveis para pequenas ´areas que uma pesquisa por
amostragem. Nesse modelo, as distribui¸oes a priori tˆem a mesma forma daquelas
dadas para o primeiro modelo, acrescentando prioris para os parˆametros η
0
e η
1
tais
que η
0
N(µ
η
0
, ϕ
η
0
) e η
1
N(µ
η
1
, ϕ
η
1
). Pretende-se com a lei de variˆancia pro-
posta nos anos em que se utiliza a PNAD, aumentar a precis˜ao em rela¸ao ao modelo
que considera as variˆancias iguais para todos os munic´ıpios, a que ´e esperado que a
variˆancia se reduza com o aumento do tamanho da amostra de segundo est´agio, ou
seja, de setores. A fra¸ao amostral de setores aparece como uma forma de relativizar
a participa¸ao dos amostrados no conjunto total de setores do munic´ıpio. No caso
de munic´ıpios ao selecionados, a fra¸ao ´e igual a zero. Uma modifica¸ao da lei de
variˆancia apresentada pode ser obtida considerando log (σ
2
it
) = k log (varc
it
), ou seja, a
variˆancia do censo ´e conhecida a menos de uma constante. A distribui¸ao a priori de
k ´e tal que k G(α
k
, β
k
).
Um quarto modelo ´e obtido levando em conta a lei σ
2
it
= k (1/var
it
), onde var
it
´e a
variˆancia estimada dada por (A.1) dividida pelo quadrado da ´area geogr´afica, se o ano
t ´e relativo `a PNAD e igual a varc
it
, se relativo a censo, com priori para k dada por
G(α
k
, β
k
). A inclus˜ao do fator de escala k significa que as variˆancias das observoes
seriam conhecidas a menos de uma constante.
As distribui¸oes condicionais completas nos modelos definindo leis para a variˆancia
σ
2
it
e no modelo espacial da pr´oxima se¸ao podem ser derivadas seguindo desenvolvi-
mento an´alogo ao apresentado no Anexo B, incluindo-se, no vetor θ, os parˆametros
envolvidos em cada situa¸ao, levando-se em conta suas respectivas distribui¸oes a pri-
ori.
Na se¸ao 3.5 ao apresentados os crit´erios de sele¸ao de modelos utilizados.
50
3.3 Modelo hier´arquico espacialmente estruturado
Nos modelos hier´arquicos apresentados at´e aqui, utiliz´avamos as informa¸oes de todas
as ´areas para prever a popula¸ao de uma dada pequena ´area. No entanto, ´e intuitivo
considerar que um par de munic´ıpios vizinhos tenham densidades demogr´aficas mais
semelhantes que dois munic´ıpios escolhidos arbitrariamente. Nesta se¸ao, prop˜oe-se
um modelo hier´arquico espacialmente estruturado denominado ao longo do texto de
modelo espacial. A estrutura de vizinhan¸ca est´a representada na distribui¸ao a priori
conjunta dos efeitos espaciais. Aqui ao consideradas vizinhas, ´areas cont´ıguas, ou seja,
´areas que compartilham um limite comum. Outras formas de definir a vizinhan¸ca em
modelos espaciais ao apresentadas no Cap´ıtulo 5.
No modelo proposto, a densidade do munic´ıpio i no tempo t, π
it
´e influenciada pelas
´areas vizinhas atrav´es da insers˜ao dos efeitos espaciais δ
ai
e δ
bi
nos parˆametros a
i
e b
i
,
ou seja, a
i
= α
0
+δ
ai
e b
i
= β
0
+δ
bi
, onde α
0
e β
0
ao termos representando interceptos.
Com esta defini¸ao, a
i
e b
i
variam apenas com efeito do espa¸co, correspondendo a um
modelo local. Os parˆametros de crescimento c
i
’s permanecem considerados similares
entre as diversas ´area, constituindo um modelo global.
A rela¸ao entre as ´areas vizinhas ´e definida nas distribui¸oes a priori de δ
ai
e δ
bi
. A
distribui¸ao a priori conjunta de δ
a
= (δ
a1
, ..., δ
am
)
dado o hiperparˆametro τ
2
da
, como
em Molli`e (1996), ´e dada por
p(δ
a
|τ
2
da
)
1
τ
m/2
da
exp
1
2τ
2
da
m
i=1
j<i
w
ij
(δ
ai
δ
aj
)
2
onde w
ij
ao pesos associados `a estrutura de vizinhan¸ca. Neste trabalho, foram es-
colhidos pesos tais que w
ij
= 1, se i e j ao ´areas vizinhas, e w
ij
= 0, caso contr´ario.
Neste caso, a distribui¸ao a priori condicional de δ
ai
, dados os efeitos δ
aj
das demais
´areas e o hiperparˆametro τ
2
da
, ´e normal com edia e variˆancia dadas por
E[δ
ai
|δ
a,i
, τ
2
da
] = E[δ
ai
|δ
aj
, j i, τ
2
da
] =
¯
δ
ai
V ar[δ
ai
|δ
a,i
, τ
2
da
] = V ar[δ
ai
|δ
aj
, j i, τ
2
da
] =
τ
2
da
w
i+
onde
¯
δ
ai
denota a edia dos δ
aj
das ´areas vizinhas a i e w
i+
=
m
j=1
w
ij
´e o n´umero de
vizinhos de i. Trabalha-se com a restri¸ao
m
i=1
δ
ai
= 0.
A distribui¸ao a priori conjunta de δ
b
= (δ
b1
, ..., δ
bm
)
dado o hiperparˆametro τ
2
db
´e an´aloga `aquela descrita para δ
ai
, substituindo-se δ
ai
por δ
bi
, incluindo a restri¸ao
51
m
i=1
δ
bi
= 0. Neste caso, o efeito espacial afeta o crescimento da densidade atrav´es do
parˆametro b
i
.
Considera-se que o crescimento tamb´em sofra influˆencia de todas as outras ´areas
e ao o das vizinhas, assumindo-se que o parˆametro c
i
tenha um efeito hier´arquico,
como no modelo (3.2).
Assim, o modelo espacial prop osto tem a forma
y
it
= π
it
+
it
,
it
N(0, σ
2
it
)
π
it
= {a
i
+ b
i
exp (c
i
t)}
φ
a
i
= α
0
+ δ
ai
b
i
= β
0
+ δ
bi
c
i
= γ + ξ
ci
, ξ
ci
N(0, τ
2
ci
)
(3.4)
com φ = 1.
A Figura 3.1 mostra a densidade dos munic´ıpios do Estado de ao Paulo em 1991
separadas por faixa. Pode-se observar que munic´ıpios pr´oximos geograficamente ten-
dem a concentrar-se na mesma faixa de densidade. Isto sugere que possa ser aplicado
um modelo de componentes espaciais `as densidades demogr´aficas.
52
Figura 3.1: Densidade dos munic´ıpios do Estado de ao Paulo em 1991.
3.4 Simula¸ao estoastica: diagn´ostico de convergˆencia
Quando a distribui¸ao a posteriori ao possui forma fechada ao ´e poss´ıvel gerar
amostras dessa distribui¸ao, diretamente, para fazer inferˆencia. Nestes casos, recorre-
mos a etodos de simula¸ao indireta, tais como os baseados em Markov Chain Monte
Carlo (MCMC) que podem ser vistos em Gamerman (1997).
A amostra da distribui¸ao a posteriori obtida a partir da simula¸ao o ´e consi-
derada para inferˆencia se os parˆametros da posteriori convergirem, no sentido de que foi
poss´ıvel atingir uma distribui¸ao estacion´aria a partir da t´e cnica de simula¸ao escolhida.
Para verificar a convergˆe ncia dos parˆametros, utilizou-se t´ecnicas informais baseadas na
observao do histograma, do tra¸co e da autocorrela¸ao dos dados da amostra gerada.
Al´em disso, utilizou-se tamb´em os crit´erios apresentados em Brooks e Gelman (1998)
e Geweke (1992).
O histograma permite que seja analisada a forma da distribui¸ao a posteriori. A
observao dos tra¸cos das m´ultiplas cadeias geradas em paralelo, com cada cadeia
possuindo diferentes pontos iniciais, possibilita que seja verificado se as seq¨uˆencias
misturam-se, indicando convergˆencia. O gr´afico da autocorrela¸ao permite verificar se
53
as amostras geradas podem se r consideradas independentes dos valores iniciais.
Para entender o crit´erio de Geweke, considere θ o vetor de parˆametros de interesse
para o qual obteve-se uma amostra da posteriori a partir de uma rodada de algum
m´etodo MCMC e ψ = t(θ) uma fun¸ao real, com trajet´oria dada por ψ
(j)
= t(θ
(j)
),
j = 1, 2, . . .. Esta trajet´oria define uma erie temporal cujas edias erg´odicas podem
ser calculadas. O crit´erio prop˜oe o uso de testes nas edias erg´odicas para verificar a
convergˆencia da cadeia com base na erie ψ
(j)
.
Para um total de m + n itera¸oes onde m ´e o per´ıodo de burn-in forme m´edias
¯
ψ
b
=
1
n
b
m+n
b
j=m+1
ψ
(j)
e
¯
ψ
a
=
1
n
a
m+n
j=m+nn
a
+1
ψ
(j)
(3.5)
onde n
b
+ n
a
< n. Como m ´e o per´ıodo de burn-in,
¯
ψ
a
e
¯
ψ
b
ao as edias erg´odicas no
in´ıcio e no final do per´ıodo de convergˆencia, sendo que deveriam apresentar, por este
motivo, comportamento similar. Quando n torna-se grande e as raz˜oes n
a
/n e n
b
/n
permanecem fixas, temos que
z
G
=
¯
ψ
a
¯
ψ
b
V ar(
¯
ψ
a
) + V ar(
¯
ψ
b
)
N (0, 1) em distribui¸ao. (3.6)
Dessa forma, a diferen¸ca padronizada z
G
entre as edias erg´odicas no in´ıcio e no
final do per´ıodo de convergˆencia ao deveria ser grande s e a convergˆencia foi atingida.
Grandes diferen¸cas indicam falta de convergˆencia, por´em pequenas diferen¸cas ao
significam que houve convergˆencia. Geweke (1992) sugere os valores n
b
= 0.1n e
n
a
= 0.5n. O crit´erio ´e univariado, podendo ser aplicado a densidade a posteriori
fazendo t(θ) = 2 log π(θ).
Brooks e Gelman (1998) introduziram uma an´alise gr´afica para avaliar a convergˆencia
com base nas quantidades
ˆ
V , a variˆancia a p osteriori estimada calculada sob to-
das as seq¨uˆencias geradas,
ˆ
W , a variˆancia a posteriori estimada intra-cadeia e
ˆ
R
c
=
(d + 3)
ˆ
V /(d+1)
ˆ
W , o fator de redu¸ao de variˆancia, com d igual ao n´umero de graus de
liberdade. O gr´afico proposto permite verificar se as variˆancias
ˆ
V e
ˆ
W estabilizam-se
como fun¸ao de n, a metade do tamanho da cadeia, e se o fator de redu¸ao
ˆ
R
c
aproxima-
se de 1. O alculo de
ˆ
R
c
foi introduzido por G elman e Rubin (1992) e consistia em
obter m replica¸oes independentes da cadeia de tamanho 2n, utilizando-se diferentes
valores iniciais, para verificar se as observoes da segunda metade das itera¸oes de
cada amostra gerada poderiam ser consideradas como pertencentes `a distribui¸ao esta-
cion´aria. Acredita-se que descartando-se as n primeiras observoes ´e poss´ıvel evitar
54
o per´ıodo de burn-in. Ap´os a convergˆencia, todas as cadeias ter˜ao o mesmo compor-
tamento, do ponto de vista quantitativo e qualitativo. O uso de m´ultiplas seq¨encias
po de ajudar a detectar convergˆencia lenta e se a simula¸ao ficou restrita a regi˜oes em
torno de modas locais. O crit´erio de Gelman e Rubin (1992) consistia em testar se a
dispers˜ao dentro das cadeias (com uma amostra de tamanho mn) ´e maior que a dis-
pers˜ao entre as cadeias. O n´umero de cadeias ao prec isa se r muito grande, evitando-se
o desperd´ıcio do tempo computacional. A inferˆencia para uma quantidade de interesse
´e feita calculando-se a edia e a variˆancia amostrais. Com m cadeias ´e poss´ıvel re-
alizar m inferˆencias e para verificar se estas s ˜ao similares o suficiente para indicar
convergˆencia, Gelman e Rubin (1992) sugeriram comparar as inferˆencias individuais
`aquela obtida utilizando-se a amostra completa, dada pelas mn observoes. Enao
considere uma vari´avel aleat´oria ψ com edia µ e variˆancia σ
2
na distribui¸ao alvo e
suponha que temos um estimador ˆµ ao viesado para µ. Considere ψ
ij
como sendo a
j-´esima observao de ψ em n itera¸oes da cadeia i. Tome ˆµ =
¯
ψ
..
. As variˆancias entre
seq¨encias, B/n, e dentro da seq¨uˆencia, W ao calculadas da seguinte forma:
B/n =
1
m 1
m
i=1
(
¯
ψ
i.
¯
ψ
..
)
2
W =
1
m(n 1)
m
i=1
n
j=1
(ψ
ij
¯
ψ
i.
)
2
.
´
E poss´ıvel estimar σ
2
fazendo uma m´edia ponderada de B e W , como segue
ˆσ
2
=
n 1
n
W +
B
n
.
que ´e um estimador ao viesado da verdadeira variˆancia σ
2
, se os pontos iniciais das
seq¨encias foram retirados da distribui¸ao alvo, mas sobreestima σ
2
se a distribui¸ao
inicial ´e apropriadamente dispersa. A variabilidade amostral do estimador ˆµ justifica a
obten¸ao de uma estimativa da variˆancia a posteriori compartilhada
ˆ
V = ˆσ
2
+B/(mn).
Uma c ompara¸ao das inferˆencias intra-cadeia e compartilhada ´e expressa como uma
raz˜ao de variˆancia,
R =
ˆ
V
σ
2
,
que ´e chamado fator de redu¸ao de variˆancia. Como o denominador de R ´e normalmente
desconhecido, uma sobreestimativa de R ´e obtida se utilizamos W como estimativa para
σ
2
. Enao uma estimativa de R ´e dada por
ˆ
R =
ˆ
V
W
=
(m + 1)
ˆ
σ
2
mW
n 1
mn
,
55
que pode ser interpretado como uma medida de diagn´ostico. Se
ˆ
R ´e grande, sugere que
ou a estimativa da variˆancia ˆσ
2
po de decrescer com mais simula¸oes ou que simula¸oes
adicionais aumentar˜ao W , pois as seq¨encias simuladas ao ter˜ao feito ainda um passeio
pela distribui¸ao alvo. Por outro lado, se
ˆ
R ´e bem pr´oximo de 1, pode-se concluir
que cada um dos m conjuntos de n observoes visitou a distribui¸ao alvo (Brooks e
Gelman,1998).
Brooks e Gelman (1998) alertam que o teste proposto por Gelman e Rubin (1992),
se aplica em situa¸oes nas quais inferˆencias ao resumidas pelas edias e variˆancias a
posteriori, mesmo que ao se acredite que as distribui¸oes a posteriori sejam normal-
mente distribu´ıdas. Dizem, ainda, que outras medidas de convergˆencia podem ser mais
apropriadas se o pesquisador pensa em utilizar estat´ısticas resumidas que ao sejam
os dois primeiros momentos. Para corrigir os efeitos da variabilidade das amostras,
Gelman e Rubin (1992) aplicaram o fator d/(d + 2), por´em Brooks e Gelman (1998)
consideraram o fator incorreto e propuseram que fosse utilizado o fator (d + 3)/(d + 1),
onde d ´e o n´umero de graus de liberdade para uma distribui¸ao t-Student aproximada
para a inferˆencia baseada nas simula¸oes. Ent˜ao, tem-se
ˆ
R
c
=
d + 3
d + 1
ˆ
R.
Ao atingir convergˆencia trˆes situa¸oes deve m ocorrer:
1. A variˆancia da mistura das seq¨uˆencias, V , deveria estabilizar-se como fun¸ao de
n;
2. A variˆancia intra- seq¨uˆencia, W , deveria estabilizar como uma fun¸ao de n. (Antes
de convergir, espera-se que W seja menor que V .);
3.
ˆ
R
c
deveria ser pr´oximo de 1.
Assim, um etodo gr´afico proposto para monitorar convergˆencia ´e dividir as m
seq¨encias em grupos de tamanho b. Ent˜ao calcula-se as quantidades V (k), W (k) e
ˆ
R
c
(k) com base na segunda metade das observoes da seq¨uˆencia de tamanho 2kb,
para k = 1, . . . , n/b. Detalhes do porquˆe de utilizar apenas metade das amostras para
monitorar a convergˆencia e da escolha de b podem ser vistos em Brooks e Gelman
(1998).
O gr´afico ´e constru´ıdo fazendo
ˆ
R
c
contra k.
´
E ´util tamb´em fazer o desenho de
V
1/2
(k) e W
1/2
(k) como fun¸ao de k, no mesmo gr´afico. A convergˆencia ´e atingida
56
quando as linhas se estabilizam e essa estabiliza¸ao ocorre no mesmo valor, o que leva
ˆ
R
c
a ser pr´oximo de 1. Uma an´alise iterativa, como a apresentada, permite avaliar se
as cadeias est˜ao convergindo.
O caso de distribui¸oes a posteriori ao-normais e o caso multivariado tamb´em
po dem ser vistos em Brooks e Gelman (1998).
A hip´otese de normalidade ´e uma limita¸ao no diagn´ostico de convergˆencia. A
referida hip´otese po de ser considerada mais razo´avel se forem feitas tranforma¸oes apro-
priadas, tais como log ou logit. No entanto, como mencionam Brooks e Gelman (1998),
ao considerarmos etodos MCMC, freq¨uentemente trabalhamos com distribui¸oes ao
normais e em muitos casos, com densidades de m´ultiplas modas. Assim, os autores
desenvolvem um fator de redu¸ao de escala que evita a hip´otese de normalidade.
Neste caso,
ˆ
R ´e uma raz˜ao de comprimentos de intervalos, constru´ıdo a partir das
´ultimas n itera¸oes de um total de 2n realizadas, como segue:
1. Para cada cadeia individual, tomar os pontos 100
α
2
% e 100(1
α
2
)% das n si-
mula¸oes, que ao os extremos do intervalo 100(1 α)%. Ao todo teremos m
comprimentos de intervalo;
2. Para o conjunto completo de mn observoes, considerando todas as cadeias ge-
radas, obter o comprimento do intervalo 100(1 α)%.
3. Calcular
ˆ
R definido como
ˆ
R
intervalo
=
comprimento do intervalo da seq¨encia completa
m´edia dos comprimentos dos intervalos das m seq¨uˆencias
.
Este etodo ´e mais acil de implementar ao necessitando do alculo de variˆancias.
A medida
ˆ
R
interval
tem a propriedade de se aproximar de 1 quando as cadeias convergem
e ser´a utilizada neste trabalho.
57
3.5 Crit´erios de sele¸ao de modelos
Durante o processo de modelagem, podem surgir d´uvidas a respeito, por exemplo, da
inclus˜ao e/ou exclus˜ao de parˆametros ou mesmo da forma da distribui¸ao adotada para
as observoes. Em casos como estes, podemos estar interessados em comparar mo-
delos alternativos com o objetivo de identificar aqueles que de screvam adequadamente
a informa¸ao contida nos dados e permitam explorar sua complexidade. Neste con-
texto, insere-se a aplica¸ao de crit´erios para sele¸ao de modelos baseados em medidas
que tentam quantificar sua qualidade de ajuste e aplicam alguma puni¸ao a modelos
complexos, c om muitos parˆametros, apontando para a escolha daqueles que sejam mais
parcimoniosos. Nesta se¸ao ao descritos os crit´erios de sele¸ao de modelos utilizados
neste trabalho.
3.5.1 Desvio preditivo esperado - EPD
Gelfand e Ghosh (1998) prop˜oem um crit´erio, conhecido como EPD (Expected P re-
diction Deviation), cujo objetivo ´e obter uma boa previs˜ao de uma r´eplica dos valores
observados, tendo em vista que deve haver fidelidade a esses valores observados. O
crit´erio consiste em minimizar a perda a posteriori para cada modelo sob estudo, com-
parando os valores obtidos e a partir da´ı, selecionar o modelo que minimizar o crit´erio.
Para um grande n´umero de poss´ıveis fun¸oes perda, o crit´erio de sele¸ao apresenta-se
de forma particionada, com um termo de bondade de ajuste e outro de puni¸ao devido
`a distˆancia entre a r´eplica e o valor observado. Os autores defendem sua utilidade
principalmente em modelos hier´arquicos complexos que incluam efeitos aleat´orios, pois
nestes casos a dimens˜ao do modelo ao ´e clara. O conhecimento da dimens˜ao do modelo
´e requisito de alguns crit´erios cl´assicos. O crit´erio consiste em calcular
min
a
E
y
rep
|y
obs
,m
L(y
rep
, a, y
obs
).
Define-se uma perda como fun¸ao de uma ao a com respeito ao vetor de dados
observados, y
obs
, e ao seu vetor de dados replicados, y
rep
, obtido como amostra da
distribui¸ao preditiva, f(y
rep
|y
obs
), para o modelo m em considera¸ao. A fun¸ao perda
para o l-´esimo componente dos vetores y
rep
e a ´e definida como segue
L(y
l,rep
, a
l
|y
obs
) = L(y
l,rep
, a
l
) + kL(y
obs
, a
l
), k 0. (3.7)
58
Agregando (3.7) para todos os componentes de y
rep
, temos
D
k
(m)
n
l=1
min
a
l
E
y
l,rep
|y
obs
,m
L(y
l,rep
, a
l
, y
obs
)
=
n
l=1
min
a
l
E
y
l,rep
|y
obs
,m
L(y
l,rep
, a
l
) + kL(y
l,obs
, a
l
).
(3.8)
Utilizando-se uma fun¸ao perda do tipo quadr´atica, para um a
l
fixo em (3.8), o
l-´esimo componente torna-se
σ
2(m)
l
+ (a
l
µ
(m)
l
)
2
+ k(a
l
y
l,obs
)
2
onde
µ
(m)
l
= E(y
l,rep
|y
l,obs
, m) e σ
2(m)
l
= V ar(y
l,rep
|y
l,obs
, m).
O m´ınimo ´e obtido quando a
l
´e (k + 1)
1
(µ
(m)
l
+ ky
l,obs
). Substituindo este valor de
a
l
em (3.8), temos
D
k
(m) =
n
l=1
σ
2(m)
l
+
k
k + 1
n
l=1
(µ
(m)
l
y
l,obs
)
2
. (3.9)
Em (3.9) considere
P (m) =
n
l=1
σ
2(m)
l
e G(m) =
n
l=1
(µ
(m)
l
y
l,obs
)
2
.
Os termos G(m) e P (m) s ˜ao medidas de qualidade de ajuste e de puni¸ao, respec-
tivamente. Para modelos subajustados ou sobreajustados, espera-se que as variˆancias
preditivas sejam elevadas e assim, o valor de P (m) tender´a a ser grande.
`
A medida em
que os modelos crescerem em complexidade, G(m) diminuir´a, enquanto P (m) come¸car´a
a aumentar. O aumento da complexidade do modelo pode resultar em puni¸ao e neste
caso, deve-se optar pela alternativa mais parcimoniosa.
Em (3.9), se k , temos
D(m) lim
k→∞
D
k
(m) = P (m) + G(m).
59
3.5.2 Crit´erio de informa¸ao baseado no desvio - DIC
A cria¸ao do crit´erio DIC (Deviance Information Criterion) foi motivada pelo problema
de comparar modelos complexos, tais como os do tipo hier´arquico, nos quais o n´ume ro
de parˆametros envolvidos ao est´a claramente definido.
Seguindo a nota¸ao de Spiegelhalter et al. (2002), suponha que θ
t
seja o verdadeiro
valor do parˆametro de interesse e que
˜
θ(y) seja um estimador para aquela quanti-
dade. Defina a informa¸ao residual nos dados observados y condicionais a θ como
2 log {p(y|θ)}. Ent˜ao a diferen¸ca entre a informa¸ao residual verdadeira e estimada
´e denotada por
d
Θ
{y, θ
t
,
˜
θ(y)} = 2 log{p(y|θ
t
)} + 2 log{p(y|
˜
θ(y))}. (3.10)
A quantidade (3.10) pode ser pensada como a redu¸ao na incerteza devido a es-
tima¸ao ou o grau de sobreajuste devido a
˜
θ(y) adaptar-se aos dados. A quantidade
d
Θ
po de constituir-se na base para as medidas cl´assica e Bayesiana de dimens˜ao de
modelos as quais se diferenciam pela forma como tratam os parˆametros desconhecidos
em d
Θ
. A medida cl´assica de dimens˜ao de modelos pode ser vista em Spiegelhalter et
al. (p. 4, 2002). Num contexto Bayesiano, a quantidade desconhecida θ
t
´e considerada
uma vari´avel aleat´oria. Enao d
Θ
{y, θ,
˜
θ(y)} pode ser estimado pela sua esperan¸ca a
posteriori com respeito a p(θ|y) denotada por
p
D
{y, Θ,
˜
θ(y)} = E
θ|y
[d
Θ
{y, θ,
˜
θ(y)}]
= E
θ|y
[2 log{p(θ|y)}] + 2 log[p{y|
˜
θ(y)}].
Enao p
D
{y, Θ,
˜
θ(y)} ´e proposto como o n´umero efetivo de parˆametros com respeito a
um modelo cujo c onjunto de parˆametros de interesse ´e Θ. Considere que
˜
θ(y) = E
θ|y
=
¯
θ. Outros estimadores poss´ıveis para d
Θ
e θ ao a mediana e a moda a posteriori.
Tomando f(y), um termo completamente especificado e padronizado (uma densidade
ou fun¸ao de probabilidade) como fun¸ao somente dos dados, p
D
po de ser escrito como
p
D
= D(θ) D(
¯
θ)
onde
D(θ) = 2 log{p(θ|y)} + 2 log{f(y)}.
Quando ´e utilizada a edia a posteriori como estimador, teremos p
D
0 para
qualquer verossimilhan¸ca log-cˆoncava em θ. Nos casos em que temos verossimilhan¸cas
ao log-cˆoncavas, podem ocorrer valores negativos de p
D
(Spiegelhalter et al., 2002).
60
A edia a posteriori do desvio, E
θ|y
{D(θ)} = D(θ) p ode ser utilizada para comparar
modelos, na medida em que incorpora alguma puni¸ao para a complexidade do modelo,
representada pela quantidade p
D
, o n´umero de parˆametros do modelo.
Antes de observar os dados Y , esperamos que o desvio a posteriori esperado seja
E
Y
(
¯
D) = E
Y
[E
θ|y
{D(θ)}]
= E
θ
(E
Y |θ
[2 log{p(Y |θ)} + 2 log{f(y)}]).
(3.11)
Se f(y) = p{Y |
ˆ
θ(Y )} onde
ˆ
θ(Y ) ´e o estimador de axima verossimilhan¸ca de θ,
enao
E
Y |θ
2 log
p(Y |θ)
p{Y |
ˆ
θ(Y )}

´e a raz˜ao de verossimilhan¸ca estimada para os valores ajustados
ˆ
θ(Y ) com respeito ao
modelo nulo e para certas condi¸oes ´e aproximadamente E(χ
2
p
) = p, a dimens˜ao de θ.
Enao, na equa¸ao (3.11), supondo o modelo como verdadeiro, espera-se que o desvio
esperado a posteriori seja E
Y
(
¯
D) E
θ
(p) = p, o n´umero de parˆametros livres em θ.
Esse fato pode s er ´util para verificar a qualidade de ajuste do modelo.
Uma medida de diagn´ostico de influˆencia pode ser dada por p
Di
definida como a
influˆencia que cada observao tem em seu pr´oprio valor ajustado
p
Di
= 2
E
θ|y
log
p(θ|y
i
)
p(θ)

log
p(
¯
θ|y
i
)
p(
¯
θ)

.
Considere que exista uma r´eplica do conjunto de dados Y , independente e denotada
por Y
rep
, sendo obtida pelo mesmo processo que se sup˜oe para os dados observados.
Suponha que a perda em associar uma probabilidade p(Y |
˜
θ) ao conjunto de dados
Y seja L(Y,
˜
θ). Assumindo que modelos p(Y |
˜
θ), para os quais espera-se que L(Y,
˜
θ)
seja pequena, ao favorecidos quando estamos selecionando modelos, um crit´erio para
sele¸ao de modelos pode ser baseado numa estimativa de E
Y
rep
|θ
t
{L(Y
rep
,
˜
θ)}. Uma
estimativa desta quantidade ´e a perda L{y,
˜
θ(y)} que ´e sofrida ao predizer o observado
y que deu origem a
˜
θ(y). Denotando o erro associado a esta estima¸ao como sendo c
Θ
,
tem-se
E
Y
rep
|θ
t
[L{Y
rep
,
˜
θ(y)}] = L{y,
˜
θ(y)} + c
Θ
{y, θ
t
,
˜
θ(y)}. (3.12)
Considere L(Y,
˜
θ) como uma fun¸ao perda logar´ıtmica, tal que
L(Y,
˜
θ) = 2 log{p(Y |
˜
θ)} = D(
˜
θ).
O crit´erio proposto ´e o deviance information criterion, DIC, definido como segue
DIC = D(
¯
θ) + 2p
D
=
¯
D + p
D
(3.13)
61
A equa¸ao (3.13) mostra que a quantidade DIC pode se r considerada como medida
Bayesiana de ajuste ou adequa¸ao, recebendo uma puni¸ao representada pelo termo de
complexidade p
D
.
Utilizando-se a fun¸ao perda logar´ıtmica na equa¸ao (3.12), obt´em-se
c
Θ
{y, θ
t
,
˜
θ(y)} = E
Y
rep
|θ
t
{D
rep
(
˜
θ)} D(
˜
θ)
onde D
rep
(
˜
θ) = 2 log[p{Y
rep
|
˜
θ(y))}]. Expandindo-se c
Θ
, temos
c
Θ
= E
Y
rep
|θ
t
{D
rep
(
˜
θ)D
rep
(θ
t
)}+E
Y
rep
|θ
t
{D
rep
(θ
t
)D(θ
t
)}+{D(θ
t
)D(
˜
θ)}. (3.14)
Denote os dois primeiros termos de (3.14) por L
1
e L
2
, respectivamente e substitua
o verdadeiro θ
t
pela quantidade aleat´oria θ. Expandindo-se L
1
at´e a segunda ordem,
temos
L
1
(θ,
˜
θ) E
Y
rep
|θ
{−2(
˜
θ θ)
T
L
rep,θ
(
˜
θ θ)
T
L

rep,θ
(
˜
θ θ)}
onde L
rep,θ
= log{p(Y
rep
|θ)}. Como E
Y
rep
|θ
(L
rep,θ
) = 0 dos resultados para a fun¸ao
score e rearrumando a express˜ao acima, obtemos
L
1
(θ,
˜
θ) tr{I
θ
(
˜
θ θ)(
˜
θ θ)
T
}
onde I
θ
= E
Y
rep
|θ
(L

rep,θ
) ´e a informa¸ao de Fisher em Y
rep
e y.
´
E razo´avel aproximar
I
θ
pela informa¸ao observada, calculada nos parˆametros estimados. Ent˜ao
L
1
(θ,
˜
θ) tr{−L

˜
θ
(
˜
θ θ)(
˜
θ θ)
T
} (3.15)
Suponha que sob um dado modelo, obtenhamos uma distribui¸ao a posteriori p(θ|y).
A partir das aproxima¸oes em (3.14) e (3.15), o erro estimado a posteriori quando
adota-se este modelo e o estimador
˜
θ ´e
E
θ|y
(c
Θ
) tr[L

˜
θ
E
θ|y
{(θ
˜
θ)(θ
˜
θ)
T
}] + E
θ|y
{L
2
(y, θ)} + E
θ|y
{D(θ) D(
˜
θ)}
Usando a m´edia a posteriori,
¯
θ, como estimador, tem-se
E
θ|y
(c
Θ
) tr(L

¯
θ
V ) + E
θ|y
{L
2
(y, θ)} + p
D
, (3.16)
onde V ´e definido como a covariˆancia a posteriori de θ e p
D
=
¯
D D(
¯
θ). Para L
2
(y, θ),
temos
L
2
(y, θ) = E
Y
rep
|θ
[2 log{p(Y
rep
|θ)}] + 2 log{p(y|θ)}
e assim E
Y
[E
θ|Y
{L
2
(Y, θ)}] = E
θ
[E
Y |θ
{L
2
(Y, θ)}] = 0. Como p
D
tr(L

¯
θ
V )
(Spiegelhalter et al., 2002, p. 4) e a partir das express˜oes (3.12) e (3.16), temos que a
62
perda a p osteriori esperada quando adotamos um particular modelo ´e
D(
¯
θ) + E
θ|y
(c
Θ
) D(
¯
θ) + 2p
D
= DIC,
a menos do termo E
θ|y
{L
2
(Y, θ)} que se espera ser 0.
Os autores alertam que o DIC deve ser utilizado como crit´erio de compara¸ao de
modelos para os quais a se saiba que ao candidatos a explicar as observoes. Devido
ao DIC e a quantidade p
D
apresentarem valores negativos em algumas situa¸oes e a
raz˜ao para tal fato ainda ao ser clara, recomenda-se a utiliza¸ao de outros crit´erios
em conjunto, tais como o EPD e o erro de previs˜ao. Este pode ser avaliado retirando
da an´alise alguns valores observados tratando-os como parˆametros a serem estimados
e enao comparar o que foi previsto com o observado. O DIC ´e tamb´em sens´ıvel ao
estimador de θ utilizado.
63
Cap´ıtulo 4
Aplica¸ao e Resultados
4.1 Descri¸ao e an´alise preliminar dos dados
Os dados dispon´ıveis consistem nas popula¸oes de todos os munic´ıpios do Estado de
ao Paulo apuradas pelos censos demogr´aficos de 1991 e de 2000 e pela contagem
populacional de 1996. Nos per´ıodos entre censos, disp˜oe-s e das popula¸oes estimadas
dos munic´ıpios selecionados para a amostra de primeiro est´agio da PNAD. A estima¸ao
das popula¸oes municipais foi feita utilizando-se o estimador descrito em (A.1), que
leva em conta somente o desenho amostral, para os dados da PNAD de 1992 a 1999,
excetuando-se o ano de 1994, para o qual a pesquisa ao foi realizada. Ao longo
do per´ıodo, houve modifica¸oes na malha municipal do estado, ocorrendo cria¸ao de
novos munic´ıpios a partir de alguns existentes. Esse fato levou `a decis˜ao de converter os
dados seguindo a base territorial vigente em 1991. Com essa base, tem-se ao todo 572
munic´ıpios, sendo que 111 foram selecionados pela PNAD na ecada de 90. A Figura
4.1 mostra os munic´ıpios selecionados pela PNAD segundo sua classifica¸ao no processo
de amostragem: metropolitanos, auto-representativos e ao-auto-representativos.
´
E importante lembrar que censo, contagem e PNAD possuem datas de referˆencia
diferentes e foi preciso compatibilizar estas datas. Para tal, codificou-se a vari´avel
tempo na curva de crescime nto exponencial dos modelos do Cap´ıtulo 3, considerando-
se o censo de 1991 como sendo o tempo zero e um es como 1/12 do ano. Assim, o valor
da vari´avel tempo numa dada pesquisa ´e igual ao tempo decorrido ap´os a realiza¸ao
do censo de 1991. Por exemplo, numa pesquisa realizada um ano e seis meses ap´os o
censo, o tempo ´e igual a 1,5.
64
Figura 4.1: Munic´ıpios selecionados pela PNAD no Estado de ao Paulo segundo a classifica¸ao no
processo de amostragem.
Trabalha-se com a densidade populacional do munic´ıpio definida como a popula¸ao
dividida pela ´area, neste caso medida em km
2
. A densidade permite explorar melhor as
similaridades dos munic´ıpios. Por exemplo, os munic´ıpios de Ribeir˜ao Preto e Caieiras
possu´ıam, em 1991, resp e ctivamente, 442370 e 39069 habitantes o que, analisando pela
ordem de grandeza, levaria a acreditar que esses munic´ıpios ao possuem nada em
comum. No entanto, observando suas densidades, obter´ıamos 401.42 e 406.97, que
ao valores mais pr´oximos. Como a base territorial foi convertida para aquela vigente
em 1991, as ´areas dos munic´ıpios permanecem fixas no tempo. A de nsidade ´e uma
tentativa de respeitar a hip´otese de permutabilidade nos modelos hier´arquicos.
Os gr´aficos das s´eries de todos os munic´ıpios ao apresentados no Anexo C.
´
E
poss´ıvel observar que, apesar da variabilidade e do aspecto das s´eries, a maioria dos
munic´ıpios apresenta tendˆencia de crescimento, se olharmos somente para os anos de
1991, 1996 e 2000, correspondentes aos censos demogr´aficos e `a contagem de popula¸ao.
Foram calculados os coeficientes de varia¸ao (c.v.) das popula¸oes estimadas para os
seis anos em que utiliza-se os dados da PNAD. A Figura 4.2 mostra o boxplot dos coefi-
cientes em cada um desses anos. Observa-se uma grande variabilidade dos coeficientes
65
de varia¸ao entre os munic´ıpios e uma tendˆencia de crescimento entre os anos a qual
po de ser explicada pelo envelhecimento das me didas de tamanho dos setores e dos mu-
nic´ıpios utilizadas para definir as probabilidades de sele¸ao. Dessa forma, quanto mais
pr´oximos estivermos do censo demogr´afico, de onde se obt´em tais medidas de tamanho,
mais pr´oximos estaremos do valor estabelecido para o erro de amostragem das vari´aveis
escolhidas para o dimensionamento da amostra. Afastando-se do censo, a base setorial
envelhece, fazendo com que a medida de tamanho utilizada ao corresponda `a atual
e isso pode causar aumento das variˆancias e, por consequˆencia, dos c.v.’s (Menezes et
al., 1991). Al´em disso, os valores elevados do c.v. demonstram a dificuldade de utilizar
apenas o estimador derivado diretamente do plano amostral da pesquisa para estimar
as popula¸oes das pequenas ´areas, na medida em que fornece estimativas de grande
variabilidade, devido em boa parte ao tamanho reduzido de amostra nessas ´areas. Essa
variabilidade explica o comportamento das eries do Anexo C.
Figura 4.2: Boxplot dos coeficientes de varia¸ao dos munic´ıpios ao longo dos anos e m que ao utilizados
os dados da PNAD.
A situa¸ao para o Estado como um todo ´e diferente daquela verificada para os
munic´ıpios: os coeficientes de varia¸ao ficam entre 2.62% e 4.98%, revelando que o
estimador direto fornece melhores resultados para n´ıveis geogr´aficos mais agregados.
A Figura 4.3 mostra o comportamento da densidade para o Estado nos censos, na
66
contagem populacional e na PNAD. O estimador utilizado para expandir a mostra da
PNAD, neste caso, ´e aquele dado em (2.1). Apesar da depress˜ao que pode ser vista na
s´erie no ano de 1996, podemos dizer que a popula¸ao no Estado est´a crescendo e que
a variabilidade ´e menor por causa dos c.v.’s obtidos.
Figura 4.3: Densidade demogr´afica anual do Estado de ao Paulo nos censos, na contagem popula-
cional e na PNAD.
Vale lembrar que a PNAD tem como dom´ınio de divulga¸ao os vinte e sete Estados
Brasileiros e nove Regi˜oes Metropolitanas, ao havendo, portanto informa¸oes para
munic´ıpios. As justificativas para ao se disponibilizar os dados em n´ıvel municipal se-
riam a ausˆencia de unidades amostrais para munic´ıpios ao selecionados para a amostra
e o erro grande nas estimativas daqueles que foram selecionados devido ao tamanho
pequeno das amostras de segundo e terceiro est´agios. Os modelos propostos neste tra-
balho ao justamente uma tentativa de reduzir o erro das estimativas obtidas a partir
do estimador derivado do plano amostral, fazendo uma esp´ecie de calibra¸ao dos da-
dos dispon´ıveis. Al´em disso, pretende-se obter estimativas dos tamanhos p opulacionais
para os munic´ıpios que ao fizeram parte da amostra da PNAD.
A Figura 4.4 mostra a distribui¸ao da densidade m´edia dos anos censit´arios para
os munic´ıpios selecionados pela PNAD. Observa-se que a distribui¸ao das densidades
m´edias pertence a alguma distribui¸ao assim´etrica `a esquerda, concentrando-se abaixo
do valor 2000. Na Tabela 4.1, encontram-se as estat´ısticas descritivas da densidade
67
m´edia.
Figura 4.4: Distribui¸ao das densidades m´edias dos munic´ıpios.
Tabela 4.1: Estat´ısticas descritivas da densidade edia
m´ınimo 1 quartil mediana edia 3 quartil aximo
8.78 68.89 189.6 1095 821.4 10600
A Figura 4.5 mostra a dispers˜ao da densidade m´edia contra o munic´ıpio, discriminan-
do-se a que classe pertencia o munic´ıpio no processo de amostragem da PNAD: metropo-
litano, auto-representativo e ao-auto-representativo. A Figura 4.6 ´e obtida retirando-
se os munic´ıpios com densidade m´edia superior a 2000 (todos metropolitanos) e sugere
que existe uma densidade m´edia global das ´areas, com as demais densidades variando
em torno dela. Isto sugere, ent˜ao, que os dados podem ser modelados se gundo um
modelo hier´arquico.
A an´alise preliminar dos dados dispon´ıveis revela que ´e poss´ıvel model´a-los atraes
de um modelo hier´arquico e tamb´em a partir de um modelo espacial, como pode ser
visto a partir da Figura 3.1 do Cap´ıtulo 3. A hip´otese de permutabilidade associada aos
modelos hier´arquicos pode ao ser razo´avel quando tratamos as densidades de todos
os munic´ıpios como permut´aveis, a que existem alguns muito diferentes, o que pode
influenciar nas previs˜oes. A inclus˜ao de vari´aveis dummy ao modelo (3.2) pode ajudar
a resolver o problema e tamb´em ser´a considerada.
68
Figura 4.5: Densidade m´edia por munic´ıpio.
Figura 4.6: Densidade m´edia por munic´ıpio, retirando-se os de densidade maior que 2000.
69
4.2 Modelagem dos dados de densidades municipais
Nesta se¸ao, ao apresentados os resultados do ajuste dos modelos apresentados no
Cap´ıtulo 3. Para ajustar esses modelos, precisamos especificar distribui¸oes a priori
para os hiperparˆametros. As m´edias das distribui¸oes a priori normais de α, β, e γ
foram obtidas expandindo-se a fun¸ao α + β exp (γt) em erie de Taylor, em torno do
ponto zero, at´e a derivada de segunda ordem e, em seguida, igualando-se os coeficientes
de t aos coeficientes de regress˜ao estimados da curva, y = α
0
+ α
1
t + α
2
t
2
, utilizando-se
trˆes pontos, os quais eram as densidades demogr´aficas edias nos censos de 1991 e
2000 e na contagem populacional de 1996. O objetivo era fazer com que as prioris
daqueles parˆametros fossem bem localizadas. Para as variˆancias, atribuiu-se o valor
de 10
6
, ou seja, era permitido um amplo intervalo de varia¸ao. Dessa forma, tem-se:
α N(370, 10
6
), β N(726, 10
6
), e γ N(0.04, 10
6
). Para os parˆametros τ
2
a
, τ
2
b
,
τ
2
c
, foram atribu´ıdas prioris tais que τ
2
a
G(0.001, 0.001), τ
2
b
G(0.001, 0.001),
τ
2
c
G(0.001, 0.001). Essas distribui¸oes caracterizam-se por serem vagas, por´em
pr´oprias. A seguir, ao dadas as distribui¸oes a priori atribu´ıdas aos parˆametros es-
pec´ıficos de cada modelo hier´arquico de curva de crescimento, sem a componente es-
pacial, e denotando:
1. por modelo 1 aquele em que σ
2
it
= σ
2
, com priori tal que σ
2
G(0.001, 0.001);
2. por modelo 2 o que sup˜oe lei de variˆancia tal que log (σ
2
it
) = η
0
+ η
1
f
i
, na PNAD
e log (σ
2
it
) = log (varc
it
), no censo, com prioris η
0
N(0, 10
6
) e η
1
N(0, 10
6
);
3. por modelo 3 o que sup˜oe lei de variˆancia tal que log (σ
2
it
) = η
0
+ η
1
f
i
, na PNAD
e log (σ
2
it
) = k log (varc
it
), no censo, com prioris η
0
N(0, 10
6
) e η
1
N(0, 10
6
)
e k G(0.001, 0.001);
4. por modelo 4 aquele que considera as variˆancias conhecidas, a menos de uma
constante, ou seja, σ
2
it
= k (1/var
ij
) onde k tem priori k G(0.001, 0.001).
No modelo espacial, foram atribu´ıdas distribui¸oes a priori tais que:
τ
2
da
G(0.001, 0.001), τ
2
db
G(0.001, 0.001), α
0
U(−∞, ) e β
0
U(−∞, ). As
prioris dos efeitos, δ
ai
e δ
bi
, i = 1, . . . , m, foram dadas no Cap´ıtulo 3, se¸ao 3.3.
O etodo de simula¸ao indireta utilizado foi o Gibbs sampler, sendo que foram
geradas duas amostras para cada parˆametro. A e stimativa pontual adotada para os
parˆametros dos modelos considerados foi a m´edia a posteriori. A convergˆencia dos
70
parˆametros em cada modelo ´e avaliada por meio de etodos gr´aficos. Pode-se consi-
derar que ao a evidˆencias de falta de convergˆencia de um dado parˆametro, quando:
ao longo do processo iterativo, os valores da estat´ıstica de Geweke (1992) z
G
, apre-
sentada na se¸ao 3.4, ficarem entre -1.96 e 1.96, que correspondem aos quantis 2.5%
e 97.5% da distribui¸ao normal padr˜ao; os valores da estat´ıstica
ˆ
R
intervalo
de Brooks e
Gelman (1998), tamb´em na se¸ao 3.4, ficam pr´oximos de 1; os tra¸cos das duas amostras
se misturam. Valores elevados da autocorrela¸ao indicam dependˆencia de valores ini-
ciais, o que leva o Gibbs sampler a percorrer a distribui¸ao a posteriori lentamente.
A combina¸ao des ses crit´erios indicar´a se houve ou ao convergˆencia. Os histogramas
po dem mostrar detalhes da forma da distribui¸ao a p osteriori, tais como: se ´e concen-
trada ou espalhada; assimetria; multimodalidade etc, servindo tamb´em como forma de
diagnosticar convergˆencia. Os histogramas foram constru´ıdos combinando-se as 5000
´ultimas observoes de cada amostra de um dado parˆametro. A an´alise dos parˆametros
que representam variˆancias ´e feita com base em seus inversos, ou seja, nas precis˜oes. A
convergˆencia dos parˆametros a
i
, b
i
e c
i
da curva de crescimento exponencial ao se r´a
avaliada.
4.2.1 Modelando os dados de munic´ıpios selecionados pela PNAD
Os modelos de 1 a 4, que tˆem estrutura dada pelo modelo asico em (3.2), diferen-
ciados apenas pela lei de variˆancia considerada, foram ajustados para os dados dos
111 munic´ıpios selecionados pela PNAD. O resumo dos quatro modelos adotados nesta
primeira parte da aplica¸ao pode ser visto na Tabela 4.2.
Tabela 4.2: Resumo dos modelos adotados
modelo lei de variˆancia distrib. a priori
1 σ
2
it
= σ
2
σ
2
G(0.001, 0.001)
2 log (σ
2
it
) = η
0
+ η
1
f
i
, na PNAD η
0
N(0, 10
6
) e
e log (σ
2
it
) = log (varc
it
), no censo η
1
N(0, 10
6
)
3 log (σ
2
it
) = η
0
+ η
1
f
i
, na PNAD η
0
N(0, 10
6
), η
1
N(0, 10
6
)
log (σ
2
it
) = k log (varc
it
), no censo e k G(0.001, 0.001)
4 σ
2
it
= k (1/var
ij
) k G(0.001, 0.001)
O objetivo era verificar o desempenho destes quatro modelos hier´arquicos propostos,
quando aplicados ao conjunto de dados sem observoes ausentes, selecionando o que
se apresentasse mais adequado. Os munic´ıpios selecionados pela PNAD ao formam
71
uma regi˜ao de ´areas cont´ıguas e na defini¸ao de vizinhan¸ca adotada chamamos de
vizinhos aqueles munic´ıpios que compartilham um limite comum. Por e sta raz˜ao, ao
se ajustou o modelo hier´arquico com estrutura espacial, neste primeiro exerc´ıcio, onde
apenas os munic´ıpios selecionados foram considerados. O modelo espacial foi ajustado
na subse¸ao 4.2.2, utilizando-se a lei de variˆancia do modelo escolhido como o mais
adequado, dentre os quatro apresentados na Tabela 4.2, para obter as previs˜oes po-
pulacionais dos demais munic´ıpios, ao selecionados para a amostra da PNAD.
Para o modelo 1, observa-se que a maioria dos parˆametros ao convergiu ap´os
60000 itera¸oes do Gibbs sampler, prejudicando a an´alise. Para exemplificar, como
´e poss´ıvel ver no Anexo D, os histogramas de α e β mostram que as distribui¸oes
desses parˆametros est˜ao centradas em pontos diferentes, indicando bimodalidade. A
autocorrela¸ao da segunda amostra de α indica forte dependˆencia dos valores inicias.
O gr´afico da estat´ıstica z
G
de Geweke ao longo das itera¸oes aponta para a suspeita de
ao convergˆencia de α. Os desvios a posteriori chegam a ser maiores que as edias,
como po de se r visto na Tabela 4.3. Situa¸ao inversa ´e vista para σ
2
.
Tabela 4.3: Resumo da distribui¸ao a posteriori dos parˆametros do modelo 1
parˆametro m´edia desvio
α 479.643 456.312
β 583.736 452.875
γ 0.018 0.016
σ
2
1.879e-005 9.588e-007
τ
2
a
19.502 114.033
τ
2
b
8.484e-006 1.073e-005
τ
2
c
1444.068 1304.915
Para o modelo 2, os parˆametros τ
2
b
e τ
2
c
apresentam autocorrela¸oes elevadas at´e
o lag 50, indicando dependˆencia dos valores iniciais, mas pelos demais crit´erios ao a
raz˜oes para suspeitar da convergˆencia. Os gr´aficos podem ser vistos no Ane xo D. Os
valores de η
0
e η
1
, no modelo 2, ao estimados como sendo, respectivamente, 11.818 e
-9.188, significando que quanto maior a fra¸ao amostral de setores, menor ser´a log (σ
2
it
)
e, portanto, o mesmo acontece para σ
2
it
. Uma compara¸ao entre as estimativas das
precis˜oes das observoes estimadas pelo modelo 2 e a precis˜ao estimada pelo modelo
1, revela que para 34 munic´ıpios, se consegue um aumento de precis˜ao nos anos de
PNAD. Nos anos de censo, o aumento de precis˜ao ocorre em 106 munic´ıpios. As
estimativas dos parˆametros do modelo 2 podem ser vistas na Tabela 4.4 e no Anexo E.
72
Tabela 4.4: Resumo da distribui¸ao a posteriori dos parˆametros do modelo 2
parˆametro m´edia desvio
α 823.011 193.684
β 169.069 26.793
γ 0.055 0.009
η
0
11.818 0.069
η
1
-9.188 0.195
τ
2
a
2.379e-007 3.291e-008
τ
2
b
2.327e-005 1.060e-005
τ
2
c
444.775 95.401
No modelo 3, tamb´em ocorre redu¸ao na variˆancia com o aumento da fra¸ao amostral,
a que os valores de η
0
e η
1
ao estimados como sendo, respectivamente, 10.854 e -8.146.
Verifica-se que log (σ
2
it
) nos anos censit´arios sofre um aumento de 1.513 a cada unidade
acrescida na variˆancia do censo. Aqui, como no modelo 2, observa-se aumento da pre-
cis˜ao em rela¸ao ao modelo 1: para os 111 munic´ıpios a precis˜ao aumenta nos anos da
PNAD e 92 para o censo. Po de-s e considerar que os parˆametros convergiram, apesar
de alguns apresentarem valores elevados das autocorrela¸oes, como pode ser visto no
Anexo D. As estimativas dos parˆametros do mo delo 3 podem ser vistas na Tabela 4.5.
Tabela 4.5: Resumo da distribui¸ao a posteriori dos parˆametros do modelo 3
parˆametro m´edia desvio
α 1044.032 211.284
β 23.708 5.777
γ 0.090 0.020
k 1.513 0.026
η
0
10.854 0.080
η
1
-8.146 0.200
τ
2
a
1.944e-007 2.615e-008
τ
2
b
0.001 0.0006
τ
2
c
91.055 23.226
No modelo 4, a estimativa de k igual a 0.375 indica que este fator atua como redutor
da precis˜ao σ
2
it
. As estimativas dos parˆametros do modelo 4 ao apresentadas na Tabela
4.6.
73
Tabela 4.6: Resumo da distribui¸ao a posteriori dos parˆametros do modelo 4
parˆametro m´edia desvio
α 792.773 193.606
β 207.901 54.119
γ 0.041 0.007
k 0.375 0.020
τ
2
a
2.491e-007 3.518e-008
τ
2
b
2.022e-005 9.096e-006
τ
2
c
570.287 206.379
Na Tabela 4.7, ao apresentadas as medidas do crit´erio de sele¸ao EPD para os 4
modelos considerados, particionadas nos termos de qualidade de ajuste e de puni¸ao,
denotados por G e P , respectivamente. Os modelos com melhor qualidade de ajuste ao
o 1 e 2, por apresentarem menor valor de G. O modelo que recebe a menor puni¸ao ´e o
modelo 2. Na soma das quantidades G e P , obt´em-se o mesmo valor para o EPD. Na
mesma tabela podem ser vistos os valores do crit´erio DIC, tamb´em particionado. Os
modelos propostos constituem-se em exemplos onde a parcela p
D
´e negativa. O menor
valor do DIC no modelo 2 aponta para sua escolha como melhor modelo para ajustar
os dados. a um empate entre os modelos 1 e 2 pelo crit´erio EPD, mas deve-se lembrar
que o modelo 1 apresentou problemas de convergˆencia e portanto suas estimativas ao
ao confi´aveis. Combinando-se as informa¸oes fornecidas pelos dois crit´erios, conclui-se
que o modelo 2 deve ser o escolhido.
Tabela 4.7: Medidas de sele¸ao de modelos para a densidade demogr´afica
modelo G P EP D
¯
D
ˆ
D p
D
DIC
1 1.07E+08 6.11E+07 1.68E+08 13706.100 16447.500 -2741.360 10964.800
2 1.17E+08 5.12E+07 1.68E+08 11308.100 14164.900 -2856.820 8451.300
3 3.88E+08 3.22E+08 7.10E+08 11303.800 12010.200 -706.414 10597.400
4 7.55E+08 6.72E+08 1.43E+09 10128.700 11761.700 -1633.040 8495.650
As estimativas de α, β e γ mostram que os munic´ıpios est˜ao crescendo. As estimati-
vas de γ foram positivas em todos os modelos, indicando que em edia, os munic´ıpios
tˆem uma tendˆencia de crescimento explosivo, de acordo com a interpreta¸ao de um valor
positivo para o parˆametro c
i
numa curva de crescimento exponencial. No Anexo E,
vemos que as estimativas individuais c
i
indicam o mesmo comportamento. No mesmo
anexo, se encontram as estimativas de a
i
e b
i
, do modelo 2.
74
Foram obtidas as distribui¸oes preditivas de cada y
it
. Para exemplificar o que ocorre
com as distribui¸oes preditivas sob o modelo 2, ao apresentados a m´edia e o desvio a
posterior na Tabela 4.8 para os munic´ıpios Americana area 1) e Apia´ı area 2). Para
o munic´ıpio de Apia´ı, caracterizado por apresentar baixa densidade demogr´afica, os
desvios a posteriori das previs˜oes ao bastante elevados e isso foi tamb´em verificado
para os demais munic´ıpios de mesma caracter´ıstica. Al´em disso, verifica-se menores
desvios nos anos 1991, 1996 e 2000 os quais ao os anos cens it´arios e da contagem
populacional.
Tabela 4.8: Resumo das distribui¸oes preditivas para os munic´ıpios Americana e Apia´ı de 1991 a 2000,
excetuando-se o ano 1994.
´area ano edia desvio ´area ano m´edia desvio
1 1991 1154 38.320 2 1991 21.860 0.752
1 1992 1171 314.000 2 1992 22.240 187.700
1 1993 1189 315.900 2 1993 20.280 184.500
1 1995 1226 314.500 2 1995 21.420 183.900
1 1996 1249 36.070 2 1996 21.870 0.608
1 1997 1273 317.000 2 1997 17.630 181.500
1 1998 1295 315.600 2 1998 21.510 187.100
1 1999 1324 314.700 2 1999 22.270 183.400
1 2000 1354 45.140 2 2000 21.860 0.738
No caso da distribui¸ao de π
it
, parˆametro que representa a verdadeira densidade,
os desvios ao bem reduzidos em rela¸ao `a m´edia a posteriori, como pode ser visto na
Tabela 4.9 para os mesmos munic´ıpios do exemplo anterior. Na Figura 4.7, tem-se uma
compara¸ao entre os valores observados e as m´edias a posteriori de π
it
daqueles mu-
nic´ıpios.
´
E poss´ıvel observar que o comportamento das m´edias de π
it
(em vermelho) ´e
mais suave que aquele verificado para os valores observados (linha tracejada azul), pro-
movendo uma corre¸ao nos dados. Nos gr´aficos, ao tamb´em apresentados os intervalos
de 95% de c redibilidade. Os gr´aficos comparativos dos demais munic´ıpios podem ser
vistos no Anexo F. Vale notar que a densidade demogr´afica estimada pela m´edia a p os-
teriori de π
it
, sob o modelo 2, consegue acompanhar a tendˆencia de crescimento dada
pelos censos, apresentando variabilidade reduzida e corrigindo as estimativas obtidas
com base no estimador derivado do plano amostral.
As densidades apresentam variabilidade grande entre os munic´ıpios e a hip´otese
de permutabilidade po de ao ser razo´avel. Foi feita uma modifica¸ao no modelo 2
75
Tabela 4.9: Resumo das distribui¸oes a posteriori do parˆametro que representa a densidade de-
mogr´afica verdadeira para os munic´ıpios Americana e Apia´ı de 1991 a 2000, excetuando-se o ano
1994.
´area ano edia desvio ´area ano edia desvio
1 1991 1154 25.200 2 1991 21.870 0.503
1 1992 1172 22.790 2 1992 21.870 0.438
1 1993 1190 20.770 2 1993 21.870 0.386
1 1995 1230 18.060 2 1995 21.870 0.323
1 1996 1249 17.890 2 1996 21.870 0.319
1 1997 1273 18.830 2 1997 21.870 0.335
1 1998 1299 21.220 2 1998 21.870 0.371
1 1999 1326 25.130 2 1999 21.870 0.422
1 2000 1354 30.060 2 2000 21.870 0.473
Figura 4.7: Compara¸ao entre os valores observados e a m´edia a posteriori da densidade demogr´afica
dos munic´ıpios Americana e Apia´ı.
para verificar se a hip´otese de permutabilidade das densidades municipais estaria sendo
violada a ponto de influenciar os erros das previs˜oes. Para tal, foi inclu´ıda uma vari´avel
dummy X
i
, tal que a
i
= α
0
+α
1
X
i
+ξ
ai
, b
i
= β
0
+β
1
X
i
+ξ
bi
e c
i
= γ
0
+γ
1
X
i
+ξ
ci
, onde
X
i
= 1, se o munic´ıpio i ´e a capital ou possui taxa de urbaniza¸ao acima de 95%, o que
ocorre para 64 munic´ıpios dos 111 sele cionados, e X
i
= 0, caso contario.
´
Areas mais
urbanizadas tendem a apresentar crescimento mais acelerado. As prioris atribu´ıdas
aos parˆametros α
0
, α
1
, β
0
, β
1
, γ
0
e γ
1
foram, respectivamente, α
0
N(370, 10
6
),
76
α
1
N(0, 10
6
), β
0
N(726, 10
6
), β
1
N(0, 10
6
), γ
0
N(0.04, 10
6
) e γ
1
N(0, 10
6
).
As estimativas para esse ajuste encontram-se na Tabela 4.10 e ´e poss´ıvel ver que a
densidade de partida π
i0
e o fator de crescimento c
i
tˆem um ganho, respectivamente,
de 1372.64 e 0.036 unidades quando o munic´ıpio possui elevada taxa de urbaniza¸ao.
Os gr´aficos para o diagn´ostico de convergˆencia est˜ao no Anexo D e pode-se considerar
que os parˆametros convergiram. Com a inclus˜ao da vari´avel dummy no modelo 2, as
parcelas G e P do crit´erio EP D ao respectivamente iguais a 1.19E+08 e 5.22E+07,
com DIC = 7913.890. Comparando-se esses valores do EPD e do DIC com aqueles
obtidos para o modelo 2 na Tabela 4.7, observa-se que o modelo sem a vari´avel dummy
seria o preferido com base no crit´erio EPD, ocorrendo o inverso ao considerar o DIC,
ao sendo poss´ıvel desempat´a-los, levando-se em conta somente estes crit´erios e assim,
ambos ser˜ao ajustados na se¸ao a seguir para serem comparados ao modelo espacial.
Tabela 4.10: Resumo da distribui¸ao a posteriori dos parˆametros do modelo 2 com vari´avel dummy
em a, b e c.
parˆametro m´edia desvio
α
0
140.565 266.418
α
1
1147.729 344.603
β
0
71.058 39.165
β
1
227.340 55.003
γ
0
0.022 0.011
γ
1
0.036 0.001
η
0
11.837 0.070
η
1
-9.210 0.197
τ
2
a
2.7083e-007 3.839e-008
τ
2
b
2.702e-005 1.836e-005
τ
2
c
598.296 142.418
As Figuras 4.8, 4.9 e 4.10 mostram a distribui¸ao espacial das m´edias a posteriori dos
parˆametros a, b e c, obtidas pelo modelo 2.
´
E poss´ıvel ver que existe rela¸ao entre os
parˆametros de munic´ıpios vizinhos, sugerindo a aplica¸ao de um modelo com estrutura
espacial nos parˆametros a, b e c. Um modelo com estrutura espacial nos parˆametros a
e b ´e ajustado, na pr´oxima subse¸ao, para os dados de munic´ıpios selecionados e ao
selecionados para a amostra da PNAD.
77
Figura 4.8: Mapa do Estado de ao Paulo com o parˆametro a de cada munic´ıpio classificado pelas
m´edias a posteriori obtidas pelo modelo 2.
Figura 4.9: Mapa do Estado de ao Paulo com o parˆametro b de cada munic´ıpio classificado pelas
m´edias a posteriori obtidas pelo modelo 2.
78
Figura 4.10: Mapa do Estado de ao Paulo com o parˆametro c de cada munic´ıpio classificado pelas
m´edias a posteriori obtidas pelo modelo 2.
4.2.2 Modelando os dados de munic´ıpios selecionados e ao
selecionados pela PNAD
Nesta subse¸ao, pretende-se obter a distribui¸ao de π
it
dos munic´ıpios ao selecionados
para a amostra de primeiro est´agio da PNAD nos anos ao censit´arios. Na se¸ao ante-
rior, vimos que ´e razo´avel propor um modelo hier´arquico com estrutura espacial para
ajustar os dados. O conjunto dos munic´ıpios selecionados pela PNAD ao formam uma
regi˜ao de ´areas cont´ıguas. Al´em disso, no modelo hier´arquico espacialmente estrutu-
rado da se¸ao 3.3, a defini¸ao de vizinhan¸ca adotada considera como vizinhas ´areas
que compartilhem um limite comum. Sendo assim, foi feita uma sele¸ao de uma regi˜ao
do Estado de ao Paulo, a qual pode ser vista na Figura 4.11, contendo munic´ıpios
selecionados e ao selecionados pela PNAD. A regi˜ao em destaque no mapa ´e formada
apenas por ´areas cont´ıguas, contendo 73 munic´ıpios, dentre os quais 24 ao foram se-
lecionados para a PNAD. Vale lembrar que, para os munic´ıpios ao selecionados pela
PNAD, dispomos ap e nas das popula¸oes fornecidas pelos c ensos.
As distribui¸oes a priori dos parˆametros do modelo espacial ao as mesmas a
descritas para os parˆametros em comum com o modelo 2 (na Tabela 4.2), acrescentando-
se as distribui¸oes a priori dos efeitos espaciais, especificadas na se¸ao 3.3. Adotou-se
para σ
2
it
no modelo espacial, lei de variˆancia igual `aquela considerada no modelo 2.
79
Figura 4.11: Mapa do Estado de ao Paulo destacando a regi˜ao de aplica¸ao do modelo espacial.
O modelo 2 da se¸ao anterior, tratado aqui c omo modelo sem vari´avel dummy, foi
tamb´em ajustado para os munic´ıpios da regi˜ao selecionada no mapa da Figura 4.11.
Um resumo dos modelos adotados nesta se¸ao ´e apresentado na Tabela 4.11.
Tabela 4.11: Resumo dos modelos adotados
modelo parˆametros lei de variˆancia distrib. a priori
s/dummy a
i
= α + ξ
ai
log (σ
2
it
) = η
0
+ η
1
f
i
, η
0
N(0, 10
6
)
b
i
= β + ξ
bi
na PNAD η
1
N(0, 10
6
)
c
i
= γ + ξ
ci
log (σ
2
it
) = log (varc
it
),
no ce nso
c/dummy a
i
= α
0
+ α
1
X
i
+ ξ
ai
log (σ
2
it
) = η
0
+ η
1
f
i
, η
0
N(0, 10
6
)
b
i
= β
0
+ β
1
X
i
+ ξ
bi
na PNAD η
1
N(0, 10
6
)
c
i
= γ
0
+ γ
1
X
i
+ ξ
ci
log (σ
2
it
) = log (varc
it
),
no ce nso
espacial a
i
= α
0
+ δ
ai
log (σ
2
it
) = η
0
+ η
1
f
i
, η
0
N(0, 10
6
)
b
i
= β
0
+ δ
bi
na PNAD η
1
N(0, 10
6
)
c
i
= γ + ξ
ci
log (σ
2
it
) = log (varc
it
), δ
ai
|δ
a,i
, τ
2
da
N(
¯
δ
ai
, τ
2
da
/w
i+
)
m
i=1
δ
ai
= 0 e
m
i=1
δ
bi
= 0 no c enso δ
bi
|δ
b,i
, τ
2
db
N(
¯
δ
bi
, τ
2
db
/w
i+
)
No modelo sem vari´avel dummy, ao a evidˆencias de falta de convergˆencia dos
parˆametros, apesar das autocorrela¸oes dos parˆametros γ, τ
2
b
e τ
2
c
apresentarem
valores elevados, como pode ser visto no Anexo D, demorando a decrescer. Os resumos
80
das distribui¸oes a posteriori podem ser vistos na Tabela 4.12. Como no caso em
que se trabalhou somente com os munic´ıpios selecionados para a amostra de primeiro
est´agio, os munic´ıpios apresentam tendˆencia de crescimento. Al´em disso, as variˆancias
das observoes diminuem com o aumento da fra¸ao amostral de setores, a que as
estimativas de η
0
e η
1
ao, respectivamente, 13.730 e -33.622.
Tabela 4.12: Resumo da distribui¸ao a posteriori dos parˆametros do mo delo hier´arquico sem vari´avel
dummy para os dados da regi˜ao selecionada
parˆametro edia desvio
α 1023.986 264.887
β 349.323 71.775
γ 0.062 0.006
η
0
13.730 0.151
η
1
-33.622 2.432
τ
2
a
1.945e-007 3.478e-008
τ
2
b
6.067e-006 2.048e-006
τ
2
c
753.867 226.077
Acrescentando vari´aveis dummy em a, b e c, como na subse¸ao anterior, para os
45 munic´ıpios com taxa de urbaniza¸ao maior que 95% mais a capital, ao obtidos os
resultados da Tabela 4.13. O fato de um munic´ıpio ter urbaniza¸ao elevada faz com que
a densidade inicial seja acrescida de 1708.566 referente `a soma das edias a posteriori
de α
1
e β
1
.
Tabela 4.13: Resumo da distribui¸ao a posteriori dos parˆametros do modelo hier´arquico com vari´avel
dummy em a, b e c para os dados da regi˜ao selecionada.
parˆametro edia desvio
α
0
301.773 367.316
α
1
1345.589 459.883
β
0
72.264 38.104
β
1
362.977 59.703
γ
0
0.060 0.012
γ
1
0.012 0.014
η
0
13.735 0.142
η
1
-33.484 2.284
τ
2
a
2.101e-007 3.570e-008
τ
2
b
3.011e-005 1.039e-005
τ
2
c
521.065 163.297
81
No modelo espacial, existe a suspeita de ao convergˆencia do parˆametro β
0
, como
po de ser visto no Anexo D. As estimativas dos parˆametros podem ser vistas na Tabela
4.14. Os resultados tamb´em mostram que a variˆancia decresce com o aumento da
fra¸ao amostral do segundo est´agio.
Tabela 4.14: Resumo da distribui¸ao a posteriori dos parˆametros do modelo espacial
parˆametro edia desvio
α
0
1260.693 8.959
β
0
153.544 5.848
γ 0.023 0.001
η
0
13.695 0.156
η
1
-33.088 2.539
τ
2
c
1643.975 697.630
τ
2
da
9.570e-008 1.909e-008
τ
2
db
7.121e-008 1.517e-008
Na Tabela 4.15, tem-se as previs˜oes da densidade demogr´afica, dadas pelas m´edias a
posteriori do parˆametro π
it
, para o munic´ıpio Guararema, tomado como exemplo, sob
os modelos com e sem a vari´avel dummy e sob o modelo espacial. Vale a pena observar
que os desvios a posteriori para o modelo espacial ao maiores que aqueles observados
nos demais modelos. Na Tabela 4.16, tem-se as previs˜oes para novas observoes, dadas
pelas m´edias das distribui¸oes preditivas y
it
. Neste caso, nos anos de PNAD, os desvios
ao bastante elevados para todos os modelos e isso se deve `a estima¸ao das variˆancias
σ
2
it
. Uma lei de variˆancia bem escolhida pode resultar na redu¸ao das variˆancias.
Tabela 4.15: edia e desvio a posteriori da verdadeira densidade π
it
para o munic´ıpio Guararema sob
os modelos com e sem vari´avel dummy e o modelo espacial.
modelo 2 s/dummy modelo 2 c/dummy espacial
´area ano m´edia desvio e dia desvio edia desvio
19 1991 64.280 1.492 64.110 1.501 64.220 7.071
19 1992 65.450 1.357 65.440 1.342 65.760 6.347
19 1993 66.610 1.250 66.730 1.225 67.190 5.824
19 1995 69.270 1.098 69.520 1.091 70.030 5.360
19 1996 70.510 1.078 70.780 1.085 71.220 5.432
19 1997 72.130 1.117 72.360 1.133 72.640 5.721
19 1998 73.90 1.259 74.040 1.265 74.060 6.199
19 1999 75.850 1.535 75.820 1.502 75.480 6.827
19 2000 77.790 1.919 77.560 1.830 76.780 7.502
82
Tabela 4.16: edia e desvio da distribui¸ao preditiva para o munic´ıpio Guararema sob os modelos
com e sem a vari´avel dummy e o modelo e spacial.
modelo 2 s/dummy modelo 2 c/dummy espacial
´area ano m´edia desvio edia desvio m´edia desvio
19 1991 64.290 2.212 64.110 2.244 64.220 7.283
19 1992 61.580 962.700 64.860 956.500 64.620 946.800
19 1993 91.380 945.900 67.300 966.700 68.320 946.400
19 1995 71.110 960.700 70.810 973.200 83.030 955.400
19 1996 70.550 1.999 70.790 1.999 71.200 5.690
19 1997 55.400 964.900 89.680 977.300 67.890 949.500
19 1998 62.360 973.800 58.040 973.800 78.020 948.900
19 1999 80.780 958.400 72.540 973.300 45.000 957.100
19 2000 77.800 2.774 77.600 2.731 76.740 7.781
Os valores calculados do DIC para o modelo espacial e os modelos sem e com a
vari´avel dummy foram 20385.200, 4314.980 e 5077.390, respectivamente, sendo que,
para o modelo espacial, a parcela p
D
foi positiva, ao contr´ario dos outros dois casos.
Para o EPD temos 1.588E+8, 1.610E+8 e 1.663E+8 para o modelo espacial e os mo-
delos sem e com a vari´avel dummy, respectivamente. O modelo espacial leva vantagem
em rela¸ao ao modelo sem a vari´avel dummy pelo crit´erio EPD, mas perde pelo DIC.
Como o modelo espacial apresentou problemas de convergˆencia de um parˆametro, o
modelo sem a vari´avel dummy (o modelo 2 da Tabela 4.2) ser´a utilizado para obter as
previs˜oes populacionais dos munic´ıpios. As medidas de sele¸ao de modelos podem ser
vistas na Tabela 4.17.
Tabela 4.17: Medidas de sele¸ao de modelos para a densidade demogr´afica
modelo G P EP D
¯
D
ˆ
D p
D
DIC
s/dummy 1.59E+08 1.970E+06 1.610E+8 6415.830 8516.680 -2100.850 4314.980
c/dummy 1.64E+08 1.948E+06 1.663E+8 6422.730 7768.080 -1345.340 5077.390
espacial 1.57E+08 1.970E+06 1.588E+8 14315.400 8245.580 6069.830 20385.200
83
4.3 Previs˜oes Bayesianas como m´etodo de calibra¸ao
O IBGE expande os dados da PNAD utilizando estima¸ao de raz˜ao, onde a vari´avel
auxiliar ´e a proje¸ao populacional obtida por processo independente da amostra da
PNAD. Com esse m´etodo, tem-se um ajuste dos pesos fornecidos pelo uso do estimador
derivado do plano amostral. Quando esse s pesos ajustados ao usados para estimar o
total da popula¸ao, ´e produzida uma estimativa com o mesmo valor da popula¸ao
projetada, e diz-se que houve uma calibra¸ao dos dados da PNAD. Nossa proposta ´e a
aplica¸ao de modelos hier´arquicos e espaciais sob abordagem Bayesiana para promover
o ajuste das popula¸oes, mais especificamente as municipais, obtidas com base no
estimador direto, obtendo-se tamb´em as estimativas das popula¸oes dos munic´ıpios ao
selecionados para a amostra da PNAD. Como visto na Figura 4.7 e no Anexo F, o ajuste
das densidades, que ao as popula¸oes divididas pelas ´areas dos respectivos munic´ıpios,
´e conseguido pelo modelo 2 (modelo hier´arquico sem a vari´avel dummy, na Tabela
4.2). Falta prever as popula¸oes dos munic´ıpios. Na se¸ao anterior, foram estimadas as
densidades demogr´aficas dos munic´ıpios ao selecionados e a etapa seguinte ´e fazer as
previs˜oes para os tamanhos populacionais µ
it
, com base em sua distribui¸ao a posteriori,
obtida pelo Gibbs sampler atrav´es da inclus˜ao do passo µ
(l)
it
= π
(l)
it
A
i
, como na se¸ao
3.2.1. A edia a posteriori de µ
it
´e utilizada como estimativa pontual da popula¸ao
municipal.
Como a f oi dito anteriormente, o menor dom´ınio de divulga¸ao dos dados da PNAD
´e o n´ıvel de regi˜ao metropolitana. Como forma de validar os resultados do modelo
2 utilizado para prever as popula¸oes municipais, foram obtidas as estimativas da
popula¸ao da regi˜ao metropolitana do estado de ao Paulo a partir da aplica¸ao desse
modelo, com o objetivo de compar´a-las ao resultado oficial da pesquisa. A regi˜ao
metropolitana ´e formada pela agrega¸ao de um conjunto de munic´ıpios para os quais
a obtivemos as estimativas dos tamanhos populacionais. Es tamos interessados na
distribui¸ao a posteriori de
r
i=1
µ
it
|D, ou seja,
r
i=1
π
it
A
i
|D, que ´e facilmente obtida,
acrescentando-se no algoritmo do Gibbs sampler o passo
θ
(l)
t
=
r
i=1
π
(l)
it
A
i
onde θ
t
representa a popula¸ao da regi˜ao metropolitana no tempo t e r ´e o n´umero de
munic´ıpios pertencentes `a regi˜ao.
Na Figura 4.12, temos o gr´afico comparativo das estimativas da popula¸ao da regi˜ao
84
metropolitana do Estado de ao Paulo dadas pelo modelo 2 e pelo m´etodo de calibra¸ao
do IBGE. A edia a posteriori de θ
t
´e utilizada como estimativa pontual da popula¸ao
da regi˜ao metropolitana. As linhas cheias representam os limites do intervalo de 95%
de credibilidade para a popula¸ao θ
t
, enquanto a linha tracejada ´e a m´edia a posteriori.
O s´ımbolo (+) representa a popula¸ao calibrada, mais o que foi observado nos censos.
Claramente os resultados obtidos pelo modelo proposto ao bem pr´oximos daqueles
obtidos pelo etodo de calibra¸ao. Na Tabela 4.18 ao apresentados os limites do
intervalo de 95% de credibilidade, a m´edia e o desvio a posteriori, em cada ano, o
observado na contagem e nos censos e as popula¸oes divulgadas pela PNAD.
Figura 4.12: Compara¸ao entre as popula¸oes estimadas pelo modelo 2 e as popula¸oes calibradas pelo
uso de estima¸ao de raz˜ao, mais as observadas nos censos e na contagem, para a regi˜ao metropolitana
do Estado de ao Paulo.
Na Figura 4.13, temos os gr´aficos dos munic´ıpios Cubat˜ao area 12) e Diadema
area 13), ambos selecionados pela PNAD, onde as popula¸oes estimadas pelo ajuste
do modelo 2 ao comparadas com as proje¸oes populacionais fornecidas pelo IBGE
nos anos ao censit´arios, tendo sido obtidas atrav´es da aplica¸ao do etodo dos co-
eficientes (IBGE, 2002a), e com a contagem populacional e os censos demogr´aficos.
As linhas cheias representam os limites do intervalo de credibilidade 95% para a po-
85
Tabela 4.18: Limites do intervalo de 95% de credibilidade, edia e desvio a posteriori, em cada
ano, valores observados na contagem e nos censos e popula¸oes divulgadas pela PNAD para a regi˜ao
metropolitana do Estado de ao Paulo.
ano lim. 2.5% pnad/censo m´edia lim. 97.5% desvio
1991 14938673 15391795 15577252 16198293 319288
1992 15183558 15751523 15767241 16335756 292577
1993 15425118 15973940 15958875 16483571 269291
1995 15931807 16402029 16397295 16858539 234780
1996 16149408 16513474 16604628 17057188 230528
1997 16401213 16915433 16874538 17342567 239494
1998 16641900 17148046 17169698 17693756 268315
1999 16871872 17380475 17494520 18124915 319213
2000 17082531 17797364 17819346 18591574 385811
pula¸ao verdadeira µ
it
obtida pelo modelo 2, enquanto a linha tracejada ´e a m´edia a
posteriori. O s´ımbolo (+) representa a popula¸ao projetada nos anos ao censit´arios e
o que foi observado nos censos.
´
E poss´ıvel observar que o modelo 2 consegue estimar
os tamanhos populacionais bem pr´oximos ao que foi projetado e ao que foi coletado
pelos censos, que ao informa¸oes oficiais, fornecendo o erro das estimativas, o qual
ao ´e calculado pe lo etodo de proje¸ao utilizado. Isso mostra que o modelo proposto
foi capaz de corrigir os dados expandidos pelo desenho amostral, fornecendo o erro das
estimativas, se aproximando das estat´ıticas oficiais. Na Tabela 4.19, ao apresentadas
as estat´ısticas utilizadas na constru¸ao da Figura 4.13.
Para verificar o que ocorre no caso de obten¸ao dos tamanhos populacionais dos
munic´ıpios ao selecionados pela PNAD, considere como exemplo os gr´aficos dos mu-
nic´ıpios arzea Paulista area 72) e Votorantim area 73) mostrados na Figura 4.14.
Os intervalos de 95% de credibilidade dos dois munic´ıpios contˆem as proje¸oes e os
valores observados nos censos, mostrando que o modelo 2 foi capaz de prever as po-
pula¸oes municipais com uma precis˜ao razo´avel em rela¸ao aos dados oficiais. Apenas a
proje¸ao de 1995 para o munic´ıpio Votorantim ao est´a contida no intervalo. A Tabela
4.20 mostra as edias e os desvios a posteriori, bem como os limites dos intervalos de
credibilidade e as proje¸oes feitas pelo IBGE para os dois munic´ıpios.
No Anexo G, tem-se as popula¸oes municipais estimadas atrav´es das m´edias a poste-
riori para munic´ıpios selecionados e ao selecionados para amostra da PNAD, o desvio
a posteriori como medida de erro das estimativas, os intervalos de 95% de credibilidade
86
Figura 4.13: Compara¸ao entre as popula¸oes estimadas pelo modelo 2 e as popula¸oes projetadas pelo
m´etodo dos coeficientes, mais as observadas nos censos e na contagem, para os munic´ıpios Cubat˜ao e
Diadema s elec ionados pela PNAD.
Tabela 4.19: Limites do intervalo de 95% de credibilidade, edia e desvio a posteriori, em cada ano,
valores observados na contagem e nos censos e popula¸oes projetadas para os munic´ıpios Cubat˜ao e
Diadema s elec ionados pela PNAD.
´area estat´ıstica 1991 1992 1993 1995 1996 1997 1998 1999 2000
lim. 2.5% 86601 88660 90562 94352 95882 97684 99343 100958 102360
12 proje¸ao IBGE 91136 91960 92870 94425 97257 99158 100767 102372 108309
m´edia a posteriori 90548 92207 93808 97269 98813 100744 102789 104948 107036
lim. 97.5% 94552 95810 97055 100072 101602 103690 106092 108809 111641
desvio 2038 1831 1669 1478 1473 1549 1728 2018 2390
lim. 2.5% 298995 302467 306063 314340 318060 322710 326430 330150 333250
13 proje¸ao IBGE 305287 311875 318305 329986 323116 327562 331325 335078 357064
m´edia a posteriori 310620 313410 316200 323020 326430 330770 336040 341930 348130
lim. 97.5% 322400 324260 326120 331390 334180 339140 345340 353710 363630
desvio 5971 5543 5115 4282 4080 4158 4771 6030 7754
e os valores das proje¸oes e dos censos no per´ıodo em estudo.
As proje¸oes de popula¸ao dos munic´ıpios e as popula¸oes estimadas pela PNAD
87
po dem ser obtidas, respectivamente, na internet no ende re¸co < www.ibge.gov.br > e
em CD-ROM.
Figura 4.14: C ompara¸ao entre as popula¸oes estimadas pelo modelo 2 e as popula¸oes projetadas
pelo m´etodo dos coeficientes, mais as observadas nos censos e na contagem, para os munic´ıpios arzea
Paulista e Votorantim ao selecionados pela PNAD.
Tabela 4.20: Limites do intervalo de 95% de credibilidade, edia e desvio a posteriori, em cada
ano, valores observados na contagem e nos censos e popula¸oes projetadas para os munic´ıpios arzea
Paulista e Votorantim ao selecionados pela PNAD.
´area estat´ıstica 1991 1992 1993 1995 1996 1997 1998 1999 2000
lim. 2.5% 65625 67725 69825 74550 76720 79450 82215 85085 87745
72 proje¸ao I BGE 68921 71042 73220 77078 78156 81304 83968 86626 92800
m´edia a posteriori 68705 70595 72485 76930 79065 81865 84980 88375 91840
lim. 97.5% 71750 73360 75075 79275 81410 84350 87815 91875 96145
desvio 1557 1431 1327 1188 1183 1252 1431 1743 2161
lim. 2.5% 76379 78513 80464 84199 85616 87161 88596 89995 91228
73 proje¸ao I BGE 80728 83317 85763 90282 87191 88895 90338 91777 95925
m´edia a posteriori 80372 81972 83500 86701 88118 89866 91688 93564 95368
lim. 97.5% 84125 85248 86407 89204 90657 92626 94852 97392 99949
desvio 1958 1713 1517 1289 1294 1395 1597 1886 2223
88
Cap´ıtulo 5
Conclus˜oes e Trabalhos Futuros
Um fato relevante ´e que os pesos da PNAD ao recalculados quando da realiza¸ao de
um censo demogr´afico porque no processo de estima¸ao hoje adotado pela pesquisa ´e
utilizado estimador de raz˜ao, onde a vari´avel independente ´e a popula¸ao projetada,
levando em considera¸ao a evolu¸ao populacional ocorrida entre censos, sob hip´oteses
de crescimento associadas a taxas de fecundidade, mortalidade e migra¸ao, como no
m´etodo das componentes demogr´aficas descrito na se¸ao 1.2. Assim, quanto mais
afastada do censo for a realiza¸ao da pesquisa, maior o erro das estimativas. Al´em
disso, a divulga¸ao das informa¸oes ao ´e realizada para n´ıvel ao desagregado quanto
o de munic´ıpio. O etodo apresentado por este trabalho evita o rec´alculo dos pesos.
A informa¸ao passada pode ser atualizada a cada entrada de novas observoes, sejam
elas provenientes do censo ou de uma estimativa da PNAD. O modelo hier´arquico
proposto permite que os dados da pesquisa sejam corrigidos, mesmo para n´ıveis como
o de munic´ıpio.
Os modelos 1 e 2 ao equivalentes para aqueles munic´ıpios em que a fra¸ao amostral
de setores ´e praticamente nula. Uma lei de variˆancia bem escolhida pode contribuir para
a redu¸ao das variˆancias das observoes, representada por σ
2
it
, e para a convergˆencia
de parˆametros.
Os modelos apresentados foram capazes de captar a tendˆencia de crescimento dos
munic´ıpios, obtendo-se estimativas de boa qualidade para π
it
, no caso da densidade,
e para µ
it
, no caso da popula¸ao. Conclui-se que ´e poss´ıvel a aplica¸ao de modelos
hier´arquicos e espaciais para a obten¸ao das estimativas de densidades ou de tamanhos
populacionais de munic´ıpios onde a ´unica informa¸ao dispon´ıvel ´e o censo demogr´afico,
utilizando-se os dados obtidos a partir de pesquisa por amostragem realizada em ou-
89
tros locais. Ainda, as estimativas encontradas apresentam boa precis˜ao, com valores
pr´oximos ao que ´e obtido por outras ecnicas. Al´em disso, obtemos pelos modelos
propostos, a distribui¸ao de probabilidade da popula¸ao π
it
do munic´ıpio i no tempo
t, o que permite quantificar o qu˜ao veross´ımel ´e um dado valor da popula¸ao muni-
cipal dentro da distribui¸ao estimada. Freq¨entemente, prefeitos contestam o tamanho
populacional dos munic´ıpios de sua responsabilidade fornecido pelas est´ısticas oficiais.
Nesses casos, o conhecimento da distribui¸ao de probabilidade da popula¸ao municipal
oferece uma forma de verificar se o questionamento do prefeito ´e ou ao pertinente,
contribuindo para a tomada de decis˜ao.
Em IBGE (2002b), os coeficientes de varia¸ao das estimativas da PNAD ao mode-
lados como fun¸ao dos tamanhos das estimativas
ˆ
Y atrav´es da seguinte rela¸ao:
CV (
ˆ
Y ) = A
ˆ
Y
B
.
Os valores de A e B ao ajustados e obt´em-se os valores 18,92 e -0,47, respectivamente,
para vari´aveis referentes a pessoas. Ent˜ao podemos aproximar esses valores de tal
forma que
CV (
ˆ
Y ) = 20
ˆ
Y
0.5
.
Como, V (
ˆ
Y ) =
ˆ
Y
2
CV (
ˆ
Y )
2
, ent˜ao temos V (
ˆ
Y ) = 400
ˆ
Y
1
. Se considerarmos a densidade,
temos V (
ˆ
D) = V (
ˆ
Y )/area
2
e portanto V (
ˆ
D) = 400
ˆ
D/area. Com base nisso, uma
poss´ıvel lei de variˆancia ´e dada por σ
2
it
= λ
0
π
λ
1
it
onde as distribui¸oes a priori de λ
0
e
λ
1
ao dadas por λ
0
N(400, 6400) e λ
1
N(1, 0.25). Esta lei de variˆancia tamb´em
foi explorada neste trabalho, mas os resultados ainda ao foram satisfat´orios, pois ao
houve convergˆencia dos parˆametros e os valores iniciais para o Gibbs sampler devem
ser bem escolhidos. Uma an´alise das distribui¸oes a priori tamb´em ´e recomend´avel.
Por apresentar uma rela¸ao com o tamanho do munic´ıpio, ocorrer´a uma diferencia¸ao
entre as variˆancias municipais nos anos da PNAD mais acentuada que aquela verificada
no modelo 2, onde a fra¸ao amostral igual a zero pouco contribu´ıa para a redu¸ao da
variabilidade.
Extens˜oes deste trabalho podem ser realizadas pela inclus˜ao de covari´aveis, ou
vari´aveis chamadas sintom´aticas, que ajudem a explicar o tamanho populacional. Es-
sas vari´aveis podem ser obtidas a partir de censos, tais como o demogr´afico e o escolar,
registros administrativos, como o Registro Civil, e de pesquisas por amostragem, como
a pr´opria PNAD. No modelo espacial, pode ser inclu´ıda uma componente espacial no
parˆametro c.
90
Quanto ao modelo hier´arquico espacialmente estruturado, existem outras formas de
definir a vizinhan¸ca al´em daquela utilizada na se¸ao 3.3. Uma possibilidade ´e levar em
considera¸ao uma estrutura de vizinhan¸ca que dependa da distˆancia entre os centr´oides
das ´areas, com pesos decrescendo `a medida que as distˆancias entre os centr´oides au-
mentem. Neste caso, o modelo espacial poderia ser aplicado somente aos munic´ıpios
selecionados pela PNAD, pois ao haveria necessidade de que as ´areas fossem cont´ıguas.
Um outro caso ´e aquele em que o peso associado a uma determinada ´area ´e dado pelo
inverso de seu n´umero de vizinhos ou pela raz˜ao entre o comprimento da fronteira e
o per´ımetro da ´area. A defini¸ao da vizinhan¸ca desempenha papel importante na mo-
delagem espacial. Em algumas situa¸oes, considerar como vizinhas apenas ´areas que
compartilhem um mesmo limite pode ao ser razo´avel. Por exemplo, em mapeamentos
de doen¸cas, as divis˜oes geogr´aficas pouco contribuem para explicar fatores de risco co-
muns. Em alguns casos, pode ser mais apropriado supor que a distribui¸ao condicional
dos efeitos espaciais ao ´e normal. Diggle (1998) et al. apresentam exemplos onde as
distribui¸oes Poisson e binomial ao mais adequadas que a normal.
Um trabalho futuro ´e a utiliza¸ao do modelo de Bernardo e Mu˜nhoz (1993), mostrado
no Cap´ıtulo 1, incluindo parˆametros hier´arquicos de forma a permitir a troca de in-
forma¸oes entre as ´areas, tirando proveito de suas similaridades. Neste caso, o modelo
proposto ´e do tipo dinˆamico e hier´arquico multivariado. Referˆencias deste modelo
po dem ser vistas em Gamerman e Migon (1993), com uma aplica¸ao em Landim e
Gamerman (2000). O modelo dinˆamico-hier´arquico ´e composto por trˆes partes. A
primeira parte c onsiste na equa¸ao das observoes a qual descreve a distribui¸ao das
observoes. A segunda parte constitui-se de um conjunto de equa¸oes, chamadas
estruturais, onde os parˆametros presentes ao hierarquicamente estruturados. Final-
mente, a terceira parte consiste na equa¸ao do sistema que diz respeito `a maneira
como os parˆametros evoluem atrav´es do tempo. O conjunto de equa¸oes que comp˜oem
o modelo dinˆamico-hier´arquico pode ser escrito da seguinte forma:
y
t
= F
1t
θ
1t
+ ν
1t
ν
1t
N(0, V
1t
)
θ
1t
= F
2t
θ
2t
+ ν
2t
ν
2t
N(0, V
2t
)
.
.
.
θ
k1,t
= F
kt
θ
kt
+ ν
kt
ν
kt
N(0, V
kt
)
θ
kt
= G
t
θ
k,t1
+ ω
t
ω
t
N(0, W
t
)
(5.1)
Todos os parˆametros de dist´urbio em (5.1) ν
1t
, ν
2t
, ..., ν
kt
e ω
t
ao independentes e
91
as matrizes F
1t
, F
2t
, ..., F
kt
e G
t
ao compostas por constantes conhecidas. O modelo
acima possui k n´ıveis hier´arquicos. Um aspecto importante a considerar ´e a dimens˜ao
do vetor θ
jt
a qual diminui `a medida que j aumenta, ou seja, quanto mais elevado o n´ıvel
hier´arquico, menos parˆametros temos a estimar e conseq¨uentemente a complexidade
do problema se reduz.
No caso espec´ıfico da modelagem de eventos demogr´aficos ter´ıamos, para cada mu-
nic´ıpio i no tempo t, um vetor y
it
= (p
it
, b
it
, d
it
, m
it
)
associado onde p
it
, b
it
, d
it
e m
it
ao, respectivamente, os valores observados (ou estimados a partir de pesquisa por
amostragem) do tamanho da popula¸ao, do total de nascimentos, do total de mortes e
do saldo migrat´orio. Considerando um padr˜ao de crescimento linear no tempo, temos,
para cada regi˜ao i, as seguintes equa¸oes de observao
p
it
= π
it
+ ν
pit
b
it
= β
it
+ ν
bit
d
it
= δ
it
+ ν
dit
m
it
= µ
it
+ ν
mit
(5.2)
de equa¸oes estruturais
π
it
= π
t
+ ν
πit
β
it
= β
t
+ ν
βit
δ
it
= δ
t
+ ν
δit
µ
it
= µ
t
+ ν
µit
(5.3)
e de equa¸oes do sis tema
π
t
= π
t1
+ β
t1
δ
t1
+ µ
t1
+ ω
πt
β
t
= β
t1
+ ω
βt
δ
t
= δ
t1
+ ω
δt
µ
t
= µ
t1
+ ω
µt
(5.4)
O modelo apresentado possui dois n´ıveis hier´arquicos. A equa¸ao de evolu¸ao pre-
sente no n´ıvel mais elevado da estrutura implica uma evolu¸ao de todos os parˆametros
dos outros est´agios dessa estrutura.
O modelo definido nas equa¸oes (5.2), (5.3) e (5.4) tamb´em foi considerado, por´em
houve alguns problemas que impediram sua utiliza¸ao e que merecem aten¸ao. As
92
quest˜oes que dificultaram o trabalho com esse modelo foram: a ausˆencia de dados
de nascimentos para anos anteriores a 1994 (como trat´a-la?) em n´ıvel municipal, a
ao realiza¸ao da PNAD em 1994, a implementa¸ao de algoritmo para realiza¸ao do
MCMC, a que o procedimento envolvia invers˜ao de matrizes de dimens˜ao grande
(4 x 572) e a parametriza¸ao em espa¸co de estados poderia deixar a convergˆencia
lenta, aumentando o tempo computacional. Alguns dos problemas citados poderiam
ser contornados da seguinte forma:
quanto `a ausˆencia de dados de nascimentos ao n´ıvel municipal para os primeiros
anos do per´ıodo de interesse, poder´ıamos tratar os valores perdidos como parˆame-
tros a estimar;
no ano de 1994, para o qual ao houve a PNAD, a equa¸ao de atualiza¸ao refe-
rente a este ano poderia ficar igual a do ano anterior, o que implicaria uma ao
atualiza¸ao dos parˆametros da distribui¸ao a posteriori neste ano. Outra proposta
seria tratar os tamanhos populacionais de todos os munic´ıpios como parˆametros
neste ano;
a implementa¸ao do algoritmo em linguagens de programa¸ao, tais como C, FOR-
TRAN ou Ox, onde fosse poss´ıvel adotar o procedimento proposto por Landim
e Gamerman (2000) para acelerar a convergˆencia do m´etodo, uma vez que ao ´e
poss´ıvel implemena-lo no Winbugs, observando-se que falta um ano da erie.
Outra quest˜ao seria como obter e stimativas para os munic´ıpios criados dentro do
per´ıodo e m estudo. No modelo de Bernardo e Mu˜nhoz (1993), existe a possibilidade
de se trabalhar com esses munic´ıpios arrumando a matriz F
1
convenientemente.
O saldo migrat´orio ao n´ıvel municipal pode ser citado como mais uma dificuldade: o
n´umero de imigrantes ´e facilmente calculado levando-se em conta a pergunta existente
nos question´arios das pesquisas, tanto censit´arias quanto por amostragem, sobre qual
o lugar de residˆencia anterior que, se diferente do munic´ıpio pesquisado, ser´a enao
computado como imigrante; a o n´umero de emigrantes de um dado munic´ıpio deve
ser obtido observando-se nos demais munic´ıpios (de todos os estados) as respostas que
indiquem que o indiv´ıduo habitava o munic´ıpio considerado, levando-se em conta ainda
que nesse n´umero ao estar´a inclu´ıda a migra¸ao internacional, para a qual ao teremos
informa¸oes. Ainda, deve-se observar que a pergunta citada est´a presente apenas no
question´ario da amostra do censo, sendo necess´ario realizar a expans˜ao da mesma.
93
Outra extens˜ao ao trabalho de Bernardo e Mu˜nhoz (1993) seria a inclus˜ao de uma
componente espacial ao modelo proposto, na medida em que os nascimentos e as mortes
ao registrados muitas vezes em regi˜oes vizinhas e o crescimento populacional experi-
mentado por uma dada ´area po de ter rela¸ao direta com o desenvolvimento de regi˜oes
pr´oximas.
Um outro ponto ´e a compatibiliza¸ao das diferentes fontes de dados e suas datas de
referˆencia.
Seria interessante a aplica¸ao de um modelo que leve em conta o sexo e a estrutura
et´aria da popula¸ao. Neste caso, estar´ıamos preocupados em obter estimativas para
pequenos dom´ınios. A obten¸ao dessas estimativas nesses n´ıveis constitui-se numa
importante ferramenta para os dem´ografos em suas hip´oteses a respeito, por exemplo,
do envelhecimento da popula¸ao, e tamb´em para os governantes na tomada de decis˜ao
de aplica¸ao de recursos.
94
Referˆencias
ARORA, V.; LAHIRI, P. On the superiority of the Bayesian method over the BLUP
in small area estimation problems. Statistica Sinica, V. 7, p. 1053-1063, 1997.
ASSUNC¸
˜
AO, R. M. etodo Espacial de Rela¸ao de Coortes para Proje¸oes de
Pequenas
´
Areas: Relat´orio Final, Programa de Professor Visitante, ENCE-IBGE, 2001.
BERNARDO, J.M.; MU
˜
NOZ, J. Bayesian analysis of population evolution. The
Statistician, V. 42, p. 541-550, 1993.
BIANCHINI, Z.M.; ALBIERI, S. Principais Aspectos de Amostragem das Pesquisas
Domiciliares do IBGE - revis˜ao 2002. Texto para Discuss˜ao, n. 8. Rio de Janeiro:
IBGE, 2003.
BRASS, W. Methods for estimating fertility and mortality from limited and
defective data. Chapel Hill: The University of North Carolina at Chapel Hill, Carolina
Population Center, 1975.
BROOKS, S.P.; GELMAN, A. General Metho ds for Monitoring Convergence of
Iterative Simulations. Journal of Computational and Graphical Statistics, V. 7, n.
4, p. 434-455, 1998.
CODEPLAN; IBGE. Proje¸ao da Popula¸ao da Regi˜ao Centro-Oeste e Tocantins 1997-
2020. Cadernos de Demografia, n. 12, 1999.
DIGGLE, P.J.; MOYE ED, R.A.; TAWN, J.A. Model-based Geostatistics. 1998. Dispon´ıvel
em: < http : //www.maths.lancs.ac.uk/ diggle >. Acesso em: 10 ago. 2004.
95
FAY, R.E.; HERRIOT, R.A. Estimates of income for small places: an application of
James-Stein procedures to census data. Journal of the American Statistical
Association. V. 74, p. 269-277, 1979.
FREIRE, F.H.; ASSUNC¸
˜
AO, R.M. Proje¸ao Populacional com Estimadores Bayesianos
Espaciais. In: ENCONTRO NACIONAL DE ESTUDOS POPULACIONAIS, 2002,
Ouro Preto. Anais... Ouro Preto: AB EP, 2002. CD-ROM.
GAMERMAN, D. Markov Chain Monte Carlo: Stochastic simulation for Bayesian
inference, 1st ed. London: Chapman & Hall, 1997.
GAMERMAN, D.; MI GON, H. Dynamic hierarchical models. Journal of the Royal
Statistical Society B, V. 55, Part 3, p. 629-642, 1993.
GELFAND, A.E.; GHOSH, S.K. Model choice: A minimun posterior predictive loss
approach. Biometrika, V. 85, n. 1, p. 1-11, 1998.
GELMAN, A.; RUBIN, D. Inference from Iterative Simulation using Multiple
Sequences. Statistical Science, V. 7, p. 457-511, 1992.
GEWEKE, J. Evaluating the accuracy of sampler-based approaches to the calculation
of posterior moments. In: BERNARDO, E. M. et al. Bayesian Statistics 4. Oxford:
Oxford University Press, 1992. p. 169-193.
GHOSH, M.; NATARAJAN, K.; STROUD, T.W.F.; CARLIN, B. Generalized linear
models for small-area estimation. Journal of the American Statistical Association,
V.93, p. 273-282, 1998. Apud PFEFFERMANN, D. Small Area Estimation - New
Developments and Directions. International Statistical Review, V. 70, n. 1, p.125-143,
2002.
GOLDSTEIN, H. Multilevel Statistical Models. Kendall’s Library of Statistics 3, 2nd
ed. London: E dward Arnold, 1995.
96
HAKKERT, R. Fonte de Dados Demogr´aficos. B elo Horizonte: ABEP, 1996.
IBGE. Estimativas populacionais do Brasil, Grandes Regi˜oes, Unidades da
Federa¸ao e Munic´ıpios - Meto dologia. Rio de Janeiro, 2002a. Dispon´ıvel em:
< http : //www.ibge.gov.br >. Acesso em: 28 out. 2002.
IBGE. Pesquisa Nacional por Amostra de Domic´ılios 2000 - Brasil. Rio de Janeiro,
V.22, 2002b.
KLEIN, R.; MOURA, F.A.S. An´alise dos erros amostrais de indicadores educacionais
obtidos atrav´es de dados da Pesquisa Nacional por Amostra de Domic´ılios. Revista
Brasileira de Estat´ıtica, Rio de Janeiro, V. 59, n. 211, p. 47-58, jan./jul. 1998.
KOTT, P. Robust small domain estimation using random effects modelling.
Survey Methodology, V. 15, p. 1-12, 1989. Apud PFEFFERMANN, D. Small Area
Estimation - New Developments and Directions. International Statistical Review, V.
70, n. 1, p.125-143, 2002.
LANDIM, F.; GAMERMAN, D. Dynamic hierarchical models: an extension to matrix-
variate observations. Computacional Statistics & Data Analysis, V. 35, p. 11-42, 2000.
MACGIBBON, B.; TOMBERLIM, T.J. Small area estimates of proportions via
empirical Bayes techniques. Survey Methodology, V.15, p. 237-252, 1989. Apud
PFEFFERMANN, D. Small Area Estimation - New Developments and Directions.
International Statistical Review, V. 70, n. 1, p.125-143, 2002.
MADEIRA, J.L.; SIM
˜
OES, C.C.S. Estimativas preliminares da popula¸ao urbana
e rural segundo as unidades da Federa¸ao, 1960/1980: por uma nova metodologia.
Revista Brasileira de Estat´ıstica, V. 33, n. 129, p. 3-11, 1972.
MENEZES, A.C.F.; ALMEIDA, R.A.P.; BIANCHINI, Z.M. Revis˜ao da PNAD: A
Quest˜ao Amostral: odulo II do Anteprojeto. Texto para Discuss˜ao, n. 54.
97
Rio de Janeiro: I BGE , 1991.
MIGON, H.; GAMERMAN, D. Generalized Exponential Growth Models : A Bayesian
Approach. Journal of Forecasting, V. 12, p. 573-584, 1993.
MOLLI
´
E, A. Bayesian mapping of disease. In: GILKS, W. R.; RICHARDSON, S.;
SPIEGELHALTER, D.J. Markov Chain Monte Carlo in Practice. New York:
Chapman & Hall, 1996. p. 359-379.
MOURA, F.A.S.; HOLT, D. Small Area Estimation Using Multilevel Mo dels . Survey
Methodology, V. 25, n. 1, p.73-80. Statistics Canada, June 1999.
MOURA, F.A.S.; MIGON, H. Bayesian spatial models for small area estimation of
proportions. Statistical Modelling, V. 2, p. 183-201, 2002.
PFEFFERMANN, D. Small Area Estimation - New Developments and Directions.
International Statistical Review, V. 70, n. 1, p.125-143, 2002.
PRASAD, N.G.N.; RAO, J.N.K. On robust small area es timation using a simple
random effects model. Survey Methodology, V.25, p. 67-72, 1999. Apud
PFEFFERMANN, D. Small Area Estimation - New Developments and Directions.
International Statistical Review, V. 70, n. 1, p.125-143, 2002.
RAO, J.N.K. Some Recent Advances in Model-Based Small Area Estimation. Survey
Methodology, V. 25, n. 2, p.175-186. Statistics Canada, December 1999.
SPIEGELHALTER, D.J.; BEST, N.G.; CARLIN, B.P.; LINDE, A. Bayesian Measures
of Model Complexity and Fit. Journal of the Royal Statistical Society B, V. 64, Part
3, p. 1-34, 2002.
SPIEGELHALTER, D.; THOMAS, A.; BEST, N.; LUNN, D. WinBUGS User Man-
ual Version 1.4. MRC Biostatistics Unit, Cambridge. Dispon´ıvel em: < http :
//www.mrc bsu.cam.ac.uk/bugs >. Acesso em: 20 abr. 2004.
98
WALDVOGEL, B. ecnicas de proje¸ao populacional para o planejamento regional.
Belo Horizonte: CEDEPLAR, 1997.
WEST, M.; HARRISON, P.J. Bayesian Forecasting and Dynamic Models, 2nd ed. New
York: Springer, 1997.
99
Anexo A
Estimador para a popula¸ao municipal
Como as estimativas foram obtidas para munic´ıpios, foram desconsideradas as parcelas
e as quantidades do estimador de Klein e Moura (1998), dado em (2.1), relativas a
estrato, pois o poderiam ser consideradas se a expans˜ao tivesse sido realizada para um
n´ıvel geogr´afico superior ao de munic´ıpio. O mesmo foi feito em rela¸ao `a variˆancia.
Enao foram utilizados os seguintes estimadores para obter o tamanho da popula¸ao e
a variˆancia municipais:
ˆ
Y =
1
m
hi
m
hi
j=1
N
hij
n
hij
P
hij
n
hij
k=1
y
hijk
e
ˆ
V =
1
m
hi
(m
hi
1)
m
hi
j=1
ˆ
Y
hij
P
hij
ˆ
Y
hi
2
(A.1)
onde os ´ındices h e i identificam um munic´ıpio.
Quando o munic´ıpio ´e auto-representativo ou metropolitano, o estimador do tamanho
populacional dado em (A.1) ´e o mesmo que aquele em (2.1), considerando como dom´ınio
geogr´afico o pr´oprio munic´ıpio. Ocorre diferen¸ca entre os estimadores quando a es-
tima¸ao ´e realizada para os munic´ıpios ao auto-representativos, pois ao deveria ser
levado em conta o estrato a que pertenciam.
100
Anexo B
Distribui¸oes condicionais completas
As distribui¸oes a p osteriori dos modelos apresentados no Cap´ıtulo 3 ao ao trat´aveis,
ao sendo poss´ıvel portanto gerar amostras dessa distribui¸ao diretamente para fazer-
mos inferˆencia. Recorre-se, enao, a m´etodos MCMC para a simula¸ao indireta da pos-
teriori. Aqui ao apresentadas as distribui¸oes condicionais completas dos parˆametros
do modelo (3.2), necess´arias `a obten¸ao da posteriori atrav´es do m´etodo Gibbs sampler,
para o caso em que σ
2
it
= σ
2
, i, t.
Para facilitar a nota¸ao, considere a = (a
1
, . . . , a
m
)
, b = (b
1
, . . . , b
m
)
, c = (c
1
, . . . , c
m
)
,
φ = σ
2
, ψ
a
= τ
2
a
, ψ
b
= τ
2
b
, ψ
c
= τ
2
c
e θ = (a, b, c, α, β, γ, φ, ψ
a
, ψ
b
, ψ
b
).
Queremos obter p(θ|y, t) p(y|θ, t)p(θ). A fun¸ao de verossimilhan¸ca p(y|θ) ´e tal
que
p(y|θ, t) =
m
i=1
n
j=1
p(y
ij
|θ, t) =
m
i=1
n
j=1
p(y
ij
|a, b, c, φ, t) =
m
i=1
n
j=1
p(y
ij
|a
i
, b
i
, c
i
, φ, t)
Como y
ij
|π
ij
, φ N(π
ij
, φ) e considerando que os y
ij
sejam condicionalmente indepen-
dentes dados π
ij
e φ, temos
p(y|θ, t)
m
i=1
n
j=1
φ
1/2
exp {−
φ
2
[y
it
(a
i
+ b
i
e
c
i
t
j
)]
2
}
φ
mn/2
exp {−
φ
2
m
i=1
n
j=1
[y
it
(a
i
+ b
i
e
c
i
t
j
)]
2
}.
Para p(θ), temos
p(θ) = p(a|α, ψ
a
)p(b|β, ψ
b
)p(c|γ, ψ
c
)p(α)p(β)p(γ)p(φ)p(ψ
a
)p(ψ
b
)p(ψ
c
).
Logo, obtemos a distribui¸ao a posteriori conjunta de todos os parˆametros
p(θ|y, t) p(α)p(β)p(γ)p(φ)p(ψ
a
)p(ψ
b
)p(ψ
c
)
m
i=1
p(a
i
|α, ψ
a
)p(b
i
|β, ψ
b
)p(c
i
|γ, ψ
c
)
n
j=1
p(y
ij
|a
i
, b
i
, c
i
, φ, t)
(B.1)
onde
p(a|α, ψ
a
) =
m
i=1
p(a
i
|α, ψ
a
) =
m
i=1
exp
ψ
a
2
(a
i
α)
,
101
p(b|β, ψ
b
) =
m
i=1
p(b
i
|β, ψ
b
) =
m
i=1
exp
ψ
b
2
(b
i
β)
e
p(c|γ, ψ
c
) =
m
i=1
p(c
i
|γ, ψ
c
) =
m
i=1
exp
ψ
c
2
(c
i
γ)
.
Sob o modelo (3.2), a|α, ψ
a
N(α, ψ
1
a
), b|β, ψ
b
N(β, ψ
1
b
) e c|γ, ψ
c
N(γ, ψ
1
c
),
com prioris α N(µ
α
, σ
2
α
), β N(µ
β
, σ
2
β
), γ N (µ
γ
, σ
2
γ
), φ G(α
φ
, β
φ
), ψ
a
G(α
a
, β
a
), ψ
b
G(α
b
, β
b
) e ψ
c
G(α
c
, β
c
).
A distribui¸ao condicional completa de cada parˆametro pode, enao, ser obtida a
partir de (B.1).
π(α) p(α)
m
i=1
p(a
i
|α, ψ
a
) e xp
(σ
2
α
+
a
)
2
α
σ
2
α
µ
α
+ ψ
a
m
i=1
a
i
σ
2
α
+
a

2
π(β) p(β)
m
i=1
p(b
i
|β, ψ
b
) e xp
(σ
2
β
+
b
)
2
β
σ
2
β
µ
β
+ ψ
b
m
i=1
b
i
σ
2
β
+
b

2
π(γ) p(γ)
m
i=1
p(c
i
|γ, ψ
c
) e xp
(σ
2
γ
+
c
)
2
γ
σ
2
γ
µ
γ
+ ψ
c
m
i=1
c
i
σ
2
γ
+
c

2
π(a
i
) p(a
i
|α, ψ
a
)
n
j=1
p(y
ij
|a
i
, b
i
, c
i
, φ)
exp
(ψ
a
+)
2
a
i
ψ
a
α+φ
n
j=1
(y
ij
b
i
e
c
i
t
j
)
ψ
a
+

2
π(b
i
) p(b
i
|β, ψ
b
)
n
j=1
p(y
ij
|a
i
, b
i
, c
i
, φ)
exp
(ψ
b
+φ
n
j=1
e
2c
i
t
j
)
2
b
i
ψ
b
β+φ
n
j=1
(y
ij
e
c
i
t
j
a
i
e
c
i
t
j
)
ψ
b
+φ
n
j=1
e
2c
i
t
j

2
π(c
i
) p(c
i
|γ, ψ
c
)
n
j=1
p(y
ij
|a
i
, b
i
, c
i
, φ)
exp
ψ
c
2
(c
i
γ)
2
exp
φ
2
n
j=1
[y
it
(a
i
+ b
i
e
c
i
t
j
)]
2
π(φ) p(φ)
m
i=1
n
j=1
p(y
ij
|a
i
, b
i
, c
i
, φ)
φ
(2α
φ
+mn)/21
exp
φ
β
φ
+
1
2
m
i=1
n
j=1
[y
it
(a
i
+ b
i
e
c
i
t
j
)]
2

π(ψ
a
) p(ψ
a
)p(a
i
|α, ψ
a
)
ψ
(2α
a
+m)/21
a
exp
ψ
a
β
a
+
1
2
m
i=1
(a
i
α)
2

π(ψ
b
) p(ψ
b
)p(b
i
|β, ψ
b
)
ψ
(2β
b
+m)/21
b
exp
ψ
b
β
b
+
1
2
m
i=1
(b
i
β)
2

π(ψ
c
) p(ψ
c
)p(c
i
|γ, ψ
c
)
ψ
(2γ
c
+m)/21
c
exp
ψ
c
β
c
+
1
2
m
i=1
(c
i
γ)
2

Considere θ(λ) o vetor θ, e xcluindo λ.
´
E poss´ıvel ver facilmente que:
102
α|θ(α), y, t N

σ
2
α
µ
α
+ψ
a
m
i=1
a
i
σ
2
α
+
a
, (σ
2
α
+
a
)
1
;
β|θ(β), y, t N

σ
2
β
µ
β
+ψ
b
m
i=1
b
i
σ
2
β
+
b
, (σ
2
β
+
b
)
1
;
γ|θ(γ), y, t N

σ
2
γ
µ
γ
+ψ
c
m
i=1
c
i
σ
2
γ
+
c
, (σ
2
γ
+
c
)
1
;
a
i
|θ(a
i
), y, t N

ψ
a
α+φ
n
j=1
(y
ij
b
i
e
c
i
t
j
)
ψ
a
+
, (ψ
a
+ )
1
;
b
i
|θ(b
i
), y, t N

ψ
b
β+φ
n
j=1
(y
ij
e
c
i
t
j
a
i
e
c
i
t
j
)
ψ
b
+φ
n
j=1
e
2c
i
t
j
, (ψ
b
+ φ
n
j=1
e
2c
i
t
j
)
1
;
φ|θ(φ), y, t G
(2α
φ
+ mn)/2, β
φ
+
1
2
m
i=1
n
j=1
[y
it
(a
i
+ b
i
e
c
i
t
j
)]
2
;
ψ
a
|θ(ψ
a
), y, t G
(2α
a
+ m)/2), β
a
+
1
2
m
i=1
(a
i
α)
2
;
ψ
b
|θ(ψ
b
), y, t G
(2β
b
+ m)/2), β
b
+
1
2
m
i=1
(b
i
β)
2
;
ψ
c
|θ(ψ
c
), y, t G
(2γ
c
+ m)/2), β
c
+
1
2
m
i=1
(c
i
γ)
2
.
As distribui¸oes condicionais completas dos parˆametros c
i
ao tˆem forma fechada e
neste caso ´e adicionado ao Gibbs sampler um passo do algoritmo de aceita¸ao/rejei¸ao.
Utilizou-se o software Winbugs, vers˜ao 1.4 para gerar as amostras das distribui¸oes.
103
Anexo C
Densidades demogr´aficas
Os gr´aficos seguintes ao as s´eries de densidades demogr´aficas municipais observadas
nos censos e estimadas com base nos dados da PNAD, utilizando-se (A.1). As s´eries
correspondem ao per´ıodo de 1991 a 2000, e xcluindo 1994, para os munic´ıpios seleciona-
dos pela PNAD no Estado de ao Paulo.
104
105
106
107
108
109
110
111
Anexo D
Diag´ostico de convergˆencia
Figura D.1: Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, σ
2
e γ, no mo delo 1.
112
Figura D.2: Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
, τ
2
c
, no modelo 1.
Figura D.3: Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada parˆametro, no
modelo 1.
113
Figura D.4: Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas amostras de
cada parˆametro, no modelo 1.
Figura D.5: Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ e η
0
, no modelo 2.
114
Figura D.6: Tra¸co, auto-correla¸ao e histograma dos parˆametros η
1
, τ
2
a
, τ
2
b
e τ
2
c
, no modelo 2.
Figura D.7: Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada parˆametro, no
modelo 2.
115
Figura D.8: Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas amostras de
cada parˆametro, no modelo 2.
Figura D.9: Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ, no modelo 3.
116
Figura D.10: Tra¸co, auto-correla¸ao e histograma dos parˆametros η
0
, η
1
e k, no modelo 3.
Figura D.11: Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
e τ
2
c
, no modelo 3.
117
Figura D.12: Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada parˆametro, no
modelo 3.
118
Figura D.13: Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas amostras de
cada parˆametro, no modelo 3.
Figura D.14: Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ e k, no modelo 4.
119
Figura D.15: Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
e τ
2
c
, no modelo 4.
Figura D.16: Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada parˆametro, no
modelo 4.
120
Figura D.17: Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas amostras de
cada parˆametro, no modelo 4.
Figura D.18: Tra¸co, auto-correla¸ao e histograma dos parˆametros α
0
, α
1
, β
0
, β
1
, no modelo 2 com
vari´avel dummy.
121
Figura D.19: Tra¸co, auto-correla¸ao e histograma dos parˆametros γ
0
, γ
1
, η
0
, η
1
, no modelo 2 com
vari´avel dummy.
Figura D.20: Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
e τ
2
c
, no modelo 2 com
vari´avel dummy.
122
Figura D.21: Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada parˆametro, no
modelo 2 com vari´avel dummy.
Figura D.22: Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas amostras de
cada parˆametro, no modelo 2 com vari´avel dummy.
123
Figura D.23: Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ e η
0
, no modelo 2 com os
mesmos dados aplicados ao modelo espacial e com fra¸ao amostral igual a zero para os ao selecionados.
Figura D.24: Tra¸co, auto-correla¸ao e histograma dos parˆametros η
1
, τ
2
a
, τ
2
b
e τ
2
c
, no modelo 2
com os m esm os dados aplicados ao modelo espacial e com fra¸ao amostral igual a zero para os ao
selecionados.
124
Figura D.25: Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada parˆametro, para
o modelo 2 com os mesmos dados aplicados ao modelo espacial e com fra¸ao amostral igual a zero
para os ao selecionados.
Figura D.26: Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman, ao longo das itera¸oes, para o modelo 2
com os m esm os dados aplicados ao modelo espacial e com fra¸ao amostral igual a zero para os ao
selecionados.
125
Figura D.27: Tra¸co, auto-correla¸ao e histograma dos parˆametros α
0
, α
1
, β
0
, β
1
, para o modelo 2
com vari´avel dummy e mesmos dados aplicados ao modelo espacial, com fra¸ao amostral igual a zero
para os ao selecionados.
Figura D.28: Tra¸co, auto-correla¸ao e histograma dos parˆametros γ
0
, γ
1
, η
0
, η
1
, para o modelo 2 com
vari´avel dummy e mesmos dados aplicados ao modelo espacial, com fra¸ao amostral igual a zero para
os ao selecionados.
126
Figura D.29: Tra¸co, auto-correla¸ao e histograma dos parˆametros τ
2
a
, τ
2
b
e τ
2
c
, para o modelo 2
com vari´avel dummy e mesmos dados aplicados ao modelo espacial, com fra¸ao amostral igual a zero
para os ao selecionados.
127
Figura D.30: Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada parˆametro, para
o modelo 2 com vari´avel dummy e mesmos dados aplicados ao modelo espacial, com fra¸ao amostral
igual a zero para os ao selecionados.
Figura D.31: Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas amostras de
cada parˆametro, para o modelo 2 com vari´avel dummy e mesmos dados aplicados ao modelo e spacial,
com fra¸ao amostral igual a zero para os ao selecionados.
128
Figura D.32: Tra¸co, auto-correla¸ao e histograma dos parˆametros α, β, γ, η
0
, no modelo espacial.
Figura D.33: Tra¸co, auto-correla¸ao e histograma dos parˆametros η
1
, τ
2
a
, τ
2
b
e τ
2
c
, no modelo
espacial.
129
Figura D.34: Estat´ıstica de Geweke ao longo das itera¸oes nas duas amostras de cada parˆametro, no
modelo espacial.
Figura D.35: Estat´ıstica
ˆ
R
intervalo
de Brooks e Gelman ao longo das itera¸oes nas duas amostras de
cada parˆametro, no modelo espacial.
130
Anexo E
Resumo das distribui¸oes a posteriori dos parˆametros a, b e c
Tabela E.1: Resumo da distribui¸ao a posteriori do parˆametro a no modelo 2 (continua)
´area edia desvio ´area e dia desvio ´area edia desvio ´area m´edia desvio
1 892.70 130.20 25 9769.00 282.50 49 246.30 69.94 73 4239.00 207.30
2 39.39 27.09 26 1825.00 169.60 50 2927.00 212.00 74 494.30 115.80
3 64.33 33.92 27 133.50 42.97 51 481.00 128.70 75 173.70 80.43
4 133.90 105.40 28 2924.00 195.40 52 5.90 9.25 76 22.15 84.51
5 128.80 78.60 29 8.95 8.47 53 -2.89 22.83 77 13.79 7.86
6 116.60 96.15 30 211.80 76.09 54 39.92 103.10 78 489.60 186.90
7 67.27 89.34 31 1234.00 159.10 55 383.50 227.70 79 176.30 142.90
8 1527.00 202.00 32 380.80 137.90 56 26.55 12.33 80 491.50 157.90
9 130.50 173.40 33 40.27 10.14 57 -19.51 52.01 81 -120.30 106.60
10 31.23 105.40 34 11.90 4.21 58 69.95 36.84 82 13.28 14.74
11 20.23 24.32 35 24.18 6.48 59 4332.00 224.80 83 580.40 309.00
12 41.52 11.01 36 47.31 70.18 60 184.20 119.40 84 -21.60 116.70
13 5.62 148.70 37 1150.00 162.80 61 11.10 69.51 85 -28.50 50.97
14 14.72 129.80 38 2053.00 181.70 62 -38.26 107.40 86 -130.10 168.30
15 334.60 331.20 39 -21.63 50.27 63 25.01 6.12 87 3336.00 222.50
16 859.30 108.30 40 26.49 13.35 64 8698.00 267.80 88 -11.91 46.23
17 143.00 112.10 41 70.30 78.04 65 12.08 3.36 89 494.20 95.44
18 -98.01 161.40 42 25.01 4.28 66 9.23 24.41 90 1074.00 144.70
19 -45.77 77.08 43 1.68 125.10 67 -50.87 20.03 91 11060.00 330.80
20 7811.00 265.20 44 64.97 49.17 68 58.24 99.74 92 349.80 285.00
21 132.60 71.72 45 784.10 151.70 69 24.90 43.72 93 74.03 161.50
22 12.87 10.13 46 78.40 25.58 70 -83.14 131.20 94 39.78 10.62
23 134.50 100.50 47 1429.00 179.80 71 47.42 32.79 95 -76.18 141.70
24 378.00 151.50 48 40.17 64.46 72 25.05 20.96 96 260.70 104.50
131
Tabela E.1: Resumo da distribui¸ao a posteriori do parˆametro a no modelo 2 (conclus˜ao)
´area edia desvio ´area e dia desvio ´area edia desvio ´area edia desvio
97 258.90 79.86 101 569.20 110.20 105 215.30 62.47 109 41.02 47.26
98 6120.00 255.40 102 602.40 184.70 106 0.94 13.25 110 209.20 112.00
99 75.40 44.75 103 562.10 97.10 107 -99.39 198.50 111 75.25 33.79
100 1525.00 165.70 104 7681.00 267.10 108 -15.58 38.58
Tabela E.2: Resumo da distribui¸ao a posteriori do parˆametro b no modelo 2
´area m´edia desvio ´area edia desvio ´area edia desvio ´area m´edia desvio
1 261.10 123.70 29 1.56 8.47 57 143.40 51.58 85 237.90 50.08
2 -17.52 27.08 30 174.90 74.06 58 67.48 36.39 86 196.20 168.10
3 0.25 33.78 31 504.00 145.60 59 522.10 177.40 87 218.20 188.50
4 -21.82 105.10 32 262.00 134.20 60 196.70 117.30 88 42.73 46.19
5 262.10 76.56 33 -18.22 10.23 61 110.50 69.04 89 59.91 91.19
6 -4.53 96.07 34 2.53 4.18 62 143.80 107.20 90 348.10 134.80
7 111.40 89.01 35 3.71 6.40 63 9.70 5.93 91 -263.40 195.10
8 625.30 184.20 36 80.89 69.62 64 513.70 181.90 92 -211.50 285.10
9 258.10 171.20 37 340.90 151.80 65 -0.80 3.33 93 60.22 161.40
10 68.60 105.00 38 489.70 163.60 66 34.39 24.26 94 -16.35 10.50
11 35.09 24.09 39 77.07 50.12 67 79.79 20.02 95 164.10 141.40
12 29.73 10.43 40 22.20 13.09 68 134.30 99.10 96 241.60 102.40
13 170.00 147.80 41 253.20 76.75 69 26.43 43.49 97 142.10 77.45
14 398.10 127.30 42 -7.92 4.15 70 161.70 131.10 98 345.20 190.50
15 -72.90 331.60 43 275.60 123.80 71 13.82 32.65 99 65.47 44.01
16 206.90 100.30 44 -11.42 49.17 72 -16.33 21.00 100 279.10 151.70
17 -19.71 111.60 45 396.50 144.10 73 522.70 163.40 101 275.50 105.70
18 203.80 161.30 46 31.40 24.95 74 310.80 110.90 102 457.40 177.50
19 155.30 76.78 47 650.30 163.60 75 120.20 78.85 103 241.70 91.15
20 329.80 177.20 48 127.50 63.87 76 34.36 84.39 104 638.90 192.30
21 111.50 70.41 49 103.20 68.49 77 8.08 7.77 105 113.20 61.18
22 12.61 10.02 50 692.50 180.70 78 383.70 183.10 106 23.17 13.20
23 196.50 99.07 51 179.90 124.50 79 230.30 141.70 107 243.30 198.20
24 255.30 149.10 52 14.70 9.17 80 333.80 153.10 108 81.26 38.31
25 467.60 184.90 53 40.32 22.73 81 210.40 106.30 109 75.49 46.81
26 479.40 153.50 54 131.50 102.50 82 24.39 14.72 110 196.50 109.80
27 93.88 41.62 55 -25.10 227.50 83 -41.52 308.90 111 54.93 33.11
28 636.90 163.50 56 2.92 12.26 84 126.80 116.10
132
Tabela E.3: Resumo da distribui¸ao a posteriori do parˆametro c no modelo 2
´area m´edia desvio ´area edia desvio ´area edia desvio ´area edia desvio
1 0.0727 0.0275 29 0.0204 0.0299 57 0.0453 0.0160 85 0.0725 0.0133
2 0.0086 0.0247 30 0.0529 0.0214 58 0.0508 0.0252 86 0.0206 0.0269
3 0.0168 0.0390 31 0.1283 0.0215 59 0.1213 0.0260 87 0.0509 0.0378
4 0.0048 0.0377 32 0.0657 0.0265 60 0.0483 0.0254 88 0.0096 0.0285
5 0.0736 0.0179 33 0.0202 0.0171 61 0.0377 0.0243 89 0.0334 0.0397
6 0.0003 0.0337 34 0.0203 0.0347 62 0.0501 0.0321 90 0.0800 0.0247
7 0.0585 0.0307 35 0.0407 0.0329 63 0.0817 0.0352 91 0.1526 0.0571
8 0.1223 0.0216 36 0.0397 0.0288 64 0.1174 0.0286 92 0.0240 0.0376
9 0.0439 0.0280 37 0.0913 0.0272 65 0.0152 0.0332 93 -0.0080 0.0201
10 0.0187 0.0380 38 0.1154 0.0237 66 0.0337 0.0304 94 0.0439 0.0259
11 0.0700 0.0353 39 0.0308 0.0289 67 0.0101 0.0041 95 0.0311 0.0310
12 0.1223 0.0273 40 0.0429 0.0217 68 0.0412 0.0297 96 0.0570 0.0215
13 0.0412 0.0395 41 0.0550 0.0158 69 0.0144 0.0306 97 0.0656 0.0309
14 0.0746 0.0192 42 0.0411 0.0249 70 0.0230 0.0263 98 0.0731 0.0360
15 0.0038 0.0586 43 0.0554 0.0232 71 0.0242 0.0440 99 0.0572 0.0314
16 0.0670 0.0283 44 0.0077 0.0435 72 0.0064 0.0208 100 0.0733 0.0306
17 0.0142 0.0512 45 0.1084 0.0262 73 0.1207 0.0241 101 0.0782 0.0229
18 0.0264 0.0260 46 0.0530 0.0317 74 0.1058 0.0243 102 0.0967 0.0268
19 0.0385 0.0125 47 0.1256 0.0198 75 0.0471 0.0307 103 0.1074 0.0282
20 0.0878 0.0445 48 0.0406 0.0207 76 -0.0075 0.0252 104 0.1452 0.0263
21 0.0462 0.0286 49 0.0621 0.0303 77 0.0311 0.0287 105 0.0544 0.0235
22 0.0537 0.0348 50 0.1519 0.0219 78 0.0535 0.0226 106 0.0302 0.0277
23 0.0654 0.0267 51 0.0514 0.0316 79 0.0393 0.0235 107 0.0285 0.0206
24 0.0542 0.0310 52 0.0418 0.0281 80 0.0591 0.0234 108 0.0389 0.0206
25 0.1164 0.0356 53 0.0438 0.0377 81 0.0255 0.0252 109 0.0388 0.0284
26 0.1024 0.0223 54 0.0429 0.0340 82 0.0177 0.0210 110 0.0794 0.0299
27 0.1065 0.0322 55 -0.0011 0.0482 83 0.0017 0.0456 111 0.0505 0.0290
28 0.1464 0.0236 56 0.0186 0.0336 84 0.0387 0.0372
133
Anexo F
Compara¸ao entre as m´edias a posteriori das verdadeiras
densidades e os valores observados.
134
135
136
137
138
139
140
141
Anexo G
Previs˜oes populacionais anuais para os munic´ıpios selecionados
e ao selecionados pela PNAD
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s(*)
lim. 2.5% 36574 38789 40866 45296 47256 49735 52303 54978 57517
proj./censo 37622 38795 39969 42075 50739 52782 54512 56237 59185
1 m´edia 38318 40327 42327 46746 48775 51372 54155 57154 60084 1
lim. 97.5% 40004 41846 43757 48167 50265 52999 56017 59320 62671
desvio 881 784 734 737 772 841 948 1107 1317
lim. 2.5% 81478 84257 86795 92112 94363 97094 99776 102411 104901
proj./censo 86336 89008 91721 96554 95342 97206 98783 100356 111300
2 m´edia 85598 87897 90148 95082 97333 100255 103321 106626 109883 1
lim. 97.5% 89573 91394 93358 97956 100303 103369 106913 110889 114913
desvio 2061 1828 1658 1488 1505 1609 1817 2144 2560
lim. 2.5% 129536 135744 141952 156480 163392 172288 182080 192512 202880
proj./censo 130799 135287 140221 148676 177256 188840 198646 208426 208281
3 m´edia 135424 141120 147136 161344 168320 177600 188096 199872 212032 1
lim. 97.5% 141184 146560 152128 166080 173184 182912 194112 207360 221312
desvio 2991 2763 2600 2461 2516 2720 3133 3816 4733
lim. 2.5% 16737 17452 18101 19421 20028 20801 21586 22362 23055
proj./censo 17833 18360 18857 19777 20083 20928 21644 22357 24653
4 m´edia 17567 18181 18788 20133 20750 21539 22388 23300 24200 1
lim. 97.5% 18390 18912 19478 20795 21431 22254 23157 24191 25307
desvio 423 375 351 348 356 373 404 467 567
(*)Indica se o munic´ıpio foi selecionado ou ao: 1, se selecionado; 0, caso contr´ario.
142
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 17623 18811 19935 22423 23640 25265 27040 28886 30576
proj./censo 18814 19326 19895 20865 23572 24521 25325 26126 33100
5 m´edia 18499 19594 20712 23315 24563 26208 28028 30056 32084 1
lim. 97.5% 19357 20371 21466 24115 25392 27092 28990 31226 33696
desvio 440 399 395 431 446 463 500 601 789
lim. 2.5% 37767 41136 44343 51111 54068 57716 61488 65396 69111
proj./censo 39069 40304 41506 43693 57512 59828 61789 63744 71221
6 m´edia 39562 42759 45879 52666 55728 59588 63668 67978 72154 1
lim. 97.5% 41396 44420 47434 54202 57351 61431 65856 70599 75284
desvio 926 838 787 791 843 950 1111 1331 1589
lim. 2.5% 32199 34302 35940 39320 40842 42790 44686 46350 47576
proj./censo 33736 34808 35840 37729 42464 44174 45622 47066 50761
7 m´edia 33837 35824 37643 41255 42764 44583 46428 48311 50065 1
lim. 97.5% 35463 37307 39242 43086 44622 46389 48156 50285 52774
desvio 829 769 870 1014 994 924 875 992 1343
lim. 2.5% 43104 44776 46400 49976 51600 53640 55784 57976 60024
proj./censo 45387 46897 48218 50759 52294 54400 56183 57961 63724
8 m´edia 45096 46608 48128 51608 53248 55384 57720 60272 62840 0
lim. 97.5% 47128 48456 49848 53216 54880 57128 59664 62608 65744
desvio 1028 940 881 831 836 878 980 1175 1461
lim. 2.5% 50634 53690 56551 62274 64651 67609 70519 73381 76048
proj./censo 52878 54694 56176 59136 67398 70112 72410 74702 78921
9 m´edia 53108 55872 58588 64214 66688 69743 72944 76291 79443 1
lim. 97.5% 55533 58055 60577 66106 68676 71926 75418 79201 82984
desvio 1248 1104 1019 987 1029 1123 1275 1495 1769
lim. 2.5% 275415 278985 282765 291340 295155 299810 304080 308105 311745
proj./censo 283661 292369 300283 315199 327882 338908 348242 357552 344596
10 edia 286790 289625 292600 299810 303380 308245 313740 320005 326515 1
lim. 97.5% 298130 300090 302330 308175 311500 316575 323365 332115 341985
desvio 5768 5376 4984 4267 4123 4256 4890 6125 7802
lim. 2.5% 102180 106958 111410 120348 124118 128635 133120 137605 141635
proj./censo 107453 111601 116674 124948 126956 131819 135936 140042 148987
11 edia 107121 111346 115440 124150 128018 132828 137865 143130 148200 1
lim. 97.5% 111996 115700 119405 127888 131820 136988 142610 148785 154960
desvio 2519 2242 2054 1906 1956 2124 2426 2878 3436
143
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 86601 88660 90562 94352 95882 97684 99343 100958 102360
proj./censo 91136 91960 92870 94425 97257 99158 100767 102372 108309
12 edia 90548 92207 93808 97269 98813 100744 102789 104948 107036 1
lim. 97.5% 94552 95810 97055 100072 101602 103690 106092 108809 111641
desvio 2038 1831 1669 1478 1473 1549 1728 2018 2390
lim. 2.5% 298995 302467 306063 314340 318060 322710 326430 330150 333250
proj./censo 305287 311875 318305 329986 323116 327562 331325 335078 357064
13 edia 310620 313410 316200 323020 326430 330770 336040 341930 348130 1
lim. 97.5% 322400 324260 326120 331390 334180 339140 345340 353710 363630
desvio 5971 5543 5115 4282 4080 4158 4771 6030 7754
lim. 2.5% 154070 158760 163310 173600 178220 183820 189630 195580 201250
proj./censo 155990 161201 166215 175391 195628 205512 213878 222223 207663
14 edia 161070 165130 169260 178850 183400 189420 196000 203280 210560 1
lim. 97.5% 167930 171430 175140 184100 188650 194880 202230 210840 219870
desvio 3514 3226 2987 2676 2672 2830 3218 3873 4729
lim. 2.5% 33821 35522 37160 40888 42698 45053 47596 50264 52884
proj./censo 36277 37045 38540 40570 42261 43963 45404 46841 56916
15 edia 35490 37019 38595 42323 44148 46582 49296 52354 55474 1
lim. 97.5% 37206 38579 40046 43727 45599 48111 50997 54413 58110
desvio 855 776 732 718 736 780 874 1056 1341
lim. 2.5% 94724 98084 101612 110012 114128 119420 125188 131488 137592
proj./censo 96166 99107 102164 107547 121970 128404 133851 139283 142377
16 edia 98924 102032 105308 113372 117432 122920 129248 136472 144004 1
lim. 97.5% 103152 105896 108920 116648 120764 126476 133336 141456 150556
desvio 2154 2000 1871 1697 1696 1802 2079 2580 3271
lim. 2.5% 80801 84868 88886 98000 102361 108192 114513 121324 127988
proj./censo 83885 86341 89117 93813 106215 111783 116496 121197 133738
17 edia 84672 88298 92120 101234 105693 111671 118433 126077 133917 1
lim. 97.5% 88445 91679 95305 104321 108829 115101 122402 130879 139993
desvio 1924 1752 1649 1603 1648 1770 2008 2435 3067
lim. 2.5% 82558 84970 87234 92112 94189 96614 99000 101398 103649
proj./censo 85535 88362 90870 95658 98310 102269 105621 108964 108122
18 edia 86390 88400 90410 94872 96923 99562 102403 105472 108487 1
lim. 97.5% 90263 91871 93640 97686 99763 102591 105860 109532 113391
desvio 1956 1761 1610 1436 1444 1543 1751 2076 2482
144
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 16575 17022 17431 18255 18602 19011 19396 19754 20071
proj./censo 17961 18298 18574 19124 17995 18009 18021 18033 21904
19 edia 17374 17735 18084 18840 19182 19610 20065 20548 21019 0
lim. 97.5% 18182 18456 18737 19412 19751 20220 20740 21347 22006
desvio 407 364 332 296 295 308 343 408 496
lim. 2.5% 199485 204919 210353 221936 226941 232947 238953 244959 250393
proj./censo 210207 215042 220244 229250 226365 230394 233805 237206 264812
20 edia 208494 213213 217932 228657 233662 240240 247247 254826 262548 1
lim. 97.5% 218075 221793 225654 235378 240383 247247 255398 264693 274417
desvio 4754 4308 3934 3440 3425 3644 4173 5037 6129
lim. 2.5% 771786 796272 821076 876726 901848 933012 965766 999474 1031274
proj./censo 787866 808950 831210 870105 972197 1018393 1057068 1095874 1072717
21 edia 807402 829026 851286 903120 928242 961314 997884 1038588 1079610 1
lim. 97.5% 842382 860826 880542 929514 954636 989298 1029684 1077384 1128900
desvio 18057 16565 15290 13525 13455 14282 16412 20034 24760
lim. 2.5% 47068 48629 50116 53196 54545 56223 57911 59600 61140
proj./censo 49187 50683 52255 55008 55920 58172 60078 61980 64384
22 edia 49245 50594 51922 54895 56265 58028 59908 61947 63944 0
lim. 97.5% 51444 52569 53727 56573 57954 59812 61936 64358 66832
desvio 1110 1004 928 851 859 912 1025 1212 1460
lim. 2.5% 5639 5792 5939 6292 6468 6704 6945 7186 7403
proj./censo 6292 6482 6646 6964 6067 5996 5935 5875 8292
23 edia 5907 6039 6177 6518 6686 6918 7183 7486 7803 0
lim. 97.5% 6174 6289 6419 6742 6907 7136 7418 7789 8218
desvio 139 129 123 115 112 111 122 155 212
lim. 2.5% 43436 46678 49630 55335 57612 60308 62981 65595 68036
proj./censo 46074 47467 48948 51527 58017 60354 62331 64304 71995
24 edia 45650 48578 51332 56956 59321 62284 65247 68210 70999 0
lim. 97.5% 47741 50420 53005 58565 61064 64259 67571 70999 74194
desvio 1092 956 863 832 889 1006 1165 1357 1553
lim. 2.5% 89293 94887 100107 110684 115159 120583 125939 131329 136346
proj./censo 93146 88161 90983 95776 120335 116319 121502 126672 141884
25 edia 93632 98717 103633 114074 118718 124515 130549 136889 142957 1
lim. 97.5% 98107 102650 107226 117498 122312 128481 135058 142143 149059
desvio 2235 1988 1825 1739 1817 2008 2312 2732 3224
145
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 103316 108284 113160 123924 128892 135056 141772 148488 155020
proj./censo 107976 112842 117241 125554 133523 139893 145285 150664 162433
26 edia 108284 112792 117300 127788 132848 139380 146556 154468 162380 1
lim. 97.5% 113252 117300 121532 131744 136804 143612 151340 160264 169648
desvio 2522 2286 2122 1982 2021 2178 2498 3032 3749
lim. 2.5% 162688 170970 179334 199178 208772 221318 235094 250100 264532
proj./censo 164957 172825 180568 194577 228344 244149 257529 270874 272942
27 edia 169986 177776 185894 205574 215250 228288 242966 259612 276750 1
lim. 97.5% 177366 184664 192372 211888 221728 235258 250920 269124 288640
desvio 3716 3449 3288 3217 3305 3553 4044 4905 6135
lim. 2.5% 10829 11048 11252 11686 11870 12076 12273 12457 12618
proj./censo 11608 11781 12004 12360 11679 11688 11696 11704 13613
28 edia 11340 11509 11678 12056 12230 12459 12704 12971 13238 0
lim. 97.5% 11860 11976 12091 12406 12585 12832 13127 13477 13858
desvio 262 236 214 185 182 191 216 259 315
lim. 2.5% 102913 106316 109397 115689 118257 121274 124292 127245 129941
proj./censo 107314 110004 112939 117986 122528 126322 129533 132736 135366
29 edia 107728 110553 113313 119156 121788 125062 128529 132188 135655 1
lim. 97.5% 112479 114854 117165 122687 125383 128914 132766 137132 141433
desvio 2441 2185 1990 1787 1806 1932 2174 2533 2963
lim. 2.5% 153237 157155 160613 167159 169602 172184 174489 176610 178454
proj./censo 163869 168129 172047 179385 167751 168719 169538 170356 191291
30 edia 160797 163748 166468 172184 174581 177578 180574 183663 186521 1
lim. 97.5% 168219 170202 172276 177163 179652 183017 186705 190762 194773
desvio 3816 3341 2962 2529 2544 2738 3108 3616 4175
lim. 2.5% 3073 3167 3255 3419 3482 3552 3616 3673 3725
proj./censo 3285 3309 3329 3368 3457 3483 3506 3528 3992
31 edia 3230 3303 3375 3522 3585 3664 3743 3826 3903 0
lim. 97.5% 3382 3436 3493 3623 3688 3774 3874 3977 4082
desvio 79 69 61 53 53 58 66 78 91
lim. 2.5% 61560 63846 66258 71910 74718 78426 82440 86922 91350
proj./censo 62697 64617 66608 70117 75352 78387 80956 83518 91807
32 edia 64332 66402 68616 74106 76896 80694 85104 90162 95508 1
lim. 97.5% 67014 68868 70938 76230 79038 82998 87714 93384 99630
desvio 1388 1280 1197 1099 1102 1166 1332 1648 2106
146
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 272704 277510 281883 290110 293315 296692 299550 302148 304226
proj./censo 289269 291302 294444 299088 293373 294396 295263 296127 323397
33 edia 285304 288725 291972 298944 302018 305828 309855 314012 318039 1
lim. 97.5% 297775 299853 302148 307517 310548 314791 319858 325703 331678
desvio 6452 5733 5149 4413 4374 4608 5158 6006 7024
lim. 2.5% 18792 19493 20115 21396 21956 22646 23363 24058 24649
proj./censo 19969 20464 21116 22146 21850 22277 22638 22999 26459
34 edia 19676 20293 20889 22155 22720 23426 24174 24958 25716 1
lim. 97.5% 20549 21072 21621 22866 23441 24179 24984 25905 26935
desvio 447 401 381 375 378 386 410 471 580
lim. 2.5% 40308 41484 42572 44982 46070 47423 48746 50127 51362
proj./censo 43205 30356 31286 32933 45605 32977 33512 34046 55227
35 edia 42278 43248 44218 46482 47540 48951 50480 52185 53891 0
lim. 97.5% 44189 44953 45835 47922 49010 50480 52215 54214 56419
desvio 994 895 824 748 748 784 874 1043 1284
lim. 2.5% 37996 40283 42343 46529 48365 50651 52969 55223 57316
proj./censo 39937 41239 42428 44664 49893 51902 53603 55300 60111
36 edia 39896 41925 43889 48139 50007 52390 54869 57477 59989 1
lim. 97.5% 41764 43567 45435 49588 51553 54064 56737 59699 62694
desvio 953 838 781 780 812 874 972 1128 1346
lim. 2.5% 290871 296541 302400 315630 321489 328734 335727 342972 349524
proj./censo 294998 302550 310161 323769 342909 354856 364968 375055 363392
37 edia 303471 308259 313173 324828 330498 338121 346563 356013 365715 1
lim. 97.5% 315945 319788 323883 334089 339507 347382 357336 368991 381843
desvio 6458 5956 5492 4733 4617 4796 5450 6647 8235
lim. 2.5% 18225 18666 19068 19850 20151 20502 20823 21154 21425
proj./censo 18970 19103 19246 19494 21018 21429 21776 22123 22383
38 edia 19128 19459 19770 20452 20763 21164 21575 22016 22448 0
lim. 97.5% 20030 20241 20472 21063 21364 21806 22307 22869 23461
desvio 453 400 358 310 310 330 374 440 520
lim. 2.5% 263756 270808 277424 290655 295962 302287 308176 313846 318863
proj./censo 273175 279964 285955 297424 312685 322537 330876 339194 330241
39 edia 276406 282076 287602 299597 305050 311883 319081 326714 334130 1
lim. 97.5% 289492 293708 298070 308685 314064 321407 329840 339291 348742
desvio 6469 5747 5181 4546 4570 4883 5518 6467 7605
147
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 18116 19901 21572 25013 26439 28196 29981 31781 33466
proj./censo 19026 19533 20119 21100 27065 28155 29078 29998 35098
40 edia 18994 20693 22320 25748 27260 29117 31032 33020 34906 0
lim. 97.5% 19858 21485 23055 26511 28066 30024 32084 34272 36375
desvio 446 402 377 384 412 465 539 635 742
lim. 2.5% 10847 11122 11387 11946 12194 12502 12799 13090 13352
proj./censo 11671 11997 12341 12943 11916 12015 12099 12183 14410
41 edia 11364 11593 11818 12338 12580 12897 13244 13623 14006 1
lim. 97.5% 11893 12067 12253 12714 12956 13293 13692 14163 14673
desvio 266 240 220 195 194 203 229 275 340
lim. 2.5% 563680 570440 577395 592800 599365 607425 615030 621530 627770
proj./censo 568225 575181 584140 598422 622912 636548 648091 659604 652593
42 edia 585845 590915 596245 608985 615225 623610 633035 643695 654550 1
lim. 97.5% 607490 611130 615030 625170 630760 639535 651300 666250 682500
desvio 11219 10426 9653 8268 7976 8158 9185 11193 13923
lim. 2.5% 13658 13902 14121 14592 14779 14998 15201 15364 15493
proj./censo 14891 14989 15108 15303 14179 14009 13865 13722 17009
43 edia 14300 14478 14649 15039 15225 15461 15721 15997 16281 0
lim. 97.5% 14974 15079 15185 15485 15656 15916 16240 16622 17052
desvio 337 303 273 230 224 234 267 324 397
lim. 2.5% 7239 7400 7540 7834 7948 8089 8209 8323 8423
proj./censo 7836 7936 8098 8333 7693 7602 7526 7449 9187
44 edia 7580 7701 7814 8075 8189 8336 8497 8664 8825 0
lim. 97.5% 7921 8002 8089 8309 8423 8584 8778 9005 9246
desvio 172 155 141 122 121 128 145 173 209
lim. 2.5% 31308 33073 34787 38450 40132 42280 44500 46827 49011
proj./censo 32773 34035 34817 36652 41398 43065 44477 45884 51451
45 edia 32815 34454 36087 39774 41493 43712 46075 48688 51230 0
lim. 97.5% 34304 35793 37376 41063 42817 45144 47686 50550 53557
desvio 771 693 658 662 685 729 809 949 1156
lim. 2.5% 39786 40622 41325 42736 43319 43976 44514 45022 45411
proj./censo 43581 44316 45080 46426 41232 40936 40685 40434 50131
46 edia 41691 42303 42886 44133 44679 45366 46090 46845 47577 0
lim. 97.5% 43648 44021 44417 45441 45986 46718 47607 48705 49893
desvio 963 863 786 689 680 704 780 918 1107
148
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 7625 8178 8688 9682 10083 10554 11021 11489 11911
proj./censo 7956 8201 8404 8806 10499 10941 11315 11688 12395
47 edia 8004 8511 8988 9968 10387 10897 11422 11944 12444 0
lim. 97.5% 8377 8837 9285 10251 10686 11234 11822 12421 12987
desvio 192 169 153 146 155 174 203 238 277
lim. 2.5% 75072 76585 78149 81753 83419 85544 87652 89777 91715
proj./censo 76302 78813 81061 85332 84777 86434 87837 89236 95801
48 edia 78353 79645 81005 84235 85833 87975 90406 93126 95948 1
lim. 97.5% 81668 82671 83793 86649 88179 90389 93194 96594 100283
desvio 1681 1552 1432 1228 1193 1235 1411 1745 2199
lim. 2.5% 35556 36739 37833 39914 40701 41611 42487 43312 44066
proj./censo 36936 38080 39240 41307 42727 44448 45904 47357 45514
49 edia 37258 38246 39178 41092 41912 42916 43937 44975 45952 0
lim. 97.5% 38876 39674 40478 42252 43089 44200 45411 46733 47983
desvio 859 756 676 596 609 663 755 878 1011
lim. 2.5% 116917 123262 129453 142928 149134 157080 165396 174328 182644
proj./censo 123492 128615 133257 142020 150388 157094 162772 168434 193582
50 edia 122554 128329 134181 147609 153954 162162 171248 181258 191268 1
lim. 97.5% 128144 133303 138878 152322 158774 167398 177100 188034 199584
desvio 2879 2583 2420 2375 2454 2639 2974 3536 4328
lim. 2.5% 3724 3751 3773 3804 3810 3810 3804 3789 3776
proj./censo 4008 4008 4017 4024 3740 3677 3624 3571 4047
51 edia 3900 3906 3910 3919 3922 3928 3931 3937 3944 0
lim. 97.5% 4068 4052 4040 4030 4034 4043 4061 4089 4120
desvio 87 77 68 58 58 60 67 76 87
lim. 2.5% 82299 84606 86774 91209 93021 95169 97209 99198 100980
proj./censo 85085 87812 90392 95155 97550 101479 104804 108121 104508
52 edia 86130 88061 89932 93981 95783 98070 100485 102960 105435 1
lim. 97.5% 89902 91467 93011 96714 98525 100980 103752 106920 110088
desvio 1955 1763 1606 1407 1403 1485 1675 1970 2329
lim. 2.5% 29256 30100 30892 32512 33201 34011 34788 35550 36257
proj./censo 29901 30823 31766 33440 34736 36135 37319 38500 37091
53 edia 30570 31280 31976 33493 34177 35051 35972 36956 37925 1
lim. 97.5% 31943 32516 33093 34466 35147 36087 37148 38295 39516
desvio 688 618 563 498 499 530 599 705 836
149
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 10962 11325 11658 12328 12606 12939 13267 13583 13882
proj./censo 11359 11411 11524 11673 13276 13835 14308 14780 14357
54 edia 11474 11773 12068 12704 12986 13344 13724 14126 14510 0
lim. 97.5% 11991 12238 12490 13075 13366 13754 14185 14664 15150
desvio 262 233 212 190 193 207 234 275 324
lim. 2.5% 10676 11129 11540 12329 12641 12995 13342 13679 13977
proj./censo 10306 10480 10650 10959 20047 20891 21605 22317 13010
55 edia 11165 11565 11940 12702 13025 13420 13817 14220 14595 0
lim. 97.5% 11661 12006 12340 13075 13411 13836 14286 14750 15192
desvio 253 224 204 190 198 216 242 276 311
lim. 2.5% 36381 37250 38010 39495 40001 40581 41087 41594 41992
proj./censo 37975 38636 39281 40454 41367 42176 42860 43543 43740
56 edia 38083 38734 39350 40617 41160 41811 42499 43187 43802 1
lim. 97.5% 39748 40182 40653 41775 42354 43115 43911 44780 45685
desvio 849 752 676 596 601 641 715 817 930
lim. 2.5% 36091 39986 43553 50869 54255 58550 63045 67595 71763
proj./censo 37762 38809 40117 42231 57299 59607 61560 63508 74828
57 edia 37929 41606 45209 52981 56457 60843 65466 70343 75057 1
lim. 97.5% 39767 43262 46793 54673 58295 62936 67850 73055 78333
desvio 937 837 833 956 1019 1103 1217 1407 1694
lim. 2.5% 588700 594125 599200 609525 613375 616875 619500 620900 621775
proj./censo 616991 620639 627850 637594 624820 627702 628425 630073 649331
58 edia 614775 617925 621075 627900 630875 634900 639100 643650 647850 1
lim. 97.5% 640150 640850 641725 645750 648550 653275 659050 666925 675675
desvio 13096 11843 10754 9162 8953 9246 10212 11836 13841
lim. 2.5% 407294 411468 414870 421131 422986 424146 424919 425305 424996
proj./censo 428923 418078 419477 421292 429245 410944 409845 408748 448022
59 edia 426233 428165 430020 433808 435509 437596 439683 441925 444012 1
lim. 97.5% 445094 444707 444785 446485 448109 450969 454756 459240 464032
desvio 9740 8558 7601 6411 6361 6725 7529 8697 10026
lim. 2.5% 551078 566137 580382 610093 622710 637769 652421 666666 679690
proj./censo 566893 578867 590896 612435 660396 683711 703447 723132 703177
60 edia 575905 588522 601139 628815 641432 657305 674806 693121 711436 1
lim. 97.5% 601546 611721 622303 647130 659747 677248 697191 719576 742775
desvio 12931 11677 10668 9480 9516 10151 11494 13574 16126
150
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 145185 145335 145500 145755 145755 145710 145620 145350 145095
proj./censo 149519 147967 147215 145147 139825 137408 135362 133321 140159
61 m´edia 149535 149475 149445 149370 149355 149340 149325 149310 149295 1
lim. 97.5% 154200 153750 153300 153000 152850 152850 153000 153150 153450
desvio 2273 2123 2009 1868 1847 1859 1913 2015 2151
lim. 2.5% 419091 432095 444106 467248 476395 486423 496011 504827 512871
proj./censo 442370 455773 468678 492285 486167 497462 506332 515553 539313
62 m´edia 440139 450498 460526 481464 490611 501961 513643 525765 537225 1
lim. 97.5% 460747 468461 476726 495239 504276 516838 530944 546262 561249
desvio 10644 9339 8292 7103 7170 7785 8958 10606 12475
lim. 2.5% 9297880 9389560 9481240 9660016 9731832 9803648 9861712 9907552 9945752
proj./censo 9646185 9727889 9842059 100178219839066 9887614 9927868 9968485 10434252
63 m´edia 9687520 9745584 9803648 9936584 9999232 10080216101673121026357610358312 1
lim. 97.5% 100603521008785610119944102116241026663210352200104698561062724010801432
desvio 192528 176790 162274 139186 135427 139339 154940 182902 219116
lim. 2.5% 60880 62881 64656 68023 69297 70707 71981 73210 74256
proj./censo 63900 57701 58936 60695 70962 62651 63668 64682 77791
64 m´edia 63837 65430 66931 69979 71299 72846 74438 76076 77578 1
lim. 97.5% 66749 67977 69206 71981 73301 75075 76941 78988 80854
desvio 1515 1315 1162 1011 1034 1132 1293 1502 1724
lim. 2.5% 31927 34251 36418 41045 43215 45989 48884 51899 54592
proj./censo 33890 34816 36004 37901 43845 45611 47106 48596 58038
65 m´edia 33563 35726 37873 42653 44864 47678 50733 53989 57205 0
lim. 97.5% 35180 37185 39292 44180 46431 49366 52542 56160 60019
desvio 829 747 738 800 825 858 928 1095 1387
lim. 2.5% 255237 259707 263879 272372 275799 279524 283100 286080 288613
proj./censo 268618 275479 281464 292991 279528 282248 284551 286848 303551
66 m´edia 267008 270286 273564 280567 283845 288017 292338 297106 301725 1
lim. 97.5% 278332 280567 282951 288613 291891 296361 301725 308281 315135
desvio 5946 5381 4888 4172 4094 4275 4804 5680 6768
lim. 2.5% 361890 374175 386055 410535 420885 433440 445905 458550 470250
proj./censo 379006 388035 397553 414197 431561 444665 455759 466823 493468
67 m´edia 378585 389340 399915 423135 433710 447210 461700 477000 491850 1
lim. 97.5% 395595 404730 413955 435780 446355 460800 477000 495450 514350
desvio 8685 7844 7191 6462 6507 6957 7902 9387 11246
151
mun. estat´ıtica 1991 1992 1993 1995 1996 1997 1998 1999 2000 s
lim. 2.5% 148746 155493 161987 175988 182189 189852 197730 205530 212940
proj./censo 158839 164317 168655 177464 180740 186201 190824 195434 228690
68 edia 155922 161967 167993 181526 187805 195975 204750 214110 223470 1
lim. 97.5% 163176 168539 174038 186986 193245 201825 211575 222495 234000
desvio 3692 3339 3074 2791 2824 3046 3528 4316 5342
lim. 2.5% 158180 160780 163540 170200 173300 177240 181320 185480 189380
proj./censo 160084 165439 170690 180207 182506 188097 192830 197550 197644
69 edia 164700 166880 169220 175040 178000 182040 186700 192100 197780 1
lim. 97.5% 170960 172720 174660 179720 182580 186700 192020 198780 206400
desvio 3242 3028 2820 2430 2340 2388 2708 3380 4338
lim. 2.5% 5477 5798 6090 6681 6937 7256 7586 7911 8214
proj./censo 5734 5790 5825 5907 7200 7505 7763 8020 8570
70 edia 5745 6031 6309 6905 7172 7507 7858 8229 8592 0
lim. 97.5% 6011 6265 6523 7110 7387 7745 8131 8547 8963
desvio 135 120 112 110 115 125 140 163 193
lim. 2.5% 15528 17215 18860 22427 24018 26038 28156 30400 32552
proj./censo 15870 16317 16782 17600 26689 27764 28674 29581 32683
71 edia 16263 17891 19510 23100 24749 26860 29125 31552 33936 0
lim. 97.5% 17011 18568 20152 23777 25480 27693 30111 32753 35360
desvio 380 348 331 346 374 427 502 602 718
lim. 2.5% 65625 67725 69825 74550 76720 79450 82215 85085 87745
proj./censo 68921 71042 73220 77078 78156 81304 83968 86626 92800
72 edia 68705 70595 72485 76930 79065 81865 84980 88375 91840 0
lim. 97.5% 71750 73360 75075 79275 81410 84350 87815 91875 96145
desvio 1557 1431 1327 1188 1183 1252 1431 1743 2161
lim. 2.5% 76379 78513 80464 84199 85616 87161 88596 89995 91228
proj./censo 80728 83317 85763 90282 87191 88895 90338 91777 95925
73 edia 80372 81972 83500 86701 88118 89866 91688 93564 95368 0
lim. 97.5% 84125 85248 86407 89204 90657 92626 94852 97392 99949
desvio 1958 1713 1517 1289 1294 1395 1597 1886 2223
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo