Download PDF
ads:
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO
PUC/SP
Eliana Maria Bauschert de Freitas
Relações entre Mobilização dos Registros de Representação
Semiótica e os Níveis de Letramento Estatístico com duas
Professoras
MESTRADO EM EDUCAÇÃO MATEMÁTICA
São Paulo
2010
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO
PUC/SP
Eliana Maria Bauschert de Freitas
Relações entre Mobilização dos Registros de Representação
Semiótica e os Níveis de Letramento Estatístico com duas
Professoras
Dissertação apresentada à Banca Examinadora da
Pontifícia Universidade Católica de São Paulo, como
exigência parcial para obtenção do título de MESTRE
EM EDUCAÇÃO MATEMÁTICA, sob a orientação da
Professora Doutora Cileda de Queiroz e Silva
Coutinho.
São Paulo
2010
ads:
Banca Examinadora
________________________________________________
________________________________________________
________________________________________________
Autorizo, exclusivamente para fins acadêmicos e científicos, a reprodução total ou parcial desta
dissertação por processos de fotocopiadoras ou eletrônicos.
Assinatura: _______________________________________ Local e Data: ______________
A meus pais, pela compreensão nos
momentos de ausência, pelo incentivo e
por sempre terem acreditado em mim.
A
GRADECIMENTOS
A Deus que me proporcionou força para a realização desta pesquisa e colocou
pessoas tão maravilhosas em minha vida, ajudando-me a tornar esse sonho em
realidade.
À Professora Dra Cileda de Queiroz e Silva Coutinho, pela sua amizade,
orientação e paciência em todos os momentos, oferecendo-me forças para
continuar mesmo nos momentos de desânimo.
Aos membros da Banca, Professores Doutores Saddo Ag Almouloud e Érica
Valéria Alves, pelas contribuições e sugestões que foram extremamente
importantes para a conclusão deste trabalho.
A minha querida irmã que, muitas vezes, dispôs de seu tempo para ler e
discutir este trabalho.
Às professoras amigas, Cristiane, Fernanda e Priscila que com muita paciência e
carinho me ajudaram na parte experimental desta pesquisa.
À querida amiga Regina, pela ajuda na realização do abstract.
Aos colegas do curso de mestrado da PUC-SP, em especial, Ricardo e Márcio
que, de alguma forma, contribuíram para o desenvolvimento deste trabalho,
acreditando e torcendo por mim.
A todos que de maneira direta ou indireta contribuíram para a
concretização desta pesquisa.
Por fim, à Secretaria da Educação, pela oportunidade, na concessão da bolsa.
A Autora
R
ESUMO
Este trabalho teve como objetivo verificar o nível de letramento estatístico de duas
professoras da Escola Básica, que trabalham com estatística em suas aulas.
Buscou-se também identificar à influência do uso de um ambiente computacional,
no caso o software FATHOM, na evolução dos níveis de leitura gráfica e,
portanto, de letramento, pela possibilidade da utilização simultânea de diferentes
registros de representação semiótica. Procurou-se responder às seguintes
questões: “Qual é o nível de letramento estatístico de professores de Matemática
do Ensino Médio que trabalham, em sua prática docente, com os conteúdos da
Estatística Descritiva? Como estes percebem o uso simultâneo de vários registros
de representação semiótica para a análise de um conjunto de dados, com ou sem
o uso do ambiente informatizado?” Para tanto, foram utilizados como metodologia
os pressupostos da Engenharia Didática, desenvolvendo um estudo de caso com
duas professoras de Matemática da Escola Básica, que tinham trabalhado com
alguns conceitos da Estatística Descritiva em suas aulas. A análise das
entrevistas permitiu perceber que as professoras oscilaram entre os níveis de
letramento funcional e científico e que o uso do software foi um facilitador para a
percepção da necessidade e das vantagens de se trabalhar simultaneamente com
mais de um registro de representação semiótica.
Palavras-chave: Registros de Representação Semiótica, Letramento Estatístico,
Estatística Dinâmica, Educação Estatística e Professores de Matemática.
A
BSTRACT
The purpose of this project was to verify the level of statistical literacy of two
teachers of the High School which work with statistics. Also, tired to extensity the
influence of the use of computational environment, in case software FATHOM, in
the evolution of the levels of graphical reading and, consequently, literacy, using
simultaneous and differents registers of semiotic representation. We found to
answer these questions: “Which is the level of statistic literacy of the Mathematics’
teachers in High School who works with Descriptive Statistic? How these people
perceive the simultaneous use of different registers of semiotics representation for
analysis of a data set, with or without the use of computational environment?” For
these were used the methodology Didactics Engineering, developing a study of
case with two mathematics’ teachers of the High School who had already worked
with some concepts of Descriptive Statistic in their courses. The analysis of the
interviews allowed to notice that the teachers oscillated between the levels of
scientific literacy and functional literacy and the use of the software made easier
the perception of the necessity and advantages to work simultaneously with more
one register of semiotic representation.
Key-words: Register of Semiotic Representation, Statistical Literacy, Dynamics
Statistics, Statistical Education and Mathematics’ teachers.
S
UMÁRIO
INTRODUÇÃO .................................................................................................
19
I PROBLEMÁTICA .......................................................................................... 21
I.1 Objetivo e Problema de Pesquisa ............................................................ 21
I.2 Os procedimentos metodológicos adotados ............................................ 23
I.2.1 Estudo de Caso ............................................................................... 23
I.2.2 Pressupostos da Engenharia Didática .............................................
28
II ALGUMAS PESQUISAS QUE FUNDAMENTAM O ESTUDO ....................
33
II.1 Um primeiro esboço do quadro teórico ................................................... 33
II.1.1 Os níveis letramento (ou literacia) estatística propostos por
Shamos ..........................................................................................
37
II.1.2 Os níveis de leitura gráfica propostos por Curcio ........................... 39
II.1.3 A teoria dos registros de representação semiótica .........................
42
II.1.4 Saberes docentes ........................................................................... 48
II.2 Algumas pesquisas sobre o ensino e a aprendizagem da estatística .....
49
II.3 Relações entre os níveis de leitura de dados de Curcio e os registros
de representação semiótica de Duval, (VIEIRA, 2008) ..........................
59
III PRINCÍPIOS DA ANÁLISE EXPLORATÓRIA DE DADOS E O
SOFTWARE FATHOM ................................................................................
65
III.1 A análise Exploratória de Dados ......................................................... 65
III.2 Registros de representação e suas construções no software
FATHOM .............................................................................................
66
IV A SEQUÊNCIA DIDÁTICA ......................................................................... 85
IV.1 Análises a priori e a posteriori do teste diagnóstico ............................
86
IV.2 Análises a priori e a posteriori da primeira fase da parte A
das atividades de familiarização com o software Fathom ..................
125
IV.3 Análises a priori e a posteriori da segunda fase da parte A
das atividades de familiarização com o software Fathom ...................
141
IV.4 Análises a priori e a posteriori da terceira fase da parte A das
atividades de familiarização com o software Fathom .........................
152
IV.5 Análises a priori e a posteriori da parte B da sequência didática ....... 180
CONSIDERAÇÕES FINAIS ............................................................................ 187
REFERÊNCIAS ............................................................................................... 191
ANDICE I .................................................................................................... 195
TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO ...................... 195
ANDICE II ................................................................................................... 197
SEQUÊNCIA DIDÁTICA (ATIVIDADES ADAPTADAS DE VIEIRA, 2008) 197
Parte A – Familiarização com o software ................................................... 197
Parte B – Verificando a viabilidade de um plano de aula (Adaptado
de VIEIRA, 2008) ........................................................................................
214
L
ISTA DE FIGURAS
Figura 1: Esquema traçado para a realização da fase experimental da
Engenharia Didática .........................................................................
30
Figura 2: Exemplo Leitura dos Dados (CURCIO, 1994, p. 71) – tradução
nossa ................................................................................................
40
Figura 3: Exemplo Leitura entre os Dados (CURCIO, 1994, p. 71) – tradução
nossa ...............................................................................................
41
Figura 4: Exemplo Leitura além dos Dados (CURCIO, 1994, p. 71) –
tradução nossa ................................................................................
42
Figura 5: Gráfico de colunas ............................................................................
44
Figura 6: Tratamento em uma tabela pela modificação da amplitude das
classes .............................................................................................
45
Figura 7: Conversão de uma tabela de distribuição de frequências para um
gráfico de colunas para a variável gênero .......................................
45
Figura 8: Exemplo 1 do paralelo entre as apreensões e os níveis de leitura
de gráfico (atividade retirada de Curcio, 1994, p. 74) tradução
nossa ...............................................................................................
60
Figura 9: Exemplo 2 do paralelo entre as apreensões e os níveis de leitura
de gráfico (atividade retirada de Curcio, 1994, p. 74) tradução
nossa ...............................................................................................
61
Figura 10: Exemplo 3 do paralelo entre as apreensões e os níveis de leitura
de gráfico (atividade retirada de Curcio, 1994, p. 74) tradução
nossa ..............................................................................................
63
Figura 11: Tratamento entre um banco de dados (a esquerda) e uma tabela
de distribuição de freqüências (direita) ..........................................
68
Figura 12: Modificação do banco de dados pela alteração do ponto no
Gráfico ............................................................................................
73
Figura 13: Ferramenta do FATHOM para selecionar uma mesma
característica em diferentes registros ............................................
83
Figura 14: Possíveis soluções dos itens “i”, “j” e “k” da primeira questão do
teste diagnóstico ............................................................................
92
Figura 15: Tela do FATHOM esperada como solução da inserção de dados
no software .....................................................................................
131
Figura 16: Tabela com o valor da média ......................................................... 136
Figura 17: Valor da média de idades e da média salaria .................................
153
Figura 18: Modificação no banco de dados pelo manuseio das
representações gráficas .................................................................
175
L
ISTA DE TABELAS
Tabela 1: Enumeração .....................................................................................
43
Tabela 2: Tabela de distribuição de frequências para a variável “gênero” ...... 44
Tabela 3: Enumeração das idades .................................................................. 46
Tabela 4: Tabela de distribuição de freqüências com os valores em ordem
Crescente ........................................................................................
89
Tabela 5: Tabela esperada como solução da segunda questão do Teste
Diagnóstico (Registro Tabular) ........................................................
105
Tabela 6: Tabela para organização dos dados ................................................
112
Tabela 7: Tabela para auxiliar na identificação da mediana ............................
115
Tabela 8: Tabela com as frequências acumuladas e posição no rol ............... 117
Tabela 9: Tabela para identificação do valor máximo ..................................... 117
Tabela 10: Tabela de distribuição de frequências para a variável gênero ...... 133
Tabela 11: Tabela vertical de distribuição de frequências para a variável
gênero ...........................................................................................
133
Tabela 12: Tabelas de distribuição de frequências para as variáveis cargo e
escolaridade ..................................................................................
133
Tabela 13: Tabela de distribuição de frequências para a variável idade .........
137
Tabela 14: Tabela de distribuição de frequências para a variável salário ....... 137
Tabela 15: Tabela de dupla entrada para as variáveis gênero e cargo ...........
138
Tabela 16: Tabela de distribuição de frequências com os desvios salariais ... 169
Tabela 17: Tabela de dupla entrada das variáveis gênero e escolaridade ..... 171
L
ISTA DE GRÁFICOS
Gráfico 1: Localização da média no gráfico .....................................................
46
Gráfico 2: box-plot ............................................................................................
47
Gráfico 3: Gráfico de setores para a variável matéria preferida ...................... 70
Gráfico 4: Ribbon Chart para a variável matéria preferida .............................. 70
Gráfico 5: Gráfico de colunas para a variável matéria preferida ......................
71
Gráfico 6: dot plot para as variáveis idade e altura ..........................................
72
Gráfico 7: Gráfico de colunas para a variável gênero, subdividindo as
Barras para a variável matéria preferida .........................................
74
Gráfico 8: Gráfico de colunas para a variável matéria preferida,
Subdividindo as barras para a variável gênero ...............................
74
Gráfico 9: Histograma para a variável altura dos alunos ................................. 75
Gráfico 10: Box-plot da variável altura .............................................................
76
Gráfico 11: Histograma com a localização da média .......................................
79
Gráfico 12: Histograma com a localização da mediana + Box-plot ................. 79
Gráfico 13: Histograma com a localização simultânea da média e da
mediana + Box-plot .......................................................................
80
Gráfico 14: Histograma para a variável altura com a localização dos
1º, 2º e 3º quartis + Box-plot .........................................................
81
Gráfico 15: Dot-plot para organização dos dados ........................................... 113
Gráfico 16: Gráfico de barras para a variável idade ........................................ 114
Gráfico 17: Gráfico de barras para a variável idade localizando o valor
máximo ..........................................................................................
118
Gráfico 18: Representação gráfica “Ribbon Chart” para a variável gênero .....
143
Gráfico 19: Gráficos de colunas para as variáveis cargo e escolaridade ........ 144
Gráfico 20: Histograma para a variável idade ..................................................
146
Gráfico 21: Gráfico de pontos (Dot Plot) para a variável idade ....................... 147
L
ISTA DE PROTOCOLOS
Protocolo 1: Respostas da professora A para a primeira questão do teste
diagnóstico itens de “a” até “f” .....................................................
94
Protocolo 2: Resoluções da professora B para a primeira questão do teste
diagnóstico itens de “a”, “b”, “c” e “f” ...........................................
94
Protocolo 3: Respostas da professora B para a primeira questão do teste
diagnóstico itens de “a” até “f” .....................................................
95
Protocolo 4: Respostas da professora A para a primeira questão do teste
diagnóstico itens de “g” e “h” .......................................................
96
Protocolo 5: Resolução da professora B para encontrar a mediana de um
conjunto de dados .......................................................................
96
Protocolo 6: Respostas da professora B para a primeira questão do teste
diagnóstico itens de “g” e “h” .......................................................
97
Protocolo 7: Respostas da professora A para a primeira questão do teste
diagnóstico itens de “i”, “j” e “k” – construções gráficas ..............
98
Protocolo 8: Respostas da professora B para a primeira questão do teste
diagnóstico itens de “i”, “j” e “k” – construções gráficas ..............
100
Protocolo 9: Entrevista piloto – construção de gráficos com a utilização de
pares ordenados ..........................................................................
101
Protocolo 10: Respostas da professora A para a questão 1.1. do teste
diagnóstico .................................................................................
102
Protocolo 11: da professora B para a questão 1.1. do teste diagnóstico ........ 102
Protocolo 12: da professora A para a questão 1.2. do teste diagnóstico ........ 102
Protocolo 13: da professora B para a questão 1.2. do teste diagnóstico ........ 103
Protocolo 14: Conversão do registro gráfico para o tabular – questão 2 do
teste diagnóstico ........................................................................
106
Protocolo 15: Resposta da professora A para os itens de saberes docentes
da questão 2 do teste diagnóstico ..............................................
107
Protocolo 16: Resposta da professora A para os itens de saberes docentes
da questão 2 do teste diagnóstico ..............................................
107
Protocolo 17: Resposta da professora A para a questão 3 do teste
diagnóstico .................................................................................
109
Protocolo 18: Resposta da professora B para a questão 3 do teste
diagnóstico .................................................................................
110
Protocolo 19: Conversões realizada pela professora A para responder a
questão 4 do teste diagnóstico ...................................................
119
Protocolo 20: Conversões realizada pela professora B para responder a
questão 4 do teste diagnóstico ...................................................
120
Protocolo 21: Respostas da professora A para responder à questão 4 do
teste diagnóstico, itens “c” e “d” .................................................
121
Protocolo 22: Respostas da professora B para responder a questão 4 do
teste diagnóstico, itens “c” e “d” .................................................
122
Protocolo 23: Resposta da professora A referente a importância das
conversões .................................................................................
123
Protocolo 24: Resposta da professora B referente a importância das
conversões .................................................................................
123
Protocolo 25: Resposta da professora A para a utilização dos diferentes
registros ......................................................................................
124
Protocolo 26: Resposta da professora A para a utilização dos diferentes
registros ......................................................................................
124
Protocolo 27: Respostas da professora A referente a variáveis estatísticas ...
128
Protocolo 28: Respostas da professora B referente a variáveis estatísticas ...
128
Protocolo 29: Resposta da professora A referente ao uso do ambiente
computacional na escola ............................................................
129
Protocolo 30: Resposta da professora B referente ao uso do ambiente
computacional na escola ............................................................
129
Protocolo 31: Resposta da professora A para a questão 4 da parte A ............
134
Protocolo 32: Resposta da professora B para a questão 4 da parte A ............
134
Protocolo 33: Resposta da professora A para a questão 4.1. da parte A ........
135
Protocolo 34: Resposta da professora B para a questão 4.1. da parte A ........
135
Protocolo 35: Resposta da professora B para a décima questão da parte A .. 139
Protocolo 36: Resposta da professora A para a décima primeira questão
da parte A ...................................................................................
139
Protocolo 37: Resposta da professora A para a décima primeira questão
da parte A ...................................................................................
140
Protocolo 38: Resposta da professora A para a questão 2 da segunda fase
da parte A ...................................................................................
144
Protocolo 39: Resposta da professora B para a questão 2 da segunda fase
da parte A ...................................................................................
144
Protocolo 40: Resposta da professora A referente a distinção de duas
representações gráficas .............................................................
145
Protocolo 41: Respostas da professora A para as questões “5” e “5.1.” da
segunda fase da parte A ............................................................
148
Protocolo 42: Respostas da professora B para as questões “5” e “5.1.” da
segunda fase da parte A ............................................................
148
Protocolo 43: Resposta sobre a ferramenta do software que realiza a
inter-relação entre os diferentes registros apresentados
na tela .........................................................................................
150
Protocolo 44: Resposta da professora A à questão 6.1. da segunda fase da
parte A ........................................................................................
151
Protocolo 45: Resposta da professora B à questão 6.1. da segunda fase da
parte A ........................................................................................
151
Protocolo 46: Respostas da professora A para as questões “6” e “6.1.” da
terceira fase da parte A ..............................................................
157
Protocolo 47: Respostas da professora B para as questões “6” e “6.1.” da
terceira fase da parte A ..............................................................
158
Protocolo 48: Resposta da professora A referente a representação gráfica
box-plot .......................................................................................
162
Protocolo 49: Resposta da professora B referente a representação gráfica
box-plot .......................................................................................
163
Protocolo 50: Resposta da professora A para a questão 9.1 da terceira fase
da parte A ...................................................................................
163
Protocolo 51: Resposta da professora B para a questão 9.1 da terceira fase
da parte A ...................................................................................
164
Protocolo 52: Resposta da professora A para a comparação do histograma
e o box-plot .................................................................................
165
Protocolo 53: Resposta da professora B para a comparação do histograma
e o box-plot .................................................................................
165
Protocolo 54: Respostas da professora A para a questão 16 da terceira fase
da parte A ...................................................................................
177
Protocolo 55: Respostas da professora B para a questão 16 da terceira fase
da parte A ...................................................................................
178
Protocolo 56: Resposta da professora A para a última questão da terceira
fase da parte A ...........................................................................
179
Protocolo 57: Resposta da professora B para a última questão da terceira
fase da parte A ...........................................................................
179
Protocolo 58: Resposta da professora A para o item b da primeira questão
da parte B ...................................................................................
182
Protocolo 59: Resposta da professora B para o item b da primeira questão
da parte B ...................................................................................
183
Protocolo 60: Respostas da professora A para as questões “2.1”, “2.2” e
“2.3” da parte B ..........................................................................
183
Protocolo 61: Respostas da professora B para a questão 2 completa da
parte B ........................................................................................
184
Protocolo 62: Respostas da professora A para as questões “3.1”e, “3.2”
da parte B ...................................................................................
185
Protocolo 63: Respostas da professora B para a questão 3 completa da
parte B ........................................................................................
185
L
ISTA DE QUADROS
Quadro 1: Relações hipotéticas entre as Teorias de Duval e Curcio
elaborado por Vieira (2008, p. 38) .................................................
59
19
I
NTRODUÇÃO
No Programa de Estudos Pós-Graduados em Educação Matemática,
desenvolve-se um projeto de pesquisa na área da Educação Estatística, intitulado
PEA-ESTAT (Processos de Ensino e Aprendizagem da Estatística), como parte
das atividades do grupo PEA-MAT
1
. Nossa pesquisa faz parte desse projeto e
busca complementar o diagnóstico feito em Vieira (2008) que apresentaremos
mais adiante neste texto.
Nosso trabalho tem como objetivo principal verificar o nível de letramento
estatístico do professor da Escola Básica, que trabalha com estatística em sua
prática docente e, também, como o uso de um material de apoio, um ambiente
computacional auxilia no desenvolvimento dos níveis de leitura gráfica e
possibilita ao professor viabilizar a utilização de diferentes registros de
representação semiótica. Empregaremos o mesmo ambiente computacional que
Vieira (2008): o software de estatística Fathom.
Em sua dissertação, a autora citada percebeu que, em vários momentos, o
uso desse ambiente auxiliou os alunos pesquisados na compreensão de alguns
conceitos estatísticos. Dessa forma, aplicaremos uma sequência didática
construída com base na utilizada pela autora referida, para estudar procedimentos
e discursos do professor frente a esse recurso, quando solicitado a viabilizar a
aplicação de uma aula, pelo seu plano de aula, sobre a introdução aos conteúdos
de Estatística Descritiva. Assim, o foco de nosso trabalho será analisar as
condições didáticas nas quais, pelo uso do software, os registros de
____________
1
Grupo de pesquisa “Processos de Ensino e Aprendizagem da Matemática” (PEA-MAT), coordenado pelo
Prof. Dr. Saddo Ag Almouloud, ligado ao Programa de Estudos Pós-graduados em Educação Matemática
da PUC-SP e cadastrado no CNPq. O projeto PEA-ESTAT é finalizado pela FAPESP.
20
representação semiótica dos objetos estatísticos são mobilizados e a
consequente evolução nos níveis do letramento estatístico dos sujeitos.
No primeiro capítulo deste trabalho, trataremos da problemática. Neste item
definiremos nosso objetivo e as questões de pesquisa, além dos procedimentos
metodológicos escolhidos.
No segundo capítulo, apresentaremos algumas pesquisas na área da
Educação Estatística, que nos auxiliarão na constituição de nosso quadro teórico.
Abordaremos também pesquisas sobre o uso de um ambiente computacional
para o ensino e aprendizagem de alguns conceitos de Estatística Descritiva.
No terceiro capítulo, traremos uma breve explanação dos princípios da
análise exploratória de dados e a articulação com as ferramentas disponíveis no
software Fathom.
No quarto capítulo, apresentaremos as análises a priori e posteriori das
entrevistas com os professores participantes do projeto. Na sequência para
finalizar o trabalho, traremos nossas considerações finais.
21
I
. PROBLEMÁTICA
O presente capítulo traz as reflexões que conduziram nossas questões de
pesquisa e os procedimentos utilizados para respondê-las, assim como a
construção do quadro teórico no qual a pesquisa é embasada.
I.1 Objetivo e Problema de Pesquisa
Pesquisas recentes têm mostrado que, muitas vezes, o ensino da
Estatística Descritiva acontece como simples treino de algoritmos, sem a
necessária preocupação com a associação entre os resultados obtidos e o
contexto no qual o problema está inserido. Mostram, também, que os professores
sentem dificuldades com o ensino de alguns conceitos da Estatística Descritiva,
até pelo fato deles mesmos terem passado por sua formação inicial (escolar e
universitária) aprendendo-a nesse mesmo enfoque de aplicação de fórmulas e
não com o trabalho dos conceitos e contextos, que podemos chamar de
tecnicista, segundo os termos de Gascón (2003)
Esta ideia é reforçada por Coutinho (2008) que descreve em seu artigo
alguns resultados de pesquisas desenvolvidas recentemente pelo grupo de
pesquisa PEA-MAT, nos quais foi possível identificar essas dificuldades em
alguns professores pesquisados, sobretudo no que se refere à Análise
Exploratória de Dados.
A autora citada ainda enfatiza que o discurso do professor não condiz com
sua prática, uma vez que em suas falas mostram-se preocupados e dizem
22
perceber a importância da filosofia da Análise Exploratória dos Dados, mas, em
suas práticas, eles se restringem às cnicas que enfatizam o uso de algoritmos
(calcular medidas, sem qualquer preocupação ao dar significado aos resultados
obtidos).
Diante destas reflexões e dos resultados dos estudos que fomos buscar,
enfocamos nossa pesquisa no desenvolvimento dos conceitos da Estatística
Descritiva na Escola Básica, segundo o ponto de vista dos docentes de
Matemática desse nível de ensino.
O objetivo principal da presente pesquisa é verificar o nível de letramento
estatístico do professor da Escola Básica, que trabalha com a Estatística
Descritiva em sua prática docente (SHAMOS, 1995) e como o uso de um material
de apoio, no caso um software de Estatística Dinâmica (FATHOM), auxilia no
desenvolvimento dos níveis de leitura de gráfica (CURCIO, 1994) e possibilita
viabilizar a importância da utilização de diferentes registros de representação
semiótica (DUVAL, 2003).
Em outras palavras, desejamos estudar as consequências didáticas que
podem ser associadas ao uso de um software de estatística dinâmica no
conhecimento estatístico e pedagógico dos conteúdos estatísticos com
professores em exercício na Escola Básica. Desenvolveremos uma parte
destinada a explicar e situar essas teorias no âmbito deste trabalho.
Pretendemos com isso responder às seguintes questões:
Qual é o nível de letramento estatístico de professores de Matemática
do Ensino Médio que trabalham, em sua prática docente, com os conteúdos
da Estatística Descritiva?
Como estes percebem o uso simultâneo de vários registros de
representação semiótica para a análise de um conjunto de dados, com ou
sem o uso do ambiente informatizado?
Desta forma, depreendemos que a representação do objeto “distribuição de
frequências” ou do objeto “distribuição de um conjunto de dados” deve ser
realizada a partir de diferentes registros de representação semiótica: rol, tabelas,
23
gráficos, esquemas ou diagramas e medidas-resumo. Tais representações devem
ser favorecidas pela sequência de atividades preparadas pelo professor em seu
plano de aula, quando o objetivo é o trabalho com conceitos estatísticos, tais
como “distribuição”. Conjecturamos ainda que a utilização do ambiente
computacional, tal como o FATHOM, facilita a construção e a articulação dessas
representações.
Abordaremos também alguns conhecimentos pedagógicos, no entanto, não
nos aprofundaremos no assunto, por opção e por problemas de gestão do tempo.
Apenas faremos alguns questionamentos no intuito de perceber como o professor
se frente a esse tipo de perguntas, deixando-as para que ele possa refletir
sobre o assunto. Não acompanharemos o professor em suas aulas referentes à
abordagem da Estatística Descritiva, limitar-nos-emos a solicitar que analise um
plano de aula a ser trabalhado com seus alunos.
I.2 Os procedimentos metodológicos adotados
I.2.1 Estudo de Caso
Os procedimentos selecionados para responder a nossa questão de
pesquisa foram embasados nos princípios de um Estudo de Caso e em alguns
pressupostos da Engenharia Didática. Visto que um dos objetivos implícitos é
ensinar aos professores participantes o uso de ferramentas do software FATHOM.
O Estudo de Caso é uma metodologia usada em pesquisas qualitativas que
buscam realizar uma descrição densa dos fatos observados. Segundo And
(2005, p. 14), é um “estudo descritivo de uma unidade seja ela uma escola, um
professor, um grupo de alunos, uma sala de aula”.
Desse modo, percebemos a relação desta metodologia com nossa
pesquisa, uma vez que optamos por realizar uma pesquisa qualitativa com duas
professoras específicas, a partir de um “estudo denso” das interações dessas
docentes com os saberes da Estatística Descritiva em ambiente computacional.
24
Stake (1995, apud ANDRÉ 2005) distingue três tipos de Estudo de Caso:
Estudo de Caso Intrínseco, Estudo de Caso Instrumental e Estudo de Caso
Coletivo.
O Estudo de Caso Intrínseco acontece quando “o pesquisador tem um
interesse intrínseco naquele caso particular. Por exemplo, quando se deseja
investigar a prática pedagógica de uma alfabetizadora bem-sucedida, o interesse
é no caso em si, quer se conhecer mais aquela unidade específica” (ANDRÉ,
2005, p. 19). Optamos por este tipo de Estudo de Caso, que a escolha pelas
professoras participantes teve suas particularidades, que explicaremos após
descrever os outros tipos de Estudo de Caso,
O Estudo de Caso Instrumental acontece quando o pesquisador possui
uma questão a ser respondida, na qual um caso particular vai ajudar a resolvê-la.
No Estudo de Caso Coletivo, o pesquisador concentra-se em mais de um
caso, várias escolas, vários professores, mas seu objetivo final é intrínseco ou
instrumental. O interesse não está especificamente nas escolas, nos professores,
mas no que eles revelam sobre um fato peculiar.
Em relação às particularidades das escolhas das professoras, percebemos
com a leitura de pesquisas recentes, que os resultados apontam que os
professores encontram-se em um nível de letramento estatístico cultural
(abordaremos letramento estatístico no capítulo II.1.1 deste trabalho), e que não
percebem a importância do trabalho com diferentes registros de representação
para o mesmo objeto estudado (abordaremos registros de representação
semiótica no capítulo II.1.3). Desta forma optamos por escolher duas professoras
que já haviam trabalhado com Estatística na Escola sica, para verificar se
existem mudanças nos dados apontados. A seguir, a descrição de cada uma das
professoras entrevistadas.
A professora A trabalha com o ano do Ensino Médio, quase 5 anos
ininterruptos e em todos estes anos ela abordou com seus alunos conceitos da
Estatística Básica. Ela trabalha tanto em uma Escola da Rede Estadual de
Ensino, como na Rede Privada de Ensino, sua formação é licenciatura plena em
Matemática.
25
A professora B trabalhou, algumas vezes, com os conceitos da
Estatística Básica; relata em sua entrevista que isto acontece em outras séries,
não apenas no ano do Ensino Médio, mas que também desenvolveu alguns
trabalhos com esta série. Ela trabalha em uma Escola da Rede Estadual de
Ensino, sua formação é licenciatura plena em Matemática, especialização em
Educação Matemática e está em fase de conclusão do seu mestrado em
Educação Matemática.
Assim, optamos por estas duas professoras, para que possamos perceber,
se o seu trabalho com estes conceitos, uma sequência didática especifica e
estando frente a um recurso didático diferenciado (software de estatística
dinâmica), seu letramento estatístico seria apenas cultural, ou se existiriam
mudanças nesse fato.
Retornemos a discussão dos princípios do Estudo de Caso. Merrian (1988)
apud ANDRÉ (2005) concluiu que quatro são as características essenciais em um
estudo de caso qualitativo: particularidade, descrição, heurística e indução.
Particularidade significa que o estudo de caso focaliza uma
situação, um programa, um fenômeno particular. O caso em si tem
importância, seja pelo que representa. É, pois, um tipo de estudo
adequado para investigar problemas práticos, questões que
emergem do dia-a-dia.
Descrição significa que o produto final de um estudo de caso é um
descrição densa” do fenômeno em estudo. Por descrição densa
entende-se uma descrição completa e literal da situação
investigada. [...]. O estudo de caso engloba um grande número de
variáveis e retrata suas interações ao longo do tempo.
Heurística significa que os estudos de caso iluminam a
compreensão do leitor sobre o fenômeno estudado. Podem
revelar a descoberta de novos significados, estender a experiência
do leitor ou confirmar o já conhecido.
Indução significa que em grande parte, os estudos de caso se
baseiam na lógica indutiva. “Descoberta de novas relações,
conceitos, compreensão, mais do que verificação ou hipótese pré-
definida caracteriza o estudo de caso qualitativo”. (MERRIAN,
1988, p. 13, apud ANDRÉ, 2005, p. 17 - 18)
Para contemplar estas características, focalizaremos nosso estudo nas
duas professoras participantes, investigando sua postura em relação aos
conceitos da Estatística Descritiva. Faremos, também, uma descrição “densa” dos
26
fatos no momento da análise a posteriori de nossa pesquisa, buscando
compreender como elas evoluem nos níveis de letramento estatístico e na
mobilização dos diversos registros de representação semiótica de um mesmo
conceito estatístico: a distribuição de frequência.
O Estudo de Caso caracteriza-se em três fases: fase exploratória ou de
definição dos focos de estudo, fase de coleta dos dados ou de delimitação do
estudo e fase de análise sistemática dos dados. Podemos supor que ele está
diretamente ligado à Engenharia Didática que, também, possui fases distintas, a
utilizaremos, juntamente com o Estudo de Caso para elaborar, aplicar e analisar
nossa pesquisa.
Em relação ao Estudo de Caso, os cleos centrais da fase exploratória,
segundo André (2005), voltam-se às experiências cotidianas do sujeito, sua
linguagem, suas produções culturais e formas de interações sociais.
A fase exploratória é o momento de definir a(s) unidade(s) de
análise o caso –, confirmar ou não as questões iniciais,
estabelecer os contatos iniciais para entrada em campo, localizar
os participantes e estabelecer mais precisamente os
procedimentos e instrumentos de coleta de dados, (ANDRÉ, 2005,
p. 48)
Em relação a esta primeira fase, para contemplá-la faremos um estudo de
algumas pesquisas recentes no âmbito da Educação Estatística, quanto ao
letramento, aos registros de representação semiótica e aos níveis de
compreensão de gráficos. Em relação aos procedimentos e instrumentos de
coleta de dados, escolhemos adaptar a sequência didática desenvolvida por
Vieira (2008) para nosso público-alvo, professores, uma vez que ela trabalha
tanto com os registros de representação como com os níveis de compreensão
gráfica e o mesmo ambiente informatizado que trabalhamos em nossa pesquisa.
Retomando as fases do estudo de caso, percebemos que: “Uma vez
identificados os elementos-chave e os contornos aproximados do estudo, o
pesquisador pode proceder à coleta sistemática de dados”. (ANDRÉ, 2005, p. 50-
51).
27
Bassey “considera que três grandes métodos de coleta de dados nos
estudos de caso: fazer perguntas (e ouvir atentamente), observar eventos (e
prestar atenção no que acontece) e ler documentos”. (BASSEY, 2003 p. 81-83
apud ANDRÉ 2005, p. 51)
Neste momento de coleta de dados, voltaremos nossa pesquisa para a
observação das professoras no momento da resolução dos problemas propostos,
atentando-nos a seus registros, tanto orais como escritos. Segundo Vianna, “a
observação é uma das mais importantes fontes de informações em pesquisas
qualitativas em educação”. (VIANNA, 2003, p. 12)
Vianna ressalta que Bailey (1994) estabelece diferentes e sucessivas fases
do processo de observação, fases estas que tentamos desenvolver em nosso
trabalho e citamos abaixo.
definir os objetivos do estudo;
decidir sobre o grupo de sujeitos a observar;
legitimar sua presença junto ao grupo a observar;
obter confiança dos sujeitos a observar;
observar e registrar notas de campo durante semanas;
gerenciar possíveis crises que possam ocorrer entre os sujeitos
e o observador;
saber retirar-se do campo de observação
analisar os dados;
elaborar um relatório sobre os elementos obtidos. (BAILEY,
1994, apud VIANNA, 2003, p. 30)
Para a última fase do Estudo de Caso, a fase de delimitação do estudo e
de análise sistemática dos dados, André afirma que:
A elaboração do relatório final é um grande desafio na condução
do estudo de caso, pois exige certa habilidade de escrita por parte
do pesquisador. Os relatos de caso apresentam geralmente um
estilo informal, narrativo, ilustrado por figuras de linguagem,
citações, vinhetas narrativas, exemplos e ilustrações. A
preocupação é com a transmissão direta, clara e bem articulada
do caso, num estilo que se aproxime da experiência pessoal do
leitor (ANDRÉ, 2005, p. 56-57).
28
As formas de análise dos dados e de elaboração do relatório final
não estão absolutamente prontos em roteiros para serem
seguidos, havendo necessidade de que o pesquisador se baseie
em seus próprios talentos, sua criatividade e suas habilidades
pessoais. (ANDRÉ, 2005, p. 36)
Em nosso trabalho, a fase da elaboração do relatório final será orientada
pelas análises a posteriori do observado, segundo os princípios da Engenharia
Didática que apresentaremos a seguir.
I.2.2 Pressupostos da Engenharia Didática
Conforme cita Artigue (1996, p.4), a Engenharia Didática evoluiu como uma
metodologia de pesquisa que é vista como: “… em desenvolvimento de uma
pesquisa ou de uma prática, a Engenharia Didática é certamente uma prática de
intervenção controlada, e esta intervenção é teoricamente fundamentada.”
(tradução nossa). Para a autora citada, a validação se pelo confronto entre as
análises a priori e a posteriori.
A Engenharia Didática é uma metodologia de pesquisa com diferentes
fases: as análises prévias, a análise a priori, a experimentação, a análise a
posteriori e a validação. Um dos objetivos da primeira fase da Engenharia
Didática é: “identificar os problemas de ensino e aprendizagem do objeto de
estudo e delinear de modo fundamentado a(s) questão(ões), as hipóteses, os
fundamentos teóricos e metodológicos da pesquisa” (ALMOULOUD, 2007, p.
172).
Para contemplar esta primeira fase, nesta pesquisa faremos uma
abordagem detalhada do quadro teórico escolhido (Registro de Representações
Semióticas), assim como dos quadros complementares saídos das teorias da
Educação Estatística, tais como: os níveis de letramento estatístico (SHAMOS,
1995) e os níveis de leitura e compreensão de gráficos (CURCIO, 1994).
Além disso, o quadro também será constituído pelos resultados
encontrados em pesquisas recentes sobre o ensino e a aprendizagem da
29
Estatística aos quais tivemos acesso. O software FATHOM será analisado
didáticamente.
Voltando à apresentação de nossos procedimentos, passamos a segunda
fase de uma Engenharia Didática que, segundo Almouloud (2007, p. 176), é o
momento que o pesquisador elabora e analisa uma sequência de situações-
problema. “O objetivo de uma análise a priori é determinar como as escolhas
didáticas efetuadas permitem controlar os comportamentos dos alunos e explicar
seu sentido”.
Conforme citamos no Estudo de Caso, nesta fase utilizaremos como
situações-problema as atividades desenvolvidas por Vieira (2008), com as
modificações necessárias para nosso público-alvo, professores. Partimos da
hipótese de que estes não conhecem o ambiente computacional escolhido, assim
como têm pouco conhecimento de conceitos estatísticos, conforme os resultados
de pesquisas recentes em nossa revisão bibliográfica. Desta forma, optamos por
deixar até mesmo o teste diagnóstico da sequência de Vieira (2008).
Neste momento, vale ressaltar que Vieira (2008) realizou sua pesquisa
também com o ambiente informatizado FATHOM. No entanto, seu objetivo de
pesquisa foi: “a partir do desenvolvimento de uma seqüência didática, estudar as
interações entre o aluno e um ambiente de estatística dinâmica, introduzindo a
análise exploratória de dados para o nível do segundo ano do Ensino Médio”
(VIEIRA, 2008, p. 16).
A terceira fase de uma Engenharia Didática, a da experimentação, é o
momento no qual observamos como os professores participantes desenvolvem
um raciocínio estatístico adequado à resolução dos problemas propostos, sejam
estes relativos aos conhecimentos estatísticos como aos didáticos.
A quarta fase, segundo Almouloud, é a análise a posteriori:
... é o conjunto de resultados que se pode tirar da exploração dos
dados recolhidos e que contribui para a melhoria dos
conhecimentos didáticos que se têm sobre as condições da
transmissão do saber em jogo. Ela não é crônica da classe, mas
uma análise feita à luz da análise a priori, dos fundamentos
teóricos, das hipóteses e da problemática da pesquisa,...
(ALMOULOUD, 2007, p. 177)
30
A última fase, a validação é o confronto entre as análises a priori e a
posteriori, e é a principal característica da Engenharia Didática.
Em um primeiro momento, foi realizado um “piloto” para verificarmos a
adequação das atividades em relação aos resultados pretendidos. O piloto foi
realizado com uma professora que leciona aproximadamente 4 anos na rede
pública de ensino e não conhecia o software Fathom. A seguir apresentamos um
esquema representando o projeto traçado para a realização da pesquisa com
professores do Ensino Médio.
Figura 1: Esquema traçado para a realização da fase experimental da Engenharia Didática
Em nossa fase experimental, inicialmente, aplicamos um teste diagnóstico
com o objetivo de perceber o nível de conhecimento estatístico do sujeito da
pesquisa. A aplicação deste diagnóstico ficou fortemente fundamentada, uma vez
que pesquisas recentes (apresentadas a seguir neste texto) mostram que o nível
31
de letramento estatístico do professor é cultural (os níveis de letramento
estatístico considerados serão apresentados no próximo capítulo). Para esta fase,
é previsto um encontro com duração de 30 minutos.
Em seguida, nossa sequência didática (parte A) busca familiarizar o
professor com o ambiente FATHOM, além de trabalhar e/ou recordar alguns
conhecimentos estatísticos. Esta parte da sequência é subdividida em outras três
fases, cada uma com um enfoque mais especifico. A primeira evidencia as
variáveis, os tipos de variáveis e a construção de tabelas de distribuição de
frequências. A segunda apresenta e sugere a análise de algumas representações
gráficas. A última fase da parte A, além de trabalhar com as medidas-resumo
propõe uma inter-relação entre os diversos registros de representação. Para esta
parte, serão previstos dois encontros com duração de 40 minutos.
Na parte B de nossa pesquisa, sugerimos ao professor a construção de um
plano de aula, no qual a finalização por parte de seus alunos seria a construção
de um relatório estatístico que apresentasse sua escola a um aluno de uma outra
escola. Nesta parte, trazemos algumas sugestões de atividades e solicitamos
para o professor verificar a viabilidade da aplicação destas, evidenciando
mudanças, sugestões. Para esta parte, será previsto um encontro com duração
de 30 minutos.
As análises dos resultados observados no teste diagnóstico e nas fases A
e B de nossa fase experimental fornecerão os elementos para o nível de
letramento estatístico do professor que trabalha com conceitos da Estatística
Descritiva em sua prática docente e, também, como ele percebe o uso simultâneo
dos diferentes registros de representação semiótica.
33
II
. ALGUMAS PESQUISAS QUE FUNDAMENTAM O
ESTUDO
Para melhor delinear nosso trabalho, fomos buscar os resultados de
algumas pesquisas realizadas na área, além de estudar determinadas teorias
importantes para o desenvolvimento desta pesquisa.
II.1 Um primeiro esboço do quadro teórico
Neste trabalho, assumimos a Estatística como uma ciência de análise de
dados que usa a Matemática como ferramenta. O ensino da Estatística contribui
para a formação de indivíduos capazes de compreender e interpretar melhor o
mundo que os rodeia, visto que percebemos cada vez mais que a sociedade vem
se utilizando de dados para fazer previsões e tomar decisões.
A concepção da Estatística como ciência vai ao encontro da ideia
apresentada por Wild e Pfannkuch (2005), sobre como deve acontecer a
compreensão da investigação estatística:
Tomamos como ponto de partida a concepção de que o objetivo
fundamental da investigação estatística (aplicada) é a
aprendizagem na esfera do contexto do problema e que o
“pensamento estatístico” é a interação entre o estatístico e o
contextual (WILD e PFANNKUCH, 2005, p. 1, tradução nossa)
Atualmente percebemos um aumento no número de pesquisas na área da
Educação Estatística. Grandes teóricos têm estudado como acontece o
pensamento estatístico, a compreensão e a análise dos dados.
34
Segundo Morais:
As pesquisas têm mostrado que o conceito estatístico, quando é
desenvolvido na escola, não possibilita a construção do
pensamento estatístico do aluno. Normalmente é trabalhado de
maneira isolada e desarticulado, formando, assim, consumidores
despreparados e inseguros no trato com dados... (MORAIS, 2006,
p. 16)
Desta forma, julgamos ser interessante definir o que seria para nós
pensamento estatístico. Segundo Snee (1990, apud WILD e PFANKKUCH, 2005),
o pensamento estatístico define-se como:
processos do pensamento que reconhecem que a variação está
em tudo que nos rodeia e presente em qualquer coisa que
fazemos, todo o trabalho é uma série de processos
interconectados, e a identificação, a caracterização, a
quantificação, o controle e a redução da variação proporcionam
oportunidades para o crescimento. (SNEE, 1990 apud WILD e
PFANNKUCH, 2005, p. 2, tradução nossa)
Morais ao desenvolver sua pesquisa com base nessa definição de
pensamento estatístico, afirma que:
O pensamento estatístico possibilita visualizar o processo como
um todo com interação, justificação e compreensão do
relacionamento dos dados, além da mensuração da variação
presente. Assim é possível explorar os dados para além do que
está prescrito no texto, de modo que gere novos questionamentos
e tomadas de decisões conscientes e críticas. (MORAIS, 2006, p.
23)
Com isso, podemos observar que, para que a análise dos dados seja feita
de maneira crítica, é necessário que se realize a análise do contexto das
informações. Para que uma análise seja bem-feita, devemos olhar além dos
dados apresentados, considerando o objetivo da pesquisa e a situação nos quais
os dados foram coletados.
Campos (2007) resume e completa a reflexão de Wild e Pfannkuch e de
outros teórico da seguinte maneira:
35
o Pensamento Estatístico ocorre quando os modelos matemáticos
são associados à natureza contextual do problema em questão,
ou seja, quando surge a identificação da situação analisada e faz-
se uma escolha adequada das ferramentas estatísticas
necessárias para sua descrição e interpretação (CAMPOS, 2007,
p. 40)
Wild e Pfannkuch relatam que “o objetivo fundamental da investigação
estatística é a aprendizagem na esfera do contexto”, e ainda que “cada problema
sobre o qual se trabalhe uma estatística aplicada está dentro de um problema
maior, “o problema real”. Ao redor deste problema maior está um corpo conhecido
de “contexto””. (WILD e PFANNKUCH, 2005, p. 2, tradução nossa)
Ao fazer um paralelo com a teoria desenvolvida por Curcio (1994) que
propõe três níveis de leitura dos dados que serão apresentados mais adiante
neste texto, percebemos que o nível de leitura dos dados mais desenvolvido
acontece quando o indivíduo consegue inferir com base em seus conhecimentos
e nas informações do contexto.
Wild e Pfannkuch (2005) buscam desenvolver uma discussão sobre o que
é o pensamento estatístico; procuram detalhar como deve acontecer esse
pensamento, e para isto organizam em subitens como:
a concepção da estatística aplicada (a aprendizagem na esfera do
contexto);
os fundamentos do pensamento estatístico (conhecer a variação, a
construção, o raciocínio com base nos modelos e a integração entre os
conhecimentos estatísticos e do contexto);
os modos do pensamento (estratégico, interrogativo, perceptivo,
descritivo, interconexão, dedução, imaginação (conjeturas) e avaliação);
as atitudes do sujeito (curiosidade, consciência, franqueza, buscar um
significado profundo, compromisso);
as restrições (coisas que limitam o aprofundamento e a qualidade do
pensamento, como o conhecimento das pré-concepções, tempo,
dinheiro, restrições impostas por clientes); e
as técnicas (uso de técnicas de experiências passadas, modelos).
36
Ao observar as ideias a aqui apresentadas, podemos perceber uma
grande preocupação com o contexto, com a situação na qual o problema está
inserido, além dos processos do pensamento necessários para a compreensão
geral do problema em questão.
Existem outros autores que abordam este tema, no entanto, tomaremos
para nossa pesquisa o pensamento estatístico, conforme é apresentado neste
capítulo.
Para a construção do pensamento estatístico, fazemos a hipótese da
importância do trabalho com diferentes representações para o mesmo objeto de
estudo; no caso, o conjunto de dados ou distribuição de frequências. Assim, a
seguir, apresentaremos o referencial teórico deste trabalho e, com isso,
justificaremos esta importância.
Tomaremos como referencial teórico a Teoria dos Registros de
Representação Semiótica (DUVAL, 2003) assim como os níveis de leitura de
gráficos propostos por Curcio (1994) e por Friel et al. (2001) e, também algumas
ideias sobre os níveis de letramento científico propostos por Shamos (1995).
O primeiro referencial será usado para analisar o uso das diferentes
representações de um mesmo objeto da distribuição de frequência como os
registros de representação semiótica; o segundo, para analisar o nível de leitura
de gráficos dos professores, o terceiro, para analisar a relação entre a
mobilização dos registros, os níveis de leitura gráfica e o letramento estatístico.
Duval (2003) propôs sua teoria para a geometria e para a álgebra. No
entanto, Vieira (2008) sugeriu um paralelo entre a teoria de Duval (2003) e as
representações dos conceitos estatísticos que utilizaremos em nossa pesquisa.
Em relação ao uso do ambiente computacional, pesquisas recentes
apresentam que o computador está cada vez mais presente em nossas vidas e
que seu uso pode auxiliar na aprendizagem dos alunos.
Nos dias atuais, a utilização de computadores é uma realidade em
praticamente todas as áreas de atividade humana e, no cenário
educacional, a importância desta utilização está sendo cada vez
mais reconhecida por profissionais da área.
37
Diversas pesquisas indicam que tanto calculadoras como
computadores podem auxiliar os alunos na aprendizagem de
diversos conceitos matemáticos. No caso da estatística as
planilhas eletrônicas ajudam os estudantes a visualizar e explorar
melhor um conjunto de dados. (SANTOS, 2003, p. 19)
A mesma autora ressalta em seu trabalho que o uso do ambiente
computacional pode auxiliar nas interpretações dos gráficos, e é uma grande
ferramenta que fornece diferentes formas para representar o mesmo conjunto de
dados.
II.1.1 Os níveis letramento (ou literacia) estatística propostos por Shamos
Shamos (1995) propõe uma organização do letramento científico em três
níveis diferentes e hierárquicos: nível de letramento cultural, nível de letramento
funcional e nível de letramento científico.
O primeiro nível, o cultural refere-se às pessoas que apenas compreendem
os termos que utilizam em seu cotidiano, elas apenas reconhecem os termos
mais simples. As pessoas que se encontram nesse nível não utilizam termos
científicos em suas conclusões, apenas fazem breves observações sobre as
informações apresentadas.
Para o segundo nível, o funcional, o autor relata que nesta etapa a pessoa
já é capaz de compreender, ler e escrever corretamente alguns termos científicos.
Shamos relata ainda que a maioria dos adultos encontram-se no nível funcional
de letramento, pois segundo o autor: “... a recordação da ciência da maioria dos
adultos é muito pobre, mesmo para a maioria dos termos e conceitos que durante
o tempo da escola estivessem na “ponta da língua” durante os anos de
escolaridade”. (SHAMOS, 1995, p. 87, tradução nossa).
Gal (2002) considera que a compreensão estatística neste nível é maior do
que no anterior, visto que as pessoas não utilizam apenas conceitos de seu
cotidiano, mas fazem uso de alguns termos científicos. Mas, nesse nível, o
individuo utiliza alguns conteúdos de Estatística, consegue empregar certos
38
conceitos corretamente, compreende a maioria das informações observadas na
imprensa popular, mas o possui o conhecimento do emprego de todos os
termos científicos corretamente.
Shamos aponta para uma distinção interessante entre estes dois níveis
(cultural e funcional):
Uma distinção útil entre estes dois níveis de letramento é que o
sujeito letrado funcionalmente deve estar capacitado a se engajar
e um discurso significativo sobre a maioria dos artigos científicos
que aparece na imprensa popular, ao menos, colocando questões
inteligentes; enquanto que uma pessoa letrada culturalmente está
na posição de quem conhece uma língua estrangeira apenas
superficialmente, podendo apenas ficar inerte quando uma pessoa
fluente no idioma tenta iniciar uma conversação fluente.
(SHAMOS, 1995, p. 89, tradução nossa)
O último nível do letramento científico é o científico. Neste nível, a pessoa é
capaz de compreender e utilizar os conceitos científicos da Estatística
corretamente. Para Shamos (1995), aqui o indivíduo possui a compreensão global
dos termos estatísticos e sente segurança em suas escolhas. O indivíduo possui
uma preocupação com a investigação científica, com a pesquisa e, segundo o
autor: “Este individuo também aprecia os elementos da investigação científica, a
importância de um questionamento adequado, o raciocínio analítico e dedutivo, os
processos lógicos do pensamento”. (SHAMOS, 1995, p. 89, tradução nossa)
Em relação aos três níveis, Shamos menciona que o letramento cultural
(primeiro nível) é encontrado em quase todos os formados da Escola Básica, e o
segundo nível (o cultural) em todos os alunos formados na Escola Básica, que
levaram seus estudos mais a rio que eram “superiores” à sua classe. , para
alcançar o terceiro nível, os estudantes de nível superior precisam, segundo o
autor, extrapolar suas habilidades, percebendo que não existem limites para a
ciência, isto acontece quando estes são fortemente motivados e tiveram um bom
ensino.
39
Nesse sentido, podemos inferir pautados em Shamos (1995), que os
professores da Escola Básica podem atingir um nível científico de letramento
estatístico, e seus alunos alcançam apenas o nível funcional.
Vale aqui nos reportarmos aos trabalhos de Friolani (2007) e Simone Neto
(2007), ao mostrarem que os livros didáticos tendem a oferecer condições para
apenas, ao limiar entre o cultural e o funcional.
II.1.2 Os níveis de leitura gráfica propostos por Curcio
Segundo Curcio:
Os gráficos são meios de comunicar e classificar dados,
permitindo a comparação e exibindo relações. Embora a leitura
literal dos dados apresentados seja uma habilidade importante na
compreensão desse tipo de representação, o seu potencial
máximo será atingido quando o leitor for capaz de interpretar e
generalizar dados” (CURCIO, 1994, p. 1).
Curcio (1994) e Friel et al (2001) estabelecem três diferentes níveis de
leitura de um gráfico: leitura dos dados; leitura entre os dados; leitura além dos
dados. No primeiro nível, o mais elementar apenas se levantam os fatos do
gráfico, sem nenhuma interpretação, leitura simples dos eixos. Segundo Vieira:“...
este tipo de compreensão é uma tarefa que requer poucos recursos cognitivos.”
(VIEIRA, 2008, p. 21)
A seguir, um exemplo de atividade proposta por Curcio (1994) para este
nível.
40
Como John gasta dinheiro diariamente na escola.
almoço; $ 1,00
diversão; $ 0,50
transporte; $ 0,20
suprimentos
escolares; $ 0,30
Use o gráfico acima para responder as questões:
1. O que o gráfico conta para você?
a. Como John gasta seu dinheiro nos finais de semana.
b. Como John gasta seu dinheiro durante uma semana completa.
c. Como John gasta seu dinheiro durante as férias
d. Como John gasta seu dinheiro durante um dia na escola.
2. Quanto John gasta em suprimentos escolares em um dia?
a. $0,20 c. $0,50
b. $0,30 d. $1,00
Figura 2: Exemplo Leitura dos Dados (CURCIO, 1994, p. 71) – tradução nossa
Para solucionar as atividades propostas acima, não é necessário fazer
nenhuma interpretação dos dados, basta buscá-los diretamente no gráfico.
No nível seguinte (leitura entre os dados pesquisas recentes mostram
que a maior parte das pessoas é capaz de responder questões neste nível),
começam a existir interpretações, sendo feitas algumas comparações. Segundo
Curcio:
Este nível de compreensão inclui a interpretação e integração dos
dados no gráfico. Requer a habilidade para comparar quantidades
(como: melhor que, maior que, menor que) e usar outras
concepções e habilidades matemáticas (como: adição, subtração,
multiplicação, divisão) que permita o leitor combinar e integrar
dados e identificar as relações matemáticas expressas no gráfico.
(CURCIO, 1994, p. 6, tradução nossa)
A seguir, um exemplo de atividade para este nível proposta pelo autor
citado, referindo-se ao mesmo gráfico do exemplo anterior:
41
Como John gasta dinheiro diariamente na escola.
almoço; $ 1,00
diversão; $ 0,50
transporte; $ 0,20
suprimentos
escolares; $ 0,30
Use o gráfico acima para responder as questões:
3) Qual é o total de diários gastos de John na escola?
a. $1,90 c. $3,00
b. $2,00 d. $4,00
4. Quanto a mais John gasta no almoço do que no transporte?
a. $ 0,50 c. $ 0,80
b. $0,70 d. $1,20
Figura 3: Exemplo Leitura entre os Dados (CURCIO, 1994, p. 71) – tradução nossa
Neste caso, podemos observar que as soluções das atividades acima
requerem pequenas interpretações, fazem uso de comparações e de alguns
conceitos matemáticos, como as operações fundamentais. Não basta a simples
leitura dos rótulos, para fornecer a resposta desejada.
O terceiro e último nível é o da leitura além dos dados. Neste caso, o
indivíduo faz inferências com seus conhecimentos próprios e as informações do
contexto, completando a simples leitura de um gráfico com a análise dos dados
obtidos. Segundo Vieira:
Este nível de compreensão requer do leitor uma predição ou
inferência a partir dos dados, extraindo os esquemas existentes
(por exemplo, conhecimento anterior, conhecimento na memória)
para informação que o é nem explícita nem implicitamente
apresentada no gráfico.... Podemos dizer que este nível de leitura
exige, ainda mais que os níveis anteriores, um profundo
conhecimento do contexto no qual os dados foram coletados.
(VIEIRA, 2008, p. 22)
42
A seguir, um exemplo de atividade proposta por Curcio (1994) que
privilegia este nível de leitura de dados, também, para o mesmo gráfico dos
exemplos anteriores.
Como John gasta dinheiro diariamente na escola.
almoço; $ 1,00
diversão; $ 0,50
transporte; $ 0,20
suprimentos
escolares; $ 0,30
Use o gráfico acima para responder as questões:
5. Quanto dinheiro John precisa para pagar o almoço por 5 dias na escola?
a. $1,00 b. $2,00 c. $4,00 d. $5,00
6. Qual é o total de dinheiro que John precisa para 5 dias na escola?
a. $ 2,00 b. $7,00 c. $ 10,00 d. $14,00
Figura 4: Exemplo Leitura além dos Dados (CURCIO, 1994, p. 71) – tradução nossa
Podemos observar que a solução desta atividade não está apresentada
diretamente nas informações contidas no gráfico, é necessário que a pessoa faça
inferências ou relações para conseguir solucioná-las: com base no conhecimento
de quantos dias por semana John vai à escola, resolve o problema com os dados
do gráfico.
II.1.3 A teoria dos registros de representação semiótica
“O acesso aos objetos matemáticos passa necessariamente por
representações semióticas” (DUVAL, 2003, p. 21). Logo, acreditamos que a
compreensão do objeto “distribuição de frequências” deva acontecer pela
articulação de seus registros de representação semiótica. Tomaremos como
objeto de estudo os gráficos e as tabelas, usados como registros de
representação semiótica de uma distribuição de frequências.
43
Segundo Duval (2003, p. 15: 16), “existem dois tipos de transformações de
representações semióticas que são radicalmente diferentes: os tratamentos e as
conversões”. Os tratamentos são transformações dos registros de representações
semiótica que permanecem no mesmo sistema. Em seu artigo, Duval cita alguns
exemplos: “efetuar um cálculo ficando estritamente no mesmo sistema de escrita
ou de representação dos números; resolver uma equação ou um sistema de
equações; completar uma figura segundo critérios de conexidade e de simetria”.
as conversões são transformações de um mesmo objeto por registros
de representações com conteúdos diferentes. Assim, mudança de sistema,
mas conservam-se as referências ao mesmo objeto. A seguir, um exemplo
apresentados por Duval (2003, p. 16): “passar da escrita algébrica de uma
equação à sua representação gráfica”.
A teoria de Duval está mais intimamente ligada à geometria e à álgebra. No
entanto Vieira (2008) apresentou estudo para o uso desta teoria para a análise de
objetos do campo da Estatística Descritiva.
Em relação ao acesso aos objetos pela sua representação, Vieira (2008)
ressaltou que, em Estatística podemos representar uma distribuição de
frequências para uma variável de diferentes maneiras, como uma representação
gráfica ou uma tabela. Observe os exemplos de representações da mesma
distribuição de frequência para a variável “gênero”, supondo uma pesquisa feita
com determinado grupo de pessoas.
Tabela 1: Enumeração
44
Figura 5: Gráfico de colunas
Em relação aos tratamentos descritos por Duval, Vieira (2008) apresenta
um paralelo na Estatística com as transformações que ocorrem em tabelas.
Enumerar para passar à tabela de distribuição de frequências.
Tabela 2: Tabela de distribuição de frequências para a variável “gênero”
Podemos ilustrar uma segunda forma de tratamento em uma tabela, pela
mudança da amplitude das classes que agrupam os dados de uma variável
quantitativa contínua. Muitas vezes, este tipo de transformação é utilizado para
preparar os dados para a aplicação de testes de hipóteses ou outros tratamentos
estatísticos.
45
Figura 6: Tratamento em uma tabela pela modificação da amplitude das classes
Um terceiro exemplo de tratamento seria a mudança na escala de um eixo
de uma representação gráfica.
o exemplo de conversão pode acontecer, por exemplo, com a mudança
da representação de uma tabela para um gráfico, ou do valor calculado de uma
medida resumo para a representação gráfica desse valor.
Figura 7: Conversão de uma tabela de distribuição de frequências para um gráfico de colunas
para a variável gênero
A seguir, apresentamos outro exemplo que é a conversão da enumeração
dos dados para a representação da medida resumo “média das idades” (em anos)
de um determinado grupo de adolescentes.
46
Tabela 3: Enumeração das idades
Cálculo da média:
16 15 17 15 15 18 15 17 15 16 15 14 16 17 221
14 14
15 7857ou seja, , anos
µ
µ
+ + + + + + + + + + + + +
= =
=
Localização da média no gráfico:
Gráfico 1: Localização da média no gráfico
O box-plot também seria outra representação gráfica, mas em um sistema
distinto do histograma, pois esta representação não utiliza sistema de eixos
47
cartesianos nem se fundamenta na distribuição de frequências, mas sim na
distribuição dos dados.
Conteúdo do histograma: valor da variável (organizado em intervalos reais)
e frequência observada em cada intervalo.
Conteúdo do box-plot: valores assumidos pela variável, destacando ponto
mínimo, primeiro quartil, mediana, terceiro quartil e valor máximo, ou seja o
conteúdo é a representação dos valores, segundo quatro partições de mesmo
número de elementos.
Uma observação importante entre estes dois conteúdos é que, no
histograma, a área dos retângulos representa a frequência, e no box-plot, ela
representa a dispersão dos dados
Explicaremos a construção e a representatividade desta representação
gráfica no capítulo Princípios da Análise Exploratória de Dados
Gráfico 2: Box-plot
Nesse caso, temos representações distintas, em sistemas diferentes para
um mesmo objeto, para uma mesma variável estatística, as idades (em anos) de
um grupo de adolescentes.
Nesta pesquisa, assim como em Vieira (2008), buscaremos o uso
simultâneo dos diversos registros de representação semiótica do objeto
“distribuição de frequências’, fazendo com que o aluno realize a análise dos
48
dados com base na compreensão dos tratamentos e conversões efetuados pelo
software (mas sob o comando dos sujeitos).
Duval (1995 apud Almouloud, 2003) distingue quatro formas de apreensão
para a interpretação dos problemas em geometria, abaixo apenas a citaremos,
pois no capítulo II.3 veremos as possíveis inter-relações destas apreensões para
a estatística:
1. sequencial: é solicitada nas tarefas de construção ou nas
tarefas de descrição com objetivo de reproduzir uma figura;
2. perceptiva: é a interpretação das formas da figura em uma
situação geometria;
3. discursiva: é a interpretação dos elementos da figura
geométrica, privilegiando a articulação dos enunciados,
levando em consideração a rede semântica de propriedades
do objeto;
4. operatória: está centrada nas modificações possíveis de uma
figura de partida e na reorganização perceptiva que essas
modificações sugerem. (ALMOULOUD, 2003, p. 127)
II.1.4 Saberes docentes
Segundo Moreira e David:
Uma das questões recorrentes nos debates sobre a formação de
professores através da licenciatura é a falta de uma articulação
adequada entre a formação específica e a formação pedagógica,
tendo em vista a futura prática profissional na educação básica
(MOREIRA e DAVID, 2005, p. 50)
Nesse artigo, os autores relatam que a Matemática da escola não pode ser
reduzida a uma matemática científica didatizada, e que a prática do professor de
Matemática é complexa e não pode ser minimizada a uma simples cnica de
transmissão de conteúdos previamente definidos.
Para Shulman (2001), os saberes docentes são muitos e que se estes
pudessem ser organizados em um manual, abrangeriam no mínimo os seguintes
itens:
49
Conhecimento do conteúdo;
Conhecimento didático geral, levando em conta especialmente
aqueles princípios e estratégias gerais de manejo e
organização da classe;
Conhecimento do currículo, com um especial domínio dos
materiais e dos programas que servem como “ferramenta para
o ofício” do docente;
Conhecimento didático do conteúdo: em especial a inter-
relação entre a matemática e a pedagogia que constituem uma
esfera exclusiva dos professores, sua própria forma de
compreensão profissional;
Conhecimento dos alunos e de suas características;
Conhecimento dos contextos educativos, que abrangem desde
o funcionamento do grupo ou da classe, a gestão e o financeiro
da escola, as características das comunidades e a cultura; e
Conhecimento dos objetivos, as finalidades e os valores
educativos, e de seus fundamentos filosóficos e históricos.
(SHULMAN, 2001, p. 11, tradução nossa).
O autor ainda afirma que é o conhecimento didático do conteúdo que
representa a mescla entre matéria e didática e, ainda, é ele que permite a
distinção entre o especialista da área e o professor, pois o professor precisa
pensar na didática de como abordar os conteúdos.
Desta forma, como nosso público-alvo são professores da Escola Básica,
percebemos a necessidade de abordar na parte prática de nossa pesquisa,
questões que abeirassem, tanto o conhecimento do objeto de estudo como
questões que possibilitem o professor refletir sobre sua prática docente e suas
escolhas didáticas.
II.2 Algumas pesquisas sobre o ensino e a aprendizagem da estatística
Colaborando para a construção do que é o pensamento estatístico dos
sujeitos para esta pesquisa, utilizamos alguns resultados observados em Morais
(2006). O objetivo da pesquisa realizada pela autora citada foi investigar as
concepções dos professores sobre o pensamento estatístico. Em seu trabalho, a
50
autora relata uma conclusão de Santos (2003) que acreditamos ser importante
ressaltar neste momento:
As pesquisas têm mostrado que o conceito estatístico, quando é
desenvolvido na escola, não possibilita a construção do
pensamento estatístico do aluno. Normalmente é trabalhado de
maneira isolada e desarticulada, formando, assim, consumidores
despreparados e inseguros no trato com dados, não permitindo a
construção do raciocínio estatístico do aluno. Em levantamentos
feitos com professores em exercício, podemos perceber que estes
também não se sentem seguros para trabalhar nesse domínio por
atestarem pouco conhecimento sobre o tema. (SANTOS, 2003
apud MORAIS, 2006, p. 16).
A autora, também, afirma que a Estatística está cada vez mais presente no
cotidiano das pessoas e que, atualmente, um aumento dos grupos de
pesquisas, encontros e seminários. Desta forma, ela percebe a importância de
iniciar o Ensino da Estatística, desde as séries iniciais e, para isto, Morais (2006)
descreve quatro razões que Batanero (2002) aborda para ensinar estatística:
1- a Estatística é à parte da Educação geral desenvolvida para
futuros cidadãos adultos que precisam adquirir a capacidade
de leitura, interpretação de tabelas e gráficos que aparecem
nos meios de comunicação;
2- é útil para a vida posterior, já que, em muitas profissões, se
fazem necessários alguns conhecimentos básicos do tema;
3- seu estudo ajuda no desenvolvimento pessoal, baseado na
valorização da objetividade;
4- 4 - a Estatística ajuda a compreender as outras disciplinas do
currículo, tanto da Educação Básica quanto de cursos
superiores, onde, com frequência aparecem gráficos ou
conhecimentos estatísticos. (BATANERO, 2002 apud
MORAIS, 2006, p. 19-20)
A autora conclui seu trabalho relatando a necessidade de novas pesquisas
na área, pois ela percebe que trabalhos futuros podem “auxiliar o professor em
sua prática docente, de modo a complementar satisfatoriamente as atividades
propostas nos livros didáticos” (MORAIS, 2006, p. 114).
A seguir, apresentamos algumas pesquisas também relacionadas de
alguma maneira com nosso tema que também colaboraram para embasar nosso
trabalho.
51
Santos (2003, p. 5) realizou um estudo referente ao Ensino da Estatística,
com o objetivo de “investigar as possibilidades oferecidas pelo ambiente
computacional do Tabletop no processo de formação dos conhecimentos
elementares de estatística, a fim de responder à seguinte questão de pesquisa”.
Sua questão norteadora foi:
como se dá o processo de formação e
desenvolvimento de conceitos matemáticos referentes ao bloco de conteúdos
‘Tratamento da Informação’, por parte do professor, com auxilio do ambiente
computacional?”.
A pesquisa foi realizada como um estudo de caso com uma professora das
séries iniciais do Ensino Fundamental de uma escola da rede pública estadual,
dividiu-se em dois grandes momentos. O primeiro, com a formação da professora
e o segundo, com a atuação desta com outros professores e com seus alunos.
Santos realizou sua pesquisa nos contextos lápis e papel e no contexto
computador, com o software Tabletop.
A pesquisa de Santos (2003) torna-se importante para nosso trabalho, pois
também trabalha em um ambiente computacional. É interessante ressaltar que o
computador nessa pesquisa desempenhou um importante papel na formação dos
conceitos estudados.
A autora ressalta que:
O computador desempenhou um importante papel na formação
dos conceitos estudados. Primeiramente, vale ressaltar que o
software trabalhado oferecia várias possibilidades de se explorar
um mesmo conjunto de dados e a medida que Maria ia se
apropriando dos vários recursos que o software disponibiliza ela
acabava apropriando-se da matemática que estava por trás
desses recursos ou então estes lhe ajudavam a tirar conclusões
sobre o conjunto
de dados estudados. (SANTOS, 2003, p. 228)
Por isso, também, acreditamos ser interessante o trabalho com o ambiente
computacional; no nosso caso, o software Fathom que da mesma maneira que o
Tabletop trabalha com várias possibilidades de diferentes representações para
um mesmo conjunto de dados.
Como resultado de sua pesquisa, Santos (2003) evidenciou a necessidade
de se vivenciar situações de organizar, descrever, analisar e interpretar dados
52
oriundos de uma pesquisa. Em nosso trabalho, tentamos enfatizar estas
situações, algumas na parte A da sequência didática e todas na parte B. A
autora citada descreve a necessidade de pesquisas futuras relacionadas com a
formação de professores (de maneira individual ou coletiva), podendo acontecer
até em um ambiente computacional. Outra sugestão dela foi referente ao estudo
dos conceitos do bloco tratamento de informação, pois cita como sugestão o
trabalho com a média aritmética simples.
Em relação à pesquisa de Cardoso (2007, p. 15) podemos perceber uma
preocupação com o nível de letramento estatístico dos professores, o que para
nossa pesquisa é bastante relevante, pois sua questão norteadora buscava
perceber o nível de letramento estatístico de professores da Escola Básica sobre
os conceitos de medidas de Tendência Central e a Variabilidade. O objetivo de
seu trabalho foi: “verificar de que forma os professores de Matemática do Ensino
Médio mobilizam os conhecimentos estatísticos, quando confrontados com
problemas que envolvem Medidas de Tendência Central, Variabilidade e
representação Gráfica de um conjunto de dados”.
Vale ressaltar que Cardoso (2007) aplicou um questionário, que chamou de
“questionário-diagnóstico” para 29 professores, que foram selecionados
aleatoriamente. Estes atuam no Ensino Médio de escolas públicas do Estado de
São Paulo. Em sua pesquisa, os professores eram convidados a resolver
problemas individualmente. O questionário-diagnóstico de Cardoso (2007) foi
dividido em três momentos. O primeiro, trabalha com os dados apresentados por
um banco de dados fictícios, sem nenhum tipo de organização; o segundo,
apresenta os dados por tabelas de distribuição de frequências e o último, traz
representações gráficas das tabelas de distribuição de frequência da segunda
parte. O autor ainda relata que o intuito desta divisão é “identificar os níveis de
dificuldade relacionados às diferentes formas de apresentação de uma situação-
problema” (CARDOSO, 2007, p. 20)
Para aprofundar suas análises, o autor utilizou o software CHIC
(Classificação Hierárquica Implicativa e Coesiva) que “possibilita a análise
hierárquica de similaridade e/ou coesitiva dos dados qualitativos coletados,
evidenciando as inter-relações encontradas entre as respostas dadas por
53
professor” (CARDOSO, 2007, p. 71). Em geral, observou que os professores
encontram-se no nível cultural de letramento estatístico, pois, segundo suas
análises, eles não sabem justificar o uso dos cálculos e alguns utilizam a
calculadora e o livro didático como ferramentas fundamentais para resolução de
problemas, sem questionar o algoritmo ou os resultados obtidos. Neste sentido,
segundo Cardoso:
o procedimento algorítmico com o uso de calculadora é
perfeitamente dominado pelos professores, que, no entanto, não
conseguem explicar a própria construção destes procedimentos
ou mesmo interpretar os resultados. Neste sentido, podemos
supor que eles estejam em um nível cultural de alfabetização.
(CARDOSO, 2007, p. 80)
Desta maneira, achamos interessante permanecer com o teste diagnóstico
de Vieira (2008) em nossa pesquisa, mesmo que nosso público-alvo seja
composto de professores e não alunos, buscando assim compreender melhor o
apontado por Cardoso (2007).
Bigattão (2007, p. 101) também se preocupou com o letramento estatístico
dos professores da Escola Básica. No entanto, sua pesquisa não foi voltada
apenas ao ensino da estatística, mas à probabilidade, também, visto que o
objetivo central foi: “investigar as concepções dos professores de Matemática do
Ensino Fundamental II sobre os componentes e a formação do pensamento
estatístico e probabilístico”.
Para o autor (p. 29), no entanto, sua questão central foi estruturada de
maneira mais voltada à Estatística: “Qual o nível de letramento estatístico que
podemos identificar nos professores de Matemática do Ensino Fundamental II
pesquisados?”
A pesquisa envolveu 23 professores e foi também analisada com o auxílio
do software CHIC (Classificação Hierárquica Implicativa e Coesiva) que
possibilitou ao autor evidenciar as inter-relações encontradas nas respostas. A
resposta obtida por Bigattão vai ao encontro da obtida por Cardoso, pois ambos
classificam que o professor da Escola Básica possui um nível cultural de
letramento estatístico, mesmo tendo trabalhado com grupos diferentes e questões
54
distintas nos instrumentos produzidos, os resultados obtidos pelos dois foram
semelhantes.
Nossa análise comprova que a grande maioria dos professores
pesquisados não atendeu as exigências do nível cultural de
alfabetização estatística, já que nem sempre analisam e
interpretam resultados de pesquisa que possibilitem uma resposta
adequada para o problema, nem estudam a variação existente
nesses dados, não dando, assim, reais condições ao aluno de
tomar decisões baseadas nos dados, inclusive muitos não
atingem o nível funcional. (BIGATTÃO, 2007, p. 103).
Com isto, mais uma vez fica ressaltada a importância de nossa pesquisa
ser realizada com professores, pois são estes que conduzirão seus alunos na
construção dos conceitos trabalhados, durante a aplicação das sequências
didáticas. Bigattão, tanto como todos os outros autores apresentados até o
momento, levanta a importância de um número maior de pesquisas nessa área.
O autor cita a necessidade de trabalhos que investiguem o pensamento
estatístico e probabilístico em todos os níveis de escolaridade e também outros
que auxiliem o professor em sua prática docente, para que aconteça um avanço
nos níveis de letramento, como se é esperado.
O trabalho de Silva (2007, p. 319) teve como objetivo “identificar o
raciocínio de variação/variabilidade dos professores em cada etapa do ciclo
investigativo, de maneira que permitisse compreender a relação entre
pensamento estatístico e raciocínio sobre variação”.
Assim, sua pesquisa foi realizada com nove professores do Ensino
Fundamental e Médio e dois alunos do curso de Matemática da Universidade de
São Paulo. Destes, quatro professores e um aluno já haviam participado de
pesquisas antecedentes à de Silva (2007). A autora realizou uma formação
continuada com estes professores que se deu em 16 encontros. Vale ressaltar
que ela expõe que três dos professores obtiveram um frequência muito baixa, em
torno de 50%. Ela também aplicou um questionário para definir o perfil e a
experiência de Estatística dos professores envolvidos. Com a análise deste,
percebeu que três dos professores nunca tinham trabalhado com os conceitos de
Estatística e que os outros, em sua grande maioria, trabalham com gráficos.
55
Como resultados de suas análises, Silva (2007) observou que mesmo que
os professores (anterior à pesquisa) tivessem aprendido sobre desvio padrão,
em quase todos identificou a ausência de significação deste conceito.
Ela também observou que:
os poucos professores que já utilizavam a pesquisa como
metodologia de ensino de Estatística, o faziam de maneira restrita,
utilizando apenas a distribuição de freqüência e sua respectiva
representação gráfica para analisar os resultados, o que indicou a
não abordagem do conceito de variação em suas aulas.(SILVA,
2007, p. 319)
Com isso, concluiu que a “não utilização das medidas de tendência central
e dispersão, como ferramentas de análise dos dados da pesquisa pode ser em
decorrência do tipo de variável utilizada, geralmente qualitativa” (SILVA, 2007, p.
319).
Desta forma, percebeu que as dificuldades para compreender e ensinar as
medidas de tendência central podem estar acontecendo pelo fato de se ensinar
mais as variáveis qualitativas, não dando a devida importância às variáveis
quantitativas e, também, pelo fato de que, muitas vezes, utiliza-se uma única
variável na pesquisa. Esta escolha de variável, que está sendo realizada pelos
professores da Escola Básica, segundo a autora, não favorece a comparação de
grupos, o que dificulta o estímulo para observar a variabilidade.
Trataremos agora da dissertação de mestrado de título: “Análise
Exploratória de dados: Uma abordagem com alunos do Ensino Médio” de Vieira
(2008) que foi a base de nossa pesquisa, pois é a que efetivamente é parte do
mesmo elo do projeto PEA-ESTAT do qual nosso projeto faz parte. O objetivo
desta pesquisa foi:
... a partir do desenvolvimento de uma seqüência didática, estudar
as interações entre o aluno e um ambiente de estatística
dinâmica, introduzindo a análise exploratória de dados para o
nível do segundo ano do Ensino Médio, permitindo que o sujeito
desenvolva a capacidade de organizar, analisar e interpretar os
dados. Esta seqüência didática será desenvolvida com uso de um
ambiente de estatística dinâmica, que é o software Fathom
(VIEIRA, 2008, p. 16)
56
Nossa pesquisa, também, utilizará o ambiente informatizado Fathom. No
entanto, nosso público-alvo serão os professores da Escola Básica. Visamos com
isso fazer um paralelo entre os resultados obtidos por Vieira (2008) e os nossos
dados analisados. A autora também mostra na estatística a importância dos
diferentes registros de representação, por isso, um dos fatores importantes e
marcantes de seu trabalho são as relações hipotéticas entre as Teorias de Duval
e Curcio.
Sua pesquisa foi realizada com nove alunos do ano do Ensino Médio do
período noturno de uma escola estadual que foram divididos em três grupos
distintos.
A autora observou como um dos resultados de sua pesquisa que, no início
das entrevistas, os alunos conseguiam ler alguns dados em gráficos e tabelas,
mas apresentavam dificuldades para representar os dados. Muitos alunos tinham
a tendência de construir gráficos de pontos, o que segundo Vieira (2008, p. 148),
pode acontecer “talvez por serem influenciados pelo ensino do conceito de função
do primeiro ano do Ensino Médio”.
Em relação à análise e obtenção das medidas-resumo, a autora observa
que a grande maioria dos alunos apresentava várias dificuldades. Durante sua
pesquisa, com a aplicação das situações-problema, a autora afirma que foi
possível observar um avanço na compreensão e análise de alguns conceitos de
Estatística. No entanto, salienta que “uma das limitações do trabalho dela diz
respeito ao desenvolvimento da compreensão do conceito de quartis e da
construção do Box-plot” (VIEIRA, 2008, p. 152)
Ela também conclui o trabalho apresentando a relevância das múltiplas
representações de um conjunto de dados na construção de conhecimentos e
ideias. Novamente, a autora relata o paralelo entre as teorias de Duval e Curcio,
enfatizando que apenas foi criado um quadro com relações hipotéticas que
apresentaremos na sequência deste texto. A confirmação deste paralelo apenas
se dará por um estudo empírico, ainda a ser planejado
A autora relata que o ambiente computacional foi:
57
... fundamental no sentido de possibilitar a visualização dos
diferentes tipos de registros de representação semiótica de uma
distribuição de freqüências, principalmente no caso da
representação gráfica de medidas como média e mediana,
contribuindo para a compreensão destes conceitos. Apesar de os
alunos ainda não terem compreendido o significado de outros
conceitos, como quartis e a construção do Box-plot, acreditamos
que o uso desse ambiente possa contribuir com a compreensão
de tais conceitos, desde que seja desenvolvida uma seqüência de
atividades específica, com maior tempo de duração. (VIEIRA,
2008, p. 151)
Ela também relata que mesmo tendo acesso a todas as informações no
ambiente computacional, algumas vezes, os alunos não faziam uso da
multiplicidade de registros, e preferiam as tabelas para ler os dados ou procurar
informações e os gráficos para representá-las.
Em seu trabalho, a autora sugere outras questões para futuras pesquisas:
Uma delas seria a verificação da equivalência entre as teorias de
Duval (1994) sobre os tipos de apreensões de uma figura, e de
Curcio (1989) sobre os Níveis de Compreensão Gráfica,
verificação que pode ser realizada através de estudos empíricos,
necessitando de ferramentas de validação estatística. Uma das
limitações deste trabalho diz respeito ao desenvolvimento da
compreensão do conceito de quartis e da construção do Box-Plot.
Uma terceira questão a ser investigada em trabalhos futuros é se
o desenvolvimento de uma seqüência didática com uso do
software Fathom simultaneamente ao uso de ambiente não
computacional, que dedicasse um maior tempo para o estudo
destes conceitos, possibilitaria a sua compreensão (VIEIRA, 2008,
p. 152)
O objetivo principal da pesquisa de Canossa (2009, p. 99) foi “levantar
pontos para trabalhar em oficinas de formação de professores, no que se refere
ao desenvolvimento dos níveis de raciocínio estatístico dos professores da rede
pública do Estado de São Paulo, mais especificamente na região de Diadema.” A
questão norteadora para o desenvolvimento de seu trabalho foi a seguinte:
Quais as características didáticas de uma formação continuada
para professores do Ensino Médio, visando o trabalho com
conceitos de mediana e quartis, para que os alunos possam tomar
decisões a partir da análise da variação percebida, com o auxílio
do Dot-Plot e do Box-Plot? (CANOSSA, 2009, p. 99)
58
Desse modo, essa pesquisa foi bastante relevante para o desenvolvimento
da nossa, pois, também, tem como público-alvo os professores do Ensino Médio
da rede pública, recentemente foi concluída e, também, utilizou o software
FATHOM em uma parte da formação.
Os procedimentos desenvolvidos por esse autor foram a aplicação de um
questionário diagnóstico, oficinas de formação continuada (desenvolvida com
base nos resultados obtidos no teste diagnóstico) e a observação das aulas de
uma professora que foi denominada como professora colaboradora. A pesquisa
caracterizou-se como um estudo de caso.
Em suas análises, ele percebeu que:
Com o desenvolvimento da formação da professora colaboradora,
percebemos que, apesar de possuir certo conhecimento básico de
estatística, a professora nunca havia tido contato com os gráficos
Dot-Plot e Box-Plot, chegando a relatar certa aversão em utilizar
esses gráficos e insistindo em utilizar o gráfico de barra e
colunas.” (CANOSSA, 2009, p. 100)
Ao analisar os resultados obtidos, resolvemos por manter estes tipos de
gráficos em nossa pesquisa, para também analisar o comportamento do professor
frente a estas representações, uma vez que o software FATHOM permite sua
construção de forma relativamente simples, restando ao usuário a interpretação.
O autor também ressalva que mesmo depois da formação a professora não
se sentia totalmente segura na aplicação das atividades, além de aplicar em suas
aulas, apenas a reprodução das atividades sugeridas na formação. Com isso, ele
concluiu que
isso parece revelar que a professora ainda não se apropriou
adequadamente dos conceitos de variabilidade e representações
gráficas diversas, limitando-se ao abordado usualmente nos livros
didáticos (tabelas e gráficos de colunas) e permanecendo no nível
de raciocínio verbal (CANOSSA, 2009, p. 100)
Em suas análises, ele utiliza os níveis de raciocínio estatístico propostos
por Garfield (2002); na pesquisa, o autor salienta a necessidade de pesquisas
futuras, sobretudo no que diz respeito aos conceitos e procedimentos relativos ao
Ensino da Estatística.
59
II.3 Relações entre os níveis de leitura de dados de Curcio e os registros
de representação semiótica de Duval, (VIEIRA, 2008)
Vieira (2008) estabeleceu um quadro com as relações hipotéticas entre as
apreensões de uma figura, segundo Duval e os níveis de leitura de dados (níveis
de compreensão gráfica) propostos por Curcio que buscaremos identificar no
estudo da mobilização dos conhecimentos estatísticos, em situação de resolução
de problemas e de elaboração de um plano de aula.
Tipos de apreensões possíveis de uma figura Níveis de Compreensão Gráfica
Apreensão perceptiva Nível 1: Leitura dos Dados
Apreensão Discursiva
Nível 1: Leitura dos Dados +
Nível 2: Leitura entre os Dados
Apreensão Operatória
Apreensão Seqüencial
Nível 1: Leitura dos Dados +
Nível 2: Leitura entre os Dados +
Nível 3: Leitura além dos Dados
Quadro 1: Relações hipotéticas entre as Teorias de Duval e Curcio elaborado por Vieira
(2008, p. 38)
Na apreensão perceptiva, apenas se identifica o objeto matemático em
questão, “é a interpretação das formas da figura, em uma situação geométrica”
(DUVAL, 1995 apud ALMOULOUD, 2003, p. 127). Para Vieira:
Acreditamos que este tipo de apreensão está presente no “nível1”
de compreensão gráfica de Curcio, “leitura dos dados”, pois o
sujeito apenas levanta dados e informações explícitas no gráfico.
Ele visualiza a figura e levanta os dados apresentados
explicitamente nela. (VIEIRA, 2008, p. 38)
Para verificarmos este paralelo, podemos tomar a seguinte situação
descrita em Curcio (1994), na qual apenas se faz necessário a leitura dos dados.
60
O número de crianças na classe do sr. Kahn que celebram aniversário durante cada mês no
ano
0
2
4
6
8
10
J
AN
E
I
RO
FEV
E
REIRO
MAR
ÇO
ABRIL
MAIO
J
UNH
O
JU
L
HO
AGOSTO
S
ET
EMB
RO
OUT
U
BRO
NOVE
M
BRO
DEZ
E
MBR
O
mero de crianças
Use o gráfico acima para responder às questões:
1. Quantas crianças celebram aniversário em Fevereiro?
a. 0 c. 2
b. 1 d. 4
2. Em que mês há oito crianças que celebram aniversário?
a. Maio c. Setembro
b. Julho d. Novembro
Figura 8: Exemplo 1 do paralelo entre as apreensões e os níveis de leitura de gráfico (atividade
retirada de Curcio, 1994, p. 74) – tradução nossa
Para solucionar estas duas questões, o indivíduo apenas precisa observar
o gráfico, não a necessidade de se fazer análise a partir da representação
apresentada.
Neste caso, para responder a este tipo de questionamento, a interpretação
acontece diretamente pela visualização do gráfico, conforme Vieira (2008), uma
apreensão perceptiva, pois se fizermos um paralelo com a teoria das
representações semióticas, nesta apreensão, a interpretação das figuras
geométricas acontece na própria representação geométrica. Já no âmbito de
Curcio, é facilmente observado que este tipo de pergunta apenas exige um nível
de leitura dos dados, ou seja, para responder a uma questão que exige apenas
uma leitura dos dados, o sujeito precisa apenas de uma apreensão perceptiva da
figura, no caso o gráfico de colunas.
61
Em relação à apreensão discursiva, Duval afirma que é o momento que o
indivíduo faz explicitação dos elementos das figuras, algumas propriedades da
figura são especificadas e, também, leva-se em consideração as propriedades
do objeto. Segundo Vieira:
Em estatística, cremos que para este tipo de apreensão, o sujeito
deve ler os dados e ler entre os dados, estando no “nível 2” de
compreensão gráfica segundo Curcio, pois, ao explicitar as
propriedades do gráfico, o sujeito interpreta e identifica relações
nele. (VIEIRA, 2008, p. 38)
Para verificação deste paralelo, podemos tomar a seguinte situação
descrita em Curcio (1994), na qual apenas se faz necessário a leitura entre os
dados.
O número de crianças na classe do Sr. Kahn que celebram aniversário durante cada mês no
ano
0
2
4
6
8
10
JANEIRO
F
EV
ER
E
IRO
M
AR
Ç
O
AB
R
IL
MAIO
J
U
NHO
JU
L
HO
AG
O
STO
SETEMBRO
O
UTU
B
RO
N
OV
EM
BR
O
D
EZE
M
BR
O
Número de crianças
Use o gráfico acima para responder as questões:
3. O que este gráfico diz para você?
a. Há mais aniversários durante junho e novembro do que durante os outros meses do ano.
b. Há mais aniversários durante maio do que durante os outros meses do ano.
c. Há menos aniversários durante junho e novembro do que durante os outros meses do ano
d. Enquanto o ano progride de janeiro a dezembro, o número dos aniversários diminui.
4. Quantas crianças são da classe do Sr. Kahn?
a.10 c. 44
b. 30 d. 55
Figura 9: Exemplo 2 do paralelo entre as apreensões e os níveis de leitura de gráfico (atividade
retirada de Curcio, 1994, p. 74) – tradução nossa
62
Para responder à questão 3 referente ao gráfico, o indivíduo precisa
perceber que as colunas mais altas são referentes aos meses de junho e
novembro, a solução não é mais tão imediata quanto no exemplo anterior. Aqui
ele precisa ter algum conhecimento sobre a representação apresentada, no caso,
por exemplo, que o gráfico em sua totalidade apresenta todos os pesquisados,
pois cada barra mostra as pessoas que possuem uma característica em comum,
e a altura de cada barra mostra o número de elementos de cada variável.
Logo, para responder a este tipo de questionamento, o indivíduo precisa
conhecer algumas propriedades do gráfico, realizando, segundo Vieira (2008),
uma apreensão discursiva, algumas propriedades da figura também são
explicitadas. Em nível de Curcio, estas questões requerem uma leitura dos dados
e entre os dados.
Para solucionar a questão 4, o indivíduo precisa reorganizar os dados para
conseguir determinar o número de alunos na classe do Sr. Kahn, ou seja, precisa
somar todos os valores encontrados: 2+4+2+5+8+2+4+6+2+8+1 e obter como
solução que na classe referida existem 44 alunos. Na apreensão operatória,
modificações da figura inicial em outras prováveis figuras, e a apreensão
sequencial refere-se à reprodução dos passos para a construção da figura em
questão.
Vale ressaltar que o paralelo que Vieira faz entre a apreensão operatória
de Duval exige do indivíduo os três tipos de leitura de dados propostos por Curcio.
Assim, o indivíduo no nível mais avançado de leitura de dados, pois: “ao modificar
um gráfico, o sujeito vai além dos dados e das informações explícitas no mesmo”.
(VIEIRA, 2008, p. 39). Isso também pode significar que a pessoa precisa estar no
nível científico do letramento estatístico.
Já com a apreensão seqüencial, Vieira afirma:
Em estatística, acreditamos que este tipo de apreensão exige a
leitura dos dados, a leitura entre os dados e a leitura além dos
dados, pois a seqüência de passos exigida para a construção de
gráficos requer que o sujeito reflita além dos dados e das
informações disponíveis. (VIEIRA, 2008, p. 39)
63
O número de crianças na classe do sr. Kahn que celebram aniversário durante cada mês no ano
0
2
4
6
8
10
J
AN
EIR
O
FEVEREIRO
M
A
RÇ
O
AB
RI
L
MAIO
J
UN
H
O
J
ULH
O
AGOST
O
SE
T
E
M
BR
O
OUTUBRO
NOVEM
B
RO
D
EZ
EM
B
R
O
Número de crianças
Use o gráfico acima para responder as questões:
5. Qual é a probabilidade que o aniversário comemorado em dezembro aconteça no dia
25 de dezembro?
a.
1
31
c.
30
31
b.
25
31
d. 1
6. O aniversário de Sally é em fevereiro. De acordo com o gráfico qual das seguintes
afirmações está correta?
a. Sally provavelmente nasceu em 29 de fevereiro.
b. Sally não é da classe do Sr. Kahn.
c. Sally é da classe do Sr. Kahn.
d. Sally é a única que comemora aniversário em fevereiro.
Figura 10: Exemplo 3 do paralelo entre as apreensões e os níveis de leitura de gráfico (atividade
retirada de Curcio, 1994, p. 74) – tradução nossa
Para responder a estas duas questões, o individuo precisa, segundo
Curcio, uma leitura além dos dados, logo, neste caso, necessita compreender o
contexto em que a questão está inserida, para fazer as intervenções necessárias
é preciso que se possua um conhecimento científico sobre o conceito estudado.
As soluções para estas duas questões seriam. Para a questão 5, como
temos apenas um aniversário a ser comemorado em dezembro (verificação pelo
gráfico) e este mês tem 31 dias (compreensão do contexto) a probabilidade de
64
que este aniversário seja no dia 25 é de:
1
31
.
Para a 6ª questão o indivíduo precisa
perceber que, como na representação gráfica, não coluna no mês de fevereiro,
logo, esta classe não possui aniversariantes nesse mês.
Neste caso, para Vieira (2008), as apreensões são a sequencial e a
operatória. Também acreditamos que para compreender como acontece a
construção da figura e, assim, conseguir reproduzi-la (apreensão sequencial) e
para conseguir fazer modificações na figura de maneira a auxiliar nas soluções do
problema (apreensão operatória) o individuo também precisa de conhecimentos
mais profundos e específicos, da mesma maneira do que para atingir a leitura
além dos dados.
Em nosso trabalho, assumiremos as mesmas relações hipotéticas
enunciadas por Vieira (2008), pois também buscamos identificar as condições de
mobilização simultânea destas duas teorias. No entanto, não realizamos o estudo
empírico sugerido, limitando-nos à busca de uma complementação do diagnóstico
sobre a construção e mobilização das representações semióticas, foco de nossa
pesquisa.
65
III
. PRINCÍPIOS DA ALISE EXPLORATÓRIA DE
DADOS E O SOFTWARE FATHOM
III.1 A análise Exploratória de Dados
A Estatística Descritiva é o pano de fundo de nossa pesquisa, possui
alguns registros de representações semióticas para o conjunto de dados que são
universalmente aceitos pela comunidade científica, como as tabelas, os gráficos,
as medidas-resumo. Segundo Witte e Witte (2005), estas representações são de
extrema importância no sentido de organizar e resumir informações em relação a
um conjunto de dados apresentados, de forma que se torne uma linguagem
comum e utilizada por toda a comunidade científica e não apenas por um
indivíduo ou grupos de indivíduos.
O software Fathom é uma ferramenta que pode auxiliar no momento de se
construir ou mobilizar esses registros, assim como no momento de analisá-los de
forma conjunta, integrada, visto que a conversão entre eles acontece de forma
rápida, dinâmica, sem provocar dificuldades operatórias que podem gerar
obstáculos didáticos na construção dos significados.
Batanero (2001, p. 29) considera que “uma ideia fundamental da análise
exploratória dos dados é que o uso de representações múltiplas dos dados se
transforma em um meio de desenvolver novos conhecimentos e perspectivas”
(tradução nossa). Aqui se evidencia a importância do trabalho com diversas
representações para a análise exploratória de dados. Este trabalho pode ser
facilitado com o uso do ambiente informatizado FATHOM, pela agilidade e
facilidade com que ele “constrói” essas diversas representações.
66
Acreditamos que o uso aliado de ferramentas diferenciadas que priorizem o
significado (como é esperado), auxiliem em uma melhor compreensão e
mobilização dos registros de representação semiótica dos objetos envolvidos. O
software Fathom é uma ferramenta que, na nossa visão, prioriza mais o
significado e a compreensão dos dados observados do que a própria construção
destes, oportunizando ao indivíduo uma preocupação mais centrada na
interpretação das informações.
As capacidades de cálculo e das representações gráficas dos
computadores atuais, permitem obter uma ampla variedade de
gráficos estatísticos e diferentes formulários estatísticos de forma
simples e fizeram aparecer uma nova filosofia nos estudos
estatísticos: a análise exploratória dos dados, introduzida por
Tukey, que compara o trabalho do estatístico com o de um
detetive. (BATANERO, 2001, p. 27, tradução nossa)
A citação anterior relata que o uso de computadores facilita na construção
de uma variedade de gráficos, além de colaborar no desenvolvimento dos
relatórios (análises). A comparação feita entre a Análise Exploratória dos Dados e
o trabalho de um detetive, acreditamos que pode acontecer em razão de ambos
analisarem os acontecimentos como um todo, não se restringindo ao que é
apresentado, mas buscando fundo as relações entre todo o conjunto de dados, e
também é o aspecto investigativo, olhar, observar um fato ou um conjunto de
fatos buscando questionar o observado para a obtenção de respostas. Assim, de
um conjunto de dados poder obter informações importantes para a resolução do
problema proposto.
III.2 Registros de representação e suas construções no software
FATHOM
A seguir, abordaremos alguns registros de representação utilizados na
estatística, e como o Fathom os apresenta. Com a finalidade de evidenciar os
diversos registros de representação semiótica de uma distribuição de frequências,
as tabelas constituem um tipo de registro numérico que nos auxilia no momento
de organizar as respostas obtidas ao coletarmos os dados de uma pesquisa,
67
sendo seu principal intuito mostrar a ordem em que os dados foram obtidos
(função de enumeração) ou representar a distribuição das frequências que podem
ser associadas ao conjunto de dados coletados (função de síntese dos dados).
Abaixo apresentaremos uma figura da representação tabular de um banco
de dados inserido no ambiente computacional Fathom, e outra que apresenta
uma tabela de distribuição de frequências para a variável “matéria preferida”. Vale
ressaltar que os exemplos deste capítulo de nosso trabalho estão se referindo ao
banco de dados apresentado na Figura 11.
Os dados da tabela de distribuição de frequências são um registro que
evidencia o número de ocorrências de cada valor assumido pela variável
observada. Consideramos, assim, o objeto “distribuição de frequências” e suas
diversas representações (ou seja, os registros de representação semiótica
utilizados na reificação do objeto). Nesse sentido, consideramos uma distribuição
de frequências como uma função empírica que associa a cada valor da variável o
número de vezes que esse valor ocorre.
O banco de dados foi constituído por um conjunto de variáveis (e os
valores por elas assumidos) que busca caracterizar o grupo de alunos observados
de um 1º ano do Ensino Médio de uma Escola Estadual de São Paulo.
68
Figura 11: Tratamento entre um banco de dados (à esquerda) e uma tabela de distribuição de
freqüências (à direita)
Observe que, na Figura 11, a representação da esquerda (um banco de
dados) apresenta apenas os dados, e cada linha da tabela representa um
indivíduo e cada coluna uma variável, e a representação da direita (uma tabela de
distribuição de frequências) mostra a quantidade de pessoas que prefere cada
uma das disciplinas envolvidas, ou seja, representa a distribuição de frequências
da variável “matéria preferida”. Percebemos um tratamento realizado para a
visualização da variável “matéria preferida”.
Já os gráficos constituem os registros de representação semiótica que
podem facilitar a detecção de padrões nos dados coletados, além de cumprir
também algumas das funções da tabela, como representar a distribuição de
frequências. Vale ressaltar que:
69
... para a escolha da representação gráfica mais adequada, faz-se
necessário considerar a natureza dos dados. Se a variável for
qualitativa ou quantitativa com dados discretos, podemos fazer um
gráfico de barras, colunas, setor. O objetivo da análise também é
importante para esse tipo de decisão. Assim, por exemplo, se o
que se pretende é uma visão do tipo “parte/todo”, o mais
adequado é o diagrama de setores, enquanto que uma
comparação entre as partes é favorecida pelos diagramas de
barras ou colunas. (NOVAES e COUTINHO, 2008, p. 23)
Em relação à natureza das variáveis, segundo as autoras (p. 16) as
variáveis qualitativas são aquelas que: “revelam um certo tipo de características
relacionadas ao grupo pesquisado, por exemplo, cor de olhos, sexo, grau de
satisfação com serviços prestados e outras”. Ou seja, são características que não
podem ser expressas por números.
Já as variáveis quantitativas são as que:
Assumem valores numéricos, definida em um intervalo real,
podendo ser discreta ou continua.... Discreta: dados procedentes
de contagem, por exemplo, número de filhos, número de objetos,
entre outros; Contínua: os dados podem assumir qualquer valor
dentro de um intervalo real, por exemplo, altura de uma pessoa,
massa (peso) de um individuo, entre outros (NOVAES e
COUTINHO, 2008, p. 16)
Neste momento, acreditamos ser interessante ressaltar algumas
representações gráficas estatísticas, suas construções e utilizações, sempre em
um olhar didático (ou seja, visando ao ensino e à aprendizagem)
No gráfico de setores, a representação permite uma comparação parte-
todo, ele pode ser usado para representar variáveis qualitativas ou quantitativas.
Neste gráfico, reparte-se um círculo em setores circulares proporcionais à
porcentagem da frequência de cada valor da variável em questão. A seguir, um
exemplo de um gráfico de setores, envolvendo a porcentagem da preferência dos
alunos por matéria.
70
Matéria preferida
21%
13%
4%
13%
4%
29%
8%
8%
artes
biologia
filosofia
história
inglês
matemática
português
química
Gráfico 3: Gráfico de setores para a variável matéria preferida
Acreditamos ser importante ressaltar que o software FATHOM não tem a
ferramenta para a construção do gráfico de setores, conforme descrito acima.
Este ambiente informatizado possui uma representação que também realiza uma
comparação parte/todo, no entanto, de uma maneira um pouco diferenciada do
gráfico de setores. Observe o Ribbon Chart abaixo construído no FATHOM:
Gráfico 4: Ribbon Chart para a variável matéria preferida
71
Nos gráficos de colunas e barras, a comparação é feita ou pela a altura do
retângulo (gráfico de colunas), ou pelo comprimento do retângulo (gráfico de
barras). A representação destes dois gráficos é feita no sistema cartesiano.
No gráfico de colunas, o eixo das abscissas apresenta os valores da
variável, e o eixo das ordenadas as frequências. no gráfico de barras, as
frequências ficam dispostas no eixo das abscissas, e a variável no eixo das
ordenadas. A seguir um exemplo do gráfico de colunas apresentando a variável
“matéria preferida” é importante observar que aqui a ênfase está na relação
“parte-parte” da leitura.
Matéria preferida
0
1
2
3
4
5
6
7
8
a
r
t
e
s
b
io
l
ogia
f
i
l
os
of
ia
história
inglês
m
a
te
m
áti
ca
p
or
tug
uê
s
q
uí
mi
ca
Gráfico 5: Gráfico de colunas para a variável matéria preferida
Ao observar estas duas representações gráficas, fazemos a hipótese de
que a passagem de uma para a outra é uma conversão, embora sejam
representações gráficas, pois, uma está no sistema cartesiano e trabalha com
valores absolutos e a outra não está plotada no sistema cartesiano e trabalha com
valores relativos, é uma representação parte-todo.
Além do que o gráfico de colunas apresenta como conteúdo associações
entre as frequências e os valores da variável, sem a preocupação com o
estabelecimento das proporções que permitem a comparação parte-todo. Daí sua
ênfase na comparação entre as partes.
72
o gráfico de setores apresenta como conteúdo as proporções de cada
parte em relação ao todo, expressas pelas porcentagens indicativas das
frequências relativas.
Isto mostra a necessidade de mais pesquisas neste sentido para
aprofundar os estudos dos Sistemas de Representação descritos por Duval, se
pretendemos utilizar esta teoria na análise no domínio teórico da Estatística.
O dot-plot é um gráfico que utiliza pontos para a representação de cada
indivíduo observado. As variáveis percebidas são apresentadas no eixo horizontal
e cada ponto é referente a cada valor da variável que é “empilhado”. Abaixo a
representação gráfica dot-plot para as idades dos alunos de um ano do Ensino
Médio e para a variável “altura”
Gráfico 6: dot plot para as variáveis idade e altura
Aqui acreditamos ser importante salientar que o software nos permite
“mexer” no gráfico, modificando o conjunto de dados.
Acreditamos que o software permite esta modificação e pode ocasionar um
obstáculo didático, uma vez que o banco de dados não deve ser alterado pelas
modificações gráficas. O inverso também é permissível por este ambiente e
deveria ser a única maneira de modificação dos dados, que se trata de uma
pesquisa.
73
Figura 12: Modificação do banco de dados pela alteração do ponto no gráfico
A seguir, apresentamos um gráfico de colunas construído no software
Fathom, no qual estão representadas duas variáveis simultaneamente. É
interessante ressaltar que o software relaciona facilmente duas variáveis na
mesma representação gráfica. Isso acontece quando ele subdivide as barras
feminino e masculino, conforme a legenda pelas matérias preferidas ou vice-
versa. Acreditamos que esta ferramenta do software seja interessante para
facilitar a percepção que são os mesmos sujeitos que responderam para as duas
variáveis (tanto gênero como matéria preferida), contribuindo assim na percepção,
ainda que intuitiva da correlação entre duas variáveis.
74
Gráfico 7: Gráfico de colunas para a variável gênero, subdividindo as barras para a variável
matéria preferida
Gráfico 8: Gráfico de colunas para a variável matéria preferida, subdividindo as barras para a
variável gênero
Outra representação gráfica importante para a Estatística é o histograma,
que é construído por colunas justapostas, adjacentes, onde também as alturas
servem para a comparação entre as partes. Este tipo de gráfico é usado para as
variáveis quantitativas contínuas. A seguir, a representação do histograma para a
variável altura dos alunos.
75
Gráfico 9: Histograma para a variável altura dos alunos
Vale ressaltar que o software Fathom trata qualquer variável numérica
como contínua, ou seja, na construção do gráfico, se for variável numérica ele
apresentará um histograma, ainda que a variável seja quantitativa discreta. Isto
pode se tornar um obstáculo didático se não for bem trabalhado pelo professor,
caso ele venha escolher este software como recurso didático.
Outras representações importantes para a Estatística são as medidas-
resumo. Na Estatística, uma representação gráfica, o Box-plot, que apresenta
um grupo destas medidas: valor máximo e mínimo, mediana e quartis. Este
gráfico pode ser usado para perceber a variabilidade dos dados.
Para construir esta representação, construímos uma caixa de tal forma que
seu limite superior ou direito represente o terceiro quartil e o limite inferior ou
esquerdo da caixa represente o primeiro quartil. Há uma linha dentro da caixa que
representa a mediana e duas linhas (uma de cada lado) que seguem do limite da
caixa até o valor máximo e o valor mínimo. Abaixo a representação box-plot dos
dados apresentados no gráfico histograma.
76
Gráfico 10: Box-plot da variável altura
Vale ressaltar que o ponto que circulamos de vermelho no Gráfico 10 é um
valor discrepante na distribuição identificado pelo software.
Na sequência, discutiremos os significados destas medidas e suas
representações em outros gráficos. Em relação às medidas, acreditamos que
mais do que conseguir calculá-las, é importante saber quando utilizar cada uma
delas (conhecimento conceitual e não simplesmente procedimental). Segundo
Novaes e Coutinho (2008, p. 55), “a escolha da medida a ser utilizada para
representar um conjunto de dados dependerá do objetivo da pesquisa e da forma
em que se apresentam os dados a serem estudados”.
A média é o valor em torno do qual os valores observados oscilam. Em
analogia com a Física, podemos dizer que a média é comparável ao centro de
massa, ao ponto de equilíbrio do conjunto de valores observados. Para calculá-la,
somamos todos os valores observados e dividimos pelo número de observações.
Vamos determinar a média das idades dos indivíduos no mesmo banco de dados
considerado nos exemplos anteriores.
Ao observar o banco de dados em qualquer de suas representações,
podemos perceber facilmente que 24 indivíduos responderam à pesquisa. Assim
temos: uma pessoa com 14 anos, 12 pessoas com 15 anos, sete pessoas com 16
anos, três pessoas com 17 anos e uma pessoa com 18 anos. Para calcular a
média
77
1 14 12 15 7 16 3 17 1 18
24
375
24
15 625,
x x x x x
anos
µ
µ
µ
+ + + +
=
=
=
em relação à mediana, segundo Novaes e Coutinho (2008): “pode ser
mais adequada, quando existe uma grande variabilidade entre os dados
quantitativos”. Esta é a medida que divide um conjunto de observações ordenado
em duas partes, com o mesmo número de elementos.
Esquematicamente:
Uma das maneiras para encontrar a mediana é organizando os dados e
buscando o valor central. Vamos determinar a mediana das idades do mesmo
grupo de alunos. Para isso, devemos organizar os dados pesquisados em ordem
crescente ou decrescente e observar a posição que os elementos ocupam nesse
rol.
{14, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 16, 16, 16,
7º 10º 11º 12º 13º 14º 15º 16º
16, 16, 16, 16, 17, 17, 17, 18}
17º 18º 19º 20º 21º 22º 23º 24º
Ao observar a distribuição acima, percebemos que como existe número par
de elementos (24 elementos), não é possível determinar diretamente o termo
central (que divide a distribuição). No entanto, como os 12º e 13º elementos são
representados pela idade 15 anos, a mediana desta distribuição também será 15
anos (média aritmética dos 12º e 13º elementos)
78
Esquematicamente:
No caso da distribuição ter um número ímpar de elementos, um dos valores
dela será o representativo para a mediana. Vamos supor que, ao invés de 24
elementos, nossa pesquisa compreendesse 23 observações. Logo, teríamos 11
elementos antes da mediana, 11 elementos depois da mediana e o 12º elemento
seria o valor da mediana.
{14, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 16, 16, 16,
7º 10º 11º 12º 13º 14º 15º 16º
16, 16, 16, 16, 17, 17, 17}
17º 18º 19º 20º 21º 22º 23º
Esquematicamente:
79
O recurso que o software Fathom possui para visualizar a posição das
medidas no gráfico de um ponto de vista cognitivo, é um facilitador para a
compreensão de como esta medida está localizada em relação ao conjunto dos
dados observados. A seguir, apresentamos a representação gráfica para a média
da variável altura (Gráfico 11) e, também, para a mediana da variável altura
(Gráfico 12).
Gráfico 11: Histograma com a localização da média
Gráfico 12: Histograma com a localização da mediana + Box-plot
80
Vale ressaltar que o software permite que estas duas visualizações (das
duas medidas) sejam realizadas no mesmo gráfico. Desta forma, podemos
verificar mais facilmente que nem sempre essas duas medidas coincidem (a
mediana representada em azul e média, em vermelho), ou melhor, que a
coincidência é um caso especial para distribuições simétricas.
Gráfico 13: Histograma com a localização simultânea da média e da mediana + Box-plot
Esta ferramenta do software que permite a representação das duas
medidas simultaneamente, é facilitadora para a percepção da representatividade
das medidas e a variação em torno delas, sem a necessidade de se utilizar um
grande ferramental matemático. Ou seja, não exige dos alunos conhecimentos
matemáticos complexos, mas apenas certo grau de abstração para que possa
interpretar a variação dos dados.
Assim, no momento que o professor resolver utilizar este ambiente
informatizado com seus alunos, ele deverá levar em conta todas estas
informações importantes (é um dos conhecimentos explicitados por Shulman).
81
Podemos fazer, então, a inferência de que com a apreensão perceptiva,
segundo Duval (2003), ou seja, permite ao aluno o acesso a essa discussão,
ainda que não tenha o ferramental matemático, provocando a evolução no
letramento estatístico (ainda que dentro de um mesmo nível).
Quanto aos quartis o medidas raramente ou nunca trabalhadas na
Escola Básica brasileira, mas fazem parte do currículo em outros países, como
Estados Unidos da América (EUA), França, Espanha, entre outros.
Os quartis são os valores que dividem a distribuição em quatro conjuntos
com exatamente o mesmo número de elementos. Observamos, assim, que de um
ponto de vista cognitivo apresenta grau de complexidade compatível com os
desejados para o Ensino Fundamental.
Esquematicamente:
Gráfico 14: Histograma para a variável altura com a localização dos 1º, 2º e 3º quartis + Box-plot
82
A moda é outra medida bastante utilizada que representa o valor de maior
frequência da distribuição. Para observá-la no gráfico de colunas, por exemplo,
basta verificar qual é a coluna mais alta.
Outra ferramenta interessante que o software FATHOM possui é conseguir
selecionar em todas as representações construídas todos os indivíduos com os
mesmos atributos ao que é selecionado, basta “clicar” sobre um dos gráficos ou
no banco de dados que o software “ilumina” todos os indivíduos com as mesmas
características da selecionada.
Esta ferramenta relaciona (de maneira muito rápida) as diferentes
representações construídas no ambiente informatizado, isto facilita as análises
dos dados por todas as suas representações, percebendo o conjunto como um
todo, o que é esperado pela Análise Exploratória dos Dados.
Na Figura 13, observamos que o software destaca todas as pessoas do
gênero feminino, no exemplo a seguir, quando clicamos em cima da barra do
gênero feminino. Com esta seleção, conseguimos ter uma visão global do
conjunto de dados, ela permite construções de relações entre as informações
observadas (variáveis) de maneira mais rápida e ampla, aumentando as
condições didáticas para o desenvolvimento do pensamento e do letramento
estatístico.
83
Figura 13: Ferramenta do FATHOM para selecionar uma mesma característica em diferentes
registros
Observando a Figura 13, acreditamos que interpretação do tipo a maioria
das meninas prefere vôlei, nenhuma garota gosta de basquete, são mais
facilmente identificadas. Assim, com a presença do software podemos construir
rapidamente qualquer representação gráfica da variável que desejarmos, e,
também, “clicamos” sobre qualquer gráfico, desta maneira, a grande maioria das
análises necessárias seria facilmente realizada.
Relacionando tudo isto com as apreensões descritas por Duval, a leitura de
dados de Curcio e as relações hipotéticas levantadas por Vieira, acreditamos que
esta ferramenta do software seja um facilitador, para que o indivíduo alcance, pelo
menos, a apreensão discursiva e a leitura além dos dados, já que o sujeito
precisa refletir sobre as informações observadas, identificando relações entre as
representações construídas em relação ao contexto da pesquisa.
85
IV
. A SEQUÊNCIA DIDÁTICA
Neste trabalho, a sequência didática desenvolvida foi adaptada com base
no trabalho de Vieira (2008). Fizemos apenas pequenas modificações para que
as atividades propostas se adequassem de maneira mais significativa a nosso
público-alvo, professores, uma vez que a autora trabalhou com alunos do Ensino
Médio.
Dessa forma, decidimos preservar a estrutura, acrescentando questões
específicas sobre o conhecimento didático do conteúdo. As atividades foram
organizadas em três grandes categorias: o teste diagnóstico, a familiarização com
o software e a análise de um plano de aula, conforme esquema apresentado na
Figura 1, do capítulo I.
Ressaltamos que no trabalho de Vieira (2008), a última parte trazia um
problema de análise de um banco de dados, que tinha por objetivo levantar as
formas de mobilização dos registros de representação semiótica feitas pelos
alunos participantes. Alterando para a análise do plano de aula, buscamos
identificar com o professor mobiliza, ele mesmo, seus conhecimentos estatísticos
e conhecimentos sobre o ensino de conteúdos estatísticos para organizar um
conjunto de atividades para que seus alunos possam construir e mobilizar de
maneira espontânea e adequada, os registros de representação semiótica
relativos a estes conteúdos.
86
IV.1 Análises a priori e a posteriori do teste diagnóstico
O intuito do teste diagnóstico foi identificar os conhecimentos específicos e
pedagógicos que o professor possui sobre a Estatística Descritiva antes de iniciar
o processo de formação. Este é composto de quatro questões.
1ª questão:
Em certa empresa, a distribuição do número de funcionários (segundo o gênero), para os
diversos cargos e seus respectivos salários é a seguinte:
Responda
a) Quantos funcionários têm a empresa?
b) Quantos funcionários são do gênero feminino?
c) Qual a porcentagem de funcionários do gênero masculino?
d) Quais são as variáveis desta pesquisa?
e) Você considera que as variáveis da pesquisa são do mesmo tipo ou são de tipos
diferentes? Justifique.
f) Qual a média salarial dos funcionários desta empresa?
g) Se colocarmos esses funcionários em ordem crescente de salários, qual será a posição
do funcionário que dividiria essa fila em dois grupos com o mesmo número de
funcionários. Escreva o cargo e o salário deste funcionário. Você saberia dizer qual
medida-resumo você está encontrando?
h) Qual o salário que você considera que melhor representa o salário pago por esta
empresa? Por quê?
i) Construa um gráfico que represente os cargos dos funcionários desta empresa.
j) Construa um gráfico que represente os gêneros dos funcionários desta empresa.
k) Construa um gráfico que represente os salários dos funcionários desta empresa.
1.1) Em relação a esta questão, como e quando você a abordaria com seus alunos?
1.2.) Você acredita que eles responderiam todos os itens com facilidade? Que
conhecimentos os alunos precisam? Quais itens eles teriam mais dificuldade? Por
quê?
87
Análise a priori
Para resolver os dois primeiros itens desta questão, primeiro o professor
precisaria buscar os dados na tabela e, em seguida, adicionar os valores
encontrados para solucionar a questão. Para o item “a)”, esperava-se como
solução que ele percebesse que deveria somar todos os itens da coluna “nº de
funcionários”, o que totalizaria 37 funcionários e para o item “b)”, 18 funcionários
do gênero feminino (soma dos valores associados ao item “feminino” na coluna
“gênero”).
No terceiro item, além de identificar os dados da tabela, adicionar os
valores, seria necessário que professor transformasse o valor encontrado em
representação percentual. Segundo Witte e Witte (2005, p. 23), frequência relativa
é “a frequência de cada classe como uma parte ou fração da freqüência total para
toda a distribuição”.
O resultado esperado para este item poderia ser calculado da seguinte
forma: seja N o total de funcionários, N
m
o total do gênero masculino e N
f
o total
do gênero feminino. Seja também F
rm
a frequência relativa do total de
observações do gênero masculino.
N = 37
N
f
= 18
N
m
=19
F
rm
=
19
100
37
. %
F
rm
51 35
, %
Observamos que o professor não precisaria explicitar ou mesmo conhecer
o conceito de frequência relativa, mas, apenas porcentagem. Neste caso, ele
estaria em um nível cultural de alfabetização, mobilizando apenas um tipo de
registro de representação semiótica (registro numérico), fazendo o tratamento na
organização tabular desse registro. Se fizermos um paralelo entre os níveis de
Curcio para a leitura gráfica, e os níveis de leitura tabular, esta atividade
necessitaria que o professor fizesse uma leitura entre os dados.
88
Nos itens “d)” e “e)” poderíamos identificar os conhecimentos do professor
em relação à variável estatística, se ele conseguisse identificar quais seriam as
variáveis e os tipos das variáveis (qualitativa ou quantitativa). As soluções
esperadas para o item “d)” seriam cargo, gênero, número de funcionários e
salário; e para o item “e)” seriam as variáveis de tipos diferentes, pois existem
variáveis qualitativas (cargo e gêneros) e variáveis quantitativas (número de
funcionários e salário).
Nestes itens, esperariamos que, mesmo que o professor respondesse que
as categorias pudessem ou não ser expressas numericamente, ele perceberia e
explicitaria o que seria uma variável, como sendo a característica observada com
tipos diferentes. Neste caso, dependeria da maneira como o professor
explicitasse as variáveis que seriam um índice de um letramento funcional ou
científico.
No item “f)”, analisaríamos como o professor faria para encontrar a média
salarial, e como ele (apenas no seu discurso) perceberia o que este valor
representaria para o conjunto de dados, ou seja, que tipo de significado ele
atribuiria à média. Como resposta esperaríamos que o professor somasse os
salários dos 37 funcionários da empresa (que ele não esquecesse de verificar que
existem salários iguais para mais de um funcionário) e, em seguida, dividisse o
valor encontrado por 37, ou seja:
Seja
s
µ
a média dos salários dos funcionários, então
657 84
$ ,
s
R
µ
=
, pois:
3500 820 8 540 22 400 6 24340
657 84
37 37
,
S
x x x
µ
+ + +
= = =
Como análise deste valor, esperava-se que o professor percebesse que
este refletisse o fato de que os salários observados oscilam em torno de R$
657,84. Ou seja, o professor precisaria perceber que os valores observados não
seriam todos iguais ao valor da média, mas que variariam em torno dele.
Poderíamos dizer que neste caso, dependendo das explicitações do professor o
nível de letramento estatístico necessário seria o funcional. Neste caso o
professor, passaria do registro tabular (um tipo de registro numérico, mas que
89
obedece a uma organização em linhas e colunas) para o registro numérico que
seria o valor da média.
Poderíamos dizer que, para passar do registro tabular para o registro
numérico, o professor passaria, ainda que de forma implícita, pelo registro
algébrico, ao mobilizar a expressão que permitisse o cálculo da média,
xi
N
µ
Σ
=
No item “g)”, identificaríamos os conhecimentos de mediana. Uma primeira
estratégia que o professor poderia utilizar, seria a organização dos dados em
ordem crescente ou decrescente, a fim de determinar o termo central. Para
resolver a questão desta maneira, utilizamos as cores para facilitar a visualização
dos elementos que se encontram antes da mediana, o elemento que representa a
mediana e os que se encontram após a mediana.
Primeiros 18 elementos (em azul)
[400 - 400 - 400 - 400 - 400 - 400 - 540 - 540 - 540 -
540 - 540 - 540 - 540 - 540 - 540 - 540 - 540 540]
19º elemento (em vermelho)
540 -
últimos 18 elementos (em verde)
[540 - 540 - 540 - 540 - 540 - 540 - 540 - 540 - 540 - 820 -
820 - 820 - 820 - 820 - 820 - 820 - 820 – 3500]
Assim, o elemento central seria o que ocupa a 19º posição, uma vez que
há 18 elementos antes dele e 18 depois. Neste caso, o salário é de R$ 540,00 e o
cargo de vendedor. Nesse caso o professor trabalharia com os registros
numéricos
Uma segunda estratégia seria organizar os dados em uma tabela de
distribuição de frequências com os valores dos salários em ordem crescente,
como facilitador para encontrar as frequências acumuladas.
Seja N o número de funcionários e F
ac
a frequência acumulada da classe,
obtemos:
(variável) salário N F
ac
Posição
400 6 6 (1º ao 6º)
540 22 28 (7º ao 28º)
820 8 36 (29º ao 36º)
3500 1 37 37º
37
Tabela 4: Tabela de distribuição de frequências com os valores em ordem crescente
90
Se quisermos dois grupos com o mesmo número de elementos, então,
cada grupo deverá ter (
37 2
÷
) 18 elementos, sobrando um, que seria o elemento
central (19º elemento, em ordem crescente de salários). Para localizar o salário
que representa a mediana, a mobilização do conceito de frequência
acumulada crescente ou contagem (primeira estratégia). Nesta estratégia,
também, o professor precisaria determinar que a solução seria 540 que é o salário
de um vendedor desta empresa. Um erro bastante comum seria a indicação do 19
(posição ocupada) ou da frequência 22, relativa à mediana. Aqui o professor,
passaria do registro numérico, para o registro tabular e voltaria ao registro
numérico, então, determinaria o valor observando o registro tabular.
Como terceira estratégia, o professor poderia utilizar, para resolver este
item, o algoritmo que usualmente encontramos nos livros de estatística:
1
2
n
+
,
onde n é o número de dados observados, para determinar a posição do termo
mediano. Pesquisas recentes abordam que o conhecimento do professor, tanto
em relação ao conteúdo como ao pedagógico estaria baseado no que se encontra
nos livros didáticos e, por isso, a consideração dessa estratégia. Nesta última
estratégia, o professor passaria do registro numérico, para o registro algébrico em
seguida, pelo registro tabular e/ou numérico para então determinar o valor da
mediana.
Para responder ao item “h)”, esperávamos que o professor escolhesse uma
das medidas-resumo (média ou mediana) como representativa para o salário
desta empresa e justificasse os motivos da escolha. Para fazer esta justificativa,
esperaríamos que, caso o professor viesse a escolher a dia ele ressaltasse a
importância de se analisar também a dispersão dos dados, seja a amplitude total,
seja o desvio-padrão, indicando que ele tem construído o significado de média
como ponto ao redor do qual os demais se distribuem. Se ele escolhesse a
mediana, que saliente que este seria o valor que divide os dados observados em
dois grupos de mesma quantidade de elementos.
Pelas pesquisas recentemente concluídas, julgaríamos que os professores
viessem a escolher como representativa para o conjunto de dados a média
salarial; no entanto poderiam ter uma justificativa equivocada, isto fica bem claro
91
quando Silva (2007) diz que há equívocos nas medidas de tendência central por
parte de alguns professores que eles visualizam a média, como ponto central do
conjunto de dados.
As justificativas deveriam basear-se na dispersão dos dados (muito
dispersos indicariam pouca representatividade da média) e/ou na simetria ou não
da distribuição (distribuições muito assimétricas seriam melhores representadas
pela mediana). O professor também poderia justificar pela complementaridade
das informações contidas nas duas medidas, o que significaria o uso simultâneo
das representações. Estas justificativas exigiriam do professor um nível de leitura
da tabela além dos dados, letramento, pelo menos, funcional e apreensão
operatória do registro tabular de representação semiótica. (transformar tabela em
medida-resumo e “visualizar
2
a distribuição representada na tabela, com a
localização das medidas-resumo encontradas).
Os últimos três itens buscariam identificar as escolhas do professor para a
construção do gráfico, além de verificar como este faria a mudança de registro de
representação semiótica (da representação de uma tabela para a representação
gráfica) e se o professor utilizaria apenas um tipo de representação gráfica ou
variadas. Neste caso a solução pode ser um gráfico de barras, colunas, setores
e/ou dot-plot. A Figura 14 ilustra alguns possíveis gráficos para os itens i, j e k.
____________
2
A “visualização” aqui significaria que o professor deveria “imaginar” o diagrama de colunas ou dot-plot.
92
Figura 14: Possíveis soluções dos itens “i”, “j” e “k” da primeira questão do teste diagnóstico
As questões 1.1 e 1.2 referem-se aos saberes docentes, para estas
questões esperaríamos que o professor pensasse em sua prática em sala de
aula. Como dissemos, não nos aprofundaremos no assunto, por opção e por
problemas de gestão do tempo, apenas faremos alguns questionamentos no
intuito de perceber como o professor se à frente deste tipo de perguntas e
deixá-las (as questões sobre os saberes docentes) para que o professor possa
refletir sobre o assunto. Vale ressaltar que as questões 1.1, 1.2, 2.1, 2.2, 3.1 e,
assim, sucessivamente referem-se a saberes docentes.
Análises a posteriori
Para esta questão, percebemos que as duas professoras participantes de
nossa entrevista não apresentaram maiores dificuldades no momento de
93
responder à maioria dos itens. Tanto que para os itens “a”, “b”, “c”, “d”, “f”, “i” e “j”
suas respostas foram as esperadas em nossa análise a priori.
No caso do item “f”, ambas as professoras utilizaram o registro algébrico
(implicitamente), em seguida, o registro numérico para determinar o valor da
média. Vale ressaltar que elas apenas calcularam o resultado não nos sugerindo
preocupação com os desvio entre os valores.
Para o item “i” e “j”, ambas as professoras construíram gráficos de colunas
e as duas não se preocuparam com a escala, conforme observaremos à frente no
Protocolo 7. Isto pode ter acontecido, pelo fato de que atualmente a maioria dos
livros didáticos não a devida importância às escalas nos gráficos. Segundo
Cardoso (2007), os professores apoiam-se muito no que está escrito nos livros
didáticos
Em relação ao item “e”, as duas professoras relataram que havia
diferenças entre as variáveis envolvidas. A professora A justificou sua resposta
classificando as variáveis como qualitativas ou quantitativas, e a professora B
justificou a questão pela observação do tipo de dados, sua resposta foi mais
subjetiva, conforme o protocolo a seguir.
Abaixo os protocolos das professoras para os itens de a) até f), em seguida
a análise a posteriori para estes itens.
94
Protocolo 1: Respostas da professora A para a primeira questão do teste diagnóstico itens de “a”
até “f”
Protocolo 2: Resoluções da professora B para a primeira questão do teste diagnóstico itens de
“a”, “b”, “c” e “f”
95
Protocolo 3: Respostas da professora B para a primeira questão do teste diagnóstico itens de “a”
até “f”
Ao analisar o item “e” da professora B, notamos que ela distingue variável
contínua e variáveis que não utilizam números, que chama de discretas. Parece
haver confusão entre as variáveis qualitativas e as quantitativas discretas. A
mesma confusão foi identificada na pesquisa de mestrado de Déborah Maria de
Almeida, em andamento.
Observando os protocolos apresentados e a entrevista de maneira global
percebemos que existe maior preocupação com a organização das informações e
com a apresentação dos resultados pela professora A, que durante a entrevista,
também podemos notar que se utilizou mais dos algoritmos. a professora B
não usou fórmulas, apenas o raciocínio envolvendo os conceitos abordados.
A seguir, os protocolos para os itens “g” e “h”:
96
Protocolo 4: Respostas da professora A para a primeira questão do teste diagnóstico itens de “g”
e “h”
Protocolo 5: Resolução da professora B para encontrar a mediana de um conjunto de dados
97
Protocolo 6: Respostas da professora B para a primeira questão do teste diagnóstico itens de “g”
e “h”
Aqui ficam bastante evidenciadas as diferenças dos tipos de resoluções de
cada professora quando verificamos as respostas para o item “g”. A professora A
usou o algoritmo, verificou se os dados estavam organizados em ordem crescente
e encontrou o valor desejado. Este tipo de comportamento é relatado por Cardoso
(2007), ao afirmar que muitos professores utilizam os algoritmos, sem ao menos
questioná-los. A professora B organizou os dados, em uma linha, em ordem
crescente e descartou o primeiro e o último valor do conjunto de dados, depois o
segundo e o penúltimo, o terceiro e o antepenúltimo e, assim, sucessivamente a
restar apenas um valor, o da mediana. Quando sobram dois valores, a professora
realiza a média aritmética destes valores para determinar a mediana, com
veremos adiante
Vale ressaltar que esta estratégia realizada pela professora B, não
havíamos previsto em nossa análise a priori. No entanto, a professora utilizou um
raciocínio diferente do que previmos fazendo um tipo de enumeração dos dados.
98
Adiante os protocolos que envolvem a construção de gráficos:
Protocolo 7: Respostas da professora A para a primeira questão do teste diagnóstico itens de “i”,
“j” e “k” – construções gráficas
99
100
Protocolo 8: Respostas da professora B para a primeira questão do teste diagnóstico itens de “i”,
“j” e “k” – construções gráficas
Nos itens que sugerem a construção dos gráficos, as professoras
respeitaram as escalas no eixo vertical, no entanto no item “k” o respeitaram a
escala no eixo horizontal, mesmo assim optaram por gráficos propícios para cada
variável.
A professora B solicitou um espaço maior (uma folha de sulfite inteira) para
realizar suas construções, ela disse acreditar que, desta forma, as escalas
ficariam melhores. A professora A não construiu o gráfico de barras utilizando os
dois eixos, como era esperado. Ela construiu as barras utilizando as proporções,
mas colocou o valor da frequência sobre a barra. Assim, podemos depreender
que isto pode ser influência dos livros didáticos, pois alguns destes estão
apresentando os gráficos desta forma, segundo Canossa (2009) os professores
utilizam os livros didáticos, como fonte de formação continuada.
Podemos inferir que ambas não perceberam o conteúdo das
representações escolhidas: setores para relações do tipo parte/todo e colunas
101
para a relação parte/parte. Parece que escolheram o gráfico apenas pelo número
de categorias que seriam representadas. A professora A utilizou mais de um tipo
de registro, já a professora B optou apenas pela construção de gráficos de
colunas. Quando questionamos a professora A em relação à construção do
gráfico de setores esta ressalvou que acreditava ser mais interessante esta
construção para a variável sexo do que o gráfico de colunas, mas não justificou os
motivos.
Em nossa entrevista piloto, é interessante ressaltar que a professora
participante construiu um gráfico, empregando pares ordenados em um plano
cartesiano para representar os dados. Este tipo de erro também foi verificado no
teste diagnóstico aplicado por Vieira (2008), no qual os alunos representaram os
dados dessa forma (referência ao gráfico de função ou utilizados na Geometria
Analítica)
Protocolo 9: Entrevista piloto – construção de gráficos com a utilização de pares ordenados
102
Apresentamos agora os protocolos dos itens referentes aos saberes
docentes:
Protocolo 10: Respostas da professora A para a questão 1.1. do teste diagnóstico
Protocolo 11: da professora B para a questão 1.1. do teste diagnóstico
Protocolo 12: da professora A para a questão 1.2. do teste diagnóstico
103
Protocolo 13: da professora B para a questão 1.2. do teste diagnóstico
Em relação ao momento de abordar questões como estas, as duas
referiram-se que são trabalhadas, sobretudo, no ano do Ensino Médio, mas a
professora B relatou que trabalhou alguns destes conceitos em outras séries,
tanto que ela escreveu que o fez no 5ª série do Ensino Fundamental II, mas
enfatizou que o aprofundamento ocorre na última série do Ensino Médio.
As duas professoras relataram que, para responder a estas questões
alguns alunos não teriam facilidade, enfatizaram que isso aconteceria
principalmente por eles não saberem trabalhar com as medidas de tendência
central e com diferentes representações para a distribuição de frequência.
Segundo Silva (2007), os professores não utilizam as medidas de
tendência central e a dispersão como ferramentas de análise de dados, pois
ensinam mais as variáveis qualitativas e também, uma única variável. Talvez por
esse motivo, as professoras relataram que os alunos teriam dificuldades para
resolver questões que abordassem este conteúdo, os próprios professores não o
desenvolvem na escola.
104
Assim, a professora A não percebeu o objetivo geral, o pensar em como
ensinar estes conceitos. Nos termos de Shulman, podemos inferir certo
desconhecimento do currículo que atualmente introduz o trabalho com tabelas e
gráficos estatísticos já no Ensino Fundamental.
2ª questão:
O gráfico abaixo, publicado pela revista Veja (1999), mostra como são divididos os 188
bilhões de reais do orçamento da União, entre os setores de saúde, educação, previdência e
outros.
57,00%
25,00%
8,00%
10,00%
Outros
Previdência
Educão
Saúde
Construa uma tabela que mostre os valores em reais gastos em cada um dos setores.
2.1.) Em sua opinião, os alunos possuem conhecimentos necessários para a construção
desta tabela?
2.2) Qual seria o momento propício para trabalhar este tipo de questões?
2.3.) Qual seria o “caminho” que o aluno escolheria para solucionar esta questão?
Análise a priori
O objetivo principal desta questão seria diagnosticar, como o professor faz
a conversão do registro gráfico para a tabela e, ainda, como ele lida com as
informações em porcentagem para transformá-las em valores absolutos (reais),
no que tange ao conhecimento específico do conteúdo.
Nesta questão, seria possível perceber que o professor precisaria fazer
uma conversão do registro gráfico para o tabular, que segundo pesquisas
recentes, é menos utilizado em sala de aula. Aqui acreditávamos que seria
necessário um nível de letramento pelo menos funcional, pois o professor deveria
trabalhar em dois tipos de representações semióticas (o registro gráfico, o tabular
e o numérico) fazendo a conversão entre estes registros. Em relação aos níveis
de Curcio, esta questão apela para uma leitura entre os dados.
105
Para Duval (2003), a compreensão do objeto de estudo apenas acontece
de forma global, quando este consegue compreender as diferentes
representações do objeto envolvido e suas conversões e tratamentos de registros.
Pensando nas apreensões, percebemos a necessidade da discursiva, pois para
determinar os valores absolutos, o professor precisa saber que o gráfico de
setores apresenta uma relação parte/todo.
A solução esperada seria a tabela que segue:
Tabela 5: Tabela esperada como solução da segunda questão do Teste Diagnóstico (Registro
Tabular)
setores Dinheiro gasto (em bilhões)
Saúde 18,8
Educação 15,04
Previdência 47
Outros 107,16
Total 188
A seguir apresentamos os lculos necessários para se completar a tabela
acima.
10
188 18 8
100
. , bilhões para Saúde
=
8
188 15 04
100
. , bilhões para Educação
=
25
188 47
100
. bilhões para Previdência
=
57
188 107 16
100
. , bilhões para Outros
=
Para realizar estes cálculos, o professor mobilizaria conhecimentos básicos
de porcentagem. No entanto, a conversão do gráfico para a representação tabular
e do tratamento entre os valores percentuais e absolutos proporcionaria uma
análise dos dados de maneira mais global com uma visão real dos gastos em
cada um dos setores descritos. A análise a posteriori desta questão faremos com
a da 3ª questão.
Registro
Numérico
106
3ª questão:
Para analisar um conjunto de dados, podemos utilizar medidas que resumem os dados e
descrevem suas características, permitindo assim a análise da variação destes dados. Em sua
opinião, como os alunos compreendem e analisam as medidas abaixo em relação ao conjunto
de dados?
Média aritmética:________________________________________________________
Moda:_________________________________________________________________
Mediana:______________________________________________________________
Quartis:_______________________________________________________________
Esta questão tem por objetivo diagnosticar, qual(is) medida(s)-resumo o
professor conhece. Nesta pergunta, não pretendíamos verificar se o professor
sabia calcular as medidas-resumo, mas se percebia se os alunos as conheciam e
sabiam analisá-las. Assim, não seria necessário realizar nenhum tipo de
conversão ou tratamento. Para conhecer as medidas e conseguir explicar como
acontece sua análise, acreditávamos ser preciso um nível cientifico de letramento
estatístico.
Análise a posteriori da segunda e terceira questões:
Protocolo 14: Conversão do registro gráfico para o tabular – questão 2 do teste diagnóstico
107
Protocolo 15: Resposta da professora A para os itens de saberes docentes da questão 2 do teste
diagnóstico
Protocolo 16: Resposta da professora A para os itens de saberes docentes da questão 2 do teste
diagnóstico
108
Primeiro, apresentamos os protocolos observados para a questão 2 e suas
análises:
Nesta questão, as duas professoras realizaram os cálculos sem
dificuldades, no entanto, divergiram de opinião em relação se os alunos
conseguiriam ou não realizá-la. Esta discordância pode ser explicada pelos
diferentes níveis de conhecimento dos alunos, conforme relata Shulman. A
professora B citou que eles teriam facilidade e que, talvez, o único dificultador
fosse o fato dos números se tratarem de bilhões, segundo ela, números muito
“grandes”. Desta forma, poderia existir a necessidade de se trabalhar com
notação científica. Vale ressaltar que ela não usou esse tipo de registro para a
apresentação dos seus dados. Já a professora A acreditava que os alunos, em
sua maioria, não realizariam esse exercício, ela justificou o fato dos alunos não
saberem realizar a relação dos dados apresentados no gráfico e o cálculo da
porcentagem. Ela ainda complementou que, apenas fariam o exercício depois da
explicação do professor.
Embora fizessem parte do currículo, várias pesquisas mostram que esses
conteúdos não são usualmente abordados. Na pesquisa de Vieira (2008), a
autora afirma que os alunos tinham dificuldades para resolver esse tipo de
questão. A professora B confirmou o fato com suas preocupações, indicando o
conhecimento dos alunos e do contexto educativo.
Segundo Morais (2006), atualmente os conceitos estatísticos são
trabalhados de maneira isolada e desarticulada, talvez por esse motivo os alunos
possam ter dificuldades nas inter-relações entre os diversos registros de
representação e na conversão desses registros. Ambas as professoras não
tiveram dificuldade para realizar a conversão, no entanto, elas relatam as
dificuldades dos alunos.
Optamos por colocar apenas um protocolo da construção da tabela, visto
que as duas construções eram muito parecidas. Escolhemos o protocolo da
professora B para que pudéssemos perceber que ela salienta a necessidade do
uso da notação cientifica, mas na sua construção não a utiliza. Além disso,
porque podemos observar que a própria professora se atrapalha na utilização da
109
representação numérica para o orçamento, ao escrever, por exemplo,
18.800.000.000 bilhões para Saúde, quando a palavra “bilhões” não é necessária,
observe este fato no protocolo 15.
Observe agora os protocolos da 3ª questão, seguidos das análises:
Protocolo 17: Resposta da professora A para a questão 3 do teste diagnóstico
110
Protocolo 18: Resposta da professora B para a questão 3 do teste diagnóstico
Em relação a questão, percebemos que as duas professoras apenas
explicaram cada uma das medidas, não referiram como poderia ser uma possível
análise destas. Podemos observar também que algumas respostas foram muito
subjetivas, dando indícios que talvez a professora não soubesse como explicar
estas medidas. Não podemos afirmar que elas não as conhecessem, visto que na
questão seguinte elas sabiam calculá-las, talvez não conseguissem explanar
todas as medidas. (Conhecimento dos procedimentos, e o de seus
significados).
Referindo-nos à professora A, verificamos que tanto para a média
aritmética, como para os quartis, ela disse que eram medidas que representavam
o conjunto de dados e que auxiliavam na análise dos dados, ao ser questionada
reafirmou que eram usadas na análise dos dados. a professora B, em seu
discurso disse que a média é o ponto de equilíbrio entre os dados. No entanto, no
momento de relatar sua explicação poderia causar confusão com mediana. Ela
também relatou nunca ter abordado quartis com seus alunos e, por isso, não
sabia dizer como eles compreenderiam.
111
Embora o nível de letramento estatístico seja global, ou seja, é analisado
em relação ao conjunto de conhecimentos estatísticos, podemos identificar
indícios desse nível na evolução das atividades. Assim, até este momento de
nossa sequência, podemos inferir que ambas as professoras oscilaram entre os
níveis cultural e funcional.
Aqui, apresentamos uma questão a ser considerada em pesquisas futuras:
existiriam subníveis de letramento estatístico?
4ª questão:
As idades das quarenta pessoas que prestaram um concurso de seleção para uma
determinada instituição são as seguintes:
18, 18, 20, 22, 21, 18, 19, 20, 22, 18,
19, 20, 21, 18, 20, 19, 20, 19, 22, 19,
20, 21, 20, 18, 19, 18, 22, 21, 20, 19,
20, 18, 21, 18, 18, 19, 20, 19, 18, 18
a) Construa um gráfico de barras que represente as idades destas pessoas.
b) Quantas pessoas têm idade menor ou igual a 20 anos?
c) Qual a idade você considera mais apropriada para representar esta distribuição?
Justifique.
d) Tente relacionar cada um dos valores das idades desta distribuição com as respectivas
medidas:
I. Média Aritmética ( ) 18 anos
II. Mediana ( )19,5 anos
III. Moda ( ) 19 anos
IV. Primeiro Quartil ( ) 20 anos
V. Terceiro Quartil ( ) 18 anos
4.1) Em sua opinião, para que o aluno construa o gráfico de barras, que é solicitado no
item “a)” desta pergunta, é necessário que ele reorganize os dados de outra forma?
Se sim, qual seria?
4.2.) Para resolver o item “b)” qual (is) dos registros
*
apresentados e/ou construídos você
acredita que ele utilizaria? Por quê?
*Chamamos de registros as diferentes representações do objeto de estudo, no nosso
caso distribuição de freqüências, aqui podemos considerar registros as representações
gráficas, tabulares, banco de dados, medidas entre outras.
4.3) Em que fase de escolaridade você acredita que seja interessante abordar questões
como essa que envolvem construções e análise de gráfico e medidas? Os alunos
conseguem resolvê-las?
112
Análise a priori
No primeiro item desta questão, pediríamos que o professor realizasse a
construção de um gráfico de barras. Neste caso, em nenhum momento,
solicitaríamos que ele organizasse os dados, por exemplo, montando uma tabela,
mas para que ele construísse o gráfico com facilidade, haveria necessidade da
organização dos dados, nessa questão esperávamos que isso acontecesse,
mesmo sem a instrução para isto.
Esperávamos como solução da organização dos dados, antes mesmo da
construção do gráfico, uma tabela, como no exemplo abaixo, para que o professor
percebesse com mais clareza a distribuição de frequência para cada dado
observado.
Idade Freqüência
18 12
19 9
20 10
21 5
22 4
Total 40
Tabela 6: Tabela para organização dos dados
Segundo Vieira (2008), também, poderia ser possível como organização
dos dados nesta questão com a construção do gráfico “dot-plot”. Vale lembrar que
neste gráfico (gráfico de pontos), cada valor observado é representado por um
ponto. Se o professor optasse pela construção do “dot-plot”, antes do gráfico de
barras, ele conseguiria perceber quais seriam as alturas das barras, sem a
necessidade de ordenar os dados ou organizar a tabela. O dot-plot sugere o
gráfico de colunas, caso recorresse a essa estratégia o professor deveria
conhecer a equivalência entre um diagrama de barras e um de colunas.
113
Gráfico 15: Dot-plot para organização dos dados
Em seguida, esperaríamos que o professor construísse o gráfico de barras,
conforme solicitado na questão, que percebesse a necessidade das barras não
serem justapostas se o tratamento escolhido para a variável fosse o de variável
discreta e, também, que a largura de todas as barras deveria ser a mesma. Na
realidade, o gráfico adequado aqui seria um gráfico de bastões, mas como ele
não é usualmente abordado na Escola sica, decidimos não trabalhar esse tipo
de representação. Caso o professor construísse um histograma, também seria
adequado, visto que a grandeza associada à variável é contínua. Nesse caso, ele
precisa explicitar as classes a serem adotadas.
Nessa questão, também, proporíamos uma conversão, no caso de um
banco de dados para a representação gráfica. Vale ressaltar que, dependendo
das escolhas do professor para realizar a construção do gráfico de barras, ele
poderia realizar em primeiro lugar um tratamento do banco de dados para a
representação tabular (ambos registros numéricos) e, em seguida, uma
conversão da representação tabular para a gráfica (registro numérico para
registro gráfico), ou primeiro uma conversão, do banco de dados para o dot-plot,
seguido de um tratamento entre as duas representações gráficas. Acreditamos
que mesmo que o gráfico de barras fosse construído no plano cartesiano e o dot-
plot eixo implícito, ambas as representações trabalhariam com o mesmo tipo de
dados (valores absolutos) e a mesma visualização.
114
Gráfico 16: Gráfico de barras para a variável idade
Para solucionar a questão, seria necessário um nível de letramento, pelo
menos, funcional e uma leitura dos dados e entre os dados, pois seria necessário
que se conhecesse a representação do gráfico de barras, algumas de suas
propriedades para que a construção fosse correta e não tendenciosa (calibração
da escala), e para isto verificamos a necessidade de uma apreensão discursiva.
No item “b”, seria necessário verificar o total de pessoas com idade menor
ou igual a 20 anos. Aqui seria necessária uma leitura entre os dados e, pelo
menos, um nível funcional de letramento estatístico, uma vez que seria preciso
adicionar os valores observados, pois a resposta não é direta. Em relação à teoria
dos registros de representação semiótica, o professor poderia realizar um
tratamento no registro tabular construído anteriormente.
Para solucionar o item “b”, esperávamos que o professor determinasse a
frequência acumulada dessa distribuição e isto poderia ser feito com o auxilio de
uma tabela, como a apresentada abaixo.
115
Tabela 7: Tabela para auxiliar na identificação da mediana
Idade Frequência (F)
Frequência
acumulada (Fac)
18 12 12
19 9 21
20 10 ... .......31
21 5 36
22 4 40
Total 40
Quantidade de
pessoas com idade
menor ou igual a 20
anos
Pelos dados da tabela, observando a coluna da frequência acumulada
seria fácil perceber que são 31 pessoas com idade igual ou inferior a 20 anos.
No item “c”, o professor precisaria escolher uma das medidas-resumo para
justificar a idade que ele consideraria mais representativa para a distribuição de
frequências.
Nesta questão, o professor necessitaria estar em um nível pelo menos
funcional, pois existe a necessidade da justificativa da escolha e sua leitura deve
ser além dos dados para identificar o salário mais apropriado à pesquisa.
Em relação aos registros de representação semiótica, percebemos o
tratamento entre os registros numéricos (rol e representação tabular) e, também,
a apreensão operatória, visto que há necessidade de modificação do registro
tabular para o registro numérico que é o de valor representativo para a
distribuição de frequências calculadas.
No item “d”, precisaria encontrar os valores das medidas envolvidas nesse
banco de dados. Na questão, observa-se que o professor deveria conhecer o
conceito de medida-resumo, logo, para este problema como o enunciado fornece
qual a medida a ser calculada, o professor precisaria apenas lembrar como
calculá-la, o que significa que ele precisaria ter um nível funcional de letramento
estatístico.
Média aritmética:
Em relação à média aritmética, seja
i
µ
a média das idades, logo:
12 18 9 19 10 20 5 21 4 22 780
19 5
40 40
,
i
x x x x x
anos
µ
+ + + +
= = =
116
Como análise deste valor, esperávamos que o professor percebesse que
ele indica que as idades dos pesquisados variam em torno de 19,5 anos. Aqui o
professor somente mobilizaria um único registro de representação semiótica
(registro numérico).
Mediana:
No caso da mediana, esperávamos que o professor mobilizasse seu
conhecimento de que este é o valor que divide os elementos (ordenados
crescentemente) do banco de dados em duas partes de mesmo número de
elementos. Da mesma forma que, na primeira questão, o professor poderia
escolher entre duas estratégias. A primeira, seria organizar os dados e verificar o
termo central.
Diferentemente da primeira questão, neste caso quando buscamos
determinar o termo central perceberíamos que teríamos (
40 2
÷
) 20 elementos em
cada grupo, não sobrando nenhum. Nesse caso, para determinar o termo central
(este poderia ser um valor não apresentado nos dados pesquisados, mas nem por
isso deixaria de ser representativo para a pesquisa), assim, precisaríamos
encontrar a média entre os valores das 20ª e 21ª posições.
Primeiros 19 elementos (em azul)
18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 19, 19,
19, 19, 19, 19, 19,
20º e 21º elementos
19, 19,
Últimos 19 elementos (em verde)
20, 20, 20, 20, 20,
20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 22, 22, 22, 22
20º e 21º elementos
19 , 19
termo central média entre o elementos das posições 20 e 21
19 19 38
19
2 2
anos
+
= =
A segunda estratégia seria organizar os dados em uma tabela de
distribuição de frequências com os valores em ordem crescente e determinar a
frequência acumulada e a posição.
117
Tabela 8: Tabela com as frequências acumuladas e posição no rol
Idade
Número de
pessoas
Frequência
acumulada (Fac)
Posição
18 12 12 1ª a 12ª
19 9 21 13ª a 21ª
20 10 31 22ª a 31ª
21 5 36 32ª a 36ª
22 4 40 37ª a 40ª
Total 40
Como o termo central desta distribuição de frequências fica entre as
posições 20 e 21, pela visualização da tabela ficaria facilmente identificada a
mediana como 19 anos, pois ambas as posições são representadas por esse
mesmo valor.
Moda
Em relação à moda, esperava-se que o professor mobilizasse o
conhecimento de que é o valor mais frequente da distribuição. Aqui também ele
poderia escolher entre duas estratégias. A primeira, seria observar na tabela o
elemento com maior frequência.
Tabela 9: Tabela para identificação do valor máximo
Idade Frequência (F)
18 12
19 9
20 10
21 5
22 4
Total 40
A segunda estratégia seria observar, no gráfico, a barra mais comprida.
Como resposta, o professor encontraria que o valor representativo da moda é 18
anos.
118
Gráfico 17: Gráfico de barras para a variável idade localizando o valor máximo
Esta atividade exigiria apenas a leitura dos dados, a apreensão perceptiva
da figura (ou da tabela) e um letramento cultural.
Primeiro e Terceiro Quartis:
Ao buscarmos determinar os quartis perceberíamos que teríamos (
40 4
÷
)
10 elementos em cada grupo, não sobrando nenhum. Nesse caso, para
determinar os quartis devemos prosseguir da seguinte forma.
Para encontrar o valor do primeiro quartil, faríamos a média entre os
valores da 10ª posição (18 anos) e da 11ª posição (18 anos). Como em ambos os
casos, o valor encontrado seria 18 anos, este seria o valor representativo para o
primeiro quartil.
Para verificar o valor do terceiro quartil, faríamos a média entre os valores
da 30ª posição (20 anos) e da 31ª posição (20 anos). Como em ambos os casos o
valor encontrado seria 20 anos este seria o valor representativo para o terceiro
quartil.
Da mesma maneira que na mediana, o professor poderia determinar o
valor de primeiro quartil pela organização dos dados em ordem crescente ou
decrescente no rol, ou pela observação do registro tabular com as frequências
acumuladas.
119
Assim, a solução esperada para este item seria:
I. Média Aritmética (III) 18 anos
II. Mediana ( I )19,5 anos
III. Moda ( II ) 19 anos
IV. Primeiro Quartil ( V ) 20 anos
V. Terceiro Quartil ( IV ) 18 anos
Análise a posteriori
A seguir, apresentamos os protocolos das professoras para o item “a”
desta questão. Vale ressaltar que a observação feita em vermelho foi realizada
pela pesquisadora e não pelas professoras participantes, com a finalidade de
explanar os procedimentos escolhidos por elas.
Protocolo 19: Conversões realizada pela professora A para responder a questão 4 do teste
diagnóstico
120
Protocolo 20: Conversões realizada pela professora B para responder a questão 4 do teste
diagnóstico
Mesmo não solicitando às professoras que organizassem os dados de
outra maneira (antes de construir o gráfico), como por exemplo, uma tabela, as
duas perceberam a necessidade desse registro (mesmo que feitos como um
rascunho) para, em seguida, realizar a construção do gráfico. Aqui podemos
inferir que elas perceberam a necessidade da conversão entre os registros. Desta
forma acreditamos que elas apresentem a seus alunos a importância destas
conversões, como é esperado.
121
Outra hipótese foi que o conhecimento de conteúdo tenha se construído
apoiado no uso dos livros didáticos e nestes a construção de gráficos é assim
apresentada.
Para a construção do gráfico, as duas professoras tiveram cuidado de
respeitar as escalas. Nos dois casos, o único equívoco foi a construção do gráfico
de colunas e não o de barras como foi solicitado, mas no nosso entender ambas
as representações evidenciaram os mesmos fatores de uma maneira muito
similar.
No entanto, a professora B explicitou que construiu um gráfico de colunas e
como seria um gráfico de barras, o que a professora A não fez. Esta apenas fez a
construção sem qualquer comentário explicativo. Isto pode indicar que ela não
distingue esses dois tipos de gráficos (tal confusão também ocorre em alguns
livros).
Os protocolos com as respostas das professoras para o item “c” e “d” da
questão são apresentados:
Protocolo 21: Respostas da professora A para responder à questão 4 do teste diagnóstico, itens
“c” e “d”
122
Protocolo 22: Respostas da professora B para responder a questão 4 do teste diagnóstico, itens
“c” e “d”
No item “c”, a professora B escolheu 20 anos como o valor representante
da distribuição e justificou sua escolha, ressaltando que esse valor se refere a
média dos dados (depois de realizar um arredondamento para 20 anos, pois a
média era 19,5); a professora A escolheu 19 anos, justificando que esse era o
valor da mediana e aproximava-se da média. Nenhuma das professoras cogitou
no momento da pesquisa em usar as duas medidas.
É interessante ressaltar que as duas professoras preocuparam-se em
justificar as suas escolhas por uma medida de tendência central, mas nenhuma
123
delas, pelo menos, citou a necessidade da análise da dispersão dos dados da
pesquisa. Esta atitude foi evidenciada também por Silva (2007).
Para resolver o item “d”, a professora A utilizou um algoritmo para
determinar a média; as demais medidas, ou ela as determinou anteriormente,
ou ela as encontrou pela observação dos dados apresentados. A professora B,
para o cálculo da média, utilizou a estrutura do algoritmo, mas não o fez com
muito rigor, e para a mediana ela repetiu o processo descrito anteriormente
(“cancelar o primeiro e o último”). Aqui é interessante lembrar que a professora B
relatou não perceber a necessidade de se trabalhar com “tantos” dados, disse
que, com menos dados, também seria possível perceber a compreensão do
conceito. Acreditamos que talvez, a professora apenas encontre o valor da
mediana desta forma e quando existem muitos dados, este processo se torna
muito trabalhoso e inviável.
A seguir, as respostas das professoras à questão 4.1.
Protocolo 23: Resposta da professora A referente a importância das conversões
Protocolo 24: Resposta da professora B referente a importância das conversões
124
As duas professoras perceberam a necessidade de uma reorganização dos
dados em um outro registro de representação, para somente então realizar a
construção do gráfico. Como relatamos anteriormente, elas fizeram essa
reorganização. No entanto, ambas indicaram a construção de tabela, que é a
representação mais usual nos livros. Nenhuma delas recorreu a outro tipo de
representação, como por exemplo, o dot-plot.
As respostas das professoras à questão 4.2 foram as seguintes
Protocolo 25: Resposta da professora A para a utilização dos diferentes registros
Protocolo 26: Resposta da professora A para a utilização dos diferentes registros
Em relação à utilização dos registros para a análise de alguns dados, a
professora A disse que os alunos escolheriam apenas um dos registros, e a
professora B relatou que eles poderiam utilizar qualquer um dos registros
observados. No entanto, nenhuma delas pareceu observar que o gráfico favorecia
a interpretação pela apreensão perceptiva.
Referente aos níveis de letramento propostos por Shamos, nesta primeira
etapa da pesquisa, podemos observar que, em alguns momentos as professoras
estão no nível cultural e em outros no funcional. Talvez estejam em um processo
de transição entre estes dois níveis de letramento estatístico.
125
Pela análise global dos resultados obtidos nesta etapa de nossa fase de
experimentação, percebemos que as professoras envolvidas apresentavam
alguns equívocos sobre algumas construções gráficas, uma delas o possuia a
distinção dos tipos de variáveis e que também fazem poucas ou quase nenhuma
análise dos resultados obtidos. As análises apenas acontecem de maneira
superficial quando são solicitadas na questão.
Acreditamos ser interessante ressaltar que a pesquisadora fez algumas
colocações com as professoras referente ao que era resolvido, como forma de
institucionalizar alguns conceitos. No entanto, o foi proposto que elas
alterassem suas respostas, mas também não faríamos nenhuma objeção, caso
elas tivessem essa atitude, o que não ocorreu durante nossa entrevista.
IV.2 Análises a priori e a posteriori da primeira fase da parte A das
atividades de familiarização com o software Fathom
A seguir, analisaremos a parte A da sequência didática, que tem como
objetivo principal a familiarização do professor com o software Fathom. A parte A
das atividades de familiarização está dividida em três fases distintas.
A primeira fase possui nove questões; a segunda fase seis questões e a
terceira fase, 14 questões, a maioria delas deve ser resolvida com o auxilio do
software.
Vieira (2008) quando elaborou estas atividades salientou que, nesta parte,
além de se apropriar das ferramentas do software, as questões possibilitariam a
revisão de alguns conceitos estatísticos.
Essas atividades permitem trabalhar conceitos de construção do banco de
dados, usando o software Fathom, variáveis quantitativas e qualitativas,
construção de tabelas de distribuição de frequências, construção e análise de
diferentes tipos de registros, construção e interpretação de algumas medidas-
resumo (média, mediana, quartis e desvios).
126
Com o uso do software Fathom, ressaltamos que temos acesso
rapidamente a diferentes registros do mesmo objeto e, com isto, colocamos o
professor ao mesmo tempo frente ao banco de dados, tabelas, gráficos e medidas
para que ele possa perceber a importância de se trabalhar simultaneamente com
mais de um registro. Desta forma, segundo Duval, a compreensão do objeto de
estudo torna-se completa (uso simultâneo de diversas representações).
Questão preliminar:
Observe o seguinte conjunto de dados de uma pesquisa realizada com 20 funcionários de
uma empresa:
A partir deste conjunto de dados podemos levantar inicialmente as seguintes questões:
Quais as características dos sujeitos observados que estão sendo alvo desta pesquisa?
Se fôssemos classificar estas características, quais critérios poderiam ser usados? Por
quê?
Obs.: Lembre que as características observadas constituem o que chamamos de “variável
estatística”.
127
Análise a priori
Nesta questão, seria necessário que o professor conhecesse e soubesse
classificar as variáveis estatísticas, seria preciso necessária uma justificativa para
explicar o motivo da classificação. Por isso, acreditamos ser preciso um nível de
letramento estatístico entre o funcional e o cientifico, dependendo das
explanações do professor. A questão trabalha com o conhecimento específico do
professor.
Assim, esperava-se que o professor conseguisse separar as variáveis
qualitativas (gênero, cargo e escolaridade) das quantitativas (idade e salário). E
também explicasse estas variáveis por suas características comuns, ou seja, as
qualitativas representam as qualidades, os atributos dos indivíduos pesquisados,
e as quantitativas, os dados que podem ser expressos numericamente, possuem
uma estrutura nitidamente numérica.
A questão não solicitava uma análise mais detalhada, mas seria possível
que o professor (por ter estudado estatística anteriormente) relatasse que as
variáveis quantitativas podiam ser subdivididas em dois grupos, os das
quantitativas discretas e os das quantitativas contínuas.
Em nossa questão, salário seria uma variável quantitativa discreta, pois
admite uma unidade mínima e indivisível e o tratamento dado à variável idade
(considerando apenas anos completos), também, poderia ser considerado uma
variável quantitativa discreta.
Análise a posteriori
Todas as questões da parte A, nas quais apenas foram indicados
procedimentos para a construção das representações do conjunto de dados no
ambiente computacional, questões estas cujo objetivo principal foi familiarizar o
professor com algumas das ferramentas do software, as professoras realizaram
sem maiores dificuldades. Isto aconteceu nas questões: 2, 3, 4, 6, 7, 8 e 9 da
fase, 1 da fase e 1, 2, 4, 5, 7, 8, 11 da fase, por isso, optamos por fazer
agora uma análise a posteriori única para estas questões. Vale ressaltar que
128
traremos estas questões no corpo deste trabalho, para que a compreensão das
atividades seja de maneira global.
Nestas questões, pudemos observar que o interesse maior das professoras
era perceber como funcionava o ambiente computacional Fathom e quais os
recursos desse software. A professora A mostrou-se bastante entusiasmada pela
facilidade e agilidade de se realizar as diferentes construções. a professora B,
também, achou interessante a agilidade nas construções, mas não se mostrou
muito entusiasmada com a interface do software, dizendo que alguns comandos
(quando, por exemplo, necessidade de segura o shift e “arrastar” os dados)
não eram tão fáceis de serem realizados.
Quando houve a necessidade da intervenção da pesquisadora na
construção e/ou análise por parte das professoras perante o conjunto de dados,
ou, até mesmo, quando aconteceu algum comentário (escrito ou oral) relevante,
ou ainda quando havia questões do cunho docente, abordaremos mais
detalhadamente sua análise a posteriori. Por exemplo, isso aconteceu na questão
preliminar que além de ser de construções no software, abordava duas perguntas
relacionadas às variáveis estatísticas. Os protocolos destas respostas seguem:
Protocolo 27: Respostas da professora A referente a variáveis estatísticas
Protocolo 28: Respostas da professora B referente a variáveis estatísticas
129
A respeito das características dos sujeitos que são representados no banco
de dados, as duas professoras categorizaram todas as variáveis, como era
esperado. No momento de classificar estas variáveis, a professora A relatou
(oralmente) que eram classificadas como qualitativas e quantitativas e justificou
que essa classificação acontecia pelas definições de cada tipo de variável. A
professora B também relatou que as características eram diferentes e que sua
classificação acontecia pela diferença de estrutura. Ela disse não recordar a
classificação correta para as variáveis estatísticas, mas, algumas eram de
estrutura numérica e outras o. Tal distinção, apenas por não apresentar o
vocabulário científico, mostrou que a percepção da gênese da variável era
possível, independente do nível de letramento.
Referente ao uso do ambiente computacional na escola, as professoras
responderam:
Protocolo 29: Resposta da professora A referente ao uso do ambiente computacional na escola
Protocolo 30: Resposta da professora B referente ao uso do ambiente computacional na escola
As duas professoras acreditavam ser importante o uso de ambiente
computacional na escola, mas também relataram que seu uso é muito tímido por
parte dos professores, pois muitas vezes a escola não possui uma infraestrutura
130
adequada para este tipo de abordagem, ou até que alguns professores não
possuam os domínios mínimos de informática para desenvolver uma aula nesse
ambiente. Isto também foi observado em pesquisas sobre informática na
educação.
1ª questão:
Primeira Fase : Elaboração de tabelas no Fathom
1) Inicialmente, construiremos o banco de dados do exemplo a ser trabalhado no software
Fathom. Para isso, siga os procedimentos abaixo
a) Clique no ícone do Desktop , para iniciar o software
b) Clique em “new collection” , e arraste até a tela.
c) Clique duas vezes em cima da palavra “collection1”, aparecerá a caixa “rename
collection”, onde você pode inserir um nome para o seu banco de dados.
d) Agora, clique em “new case table” e arraste até a tela.
e) Insira os dados da pesquisa na tabela do Fathom. Para isso, clique em new” e escreva
o título da coluna. Depois, tecle enter”, para continuar inserindo os dados nas linhas
(Obs.: não utilize acentuação, pontuação ou espaçamentos nos nomes das variáveis).
131
A questão apenas indicou como qualquer pessoa deveria proceder para
iniciar o Fathom e a maneira de inserir um banco de dados no software. Vale
ressaltar que, neste momento, não estávamos trabalhando a análise de dados
estatísticos, mas apenas algumas construções para familiarização com o
ambiente computacional. O resultado obtido é apresentado na Figura 15.
Figura 15: Tela do FATHOM esperada como solução da inserção de dados no software
132
2ª e 3ª questões:
2) Agora, construiremos uma tabela de distribuição de freqüências para a variável
“gênero”.
a) Clique em “new summary table” e arraste até a tela
b) No banco de dados do Fathom, selecione a coluna “gênero” e arraste-a até a nova
tabela.
3) Seguindo o mesmo procedimento, construa também as tabelas de distribuição de
freqüências para as variáveis “cargo” e “escolaridade”.
Estas questões forneceram informações para auxiliarem o professor a
construir tabelas de distribuição de frequência para variáveis qualitativas. Nesse
momento, ressaltamos a importância da apresentação dos passos para a
construção das tabelas no ambiente computacional, visto que o professor não
conhecia o software anteriormente.
Nesses itens, não solicitamos nenhuma análise estatística dos dados
levantados, apenas pedimos as construções.
Em relação às construções, é importante abordar que o enunciado da
apresentava uma tabela (tabela horizontal de distribuição de frequências); no
entanto, o software promove duas possibilidades para o desenho da mesma
distribuição de frequência (horizontal e vertical), mas, como em ambos os casos,
as construções possuem a mesma representatividade não acreditamos que fosse
um obstáculo para o professor. Logo, caso o professor “arrastasse” a variável
gênero até a seta que indica para a direita, o desenho da tabela seria o
apresentado a seguir.
133
Tabela 10: Tabela de distribuição de frequências para a variável gênero
Agora, se o professor arrastasse para a seta que indica para baixo, o
desenho da mesma representação seria o apresentado abaixo.
Tabela 11: Tabela vertical de distribuição de frequências para a variável gênero
A questão apenas solicitava que o professor construísse outras tabelas
de distribuição de frequência, para que ele pudesse ir se acostumando com as
ferramentas do software.
Tabela 12: Tabelas de distribuição de frequências para as variáveis cargo e escolaridade
134
4ª questão:
4) Você considera que a variável gênero” e a variável “idade” são de mesmo tipo? Por
quê?
4.1.) O aluno consegue fazer esta distinção para os tipos de variáveis? Se sim, como
ele faria?
Aqui esperávamos que o professor percebesse que as variáveis gênero e
idade não são do mesmo tipo, conforme a atividade realizada no teste
diagnóstico. Percebeu-se a necessidade de verificar que a variável gênero é
qualitativa, pois se refere a um atributo (qualidade) do indivíduo pesquisado; no
entanto, a variável idade é quantitativa, pois expressa quantos anos a pessoa
tem, ela possui uma estrutura numérica,
Para solucionar esta questão eram necessários um nível cultural de
letramento estatístico e uma apreensão perceptiva, uma vez que era apenas
trabalhada uma categorização que poderia ser intuitiva.
Análise a posteriori
Apresentamos as respostas das professoras para esta questão:
Protocolo 31: Resposta da professora A para a questão 4 da parte A
Protocolo 32: Resposta da professora B para a questão 4 da parte A
135
Nesta questão, a professora A classificou cada uma das variáveis e afirmou
que elas não eram do mesmo tipo. A professora B também considerou que estas
variáveis não eram do mesmo tipo e as classificou como de estrutura numérica e
não numérica (novamente). Aqui discutimos com a professora B sobre a
classificação dessas variáveis, mas como ela também é pesquisadora (concluindo
mestrado em educação matemática), optou por não alterar as respostas para que
a pesquisa fosse o mais fiel possível ao que pensava.
A seguir, apresentamos como as professoras acreditam que seus alunos
realizariam a classificação das variáveis:
Protocolo 33: Resposta da professora A para a questão 4.1. da parte A
Protocolo 34: Resposta da professora B para a questão 4.1. da parte A
É interessante ressaltar que a professora A fez a classificação das
variáveis estatísticas de uma maneira muito segura e em sua opinião os alunos
conseguiriam fazer a classificação facilmente. Ela disse que trabalhava esses
conceitos com eles e que não percebeu dificuldade por parte de seus alunos.
136
Já a professora B acreditava que os alunos não conseguiriam fazer a
classificação e justificava que o fato acontece, pois os professores não trabalham
com esta distinção, ela afirmou em seu discurso que eles não teriam facilidade,
porque não tinham contato com a abordagem dos diferentes tipos de variáveis.
5ª e 6ª questões:
5) Construa uma tabela de distribuição de freqüências para a variável “idade”.
Para isso, clique em “new summary table” , selecione a coluna da variável “idade”
no banco de dados e arraste-a até a nova tabela.
Obs.: Para tabelas com dados numéricos (ou seja, variáveis quantitativas), mantenha
apertada a tecla shift enquanto arrasta a variável até a tabela.
6) Construa uma tabela de distribuição de freqüências para a variável “salário”.
Estas questões tinham instruções para a construção de tabelas de
distribuição de frequência para as variáveis quantitativas. Para a construção das
tabelas era necessário que, enquanto se arrastava a variável desejada,
mantivesse pressionada a tecla “shift”. Caso isso não acontecesse o software não
construía a tabela de distribuição de frequências, mas calculava a media
aritmética dos dados numéricos.
No caso, se não apertássemos a tecla shift o resultado obtido, que não
seria o esperado, seria uma tabela com o cálculo da média das idades, como o
apresentado na figura 16.
Figura 16: Tabela com o valor da média
Como solução correta para essas questões, esperávamos que o professor
construísse as tabelas de distribuição das frequências apresentadas a seguir.
137
Tabela 13: Tabela de distribuição de frequências para a variável idade
Tabela 14: Tabela de distribuição de frequências para a variável salário
7ª e 8ª questões:
7) Podemos também construir tabelas combinando algumas variáveis. Por exemplo,
vamos construir uma tabela que mostre o nível de escolaridade dos funcionários de
gênero masculino e feminino.
a) Clique em “new summary table” para construir a tabela;
b) Clique na variável “escolaridade” e arraste até o lado direito da tabel:
c) Agora, clique na variável “gênero” e arraste até o lado de baixo da tabela.
8) Construa uma tabela que mostre os cargos dos funcionários de gênero masculino e
feminino.
138
Estas questões propunham a construção de tabelas de dupla entrada, esta
atividade pode ser tomada como um exemplo de tratamento, conforme Duval,
(2003) uma vez que não mudamos o registro, apenas fizemos uma transformação
nos registros (tabelas de distribuição de frequências) apresentados. Com estas
atividades, pretendíamos que o professor percebesse mais um recurso do
software que é a construção de tabelas de distribuição de frequência envolvendo
duas variáveis distintas.
Como solução da questão, esperávamos que o professor elaborasse
uma tabela igual à apresentada na questão. A tabela para a questão é
apresentada nos dados da tabela 15.
Tabela 15: Tabela de dupla entrada para as variáveis gênero e cargo
9ª e 10ª questões
9) Você acredita estar claro, neste momento da atividade, para o aluno as diferenças entre
as variáveis qualitativas e as quantitativas?
10) O fato do Fathom trabalhar todas as variáveis de estrutura numérica como uma
variável quantitativa contínua pode dificultar a aprendizagem deste conceito? Se sim,
qual (is) procedimento (s) podemos tomar para que isso não aconteça?
Com estas duas questões, queríamos identificar os elementos do
conhecimento pedagógico do professor para os fatores abordados nelas. E
mostrar ao professor um obstáculo do trabalho com este software, pedimos para
que ele nos indicassem maneiras de minimizar este obstáculo.
139
Análises a posteriori
Após o trabalho com as diversas variáveis que compõem o banco de dados
a professora B não afirmou que os alunos não fariam a distinção entre elas. Ela
relatou que poderia até ser que eles conseguissem realizar esta classificação,
talvez, nesse momento pudéssemos perceber um avanço no conhecimento
pedagógico e no conhecimento específico, mas para que isto aconteça novos
conceitos devem ser criados e/ou antigos devem ser reestruturados de maneira
correta.
A professora começou a ter a percepção exata da distinção após responder
às questões da sequência e das discussões que tivemos, pelo seu discurso
pudemos notar isso. Então, podemos dizer que a sequência influenciou esta
professora, pelo menos, nesse conceito.
Protocolo 35: Resposta da professora B para a décima questão da parte A
Na 10ª questão, as respostas obtidas foram as seguintes:
Protocolo 36: Resposta da professora A para a décima primeira questão da parte A
140
Protocolo 37: Resposta da professora A para a décima primeira questão da parte A
Em relação ao fato do software trabalhar todas as variáveis de estrutura
numérica, como as quantitativas contínuas a professora A acreditou não ser um
obstáculo, se o conceito fosse bem trabalhado com os alunos anteriormente ao
uso do computador e explicado aos alunos que este software tratava as variáveis
desta maneira. A professora B acreditou ser um obstáculo e que a maneira de
resolvê-lo seria com a alteração das ferramentas do FATHOM. Assim, deveria se
criada uma função que fizesse essa distinção. É interessante lembrarmos que
esta professora o aprovou totalmente o software, mostrando resistência a ele,
algumas vezes, relatou que algumas questões poderiam ser realizadas no Excel,
que é um software mais conhecido e, portanto, mais fácil de trabalhar.
Além disso, o Excel faz a distinção entre gráfico de colunas e histograma.
Efetivamente, o conhecido provoca mais segurança do que o desconhecido, e
alguns livros de Estatística trazem os comandos do Excel. Lembramos que
nosso trabalho é sobre o uso dos registros de representação semiótica e os níveis
de letramento estatístico, e que o software FATHOM é apenas uma ferramenta
que nos auxilia a alcançar nosso objetivo.
Até o momento de nossa fase experimental, observamos que para alguns
conteúdos, foi possível perceber um avanço nos conhecimentos específicos por
parte das professoras, como por exemplo, variáveis estatísticas. Em relação aos
conhecimentos pedagógicos, ainda notamos pouca preocupação por parte das
professoras.
141
IV.3 Análises a priori e a posteriori da segunda fase da parte A das
atividades de familiarização com o software Fathom
1ª questão:
Nesta fase, utilizaremos o software Fathom para construir os gráficos, que constituem um
outro tipo de representação de uma Distribuição de Freqüências.
a) Clique no ícone para construir o gráfico, e arraste até a tela;
b) Clique na coluna variável “gênero” para selecioná-la e arraste até a área do gráfico,
sobre a caixa drop na anttribute here”.
Este gráfico é chamado “diagrama de colunas”, e é normalmente utilizado para representar
variáveis qualitativas ou mesmo variáveis quantitativas discretas. Ele coloca em evidência a
comparação entre os valores observados.
142
Esta questão apenas mostra como construir gráficos no Fathom.
Acreditamos que esta segunda fase seja muito importante, pois após trabalhar
com as tabelas de distribuição de frequência este será o primeiro momento que o
professor terá acesso a outro registro de representação semiótica para os dados
observados.
Como solução da questão, esperávamos que o professor construísse a
representação gráfica para a variável gênero desenhada no enunciado.
Nesta questão, também, apresentamos uma informação relevante sobre o
diagrama de colunas, que acreditamos ser relevante para o professor recordar
qual o uso correto para este tipo de representação gráfica.
2ª e 3ª questões:
2) Clique no ícone “bar chart” escolha outro tipo de gráfico. O que você observa? É o
mesmo tipo de comparação que ele representa?
2.1) Em sua opinião, os alunos percebem a distinção dessas duas representações?
Qual delas proporciona maior possibilidade de compreensão? Por quê?
3) Construa os gráficos para as variáveis cargo” e “escolaridade”.
Para estas questões, o professor precisaria construir outras representações
gráficas, às outras variáveis envolvidas na pesquisa. Esta é uma maneira dele se
familiarizar com a ferramenta do software, além de perceber que, com os mesmos
dados, o Fathom apresenta diferentes representações.
Mais especificamente na segunda questão, o professor precisaria perceber
que, quando mudamos de “Bar chart” para “Ribbon chart”, o software passa a
trabalhar com os valores relativos (percentuais) e não mais absolutos. Aqui se
pode notar uma conversão ao nível da teoria das representações semióticas de
Duval, embora as duas representações sejam gráficas, uma está disposta no eixo
cartesiano, indicando valores absolutos, enquanto a outra trabalha com a
representação parte/todo, com porcentagem. Desta forma, percebemos que elas
não permanecem no mesmo sistema, para que seja considerado um tratamento,
altera o conteúdo da representação, uma vez que “Ribbon chart” é equivalente ao
diagrama de setores.
143
Como solução para a questão, esperamos que seja a representação
gráfica do “Ribbon Chart” (como o que está apresentado abaixo). Com a análise
destas duas representações gráficas, consideramos que o professor perceba que
o “Ribbon Chart” parece com o gráfico de setores, mas para que aconteça esta
percepção acreditamos que o nível de letramento estatístico tenha de ser entre o
funcional e o cientifico, pois é necessário que o professor compreenda as
propriedades do gráfico de setores para então conseguir fazer a associação.
Também acreditamos na necessidade das apreensões discursivas e operatórias
para que seja possível ser feita comparação.
Gráfico 18: Representação gráfica “Ribbon Chart” para a variável gênero
Como solução da 3ª questão, esperávamos apenas as construções de
outros gráficos (apresentados abaixo), mas a questão não solicita alguma
explicação ou análise dos dados. Ou seja, é mais um item de familiarização com o
software, para que o professor aproprie-se dessa ferramenta para incorporar tal
apropriação a seus saberes.
144
Gráfico 19: Gráficos de colunas para as variáveis cargo e escolaridade
Análise a posteriori
Apresentamos os protocolos com as respostas das professoras para esta
questão:
Protocolo 38: Resposta da professora A para a questão 2 da segunda fase da parte A
Protocolo 39: Resposta da professora B para a questão 2 da segunda fase da parte A
Em relação à questão 2, ambas as professoras afirmaram que a distinção
entre as duas representações gráficas ocorreu pelo fato de uma utilizar valores
absolutos e a outra trabalhar com valores relativos. Assim, não percebemos
145
indícios de nenhuma das duas ao analisar o “ribbon chart”, como uma
representação gráfica que realiza uma comparação parte/todo diferente do “bar
chart”, mas notaram a diferença de conteúdos entre as duas representações.
Cardoso (2007) afirma que, muitos professores não conseguem explicar suas
construções, desta forma, podemos conjecturar que, talvez, elas não conheçam a
distinção do uso entre as duas representações gráficas.
A seguir, optamos por colocar apenas um protocolo para a questão 2.1.)
pois as duas professoras fizeram basicamente o mesmo relato:
Protocolo 40: Resposta da professora A referente a distinção de duas representações gráficas.
As duas professoras salientaram que, no momento de escolher uma das
duas representações, os alunos teriam mais facilidade com a comparação
realizada pelo gráfico de colunas (Bar chart). Isto pode ter acontecido, pelo fato
desta representação gráfica estar mais presente nos livros didáticos (comparação
entre as partes), já que a comparação parte/todo, quando feita nos livros didáticos
acontece com o gráfico de setores que basicamente possui as mesmas
propriedades do Ribbon chart, mas seu design é diferente.
Novamente citamos Canossa (2009) quando este afirma que os
professores limitam-se ao que é abordado nos livros didáticos. Optamos por
colocar apenas um protocolo, uma vez que as duas professoras fizeram
basicamente o mesmo relato.
146
4ª e 5ª questões:
4) Construa agora um histograma para a variável idade. (Escolha o Histogram).
5) Construa um gráfico de pontos para a variável idade” (Escolha :Dot Plot). Explique a
diferença entre os dois gráficos. Como você explicaria a variação dessa variável pela
observação dos dois gráficos?
5.1) Como os alunos podem perceber estas distinções entre o tipo de informação
fornecida em cada gráfico?
Obs.: A variável idade” é uma variável quantitativa contínua, mas pode ser tratada como
discreta, por ser apresentada em número de anos completos (uma contagem). O
software Fathom, por definição, trata toda variável numérica como contínua. Então,
para construir o gráfico Histograma, o software faz uma correção de continuidade”,
ou seja, soma e subtrai meia unidade ao valor da variável, construindo assim um
intervalo e propiciando a percepção da continuidade. Sendo assim, para variáveis
discretas, é mais adequado utilizar o gráfico Dot Plot (neste tipo de gráfico, cada
ponto representa um valor observado).
Estas questões têm como objetivo a construção de gráficos às variáveis
quantitativa, além de trazer ao professor uma informação bastante importante em
relação ao software usado na pesquisa, caso o professor realize atividades com o
software Fathom em suas aulas, ele já terá conhecimento do modo como o
software trata as variáveis quantitativas.
Como solução da questão, esperávamos a construção do histograma no
software, como o apresentado no Gráfico 20.
Gráfico 20: Histograma para a variável idade
147
Na 5ª questão, esperávamos como solução a construção do Dot-plot”
(esta representação encontra-se no Gráfico 21), além da construção esperava-se
que o professor percebesse que o dot-plot é uma representação gráfica mais
próxima do gráfico de colunas do que o histograma. Assim, o gráfico de colunas é
utilizado para a representação de variáveis qualitativas e quantitativas discretas, e
o histograma é usado para a representação de variáveis quantitativas contínuas.
Em nossa sequência, como o tratamento utilizado para a variável idade
(tempo variável contínua) é discreto, seria mais adequado à representação “dot-
plot”. Neste momento, poderíamos evidenciar uma limitação do software para as
variáveis quantitativas discretas, o que poderia ocasionar um obstáculo didático,
caso não fosse bem trabalhado pelo professor com seus alunos. Como foi
abordado na questão anterior.
Gráfico 21: Gráfico de pontos (Dot Plot) para a variável idade
Análise a posteriori
A seguir, as respostas das professoras para as questões:
148
Protocolo 41: Respostas da professora A para as questões “5” e “5.1” da segunda fase da parte A
Protocolo 42: Respostas da professora B para as questões “5” e “5.1” da segunda fase da parte A
A professora B relatou que o tratamento dado por cada gráfico foi diferente,
tanto que disse que um (gráfico de pontos) é utilizado para representar variáveis
discretas, e que o histograma é representado para as contínuas. Vale lembrar que
o dot-plot não é trabalhado na Escola Básica. Ela, também, salientou que esta
conclusão é possível pela observação das representações, em que uma possui
colunas “juntas” (dando indícios de continuidade) e a outra, pontos separados (o
que indica tratamento discreto). Seus relatos escritos foram bastante
simplificados, mas também apresentaram esta informação. Aqui podemos
149
perceber que a professora B encontra-se em um nível funcional de letramento
estatístico, já que realiza uma análise, além do que é observado.
Em relação à professora A, citou que o histograma trabalha com dados
agrupados, e que o gráfico de pontos, com dados simples. Em nenhum momento,
relatou sobre a continuidade ou o das variáveis. Aqui percebemos novamente
uma forte influência do livro didático, pois respondeu que o histograma é a melhor
escolha e, em sua justificativa, referiu-se que a representação do gráfico de
pontos é mais difícil, isto pode ter acontecido pelo fato dos livros trazerem mais a
representação de histogramas e gráficos de colunas que gráfico de pontos.
Vale ressaltar que os currículos não contemplam o gráfico de pontos; no
entanto, no discurso das professoras percebemos que elas se interessam por
esta representação semiótica e disseram que pode ser um facilitador para a
conversão de uma tabela para o registro gráfico, antes da construção de, por
exemplo, um gráficos de barras.
6ª questão:
6) Agora, no gráfico da variável nero, clique sobre a barra que indica o gênero
masculino. O que você observa no banco de dados e nos outros gráficos?
6.1.) Em relação a esta ferramenta do software, você acredita ser um facilitador para a
compreensão da inter-relação entre as representações apresentadas?
150
Esta questão apresenta para o professor mais uma ferramenta do software
em que é possível selecionar, em todos os registros presentes na tela, uma
característica comum a alguns elementos da pesquisa. Na atividade, pedimos que
o professor selecionasse (clicando em cima) a barra do gênero masculino, com
isso o Fathom seleciona em todos os demais gráficos e, também, no banco de
dados os gêneros masculinos.
Com o auxílio do ambiente informatizado, seria possível ressaltar a relação
entre os registros de representação semiótica que se torna mais visível, uma vez
que todos são construídos rapidamente e relacionam-se. Temos a visão
simultânea de vários registros de uma única vez e a interação dos dados nas
diversas representações, o que não pode ser feita fora do ambiente, nem temos
conhecimento de outro ambiente que o faça.
Com essa ferramenta (selecionar um dado especifico da pesquisa)
podemos perceber com maior facilidade e clareza que as diversas representações
realizadas no Fathom referem-se ao mesmo objeto de estudo, ou seja, ao mesmo
banco de dados. Segundo Duval, os objetos matemáticos somente são
compreendidos de forma global por suas diferentes representações.
Como solução desta questão, esperávamos que o professor percebesse
que o gênero masculino ficou destacado em todas as representações.
Análise a posteriori
A seguir, os protocolos com as respostas das professoras:
Protocolo 43: Resposta sobre a ferramenta do software que realiza a inter-relação entre os
diferentes registros apresentados na tela
151
Protocolo 44: Resposta da professora A à questão 6.1. da segunda fase da parte A
Protocolo 45: Resposta da professora B à questão 6.1. da segunda fase da parte A
Em relação à ferramenta do software de destacar todos os itens referentes
da mesma variável selecionada, as professoras perceberam que isso acontece,
mas não relataram nada sobre o ganho cognitivo com o uso desta ferramenta. No
entanto, na última questão da pesquisa, em que foram pedidas algumas análises,
elas utilizaram esta ferramenta, como um facilitador para conseguir as respostas.
A professora B acredita que isto facilitaria a compreensão das inter-relações entre
as variáveis e, além do mais, disse que poderia ser um facilitador para a análise
dos dados.
Acreditamos, sobretudo porque ambas utilizaram deste recurso na análise
dos dados e pelos discursos também, que elas perceberam que este era um
facilitador da análise dos dados que o ambiente informatizado nos proporciona,
diferente do ambiente lápis e papel. Ou seja, essa ferramenta do software parece
passar a integrar os saberes dessas professoras, visto que seu discurso mostrou
a percepção da importância da articulação entre os registros de representação
semiótica.
152
IV.4 Análises a priori e a posteriori da terceira fase da parte A das
atividades de familiarização com o software Fathom
1ª e 2ª questões:
1) Construa uma tabela de distribuição de freqüências para a variável “idade”, da mesma
maneira que você fez na primeira fase, mas agora sem apertar a techa shift (somente
arraste a variável até a tabela).
Observe que apareceu somente um valor na tabela. Este é o valor da “média aritmética”
para a variável “idade” (no Fathom, quando construímos tabelas de variáveis quantitativas, se
não mantivermos apertada a tecla shift, a tabela mostra a média aritmética).
A média aritmética é uma medida que resume e representa um conjunto de dados
em um único valor. A média de um conjunto é o valor ao redor do qual os valores
observados se distribuem, é calculada como a soma dos valores dividida pelo número
total de observações. Podemos fazer uma analogia entre a média de um conjunto de
dados e o fiel de uma balança em equilíbrio.
2) Seguindo o mesmo procedimento, obtenha o valor da média aritmética para a variável
“salário”.
Nestas duas questões, o professor teria de encontrar o valor da média das
idades e dos salários, utilizando a ferramenta do software. Vale ressaltar que o
Fathom não apresenta, como foi realizado este cálculo. Ele apenas viabiliza o
resultado final. Como estamos trabalhando com professores, não acreditamos ser
um obstáculo didático; no entanto, se este resolver tratar das medidas-resumo
com seus alunos, este ambiente informatizado apenas contribuiria em parte.
Poderá ser usado como ferramenta de validação do resultado do cálculo ou como
ponto de partida do processo de análise.
Quanto às medidas-resumo, o software calcula apenas os resultados finais,
não apresenta os algoritmos, nem os procedimentos utilizados para encontrar os
valores apresentados. No entanto, uma ferramenta bastante interessante do
software é apresentar essas medidas nos registros gráficos, auxiliando na
percepção da integração entre registros do mesmo objeto e as distribuições de
153
frequências. Estas representações gráficas serão trabalhadas posteriormente,
nesta mesma fase da sequência.
As construções esperadas para a questão foram as duas seguintes
representações:
Figura 17: Valor da média de idades e da média salarial
3ª questão:
Iremos agora representar o valor da média no gráfico.
a) Construa um gráfico (histogram) para a variável “salário”;
b) Clique em “graph”, “plot value”;
c) No menu que se abrirá, clique em “functions”, “statistical”, “one attribute”.
d) Clique (duas vezes) em “mean”, em seguida clique em “OK”.
154
Veja o gráfico:
“A média sozinha é suficiente para que se possa analisar um conjunto de dados? Pense,
por exemplo: Qual o intervalo de variação dos valores observados? Qual é a posição da média
dentro deste intervalo?”.
Uma outra medida que podemos utilizar para sintetizar e representar um conjunto de
dados é a mediana. A mediana é o valor que ocupa a posição central dos dados
ordenados, ou seja, é o valor que é maior ou igual a 50% dos dados ordenados e menor
ou igual a 50% dos dados observados. Podemos fazer uma analogia entre a mediana e o
ponto médio de um segmento.
Nesta questão, o professor deparou-se com uma conversão de registros
em relação ao anterior (conversão do valor numérico da medida para o registro
gráfico), pois agora o valor da média foi apresentado no registro gráfico. Com os
questionamentos realizados, esperávamos que o professor percebesse que a
média sozinha não era suficiente, e o desvio-padrão deveria ser associado para
que tivesse sentido em relação aos dados observados.
A sequência teve sua continuidade com o estudo dos quartis e não com o
estudo do desvio-padrão. No entanto, Vieira relata que:
Em nossa seqüência, optamos por não trabalhar diretamente com
o desvio-padrão, e ao invés disso, passamos para o estudo da
mediana e dos quartis, cognitivamente menos complexos do que a
variância e o desvio-padrão, e que permitam a introdução de mais
um registro de representação semiótica: o Box-plot. (VIEIRA,
2008, p. 112)
Não modificamos a ordem da sequência proposta por Vieira (2008), não
porque as medidas-resumo, variância e desvio padrão, são mais complexas do
que mediana e quartis, uma vez que estamos trabalhando com professores, mas
155
porque acreditamos ser interessante abordar um novo registro de representação
semiótica, Duval (2003) afirma que os objetos somente são compreendidos
plenamente pelo entendimento de seus registros de representação.
Percebemos que o professor, para responder às perguntas propostas,
precisa fazer uma leitura além dos dados apresentar uma apreensão operatória e
possuir um nível funcional de letramento estatístico.
4ª e 5ª questões:
4) Na mesma tabela da média das idades (construída no item 1), vamos mostrar também a
mediana.
a) No Fathom, clique na tabela acima, depois em summary”, “add formula”.
b) No menu, clique em “functions”,”statistical”, “one attribute”. Clique (duas vezes)
em median” e “OK”.
Você terá o valor que ocupa a posição central nas idades ordenadas.
5) Representaremos a mediana no gráfico (pode ser no mesmo gráfico do item 3).
a) Clique no gráfico da variável salário no qual você construiu a média;
b) Clique em “graph”, “plot value”
c) No menu que se abrirá, clique em “functions”, “statistical”, one atribute”,
“median” (duplo clique).
156
Analogamente, como foi trabalhada a média, trabalhamos nestas questões
a mediana, mostrando ao professor os dois registros para a medida, tanto o valor
como a localização desse valor no histograma (representação gráfica). Aqui
percebemos uma apreensão discursiva para atribuição de significados.
Assim, acreditamos ser de grande importância que estas medidas sejam
calculadas na mesma tabela e apresentadas no mesmo gráfico pois, desta forma,
a visualização de suas diferenças ficará mais aparente e possíveis confusões
entre estas medidas poderão ser sanadas. Ambas são medidas de tendência
central e, algumas vezes, são representadas pelo mesmo valor, quando a
distribuição é simétrica. Diversas pesquisas, entre elas Novaes (2004) e Canossa
(2009) mostram a confusão entre elas.
Como solução para as questões, esperávamos a construção do valor
dessa medida na tabela e a representação desse valor no gráfico. Em ambos os
casos, o próprio enunciado indica como estes devem aparecer na tela do
software.
Para dar significado à mediana, pela observação do gráfico é necessário
que o professor faça uma transformação (DUVAL, 2003), “empilhando”
mentalmente as colunas (as quatro primeiras) e as seis outras, comparando os
resultados obtidos que devem ser iguais.
6ª questão:
6) Como os valores representados se distribuem em relação a média? E em relação à
mediana?
6.1.) Na sua opinião, os alunos tem clareza da distinção destas duas medidas? Caso não
tenham esta clareza, por que isso acontece?
Para responder à questão, esperávamos que o professor analisasse os
resultados obtidos anteriormente e, com isso, percebesse como esses valores se
relacionam com o conjunto de dados.
Em relação à média, esperava-se que o professor percebesse que essa
medida é o valor em torno do qual os outros se distribuem, que não precisa ficar
157
necessariamente “no meio” do conjunto de dados e que a análise completa desse
valor, para saber sua representatividade para os elementos pesquisados,
somente estará completa quando pareada a uma medida de variabilidade, como o
desvio-padrão. Para esta medida, o professor deveria percebe que quanto menos
simétrica for a distribuição de frequências mais distante da mediana estará o valor
da média aritmética.
Para a mediana, esperava-se que o professor percebesse que esta medida
divide o conjunto ordenado de dados em dois conjuntos, com exatamente o
mesmo número de elementos.
Para que existam estas conclusões, observamos que o nível de letramento
estatístico deveria ficar entre o funcional e o científico; no entanto, mais próximo
ao científico e que a leitura deveria ser além dos dados, uma vez que o professor
precisa perceber as relações entre os valores encontrados, suas representações
e a possibilidade de se determinar a variabilidade dos dados em relação à média
para que a análise seja completa.
A articulação entre os registros tabular e gráfico é fundamental para a
atribuição de significado.
Análise a posteriori
A seguir, apresentamos os protocolos com as respostas das professoras:
Protocolo 46: Respostas da professora A para as questões “6” e “6.1.” da terceira fase da parte A
158
Protocolo 47: Respostas da professora B para as questões “6” e “6.1.” da terceira fase da parte A
A professora B trouxe em seus relatos indícios dos conceitos de média e
mediana corretamente, mas não conseguiu escrever no papel exatamente o que
significa uma medida e a outra, assim verificamos que ela percebeu a distinção
entre as duas. a professora A trouxe uma resposta muito subjetiva, não nos
mostrou em seu relatos (escritos e orais) a diferença entre as duas medidas.
Ambas acreditavam que os alunos teriam dificuldade de perceber a
distinção entre as duas medidas e justificaram. A professora A disse que isso
acontece pela dificuldade que os alunos têm para interpretar, e a professora B
que isso acontece, pois os alunos apenas calculam as medidas e não se
preocupam se esta é ou não solução para o problema em questão.
O fato é evidenciado por Silva (2007), ao perceber que os professores não
utilizam as medidas de Tendência Central, como ferramentas de análise de
dados. Podemos, assim, conjecturar que os alunos apresentam dificuldade para
compreender as medidas, pois o ensino usual limita-se apenas ao cálculo dessas
medidas.
Nessa questão, podemos dizer que a professora B encontra-se entre os
níveis cultural e funcional de letramento estatístico, ou seja, em um processo de
159
transição entre um nível e outro, que em seus relatos orais ela conseguiu
diferenciar as duas medidas envolvidas, mas apresentou dificuldade para
escrever estes conceitos.
7ª questão:
Vamos determinar, além da mediana, dois valores tais que 25% das observações
ordenadas serão menores ou iguais a um deles e 75% serão menores ou iguais ao outro. Tais
valores são denominados, respectivamente, primeiro quartil e terceiro quartil. Note que a
mediana representa o segundo quartil.
Para representar os quartis, utilizaremos ainda o mesmo histograma da variável salário.
a) Selecione o gráfico e clique em graph”, “plot value”.
b) No menu, clique em “functions”, “statistical”, “one attribute”, “percentile” (duas
vezes)
c) Na caixa de funções aparecerá “percentile ( )”. Dentro dos parênteses escreva (25,
salario), e clique em “OK”. Você terá representado no gráfico o primeiro quartil
d) Repita o mesmo procedimento, e na caixa da função percentile, escreva (75, salario), e
clique em OK”. Será representado o terceiro quartil.
160
Nesta questão, apresentamos a construção, no ambiente computacional,
das representações do primeiro e terceiro quartis. A pergunta apresenta o
conceito de quartis, isto é, de muita importância visto que, muitas vezes, não é
possível verificar um trabalho efetivo dos professores sobre este conceito, uma
vez que o conceito de “quartis” não faz parte do currículo da Escola Básica
Com o estudo dos quartis, ressaltando a mediana, como segundo quartil,
as diferenças entre as medidas média e mediana evidenciam-se, já que os quartis
separam os dados em 25%, 50% e 75%, e a média é o valor que os outros dados
se distribuem ao redor.
Aqui não pedimos nenhuma interpretação nem análise dos resultados
obtidos, mas limitamo-nos apenas aos procedimentos para a localização das
medidas no histograma.
Vale ressaltar que, da mesma maneira que a média, o software não
apresenta os cálculos e/ou o algoritmo utilizado para se determinar os valores dos
quartis. Logo, aqui também devemos levar em conta que quando se trabalha com
alunos no ambiente informatizado, o Fathom apenas contribui em parte para
esses conceitos. A atividade deveria, assim, ter foco no significado e na análise, e
não no procedimento algorítmico.
8ª questão:
Uma representação gráfica envolvendo quartis, mediana, valor máximo e valor mínimo é o
“box-plot”. No box-plot, define-se uma “caixa” com o limite esquerdo dado pelo primeiro quartil
e o limite direito pelo terceiro quartil. A mediana é representada por um traço no interior da
caixa, e segmentos de reta são colocados da caixa até os valores máximo e mínimo.
Construa um novo gráfico para a variável salário, e no canto superior direito do gráfico,
clique na tela e selecione box-plot, para representar este gráfico.
161
O intuito desta questão foi apresentar uma nova representação gráfica para
o professor que poderia comparar essa representação gráfica com a anterior. O
box-plot é uma representação que, muitas vezes, não é conhecida. Além disso,
segundo Vieira:
Nesta fase, era esperado que o aluno comparasse os dois
gráficos relacionando a mediana, os quartis e os valores máximo e
mínimo da distribuição. Consideramos que a seqüência de passos
necessária para a passagem do histograma para o box-plot
caracteriza uma apreensão seqüencial, na perspectiva de Duval,
e, para realizar tal apreensão, é necessário que o aluno atinja
nível de leitura “alem dos dados. (VIEIRA, 2008, p. 116)
Aqui, esperávamos que o professor percebesse que a representação
gráfica “Box-plot” trazia muitas informações. Neste gráfico, as medidas-resumo
estão representadas de uma maneira de fácil compreensão. No entanto, pode ser
que isso não tenha acontecido pelo fato dessa representação não ser muito
conhecida, como vimos em pesquisas recentes, os professores, muitas vezes,
nunca tiveram contato com esta representação e apresentam dificuldades para
construí-la, sobretudo, para compreendê-la.
9ª e 10ª questões:
9) Em relação aos últimos gráficos utilizados para representar os quartis responda:
Qual tipo de gráfico você prefere? Justifique
9.1.) Um aluno, na tentativa de explicar para um colega, a relação de dimensões
diferentes à mesma porcentagem (fato que acontece no box-plot) fez a seguinte
colocação: “É fácil, se a gente pensar em duas latas de sardinha com três
sardinhas dentro, na lata grande as sardinhas estão mais espalhadas, mas, na
pequena, as três ficarão pertinho uma da outra, e de qualquer forma as duas tem a
mesma quantidade”. Como você avalia esta explicação?
10) Compare os dois tipos de gráficos, dizendo as principais diferenças entre eles e quais
informações são mais evidentes em um ou em outro.
Na questão, solicitamos que o professor escolhesse o gráfico que
acreditasse representar melhor os quartis. No entanto, pedir que faça esta
escolha se faz apenas por motivos didáticos, para instigar a observação pelos
dois registros, pois pela análise exploratória de dados o correto é trabalhar
simultaneamente com os dois registros, uma vez que, desta forma, poderemos ter
mais informações.
162
No momento de comparar as duas representações gráficas esperávamos
que o professor percebesse que ambas mantêm o conteúdo das medidas-
resumo: média, mediana e quartis, mas, que os valores são mais visivelmente
representados pelo Box-plot. No histograma, a quantidade de indivíduos para
cada observação é mais evidente, o conteúdo principal são as frequências,
enquanto que no box-plot o conteúdo principal é a distribuição dos elementos em
quattro grupos com o mesmo número de elementos.
Em relação à preferência dos gráficos, esperávamos que o professor
justificasse sua escolha, evidenciando as propriedades de cada representação e
não pelo uso rotineiro de uma delas. Para que a justificativa de sua escolha fosse
feita pela visualização das medidas em cada gráfico e pelas propriedades de cada
representação, acreditávamos na necessidade de um letramento entre o funcional
e a científico, dependendo das justificativas levantadas pelo professor. Aqui
também fazia necessário no mínimo uma leitura entre os dados, para que esta
justificativa pudesse ter alguma coerência.
Análise a posteriori
A seguir, as respostas das professoras á questão 9:
Protocolo 48: Resposta da professora A referente a representação gráfica box-plot
163
Protocolo 49: Resposta da professora B referente a representação gráfica box-plot
Acreditamos que a professora A tenha tido mais familiaridade com esta
representação, uma vez que para representar os quartis ela a escolheu,
justificando que a representação destas medidas é de visualização imediata. A
professora B, também, conhece o box-plot, mas relatou que preferiu utilizar o
histograma. Neste caso, conjecturamos, que possuía maior familiaridade com
esta representação, uma vez que o box-plot não consta no currículo da Escola
Básica.
Seguem os protocolos da questão 9.1.:
Protocolo 50: Resposta da professora A para a questão 9.1. da terceira fase da parte A
164
Protocolo 51: Resposta da professora B para a questão 9.1. da terceira fase da parte A
Para o item 9.1., a professora A disse que era bastante interessante a
explicação da criança; no entanto, não se faz suficiente, pois é preciso outros
exemplos e, trabalhar com a média e a mediana diferentes. a professora B
gostou da explicação dada pela criança; no entanto, em seu relato houve um
equívoco na justificativa, quando ela afirmou que na segunda parte (lata menor),
as sardinhas estavam mais dispersas (há uma variação maior).
Para esta questão, percebemos em alguns relatos um letramento funcional
por parte das professoras e em outros momentos apenas cultural.
Notamos, também, que a professora A ainda não compreendeu
efetivamente o conceito de quartis e sua aplicação. Continua usando, como
referência apenas a média, que é a medida mais trabalhada na Escola Básica.
Estudos, como os de Bigattão (2007), Cardoso (2007) entre outros, indicam que
os quartis também são pouco abordados nos cursos de Licenciatura em
Matemática.
165
A seguir, os protocolos da questão 10.
Protocolo 52: Resposta da professora A para a comparação do histograma e o box-plot
Protocolo 53: Resposta da professora B para a comparação do histograma e o box-plot
A resposta da professora A para as diferenças entre as duas
representações foi muito superficial (mesmo em seus relatos orais), não nos
permitindo conjecturar se ela realmente compreendeu as diferenças entre as duas
166
representações, nada foi acrescentado em relação à resposta anterior. Já a
professora B, separou a explicação de cada uma das representações,
evidenciando o que cada uma possui, mas não realizou um paralelo entre as
duas.
Ambas as professoras perceberam a importância de se trabalhar com as
diferentes representações, concordando com Duval que a escolha da
representação depende do que se pretende responder, esta percepção é
fundamental no desenvolvimento da Análise Exploratória de Dados.
Para esta questão, acreditamos que o nível de letramento estatístico fosse
o funcional (para as duas professoras), uma vez que, nenhuma delas conseguiu
realizar um paralelo entre as principais diferenças e as informações mais
evidentes entre as duas representações gráficas, mas sabiam os termos e seus
significados e tinham a percepção da variação, “espinha dorsal” da análise
estatística.
Após as professoras responderem às questões, também, houve um
momento de comentários orais sobre as duas representações, a fim de
institucionalizar estes conceitos. Comentamos que as medidas-resumo
apresentadas pelo box-plot são imediatas e de fácil compreensão e que o
principal fator abordado pelo histograma eram as frequências. No entanto,
ressaltamos que o box-plot não é uma representação gráfica trabalhada na
Escola Básica
11ª e 12ª questões:
Veremos agora como inserir uma nova coluna no banco de dados inicial. Vamos assim
considerar a distância entre cada valor observado para a variável “idade” e o valor obtido para
a média. Chamaremos cada uma dessas distâncias de “desvio”. Podemos nomear esta nova
coluna de “idadedesvios”.
a) Na tabela, clique em <new> e insira o título para a coluna;
b) para calcular os desvios, clique na coluna “idadedesvios”;
c) No menu, clique em edit”, “edit formula”;
d) Na caixa, escreva idade-mean(idade)” e clique em OK” (será calculado para cada
valor da variável, a diferença entre o valor observado e a média aritmética).
167
12) Observe o resultado na tabela. O que significa o resultado “positivo” nesse cálculo? E
o “negativo”?
Nesta questão, as instruções apresentadas ao professor facilitam a
construção dos desvios observados entre a idade e a média aritmética das
idades. Deveria também compreender que a soma dos desvios é sempre igual a
zero.
168
Como solução da questão 11, esperávamos que o professor construísse
uma nova coluna no banco de dados com os valores dos desvios entre as idades
e a média das idades, com o auxílio do ambiente informatizado.
Para a questão 12, esperava-se que o professor percebesse que os
desvios apresentados eram em relação à média das idades, por isso há valores
negativos e valores positivos. Ele deveria relatar que, quando o valor da idade for
maior do que a média, a diferença se positiva, e que o resultado negativo
acontece quando o valor da idade é menor do que a média, a diferença se
negativa.
Aqui, acreditamos ser necessário, pelo menos, um nível funcional de
letramento e uma apreensão discursiva da representação tabular.
Análise a posteriori
Em relação aos desvios das idades em relação à média, as professoras
constataram, conforme esperado que os positivos eram os que possuíam a idade
maior que a média e os negativos os que possuíam a idade menor do que a
média. Em nenhum momento elas evidenciaram o motivo deste acontecimento,
talvez porque tenham percebido isso apenas pela observação da tabela ou talvez
ainda porque realmente compreenderam o comportamento dos desvios em
relação à média.
Nos comentários, nenhuma citou o fato de que como os dados se
distribuem ao redor do valor médio, é de se esperar que a soma de todos os
desvios seja igual a zero. As justificativas dadas e os diálogos indicaram que a
apreensão foi discursiva, mas o ainda operatória. Também não cogitaram
mudar a representação para favorecer ou simplificar o tratamento numérico das
células.
169
13ª, 14ª e 15ª questões:
Vamos inserir os desvios na tabela de distribuição de freqüência da variável idade (que foi
construída na primeira fase da atividade).
Clique na coluna “idadedesvios”, e arraste até o canto esquerdo da tabela
14) Construa também uma coluna para os desvios da variável salário, e depois insira na
tabela de distribuição de freqüências do salário.
15) Em sua opinião, como os alunos interpretam o fato da adição de todos os desvios
resultar em zero?
Como construção da tabela de distribuição de frequência para os desvios
da variável salário, esperávamos a construção apresentada a seguir. Vale
ressaltar que o intuito desta construção era reforçar que a soma dos desvios
resulta em zero, além de proporcionar ao professor uma nova oportunidade de
utilizar esta ferramenta do software.
Tabela 16: Tabela de distribuição de frequências com os desvios salariais
Summary TableEmpresa
SalarioSalarioSalarioSalarioSalarioSalarioSalarioSalarioSalarioSalario
700 800 850 950 1200 1300 1500 1700 2000 2200
salariodesvios
3
-552.5
1
-452.5
1
-402.5
6
-302.5
1
-52.5
2
47.5
1
247.5
1
447.5
1
747.5
3
947.5
20
0
Row
Summary
S1 =
(
)
count
S2 =
( )mean
A questão forneceria informações para inserir o desvio das idades em uma
tabela de distribuição de frequências. O intuito da construção seria evidenciar que
a soma dos desvios resulta em zero e, isso, esperávamos que o professor
percebesse relatando que isso acontece, pois como os dados se distribuem ao
redor da média, os desvios positivos “anulam” os negativos.
Para perceber isto, com a observação da construção da tabela
apresentando os desvios, é necessário apenas uma leitura dos dados; no entanto,
para compreender o motivo disto acontecer é preciso entender as propriedades
170
da medida-resumo, média e como acontece o comportamento dos desvios em
relação à média e, para isto, é necessário um letramento científico, que implica
a compreensão de propriedade teórica específica.
Análise a posteriori
A professora B disse nunca ter pensado o motivo das soma dos desvios
resultar em zero, mesmo depois de questionada resolveu escrever “não sei” para
a questão. A professora e a aplicadora discutiram sobre o assunto, a professora
disse ter entendido e relatou que era lógico isto acontecer, mas preferiu manter a
resposta inicial, antes da discussão (vale lembrar que ela é também pesquisadora
e, por esse motivo, optou por não modificar os fatos, tentando deixar o mais real
possível).
a professora A relatou que os próprios alunos conseguiriam
compreender esta soma ser zero, uma vez que os desvios o cada valor menos
a média (a qual é a medida de equilíbrio da distribuição). No entanto, percebemos
que a explicação dela foi apenas a descrição do algoritmo e não indicou a
compreensão do conceito.
16ª questão:
16) Baseando-se nas atividades desenvolvidas até o momento, responda:
a) Quantos funcionários responderam à pesquisa?
b) Do total de entrevistados, qual é a quantidade de funcionários do gênero feminino?
E do masculino?
c) Em relação ao nível de escolaridade, quantas mulheres têm nível superior? E
quantos homens?
d) Entre as idades observadas, qual a idade máxima e a idade mínima?
e) Qual é o menor salário nesta empresa? E o salário máximo? E a média dos
salários?
f) Quais são os cargos que têm salário acima da média nesta empresa?
g) Quantos funcionários recebem salário abaixo da média nesta empresa?
h) Quantos funcionários do nero masculino recebem salário acima da média na
empresa? E do gênero feminino?
i) Quantos funcionários do gênero feminino recebem mais que R$ 1900,00? E do
gênero masculino?
j) Quantos funcionários do gênero feminino recebem menos que R$ 900,00? E do
gênero masculino?
k) Qual valor você utilizaria para representar o salário desta empresa? Justifique:
171
Neste último item, o professor precisaria responder a algumas questões,
utilizando os diversos registros de representação semiótica que construiu no
Fathom ao longo da pesquisa. Aqui apresentamos questões que, para serem
respondidas seria necessário uma leitura além dos dados nos termos de Curcio.
Para responder aos itens “a)” e “b)”, o professor pode realizar apenas uma
leitura dos dados em uma ou em várias representações de registros construídas
no Fathom. Uma das maneiras de se determinar estas respostas, seria pela
observação da tabela de distribuição de frequências para a variável gênero ou,
até mesmo, pela visualização do gráfico de colunas para esta mesma variável.
Como resposta para o item “a)”, era esperado 20 funcionários e para o item “b)” 7
de gênero feminino e 13 do masculino. Observe aqui que a questão fazia uso de
uma apreensão apenas perceptiva, pois somente com a observação dos dados
apresentados seria possível respondê-la.
O item “c)” requeria uma leitura entre os dados, uma vez que para
responder era necessário combinar as informações referentes às variáveis gênero
e escolaridade. Vale ressaltar que, para resolver este item, o professor poderia
utilizar uma tabela de dupla entrada para as variáveis: gênero e escolaridade
construída facilmente no software. Esta não era a única maneira de solucionar a
questão, pois ele poderia combinar outras representações semióticas, para
encontrar a solução esperada. Caso o professor viesse a construir a tabela de
distribuição de frequências, poderíamos identificar um tratamento ao nível de
Duval da representação do banco de dados, para a tabela de distribuição de
frequências. Como resposta para este item esperava-se que duas mulheres
possuíssem nível superior e três homens possuíssem nível superior.
Tabela 17: Tabela de dupla entrada das variáveis gênero e escolaridade
172
Para responder ao item “d)”, o professor apenas deveria buscar a menor e
a maior idade. Neste caso, salientamos que poderia encontrar, facilmente, a
resposta observando qualquer uma das representações presentes, inclusive, o
“box-plot” que traz estas informações ressaltadas. Vale ressaltar que mesmo que
implicitamente estamos trabalhando com os conceitos de valor máximo e mínimo.
Acreditamos que o professor também poderia se utilizar de diferentes
representações semióticas, além dos distintos recursos que o software nos
possibilita, como por exemplo, a ferramenta de selecionar alguns elementos da
pesquisa (ferramenta esta que apresentamos no final da segunda fase da parte A
desta sequência didática). Como soluções seriam esperadas para a idade
máxima 43 anos e mínima 23 anos.
No item “e)” era preciso que o professor buscasse informações sobre a
variável salário, podendo acontecer em várias representações semióticas para
que suas respostas fossem mais facilmente encontradas. Um exemplo disso era
para determinar os valores de máximo e mínimo da variável e poderia observar o
box-plot que fornece estas informações rapidamente. O valor da média até
poderia ser encontrado também nessa representação gráfica, mas, outra maneira
seria observar, por exemplo, a tabela que apresenta o salário médio.
Para responder a esta questão, seria preciso que se realizasse uma leitura
entre os dados. Como solução do maior salário deveria ser encontrado o valor
2.200, para menor 700 e para média 1.252,50.
Como análise deste resultado, esperava-se que o professor percebesse
que esta distribuição não é simétrica, uma vez que a média dos salários encontra-
se mais próxima do extremo superior. Para isto, acreditávamos ser necessário um
nível científico de alfabetização.
Para o item “f)”, se faz necessária uma leitura além dos dados, uma vez
que o professor precisaria tirar conclusões com a observação da média e das
diversas representações, mas haveria necessidade da intervenção dele,
determinando quais eram os valores maiores do que a média. Em relação ao
letramento estatístico, o nível deve estar entre o funcional e o cientifico. As
respostas esperadas para este item seriam os cargos de encarregado (1.300),
173
vendedor (1.500), gerente (2.100) e engenheiro (2.200). Este item diferiu-se muito
do anterior pelo tipo de questionamento realizado, pois ao invés de apenas
perguntar quais, questionamos quem recebe acima ou abaixo (no caso do item
“g)”) da média salarial.
Os itens “h)”, “i)” e “j)” também se referem à leitura entre os dados. Para
solucioná-los, esperávamos que o professor utilizasse os recursos do software,
criando tabelas de dupla entrada, representações gráficas, cálculos de medidas,
como ele acreditasse ser mais conveniente. Esperávamos como solução para
estes itens: “h)” do gênero masculino cinco funcionários receberiam salário acima
da média, e do gênero feminino três funcionários receberiam salário acima da
média; “i)” apenas uma funcionária receberia salário acima de 1.900, e três
funcionários receberiam mais do que 1.900; “j)” apenas um funcionário do gênero
masculino receberia menos do que 900 e quatro funcionários do gênero feminino
receberiam menos do que 900. Aqui observamos, também, um nível entre o
funcional e o cientìfico para solucionar estes itens.
No último item esperávamos do professor uma leitura além dos dados, uma
vez que ele teria de escolher um salário para representar a empresa, mas mais do
que isto justificar os motivos de sua escolha. Este item não possui uma única
solução, no entanto esperavámos que o professor escolhesse entre as medidas-
resumo e explicasse os motivos de sua escolha. Para fazer esta justificativa
esperávamos que, caso o professor viesse a escolher a média, ele ressaltasse a
importância de se analisar, também, a dispersão dos dados, seja a amplitude
total, seja o desvio-padrão, indicando que ele tem construído o significado de
média como ponto ao redor do qual os demais se distribuem. No entanto, se ele
escolhesse a mediana, que conseguisse justificar os motivos da
representatividade ser feita pelo valor que divide os dados observados ao meio.
Em relação à moda esta seria representada pelo valor mais frequente da
pesquisa.
As justificativas deveriam basear-se na dispersão dos dados e/ou na
simetria ou não da distribuição. O professor, também, poderia justificar pela
complementaridade das informações contidas nas duas medidas, o que
significaria o uso simultâneo das mesmas análises dos dados.
174
Análise a posteriori
Na última questão desta parte de nossa sequência, percebemos que todas
as respostas numéricas das professoras foram, conforme esperávamos em nossa
análise a priori, diferente de nosso piloto, as professoras fizeram uso das
ferramentas do software, arealizaram construções novas quando perceberam
necessidade.
Vale ressaltar que as professoras usaram tanto representações gráficas
como tabulares para suas análises. Percebemos, também, que elas fizeram uso
da ferramenta do software para selecionar os elementos com a mesma
característica, ressaltando que isto é uma grande maneira de agilizar e facilitar o
entendimento das representações. Ou seja, as professoras parecem ter se
apropriado das ferramentas oferecidas pelo software.
No entanto, precisamos fazer uma ressalva para a professora A. Enquanto
ela realizava as construções, em um determinado momento da entrevista ela
“mexeu” no conjunto de dados sem querer, pois mexer no gráfico implica na
alteração dos valores do banco de dados, conforme discutimos no capítulo III.2.
deste trabalho. Desta forma, algumas de suas análises deram-se pelas
representações apresentadas no papel (questões para ela responder).Nesse
caso, podemos afirmar que o software não foi um facilitador e poderia ocasionar
alguns erros, caso ela não tivesse percebido. Se o conceito estiver bem
construído, tal mudança provocaria erro nos valores, mas não na forma da
análise.
175
Figura 18: Modificação no banco de dados pelo manuseio das representações gráficas
Quando observamos o gráfico acima, é quase imperceptível a mudança no
deslocamento da coluna em vermelho à direita.
No item “k)”, percebemos que a professora B escolheu a moda para
representar os salários da empresa e sua justificativa mostrou fortemente essa
escolha. A professora A escolheu a média para representar o salário da empresa
e sua justificativa deu-se pela própria medida, ou seja, não conseguiu explicar os
176
motivos da escolha, apenas justificou dizendo que a média era a medida que
melhor resumia os dados observados. No entanto, elas não apresentaram
nenhuma análise relacionada à dispersão dos dados. Desta forma, acreditamos
que, para este conceito, as professoras apresentem um nível cultural de
alfabetização. Em alguns momentos faziam a leitura além dos dados, mas grande
parte de suas interpretações basearam-se na leitura dos dados ou no máximo
entre os dados.
Na maioria das respostas, as professoras buscaram utilizar o recurso do
software de “iluminar” todos os registros, conforme clicamos em uma das
características. Em outros momentos, também, foi possível observar as
professoras utilizando mais de uma representação para responder às questões.
Neste caso, comentávamos a importância do trabalho com diversas
representações semióticas.
Elas mostraram bastante interesse no trabalho com as inter-relações entre
os diversos registros apresentados e afirmaram a importância de se trabalhar com
a maioria deles. A professora A ficou bastante entusiasmada com o ambiente
computacional, até mesmo dando indícios de querer trabalhar com este ambiente
com seus alunos.
A seguir, trazemos os protocolos com as respostas obtidas pelas
professoras, diferente do teste diagnóstico, em que elas tiveram de realizar
cálculos e/ou construções para responder à questão. Aqui, com o uso do software
e pela observação e manuseio destas representações, elas apenas apresentaram
as respostas finais.
177
Protocolo 54: Respostas da professora A para a questão 16 da terceira fase da parte A
178
Protocolo 55: Respostas da professora B para a questão 16 da terceira fase da parte A
17ª questão:
Quais seriam as possíveis estratégias dos alunos para responder os itens da questão
anterior?
(Observação: Se quiser, leve em consideração o aluno com a possibilidade do uso do
Fathom)
Para essa questão, queríamos perceber se o professor notou a importância
do uso de diferentes registros de representação semiótica, como ele percebeu o
179
uso do ambiente informatizado e se o professor verificou que para solucionar os
itens anteriores, se faz necessário o uso simultâneo de várias representações e,
em alguns casos, a leitura além dos dados. Queríamos também observar a
evolução do conhecimento pedagógico e do conhecimento dos alunos.
Análise a posteriori:
As duas professoras relataram a importância de se utilizar as diferentes
representações semióticas e disseram que as escolhas deram-se pela
necessidade de cada questão.
Protocolo 56: Resposta da professora A para a última questão da terceira fase da parte A
Protocolo 57: Resposta da professora B para a última questão da terceira fase da parte A
Ao observar as respostas das duas professoras, pudemos inferir que o
conhecimento específico do conteúdo ainda não provocou evolução no
conhecimento didático do conteúdo, pois as professoras não relataram as
estratégias utilizadas por seus alunos. Limitaram-se a uma afirmação bastante
genérica que parecia estar fundamentada nas próprias atividades da sequência.
180
IV.5 Análises a priori e a posteriori da parte B da sequência didática
Nesta última parte da sequência didática, propusemos ao professor que ele
analisasse uma atividade, verificando a viabilidade de se construir um plano de
aula com esta atividade.
A atividade instruiria na construção de um relatório sobre as informações
de uma pesquisa, e, para realizar esta pesquisa ele teria de escolher: as variáveis
estatísticas que achasse conveniente, explicar os motivos da escolha das
variáveis; criaria os questionamentos para realização de sua pesquisa;
organizaria os dados das pesquisas. Para isso, deveria utilizar registros diferentes
(tabelas, gráficos e medidas) e escreveria pequenos textos explicativos sobre os
dados encontrados.
Primeira questão:
Vamos supor professor, que você irá trabalhar com os conceitos estatísticos com seus
alunos. Para isto é necessário a construção de um plano de aula para trabalhar estes
conteúdos. Abaixo descrevemos uma atividade que propõe aos alunos a construção de um
relatório sobre os estudantes da sua escola.
O objetivo deste relatório é a criação de uma pesquisa que deve se iniciar pela coleta e
organização dos dados, pela preparação dos registros (tabelas, gráficos, medidas) e se findar
com a organização das informações em um relatório explicativo que deverá ser enviado
“ficticiamente” a um aluno de outra escola.
Professor, gostaríamos que você observasse cada uma das etapas e sugerisse mudanças
(se assim achar conveniente) e relatasse sua opinião de como seria a realização destas etapas
pelos alunos, se eles achariam fácil resolver uma atividade destas, se seria interessante, entre
outras informações que julgar conveniente.
ATIVIDADE PARA SER DESENVOLVIDA COM OS ALUNOS
Suponha que você queira comunicar a um outro aluno, como são os estudantes de sua
escola. Para isso, você irá prepara um relatório que mostre resumidamente as características
principais destes estudantes.
1) Preparação das questões de investigação:
a) Quais dados (físicos, sociais, culturais etc) devem entrar na caracterização do aluno
típico?
b) Seria necessário traçar um perfil para as meninas e outro para os meninos? Por quê?
1.1.) Em sua opinião, como os alunos desenvolveriam esta etapa da atividade?
181
Nesta primeira questão, o professor deveria perceber que aqui tratamos
das variáveis estatísticas, que este é o primeiro momento do aluno pensar nas
variáveis estatísticas pertinentes para sua pesquisa.
Esperava-se que o professor percebesse a importância desta fase do plano
de aula para a organização da coleta de dados que virá a ser feita na próxima
fase. Seria interessante ele ressaltar a importância de se trabalhar com variáveis
qualitativas e quantitativas.
Segunda questão:
2) Preparação da coleta de dados:
- Prepare folhas de registro para os dados que serão pesquisados;
- Escolha as variáveis da pesquisa;
- Peça aos alunos de sua escola que respondam as perguntas da pesquisa.
2.1.) Que tipo de variáveis os alunos escolheriam para descrever os indivíduos de sua
escola?
2.2.) Você acredita que eles levariam em consideração tanto variáveis qualitativas como
quantitativas?
2.3.) Em sua opinião, eles teriam facilidade de realizar esta pesquisa em sua escola?
Para a segunda parte, esperamos que o professor percebesse a
importância da organização e coleta de dados para a pesquisa. Aqui seria
importante que ele relatasse como o trabalho seria realizado pelos alunos, que os
dados pesquisados seriam reais. Esta é uma maneira de motivá-los, pois no final
da pesquisa, com a construção do relatório, conseguirão traçar um perfil dos
estudantes de sua escola.
Terceira questão:
3) Organização e representação dos dados:
- Organize seus dados adequadamente;
- Para cada tipo de variável da sua pesquisa, construa os tipos de representações
(gráficos, tabelas) que você considerar mais apropriado para representar tal variável.
Quando considerar conveniente, utilize também as medidas-resumo;
- Escolha uma das variáveis para fazer as representações somente utilizando lápis e
papel, para as demais, utilize o software Fathom;
- Acompanhando estas representações estatísticas, redija pequenos textos que
servirão como relatórios, descrevendo os estudantes de sua escola pelo conjunto de
dados que você coletou.
182
3.1.) Você acredita que os alunos sabem como trabalhar com as inter-relações entre os
diferentes registros para a construção do relatório?
3.2.) Em sua opinião, os alunos conseguem realizar corretamente as construções das
tabelas e dos gráficos para as diferentes variáveis?
Aqui ressaltamos a importância das múltiplas representações para a
mesma distribuição de frequências, por isso sugerimos que apenas uma das
variáveis fosse representada no lápis e papel, e as outras com o uso do software,
pois desta forma as construções tornar-se-iam mais rápidas.
Esperávamos que o professor percebesse a necessidade das
interpretações (pequenos textos) dos dados observados, mas, para que estas
informações tenham sentido seria necessário que se usassem algumas medidas
para acontecer a análise dos dados.
Análise a posteriori
As professoras relataram que o desenvolvimento da atividade seria
bastante interessante. A professora A até ressalvou que gostaria de realizar com
seus alunos do ano do Ensino Médio (acompanhamos a professora, mas ela
não teve tempo hábil, por diversos acontecimentos escolares, para realizar com
seus alunos).
Para a questão, a professora B acreditou que estava bom e que era
muito interessante. A professora A também relatou que era bastante oportuna e
afirmou a necessidade de se traçar um perfil aos meninos e outro às meninas,
como maneira de enriquecer a pesquisa.
Protocolo 58: Resposta da professora A para o item b da primeira questão da parte B
183
Protocolo 59: Resposta da professora B para o item b da primeira questão da parte B
Em relação como os alunos desenvolveriam a primeira etapa da atividade,
as duas professoras relataram que não teriam dificuldades, escolheriam as
variáveis e sairiam pela escola realizando a pesquisa.
Para a segunda parte, a professora B sugeriu que o professor pedisse aos
alunos que confeccionassem folhas de registros para facilitar a coleta de dados.
Em relação às possíveis variáveis que os alunos escolheriam, as duas
professoras relataram tanto variáveis qualitativas como quantitativas e afirmaram
que os alunos também levariam em conta os dois tipos de variáveis. Citaram
também que os alunos não teriam dificuldades para realizar o trabalho na escola
e ainda seria uma atividade do agrado deles por ser diferenciada.
Protocolo 60: Respostas da professora A para as questões “2.1”, “2.2” e “2.3” da parte B
184
Protocolo 61: Respostas da professora B para a questão 2 completa da parte B
Em relação a terceira parte, elas não sentiram tanta segurança pela sua
realização por parte dos alunos, tanto que a professora B até sugeriu que se
tivesse um relatório como amostra para os alunos consultarem, afirmaram ainda
que eles teriam dificuldades e que algumas construções, em lápis e papel,
poderiam ser feitas erradas que, neste caso, o ambiente informatizado seria um
facilitador. Mas em nenhum momento as professoras disseramm que a atividade
era inviável
185
Protocolo 62: Respostas da professora A para as questões “3.1”e, “3.2” da parte B
Protocolo 63: Respostas da professora B para a questão 3 completa da parte B
187
C
ONSIDERAÇÕES FINAIS
Esta pesquisa teve como objetivo verificar o nível de letramento estatístico
de duas professoras da Escola Básica, que trabalham com estatística em suas
aulas, e, também, como o uso de um ambiente computacional de Estatística
Dinâmica, no caso o software FATHOM, auxilia no desenvolvimento dos níveis de
leitura gráfica e possibilita ao professor viabilizar a utilização de diferentes
registros de representação semiótica.
A metodologia escolhida seguiu alguns pressupostos da Engenharia
Didática e constituiu um Estudo de Caso, com isso pudemos organizar o corpus
desta pesquisa visando responder a nossa primeira questão de pesquisa “Qual é
o nível de letramento estatístico de professores de Matemática do Ensino
Médio que trabalham, em sua prática docente, com os conteúdos da
Estatística Descritiva?”
Analisamos os dados obtidos por meio de entrevistas com duas
professoras de Matemática da Escola Básica, que já tinham trabalhado com
conceitos da Estatística Descritiva. Percebemos que ambas oscilaram entre os
níveis de letramento funcional e científico, nos termos de Shamos (1995). Tal
constatação veio do fato de que na resolução das atividades que compunham
nossa sequência, em muitos momentos, elas mobilizavam adequadamente os
conhecimentos estatísticos, sem, no entanto, conseguir expressar uma
formalização ou mesmo sem conhecer os termos científicos adequados para
expressar os conceitos mobilizados.
Com base nas análises realizadas, questionamo-nos sobre a necessidade
de estabelecer subníveis de letramento estatístico que permitissem melhor
188
modelar o conhecimento específico do conteúdo das professoras, nos termos de
Shulman (2001). Sugerimos que, futuramente, seja realizada uma pesquisa
empírica para identificar características possíveis para estes subníveis.
Percebemos que este resultado diferiu dos anteriores observados em
pesquisas, pois indicaram que os professores pesquisados apresentavam nível
cultural de alfabetização estatística. Mas como nenhum estudo quantitativo foi
realizado para um efetivo mapeamento do nível de letramento dos professores,
apontamos para a necessidade de tal pesquisa, que permitirá, assim, uma melhor
fundamentação ás escolhas feitas para o desenvolvimento de formações
continuadas e de materiais didáticos a serem usados, tanto nessas formações
como com os alunos da Escola Básica.
Optamos por realizar este estudo de caso com estas duas professoras,
pelo conhecimento que tínhamos de sua prática docente e por sabermos que elas
haviam abordado estes conteúdos com seus alunos. Acreditamos que estes
fatores possam ter influenciado nos resultados obtidos, tal como era esperado.
Podemos, assim, inferir que encontramos, entre os professores em exercício na
rede pública (sujeitos das pesquisas realizadas até o momento das quais tivemos
acesso aos resultados), comportamentos de mobilização de conhecimentos
estatísticos, segundo os três níveis de alfabetização estatística.
Em relação a segunda questão, “Como estes percebem o uso
simultâneo de vários registros de representação semiótica para a análise de
um conjunto de dados, com ou sem o uso do ambiente informatizado?”
Notamos que as professoras utilizaram e perceberam a necessidade do
uso de diferentes registros de representação semiótica em suas respostas e nas
análises das questões sugeridas. Ou seja, perceberam a necessidade do uso
simultâneo dos registros na análise de um banco de dados.
No entanto, não foi possível analisar, por questão de tempo, como elas
tratam o uso desses diferentes registros com seus alunos em sala de aula, ou
seja, como incorporam o uso desses registros no conhecimento pedagógico do
conteúdo, nos termos de Shulman (2001). Nestas condições, abre-se aqui mais
uma perspectiva para futuras pesquisas que possam verificar, como acontece o
189
uso dos diferentes registros de representação semiótica de uma distribuição de
frequências no processo de ensino e aprendizagem. Sugerimos, também, o
estudo da mobilização desses registros pelos alunos nos distintos níveis de
escolaridade.
Em relação ao uso do software de Estatística Dinâmica, observamos que,
muitas vezes, foi um forte aliado na construção de diversas representações,
permitindo-nos um enfoque maior nas análises do que nas próprias construções.
Este software possui uma ferramenta bastante interessante (iluminar os
elementos de mesmo tipo em todas as representações de sua tela, conforme
explicamos no capítulo III desta pesquisa) o que facilita o trabalho com as inter-
relações entre os diferentes registros de representação semiótica. Entretanto,
também, notamos alguns possíveis obstáculos que podem surgir com o uso deste
software, como por exemplo, o tratamento de todas as variáveis quantitativas,
como contínuas e a permissão de modificação do banco de dados pela
movimentação dos registros gráficos.
Com nossa pesquisa, pudemos estudar como professores em exercício
mobilizam os registros de representação semiótica na resolução de problemas, e
com base nisso, identificar seu nível de letramento estatístico. O estudo dos
saberes docentes no que se refere à Estatística Descritiva ficou apenas como
pano de fundo, justificando a escolha dos registros e procedimentos para resolver
os problemas propostos com o uso do software Fathom.
Dessa forma, concluímos nossas considerações enunciando mais uma
questão para futuras pesquisas: quais elementos dos saberes docentes podem
ser mais facilmente desenvolvidos pelo uso de softwares de Estatística Dinâmica?
191
R
EFERÊNCIAS
ANDRÉ, M. E. D. A. Estudo de caso em Pesquisa e Avaliação Educacional,
Líber Livro Editora, Série Pesquisa, vol.13, Brasília, 2005.
ALMOULOUD, S. Ag. Fundamentos da didática da matemática, UFPR:
Curitiba, 2007.
______ Registros de representações semióticas e compreensão de conceitos
geométricos in MACHADO, S. D. A. org, Aprendizagem em Matemática:
Registros de Representação Semiótica, Campinas, (SP): Papirus Editora, pp
125-147, 2003
ARTIGUE, M. Engenharia Didática. In: BRUN, J. Didáctica das Matemáticas.
Lisboa: Instituto Piaget, 1996, p. 193-218
BATANERO, C. Didáctica de la Matemática – Departamento de Didáctica de la
Matemática - Universidade de Granada, 2001.
BIGATTÃO, P. A. Concepção do Professor de Matemática sobre o Ensino da
Estocástica, PUC–SP, Dissertação de Mestrado, 2007
CAMPOS, C. R. A Educação Estatística: Uma investigação acerca dos
aspectos relevantes à didática da estatística em cursos de graduação. Rio
Claro: UNESP, Tese de Doutorado, 2007.
CANOSSA, R. O Professor de Matemática e o Trabalho com Mediadas
Separatrizes, PUC–SP, Dissertação de Mestrado, 2009
CARDOSO, R. O professor de Matemática e a Análise Exploratória de Dados
no Ensino Médio, PUC–SP, Dissertação de Mestrado, 2007
COUTINHO, C. Q. S. Teaching Statistics in Elementary and High School and
Teacher Training, ICMI/IASE, 2008
CURCIO, F. R. Developing Graph Comprehension – Elementary and middle
school activities. National Council of Teachers of Mathematics, Second printing,
1994.
192
DUVAL, R. Registros de representações semióticas e funcionamento cognitivo da
compreensão em matemática in MACHADO, S. D. A. org, Aprendizagem em
Matemática: Registros de Representação Semiótica, Campinas (SP): Papirus
Editora, pp 1-31, 2003
FRIEL S. N.; CURCIO, F. R.; BRIGHT. G. W. Making Sense of Graphs: Critical
Factors Influencing Comprehension and Instructional Implications. Journal
for Research in Mathematics Education, 2001, vol. 32, nº 2, 124-158
GAL, I. Adult’s Statistical Literacy: meanings, components, responsibilities.
International Statistical Review, v. 70, n. 1, p. 1-25, 2002
GASCÓN, J. In: Educação Matemática Pesquisa – La necessidad de utilizar
modelos em didáctica de lãs matemáticas, vol. 5, nº 2, São Paulo, 2003, p.11-
37.
MORAIS, T. M. R. Um estudo sobre o pensamento estatístico: ‘componentes
e habilidades’. PUC–SP, Dissertação de Mestrado, 2006
MOREIRA, P. C.; DAVID, M. M. M. S. O conhecimento matemático do
professor: formação e prática docente na escola básica, Revista Brasileira de
Educação, 2005, nº 28, p. 50-61.
NOVAES, D. V.; COUTINHO, C. Q. S. Estatística para a Educação
Profissional. RBB, 2008
SANTOS, S. S. O desenvolvimento de conceitos elementares do bloco
tratamento da informação com auxílio do ambiente computacional: Um
estudo de caso com uma professora do 1º e 2º ciclos do Ensino
Fundamental, PUC–SP, Dissertação de Mestrado, 2003.
SHAMOS, M. H. The myth of scientific literacy, Library of Congress Cataloging
in – Publication Data, the United States of American, 1995
SHULMAN, L. S. Conocimiento y Enseñanza, Estudios Públicos, 83, 2001
SILVA, C. B. Pensamento estatístico e raciocinio sobre variação: um estudo
com professores de matemática. São Paulo: PUC–SP, Tese de Doutorado,
2007.
VIANNA, H. M. Pesquisa em Educação – a observação, Brasília: Plano, Série
Pesquisa em Educação, Vol. 5, 2003
VIEIRA, M. Análise Exploratória de dados: Uma abordagem com alunos do
Ensino Médio, PUC–SP, Dissertação de Mestrado, 2008.
193
WILD, C. e PFFANNKUCH, M. ¿Qué es el Pensamiento Estadístico?
Proceedings of the Fifth International Conference on Teaching of Statistics,
Singapore, Vol.1 pp. 333-339 – Publicado no jornal Hipótesis Alternativa Vol. 6
Nº2 – Septiembre 2005.
WITTE, R. S. e WITTE, J. S. Estatística, LTC, sétima edição, Rio de Janeiro,
2005.
195
A
PÊNDICE I
TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO
Pesquisa: Relações entre mobilização dos registros de representação
semiótica e os níveis de letramento estatístico com professores
Eu, ________________________________________________________,
portador (a) do R. G. _____________________________________, residente na
_________________________________________________________________
_______________, telefone: ___________________________________ e e-mail:
____________________________________________, abaixo assinado dou meu
consentimento livre e esclarecido para participar como voluntário (a) da pesquisa
supracitada sob a responsabilidade da pesquisadora Eliana Maria Bauschert de
Freitas, aluna do curso de Mestrado Acadêmico em Educação Matemática da
Pontifícia Universidade Católica de São Paulo e da Professora Dra. Cileda de
Queiroz e Silva Coutinho, orientadora da pesquisa.
Assinando este Termo de Consentimento, estou ciente de que:
1. O objetivo da pesquisa é verificar o nível de letramento estatístico do
professor da Escola Básica, que trabalha com estatística na sua prática docente,
e também como o uso de um material de apoio, um ambiente computacional
auxilia no desenvolvimento dos níveis de leitura gráfica e possibilita ao professor
viabilizar a utilização de diferentes registros de representação semiótica.
2. Durante a entrevista, estarei preenchendo questionários e realizando
construções no ambiente computacional FATHOM.
196
3. Quando a pesquisa terminar, terei acesso aos resultados globais do
estudo.
4. Estou livre para interromper, a qualquer momento, minha participação
nesta pesquisa.
5. A participação nesta pesquisa é voluntária, e os professores não
receberão qualquer forma de remuneração.
6. Os dados pessoais dos professores serão mantidos em sigilo, e os
resultados obtidos com a pesquisa serão apenas utilizados para alcançar os
objetivos do trabalho.
7. Poderei entrar em contato com os pesquisadores sempre que julgar
necessário. Com Eliana Maria Bauschert de Freitas, no e-mail: eliana-
[email protected] e com a pesquisadora Dra. Cileda de Queiroz e Silva
Coutinho pelo e-mail cileda@pucsp.br.
8. Obtive todas as informações necessárias para poder decidir
conscientemente sobre minha participação na referida pesquisa.
Este Termo de Consentimento é feito em duas vias, de maneira que uma
permanecerá em meu poder e outra com a pesquisadora.
São Paulo, _______ de _____________________ de 2009.
________________________________________________
assinatura do participante
________________________________________________
assinatura da responsável pela pesquisa
________________________________________________
assinatura da pesquisadora
197
A
PÊNDICE II
SEQUÊNCIA DIDÁTICA (ATIVIDADES ADAPTADAS DE VIEIRA, 2008)
Parte A – Familiarização com o software
Realizaremos essas atividades com o software de estatística dinâmica
Fathom. Nesta fase, nosso objetivo é que você conheça e familiarize-se com o
software, revendo alguns conceitos estatísticos.
Observe o seguinte conjunto de dados de uma pesquisa realizada com 20
funcionários de uma empresa:
Nome Gênero
Idade Cargo Escolaridade
Salário
Ana f 23 recepcionista
médio 850
Fabio m 25 operário fundamental
950
Mario m 30 operário fundamental
950
Mauricio
m 35 gerente superior 2200
Carlos m 29 engenheiro superior 2200
Mariana
f 31 gerente superior 2000
Lourdes
f 26 vendedor médio 1300
Sérgio m 27 operário médio 950
Marilda
f 36 aux. limpeza
fundamental
700
Rose f 32 aux. limpeza
fundamental
700
Ricardo
m 30 vendedor médio 1700
Rafael m 36 engenheiro superior 2200
Raquel f 40 encarregado
superior 1300
Cassio m 38 operário médio 950
Eduardo
m 33 operário fundamental
950
Felipe m 35 encarregado
médio 1200
Michel m 34 vendedor médio 1500
João m 40 operário fundamental
950
Miguel m 42 porteiro fundamental
800
Maria f 43 aux. limpeza
fundamental
700
198
A partir deste conjunto de dados podemos levantar inicialmente as
seguintes questões:
- Quais as características dos sujeitos observados que estão sendo alvo
desta pesquisa? ____________________________________________________
- Se formos classificar estas características, quais critérios poderiam ser
usados? Por quê? __________________________________________________
Obs.: Vale lembrar que as características observadas constituem o que
chamamos de “variável estatística”.
Como você percebe o uso do ambiente computacional na escola?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
Primeira Fase: Elaboração de tabelas no Fathom
1) Inicialmente, construiremos o banco de dados da empresa no software
Fathom. Para isso, siga os procedimentos abaixo
a) Clique no ícone do Desktop , para iniciar o Fathom
b) Clique em “new collection” , e arraste até a tela.
c) Clique duas vezes em cima da palavra “collection1”, aparecerá a caixa
“rename collection”, onde você pode inserir um nome para o seu banco de dados.
199
d) Agora, clique em “new case table e arraste até a tela.
e) Insira os dados da pesquisa na tabela do Fathom. Para isso, clique em
“new” e escreva o título da coluna. Depois, tecle “enter”, para continuar inserindo
os dados nas linhas (Obs.: não utilize acentuação, pontuação ou espaçamentos
nos nomes das variáveis).
2) Agora, construiremos uma tabela de distribuição de freqüências para a
variável “gênero”.
a) Clique em “new summary table” e arraste até a tela
b) No banco de dados do Fathom, selecione a coluna “gênero” e arraste-a
até a nova tabela.
3) Seguindo o mesmo procedimento, construa também as tabelas de
distribuição de freqüências para as variáveis “cargo” e “escolaridade”.
200
4) Você considera que a variável “gênero” e a variável “idade são de
mesmo tipo? Por quê?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
4.1.) O aluno consegue fazer esta distinção para os tipos de variáveis? Se
sim, como ele faria?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
5) Construa uma tabela de distribuição de freqüências para a variável
“idade”.
Para isso, clique em “new summary table” , selecione a coluna da
variável “idade” no banco de dados e arraste-a até a nova tabela.
Obs.: Para tabelas com dados numéricos (ou seja, variáveis quantitativas),
mantenha apertada a tecla shift enquanto arrasta a variável até a tabela.
6) Construa uma tabela de distribuição de freqüências para a variável
“salário”.
7)Podemos também construir tabelas combinando algumas variáveis. Por
exemplo, vamos construir uma tabela que mostre o nível de escolaridade dos
funcionários de gênero masculino e feminino.
a) Clique em “new summary table” para construir a tabela;
b) Clique na variável “escolaridade” e arraste até o lado direito da tabel:
201
c) Agora, clique na variável “gênero” e arraste até o lado de baixo da
tabela.
8) Construa uma tabela que mostre os cargos dos funcionários de gênero
masculino e feminino.
9) Você acredita estar claro, neste momento da atividade, para o aluno as
diferenças entre as variáveis qualitativas e as quantitativas?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
10) O fato do Fathom trabalhar todas as variáveis de estrutura numérica
como uma variável quantitativa contínua pode dificultar a aprendizagem deste
conceito? Se sim, qual (is) procedimento (s) podemos tomar para que isso não
aconteça?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
Segunda fase: Construção de gráficos no Fathom
1) Nesta fase, utilizaremos o software Fathom para construir os gráficos,
que constituem um outro tipo de representação de uma Distribuição de
Freqüências.
202
a) Clique no ícone para construir o gráfico, e arraste até a tela;
b) Clique na coluna variável “gênero” para selecioná-la e arraste até a
área do gráfico, sobre a caixa “drop na anttribute here”.
Este gráfico é chamado “diagrama de colunas”, e é normalmente utilizado
para representar variáveis qualitativas ou mesmo variáveis quantitativas discretas.
Ele coloca em evidência a comparação entre os valores observados.
2) Clique no ícone “bar chart” escolha outro tipo de gráfico. O que você
observa? É o mesmo tipo de comparação que ele representa?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
203
2.1) Em sua opinião, os alunos percebem a distinção dessas duas
representações? Qual delas proporciona maior possibilidade de compreensão?
Por quê?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
3) Construa os gráficos para as variáveis “cargo” e “escolaridade”.
4) Construa agora um histograma para a variável idade. (Escolha o
Histogram).
5) Construa um gráfico de pontos para a variável “idade” (Escolha :Dot
Plot). Explique a diferença entre os dois gráficos. Como você explicaria a variação
dessa variável pela observação dos dois gráficos?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
5.1) Como os alunos podem perceber estas distinções entre o tipo de
informação fornecida em cada gráfico?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
Obs.: A variável “idade” é uma variável quantitativa contínua, mas pode ser
tratada como discreta, por ser apresentada em mero de anos completos (uma
contagem). O software Fathom, por definição, trata toda variável numérica como
contínua. Então, para construir o gráfico Histograma, o software faz uma
“correção de continuidade”, ou seja, soma e subtrai meia unidade ao valor da
variável, construindo assim um intervalo e propiciando a percepção da
continuidade. Sendo assim, para variáveis discretas, é mais adequado utilizar o
gráfico Dot Plot (neste tipo de gráfico, cada ponto representa um valor
observado).
204
6) Agora, no gráfico da variável gênero, clique sobre a barra que indica o
gênero masculino. O que você observa no banco de dados e nos outros gráficos?
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
6.1.) Em relação a esta ferramenta do software, você acredita ser um
facilitador para a compreensão da inter-relação entre as representações
apresentadas?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
205
Terceira fase: Medidas-Resumo, Tabelas e Gráficos no Fathom
1) Construa uma tabela de distribuição de freqüências para a variável
“idade”, da mesma maneira que você fez na primeira fase, mas agora sem
apertar a techa shift (somente arraste a variável até a tabela).
Observe que apareceu somente um valor na tabela. Este é o valor da
“média aritmética” para a variável “idade” (no Fathom, quando construímos
tabelas de variáveis quantitativas, se não mantivermos apertada a tecla shift, a
table mostra a média aritmética).
A média aritmética é uma medida que resume e representa um
conjunto de dados em um único valor. A média de um conjunto é o valor ao
redor do qual os valores observados se distribuem, é calculada como a
soma dos valores dividida pelo número total de observações. Podemos
fazer uma analogia entre a média de um conjunto de dados e o fiel de uma
balança em equilíbrio.
2) Seguindo o mesmo procedimento, obtenha o valor da média aritmética
para a variável “salário”.
3) Iremos agora representar o valor da média no gráfico.
a) Construa um gráfico (histogram) para a variável “salário”;
b) Clique em “graph”, “plot value”;
c) No menu que se abrirá, clique em “functions”, “statistical”, “one
attribute”.
206
d) Clique (duas vezes) em “mean”, em seguida clique em “OK”.
Veja o gráfico:
“A média sozinha é suficiente para que se possa analisar um conjunto de
dados? Pense, por exemplo: Qual o intervalo de variação dos valores
observados? Qual é a posição da média dentro deste intervalo?”.
Uma outra medida que podemos utilizar para sintetizar e representar
um conjunto de dados é a mediana. A mediana é o valor que ocupa a
posição central dos dados ordenados, ou seja, é o valor que é maior ou
igual a 50% dos dados ordenados e menor ou igual a 50% dos dados
observados. Podemos fazer uma analogia entre a mediana e o ponto médio
de um segmento.
207
4) Na mesma tabela da média das idades (construída no item 1), vamos
mostrar também a mediana.
a) No Fathom, clique na tabela acima, depois em “summary”, “add
formula”.
b) No menu, clique em “functions”,”statistical”, “one attribute”. Clique
(duas vezes) em “median” e “OK”.
Você terá o valor que ocupa a posição central nas idades ordenadas.
5) Representaremos a mediana no gráfico (pode ser no mesmo gráfico do
item 3).
a) Clique no gráfico da variável salário que você construiu a média;
b) Clique em “graph”, “plot value”
c) No menu que se abrirá, clique em “functions”, “statistical”, “one
atribute”, “median” (duplo clique).
208
6) Como os demais valores representados se distribuem em relação a
média? E em relação à mediana?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
6.1.) Na sua opinião, os alunos tem clareza da distinção destas duas
medidas? Caso não tenham esta clareza, por que isso acontece?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
Vamos determinar, além da mediana, dois valores tais que 25% das
observações ordenadas serão menores ou iguais a um deles e 75% serão
menores ou iguais ao outro. Tais valores são denominados, respectivamente,
primeiro quartil e terceiro quartil. Note que a mediana representa o segundo
quartil.
7) Para representar os quartis, utilizaremos ainda o mesmo histograma da
variável salário.
a) Selecione o gráfico e clique em “graph”, “plot value”.
b) No menu, clique em “functions”, “statistical”, “one attribute”,
“percentile” (duas vezes)
c) Na caixa de funções aparecerá “percentile ( )”. Dentro dos
parênteses escreva (25, salario), e clique em “OK”. Você terá representado no
gráfico o primeiro quartil
209
d) Repita o mesmo procedimento, e na caixa da função percentile, escreva
(75,salario), e clique em “OK”. Será representado o terceiro quartil.
Uma representação gráfica envolvendo quartis, mediana, valor máximo e
valor mínimo é o “box-plot”. No box-plot, define-se uma “caixa” com o limite
esquerdo dado pelo primeiro quartil e o limite direito pelo terceiro quartil. A
mediana é representada por um traço no interior da caixa, e segmentos de reta
são colocados da caixa até os valores máximo e mínimo.
8) Construa um novo gráfico para a variável salário, e no canto superior
direito do gráfico, clique na sela e selecione “box-plot”, para representar este
gráfico.
210
9) Em relação aos últimos gráficos utilizados para representar os quartis
responda:
Qual tipo de gráfico você prefere? ________________________________
Justifique ____________________________________________________
____________________________________________________________
9.1.) Um aluno, na tentativa de explicar para um colega, a relação de
dimensões diferentes à mesma porcentagem (fato que acontece no box-plot) fez a
seguinte colocação: “É fácil, se a gente pensar em duas latas de sardinha com
três sardinhas dentro, na lata grande as sardinhas estão mais espalhadas, mas,
na pequena, as três ficarão pertinho uma da outra, e de qualquer forma as duas
tem a mesma quantidade”. Como você avalia esta explicação?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
10) Compare os dois tipos de gráficos, dizendo as principais diferenças
entre eles e quais informações são mais evidentes em um ou em outro.
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
211
11) Veremos agora como inserir uma nova coluna no banco de dados
inicial. Vamos assim considerar a distância entre cada valor observado para a
variável “idade” e o valor obtido para a média. Chamaremos cada uma dessas
distâncias de “desvio”. Podemos nomear esta nova coluna de “idadedesvios”.
a) Na tabela, clique em <new> e insira o título para a coluna;
b) para calcular os desvios, clique na coluna “idadedesvios”;
c) No menu, clique em “edit”, “edit formula”;
d) Na caixa, escreva “idade-mean(idade)” e clique em OK” (será
calculado para cada valor da variável, a diferença entre o valor observado e a
média aritmética).
212
12) Observe o resultado na tabela. O que significa o resultado “positivo”
nesse cálculo? E o “negativo”?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
13) Vamos inserir os desvios na tabela de distribuição de freqüência da
variável idade ( que foi construída na primeira fase da atividade).
Clique na coluna “idadedesvios”, e arraste até o canto esquerdo da tabela
14) Construa também uma coluna para os desvios da variável salário, e
depois insira na tabela de distribuição de freqüências do salário.
213
15) Em sua opinião, como os alunos interpretam o fato da adição de todos
os desvios resultar em zero?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
16) Baseando-se nas atividades desenvolvidas a o momento,
responda:
a) Quantos funcionários responderam à pesquisa? ___________________
b) Do total de entrevistados, qual é a quantidade de funcionários do gênero
feminino? ____________ E do masculino? _______________
c) Em relação ao nível de escolaridade, quantas mulheres têm nível
superior? ___________ E quantos homens? ______________
d) Entre as idades observadas, qual a idade máxima e a idade mínima?
_________________________________________________________________
e) Qual é o menor salário nesta empresa? ________________ E o salário
máximo?______________ E a média dos salários? ________________________
f) Quais são os cargos que têm salário acima da média nesta empresa?
_________________________________________________________________
g) Quantos funcionários recebem salário abaixo da dia nesta empresa?
_________________________________________________________________
h) Quantos funcionários do gênero masculino recebem salário acima da
média na empresa? _________________ E do gênero feminino? _____________
i) Quantos funcionários do gênero feminino recebem mais que R$ 1900,00?
____________________ E do gênero masculino? _________________________
j) Quantos funcionários do gênero feminino recebem menos que R$
900,00? ___________________ E do gênero masculino ? __________________
k) Qual valor você utilizaria para representar o salário desta empresa?
________________________ Justifique: _______________________________
_________________________________________________________________
214
17) Quais seriam as possíveis estratégias dos alunos para responder os
itens da questão anterior? (Observação: Se quiser, leve em consideração o aluno
com a possibilidade do uso do Fathom)
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
Parte B Verificando a viabilidade de um plano de aula (Adaptado de
VIEIRA, 2008).
Vamos supor professor, que você irá desenvolver uma atividade/aula com
os seus alunos relacionada com os conceitos de estatística que trabalhamos até o
momento. Para isto, percebemos a necessidade da organização desta aula.
Abaixo descrevemos uma atividade que propõe aos alunos a construção de um
relatório sobre os estudantes da sua escola.
O objetivo deste relatório é a criação de uma pesquisa que deve se iniciar
pela coleta e organização dos dados, pela preparação dos registros (tabelas,
gráficos, medidas) e se findar com a organização das informações em um
relatório explicativo que deverá ser enviado “ficticiamente” a um aluno de outra
escola.
Professor, gostaríamos que você observasse cada uma das etapas e
sugerisse mudanças (se assim achar conveniente) e relatasse sua opinião de
como seria a realização destas etapas pelos alunos, se eles achariam fácil
resolver uma atividade destas, se seria interessante, entre outras informações
que julgar conveniente.
215
ATIVIDADE PARA SER DESENVOLVIDA COM OS ALUNOS
Suponha que você queira comunicar a um outro aluno, como são os
estudantes de sua escola. Para isso, você irá prepara um relatório que mostre
resumidamente as características principais destes estudantes.
1) Preparação das questões de investigação:
a) Quais dados (físicos, sociais, culturais etc) devem entrar na
caracterização do aluno típico?
b) Seria necessário traçar um perfil para as meninas e outro para os
meninos? Por quê?
Sugestões:___________________________________________________
_________________________________________________________________
_________________________________________________________________
1.1.) Em sua opinião, como os alunos desenvolveriam esta etapa da
atividade?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
2) Preparação da coleta de dados:
- Prepare folhas de registro para os dados que serão pesquisados;
- Escolha as variáveis da pesquisa;
- Peça aos alunos de sua escola que respondam as perguntas da
pesquisa.
Sugestões:___________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
216
2.1.) Que tipo de variáveis os alunos escolheriam para descrever os
indivíduos da sua escola?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
2.2.) Você acredita que eles levariam em consideração tanto variáveis
qualitativas como quantitativas?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
2.3.) Em sua opinião, eles teriam facilidade de realizar esta pesquisa na
sua escola?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
3) Organização e representação dos dados:
- Organize seus dados adequadamente;
- Para cada tipo de variável da sua pesquisa, construa os tipos de
representações (gráficos, tabelas) que você considerar mais apropriado para
representar tal variável. Quando considerar conveniente, utilize também as
medidas-resumo;
- Escolha uma das variáveis para fazer as representações somente
utilizando lápis e papel, para as demais, utilize o software Fathom;
- Acompanhando estas representações estatísticas, redija pequenos textos
que servirão como relatórios, descrevendo os estudantes de sua escola pelo
conjunto de dados que você coletou.
217
Sugestões:___________________________________________________
_________________________________________________________________
_________________________________________________________________
3.1.) Você acredita que os alunos sabem como trabalhar com as inter-
relações entre os diferentes registros para a construção do relatório?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
3.2.) Em sua opinião, os alunos conseguem realizar corretamente as
construções das tabelas e dos gráficos para as diferentes variáveis?
____________________________________________________________
_________________________________________________________________
_________________________________________________________________
_________________________________________________________________
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo