( PDF ) Relações entre mobilização dos registros de representação semiótica e os níveis de letramento estatístico com duas professoras

Download PDF

ads:

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PUC/SP

Eliana Maria Bauschert de Freitas

Relações entre Mobilização dos Registros de Representação

Semiótica e os Níveis de Letramento Estatístico com duas

Professoras

MESTRADO EM EDUCAÇÃO MATEMÁTICA

São Paulo

2010

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO

PUC/SP

Eliana Maria Bauschert de Freitas

Relações entre Mobilização dos Registros de Representação

Semiótica e os Níveis de Letramento Estatístico com duas

Professoras

Dissertação apresentada à Banca Examinadora da

Pontifícia Universidade Católica de São Paulo, como

exigência parcial para obtenção do título de MESTRE

EM EDUCAÇÃO MATEMÁTICA, sob a orientação da

Professora Doutora Cileda de Queiroz e Silva

Coutinho.

São Paulo

2010

ads:

Banca Examinadora

________________________________________________

Autorizo, exclusivamente para fins acadêmicos e científicos, a reprodução total ou parcial desta

dissertação por processos de fotocopiadoras ou eletrônicos.

Assinatura: _______________________________________ Local e Data: ______________

A meus pais, pela compreensão nos

momentos de ausência, pelo incentivo e

por sempre terem acreditado em mim.

GRADECIMENTOS

A Deus que me proporcionou força para a realização desta pesquisa e colocou

pessoas tão maravilhosas em minha vida, ajudando-me a tornar esse sonho em

realidade.

À Professora Dra Cileda de Queiroz e Silva Coutinho, pela sua amizade,

orientação e paciência em todos os momentos, oferecendo-me forças para

continuar mesmo nos momentos de desânimo.

Aos membros da Banca, Professores Doutores Saddo Ag Almouloud e Érica

Valéria Alves, pelas contribuições e sugestões que foram extremamente

importantes para a conclusão deste trabalho.

A minha querida irmã que, muitas vezes, dispôs de seu tempo para ler e

discutir este trabalho.

Às professoras amigas, Cristiane, Fernanda e Priscila que com muita paciência e

carinho me ajudaram na parte experimental desta pesquisa.

À querida amiga Regina, pela ajuda na realização do abstract.

Aos colegas do curso de mestrado da PUC-SP, em especial, Ricardo e Márcio

que, de alguma forma, contribuíram para o desenvolvimento deste trabalho,

acreditando e torcendo por mim.

A todos que de maneira direta ou indireta contribuíram para a

concretização desta pesquisa.

Por fim, à Secretaria da Educação, pela oportunidade, na concessão da bolsa.

A Autora

ESUMO

Este trabalho teve como objetivo verificar o nível de letramento estatístico de duas

professoras da Escola Básica, que trabalham com estatística em suas aulas.

Buscou-se também identificar à influência do uso de um ambiente computacional,

no caso o software FATHOM, na evolução dos níveis de leitura gráfica e,

portanto, de letramento, pela possibilidade da utilização simultânea de diferentes

registros de representação semiótica. Procurou-se responder às seguintes

questões: “Qual é o nível de letramento estatístico de professores de Matemática

do Ensino Médio que trabalham, em sua prática docente, com os conteúdos da

Estatística Descritiva? Como estes percebem o uso simultâneo de vários registros

de representação semiótica para a análise de um conjunto de dados, com ou sem

o uso do ambiente informatizado?” Para tanto, foram utilizados como metodologia

os pressupostos da Engenharia Didática, desenvolvendo um estudo de caso com

duas professoras de Matemática da Escola Básica, que já tinham trabalhado com

alguns conceitos da Estatística Descritiva em suas aulas. A análise das

entrevistas permitiu perceber que as professoras oscilaram entre os níveis de

letramento funcional e científico e que o uso do software foi um facilitador para a

percepção da necessidade e das vantagens de se trabalhar simultaneamente com

mais de um registro de representação semiótica.

Palavras-chave: Registros de Representação Semiótica, Letramento Estatístico,

Estatística Dinâmica, Educação Estatística e Professores de Matemática.

BSTRACT

The purpose of this project was to verify the level of statistical literacy of two

teachers of the High School which work with statistics. Also, tired to extensity the

influence of the use of computational environment, in case software FATHOM, in

the evolution of the levels of graphical reading and, consequently, literacy, using

simultaneous and differents registers of semiotic representation. We found to

answer these questions: “Which is the level of statistic literacy of the Mathematics’

teachers in High School who works with Descriptive Statistic? How these people

perceive the simultaneous use of different registers of semiotics representation for

analysis of a data set, with or without the use of computational environment?” For

these were used the methodology Didactics Engineering, developing a study of

case with two mathematics’ teachers of the High School who had already worked

with some concepts of Descriptive Statistic in their courses. The analysis of the

interviews allowed to notice that the teachers oscillated between the levels of

scientific literacy and functional literacy and the use of the software made easier

the perception of the necessity and advantages to work simultaneously with more

one register of semiotic representation.

Key-words: Register of Semiotic Representation, Statistical Literacy, Dynamics

Statistics, Statistical Education and Mathematics’ teachers.

UMÁRIO

INTRODUÇÃO .................................................................................................

I PROBLEMÁTICA .......................................................................................... 21

I.1 Objetivo e Problema de Pesquisa ............................................................ 21

I.2 Os procedimentos metodológicos adotados ............................................ 23

I.2.1 Estudo de Caso ............................................................................... 23

I.2.2 Pressupostos da Engenharia Didática .............................................

II ALGUMAS PESQUISAS QUE FUNDAMENTAM O ESTUDO ....................

II.1 Um primeiro esboço do quadro teórico ................................................... 33

II.1.1 Os níveis letramento (ou literacia) estatística propostos por

Shamos ..........................................................................................

II.1.2 Os níveis de leitura gráfica propostos por Curcio ........................... 39

II.1.3 A teoria dos registros de representação semiótica .........................

II.1.4 Saberes docentes ........................................................................... 48

II.2 Algumas pesquisas sobre o ensino e a aprendizagem da estatística .....

II.3 Relações entre os níveis de leitura de dados de Curcio e os registros

de representação semiótica de Duval, (VIEIRA, 2008) ..........................

III PRINCÍPIOS DA ANÁLISE EXPLORATÓRIA DE DADOS E O

SOFTWARE FATHOM ................................................................................

III.1 A análise Exploratória de Dados ......................................................... 65

III.2 Registros de representação e suas construções no software

FATHOM .............................................................................................

IV A SEQUÊNCIA DIDÁTICA ......................................................................... 85

IV.1 Análises a priori e a posteriori do teste diagnóstico ............................

IV.2 Análises a priori e a posteriori da primeira fase da parte A

das atividades de familiarização com o software Fathom ..................

125

IV.3 Análises a priori e a posteriori da segunda fase da parte A

das atividades de familiarização com o software Fathom ...................

141

IV.4 Análises a priori e a posteriori da terceira fase da parte A das

atividades de familiarização com o software Fathom .........................

152

IV.5 Análises a priori e a posteriori da parte B da sequência didática ....... 180

CONSIDERAÇÕES FINAIS ............................................................................ 187

REFERÊNCIAS ............................................................................................... 191

APÊNDICE I .................................................................................................... 195

TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO ...................... 195

APÊNDICE II ................................................................................................... 197

SEQUÊNCIA DIDÁTICA (ATIVIDADES ADAPTADAS DE VIEIRA, 2008) 197

Parte A – Familiarização com o software ................................................... 197

Parte B – Verificando a viabilidade de um plano de aula (Adaptado

de VIEIRA, 2008) ........................................................................................

214

ISTA DE FIGURAS

Figura 1: Esquema traçado para a realização da fase experimental da

Engenharia Didática .........................................................................

Figura 2: Exemplo Leitura dos Dados (CURCIO, 1994, p. 71) – tradução

nossa ................................................................................................

Figura 3: Exemplo Leitura entre os Dados (CURCIO, 1994, p. 71) – tradução

nossa ...............................................................................................

Figura 4: Exemplo Leitura além dos Dados (CURCIO, 1994, p. 71) –

tradução nossa ................................................................................

Figura 5: Gráfico de colunas ............................................................................

Figura 6: Tratamento em uma tabela pela modificação da amplitude das

classes .............................................................................................

Figura 7: Conversão de uma tabela de distribuição de frequências para um

gráfico de colunas para a variável gênero .......................................

Figura 8: Exemplo 1 do paralelo entre as apreensões e os níveis de leitura

de gráfico (atividade retirada de Curcio, 1994, p. 74) – tradução

nossa ...............................................................................................

Figura 9: Exemplo 2 do paralelo entre as apreensões e os níveis de leitura

de gráfico (atividade retirada de Curcio, 1994, p. 74) – tradução

nossa ...............................................................................................

Figura 10: Exemplo 3 do paralelo entre as apreensões e os níveis de leitura

de gráfico (atividade retirada de Curcio, 1994, p. 74) – tradução

nossa ..............................................................................................

Figura 11: Tratamento entre um banco de dados (a esquerda) e uma tabela

de distribuição de freqüências (direita) ..........................................

Figura 12: Modificação do banco de dados pela alteração do ponto no

Gráfico ............................................................................................

Figura 13: Ferramenta do FATHOM para selecionar uma mesma

característica em diferentes registros ............................................

Figura 14: Possíveis soluções dos itens “i”, “j” e “k” da primeira questão do

teste diagnóstico ............................................................................

Figura 15: Tela do FATHOM esperada como solução da inserção de dados

no software .....................................................................................

131

Figura 16: Tabela com o valor da média ......................................................... 136

Figura 17: Valor da média de idades e da média salaria .................................

153

Figura 18: Modificação no banco de dados pelo manuseio das

representações gráficas .................................................................

175

ISTA DE TABELAS

Tabela 1: Enumeração .....................................................................................

Tabela 2: Tabela de distribuição de frequências para a variável “gênero” ...... 44

Tabela 3: Enumeração das idades .................................................................. 46

Tabela 4: Tabela de distribuição de freqüências com os valores em ordem

Crescente ........................................................................................

Tabela 5: Tabela esperada como solução da segunda questão do Teste

Diagnóstico (Registro Tabular) ........................................................

105

Tabela 6: Tabela para organização dos dados ................................................

112

Tabela 7: Tabela para auxiliar na identificação da mediana ............................

115

Tabela 8: Tabela com as frequências acumuladas e posição no rol ............... 117

Tabela 9: Tabela para identificação do valor máximo ..................................... 117

Tabela 10: Tabela de distribuição de frequências para a variável gênero ...... 133

Tabela 11: Tabela vertical de distribuição de frequências para a variável

gênero ...........................................................................................

133

Tabela 12: Tabelas de distribuição de frequências para as variáveis cargo e

escolaridade ..................................................................................

133

Tabela 13: Tabela de distribuição de frequências para a variável idade .........

137

Tabela 14: Tabela de distribuição de frequências para a variável salário ....... 137

Tabela 15: Tabela de dupla entrada para as variáveis gênero e cargo ...........

138

Tabela 16: Tabela de distribuição de frequências com os desvios salariais ... 169

Tabela 17: Tabela de dupla entrada das variáveis gênero e escolaridade ..... 171

ISTA DE GRÁFICOS

Gráfico 1: Localização da média no gráfico .....................................................

Gráfico 2: box-plot ............................................................................................

Gráfico 3: Gráfico de setores para a variável matéria preferida ...................... 70

Gráfico 4: Ribbon Chart para a variável matéria preferida .............................. 70

Gráfico 5: Gráfico de colunas para a variável matéria preferida ......................

Gráfico 6: dot plot para as variáveis idade e altura ..........................................

Gráfico 7: Gráfico de colunas para a variável gênero, subdividindo as

Barras para a variável matéria preferida .........................................

Gráfico 8: Gráfico de colunas para a variável matéria preferida,

Subdividindo as barras para a variável gênero ...............................

Gráfico 9: Histograma para a variável altura dos alunos ................................. 75

Gráfico 10: Box-plot da variável altura .............................................................

Gráfico 11: Histograma com a localização da média .......................................

Gráfico 12: Histograma com a localização da mediana + Box-plot ................. 79

Gráfico 13: Histograma com a localização simultânea da média e da

mediana + Box-plot .......................................................................

Gráfico 14: Histograma para a variável altura com a localização dos

1º, 2º e 3º quartis + Box-plot .........................................................

Gráfico 15: Dot-plot para organização dos dados ........................................... 113

Gráfico 16: Gráfico de barras para a variável idade ........................................ 114

Gráfico 17: Gráfico de barras para a variável idade localizando o valor

máximo ..........................................................................................

118

Gráfico 18: Representação gráfica “Ribbon Chart” para a variável gênero .....

143

Gráfico 19: Gráficos de colunas para as variáveis cargo e escolaridade ........ 144

Gráfico 20: Histograma para a variável idade ..................................................

146

Gráfico 21: Gráfico de pontos (Dot Plot) para a variável idade ....................... 147

ISTA DE PROTOCOLOS

Protocolo 1: Respostas da professora A para a primeira questão do teste

diagnóstico itens de “a” até “f” .....................................................

Protocolo 2: Resoluções da professora B para a primeira questão do teste

diagnóstico itens de “a”, “b”, “c” e “f” ...........................................

Protocolo 3: Respostas da professora B para a primeira questão do teste

diagnóstico itens de “a” até “f” .....................................................

Protocolo 4: Respostas da professora A para a primeira questão do teste

diagnóstico itens de “g” e “h” .......................................................

Protocolo 5: Resolução da professora B para encontrar a mediana de um

conjunto de dados .......................................................................

Protocolo 6: Respostas da professora B para a primeira questão do teste

diagnóstico itens de “g” e “h” .......................................................

Protocolo 7: Respostas da professora A para a primeira questão do teste

diagnóstico itens de “i”, “j” e “k” – construções gráficas ..............

Protocolo 8: Respostas da professora B para a primeira questão do teste

diagnóstico itens de “i”, “j” e “k” – construções gráficas ..............

100

Protocolo 9: Entrevista piloto – construção de gráficos com a utilização de

pares ordenados ..........................................................................

101

Protocolo 10: Respostas da professora A para a questão 1.1. do teste

diagnóstico .................................................................................

102

Protocolo 11: da professora B para a questão 1.1. do teste diagnóstico ........ 102

Protocolo 12: da professora A para a questão 1.2. do teste diagnóstico ........ 102

Protocolo 13: da professora B para a questão 1.2. do teste diagnóstico ........ 103

Protocolo 14: Conversão do registro gráfico para o tabular – questão 2 do

teste diagnóstico ........................................................................

106

Protocolo 15: Resposta da professora A para os itens de saberes docentes

da questão 2 do teste diagnóstico ..............................................

107

Protocolo 16: Resposta da professora A para os itens de saberes docentes

da questão 2 do teste diagnóstico ..............................................

107

Protocolo 17: Resposta da professora A para a questão 3 do teste

diagnóstico .................................................................................

109

Protocolo 18: Resposta da professora B para a questão 3 do teste

diagnóstico .................................................................................

110

Protocolo 19: Conversões realizada pela professora A para responder a

questão 4 do teste diagnóstico ...................................................

119

Protocolo 20: Conversões realizada pela professora B para responder a

questão 4 do teste diagnóstico ...................................................

120

Protocolo 21: Respostas da professora A para responder à questão 4 do

teste diagnóstico, itens “c” e “d” .................................................

121

Protocolo 22: Respostas da professora B para responder a questão 4 do

teste diagnóstico, itens “c” e “d” .................................................

122

Protocolo 23: Resposta da professora A referente a importância das

conversões .................................................................................

123

Protocolo 24: Resposta da professora B referente a importância das

conversões .................................................................................

123

Protocolo 25: Resposta da professora A para a utilização dos diferentes

registros ......................................................................................

124

Protocolo 26: Resposta da professora A para a utilização dos diferentes

registros ......................................................................................

124

Protocolo 27: Respostas da professora A referente a variáveis estatísticas ...

128

Protocolo 28: Respostas da professora B referente a variáveis estatísticas ...

128

Protocolo 29: Resposta da professora A referente ao uso do ambiente

computacional na escola ............................................................

129

Protocolo 30: Resposta da professora B referente ao uso do ambiente

computacional na escola ............................................................

129

Protocolo 31: Resposta da professora A para a questão 4 da parte A ............

134

Protocolo 32: Resposta da professora B para a questão 4 da parte A ............

134

Protocolo 33: Resposta da professora A para a questão 4.1. da parte A ........

135

Protocolo 34: Resposta da professora B para a questão 4.1. da parte A ........

135

Protocolo 35: Resposta da professora B para a décima questão da parte A .. 139

Protocolo 36: Resposta da professora A para a décima primeira questão

da parte A ...................................................................................

139

Protocolo 37: Resposta da professora A para a décima primeira questão

da parte A ...................................................................................

140

Protocolo 38: Resposta da professora A para a questão 2 da segunda fase

da parte A ...................................................................................

144

Protocolo 39: Resposta da professora B para a questão 2 da segunda fase

da parte A ...................................................................................

144

Protocolo 40: Resposta da professora A referente a distinção de duas

representações gráficas .............................................................

145

Protocolo 41: Respostas da professora A para as questões “5” e “5.1.” da

segunda fase da parte A ............................................................

148

Protocolo 42: Respostas da professora B para as questões “5” e “5.1.” da

segunda fase da parte A ............................................................

148

Protocolo 43: Resposta sobre a ferramenta do software que realiza a

inter-relação entre os diferentes registros apresentados

na tela .........................................................................................

150

Protocolo 44: Resposta da professora A à questão 6.1. da segunda fase da

parte A ........................................................................................

151

Protocolo 45: Resposta da professora B à questão 6.1. da segunda fase da

parte A ........................................................................................

151

Protocolo 46: Respostas da professora A para as questões “6” e “6.1.” da

terceira fase da parte A ..............................................................

157

Protocolo 47: Respostas da professora B para as questões “6” e “6.1.” da

terceira fase da parte A ..............................................................

158

Protocolo 48: Resposta da professora A referente a representação gráfica

box-plot .......................................................................................

162

Protocolo 49: Resposta da professora B referente a representação gráfica

box-plot .......................................................................................

163

Protocolo 50: Resposta da professora A para a questão 9.1 da terceira fase

da parte A ...................................................................................

163

Protocolo 51: Resposta da professora B para a questão 9.1 da terceira fase

da parte A ...................................................................................

164

Protocolo 52: Resposta da professora A para a comparação do histograma

e o box-plot .................................................................................

165

Protocolo 53: Resposta da professora B para a comparação do histograma

e o box-plot .................................................................................

165

Protocolo 54: Respostas da professora A para a questão 16 da terceira fase

da parte A ...................................................................................

177

Protocolo 55: Respostas da professora B para a questão 16 da terceira fase

da parte A ...................................................................................

178

Protocolo 56: Resposta da professora A para a última questão da terceira

fase da parte A ...........................................................................

179

Protocolo 57: Resposta da professora B para a última questão da terceira

fase da parte A ...........................................................................

179

Protocolo 58: Resposta da professora A para o item b da primeira questão

da parte B ...................................................................................

182

Protocolo 59: Resposta da professora B para o item b da primeira questão

da parte B ...................................................................................

183

Protocolo 60: Respostas da professora A para as questões “2.1”, “2.2” e

“2.3” da parte B ..........................................................................

183

Protocolo 61: Respostas da professora B para a questão 2 completa da

parte B ........................................................................................

184

Protocolo 62: Respostas da professora A para as questões “3.1”e, “3.2”

da parte B ...................................................................................

185

Protocolo 63: Respostas da professora B para a questão 3 completa da

parte B ........................................................................................

185

ISTA DE QUADROS

Quadro 1: Relações hipotéticas entre as Teorias de Duval e Curcio

elaborado por Vieira (2008, p. 38) .................................................

NTRODUÇÃO

No Programa de Estudos Pós-Graduados em Educação Matemática,

desenvolve-se um projeto de pesquisa na área da Educação Estatística, intitulado

PEA-ESTAT (Processos de Ensino e Aprendizagem da Estatística), como parte

das atividades do grupo PEA-MAT

. Nossa pesquisa faz parte desse projeto e

busca complementar o diagnóstico feito em Vieira (2008) que apresentaremos

mais adiante neste texto.

Nosso trabalho tem como objetivo principal verificar o nível de letramento

estatístico do professor da Escola Básica, que trabalha com estatística em sua

prática docente e, também, como o uso de um material de apoio, um ambiente

computacional auxilia no desenvolvimento dos níveis de leitura gráfica e

possibilita ao professor viabilizar a utilização de diferentes registros de

representação semiótica. Empregaremos o mesmo ambiente computacional que

Vieira (2008): o software de estatística Fathom.

Em sua dissertação, a autora citada percebeu que, em vários momentos, o

uso desse ambiente auxiliou os alunos pesquisados na compreensão de alguns

conceitos estatísticos. Dessa forma, aplicaremos uma sequência didática

construída com base na utilizada pela autora referida, para estudar procedimentos

e discursos do professor frente a esse recurso, quando solicitado a viabilizar a

aplicação de uma aula, pelo seu plano de aula, sobre a introdução aos conteúdos

de Estatística Descritiva. Assim, o foco de nosso trabalho será analisar as

condições didáticas nas quais, pelo uso do software, os registros de

____________

Grupo de pesquisa “Processos de Ensino e Aprendizagem da Matemática” (PEA-MAT), coordenado pelo

Prof. Dr. Saddo Ag Almouloud, ligado ao Programa de Estudos Pós-graduados em Educação Matemática

da PUC-SP e cadastrado no CNPq. O projeto PEA-ESTAT é finalizado pela FAPESP.

representação semiótica dos objetos estatísticos são mobilizados e a

consequente evolução nos níveis do letramento estatístico dos sujeitos.

No primeiro capítulo deste trabalho, trataremos da problemática. Neste item

definiremos nosso objetivo e as questões de pesquisa, além dos procedimentos

metodológicos escolhidos.

No segundo capítulo, apresentaremos algumas pesquisas na área da

Educação Estatística, que nos auxiliarão na constituição de nosso quadro teórico.

Abordaremos também pesquisas sobre o uso de um ambiente computacional

para o ensino e aprendizagem de alguns conceitos de Estatística Descritiva.

No terceiro capítulo, traremos uma breve explanação dos princípios da

análise exploratória de dados e a articulação com as ferramentas disponíveis no

software Fathom.

No quarto capítulo, apresentaremos as análises a priori e posteriori das

entrevistas com os professores participantes do projeto. Na sequência para

finalizar o trabalho, traremos nossas considerações finais.

. PROBLEMÁTICA

O presente capítulo traz as reflexões que conduziram nossas questões de

pesquisa e os procedimentos utilizados para respondê-las, assim como a

construção do quadro teórico no qual a pesquisa é embasada.

I.1 Objetivo e Problema de Pesquisa

Pesquisas recentes têm mostrado que, muitas vezes, o ensino da

Estatística Descritiva acontece como simples treino de algoritmos, sem a

necessária preocupação com a associação entre os resultados obtidos e o

contexto no qual o problema está inserido. Mostram, também, que os professores

sentem dificuldades com o ensino de alguns conceitos da Estatística Descritiva,

até pelo fato deles mesmos terem passado por sua formação inicial (escolar e

universitária) aprendendo-a nesse mesmo enfoque de aplicação de fórmulas e

não com o trabalho dos conceitos e contextos, que podemos chamar de

tecnicista, segundo os termos de Gascón (2003)

Esta ideia é reforçada por Coutinho (2008) que descreve em seu artigo

alguns resultados de pesquisas desenvolvidas recentemente pelo grupo de

pesquisa PEA-MAT, nos quais foi possível identificar essas dificuldades em

alguns professores pesquisados, sobretudo no que se refere à Análise

Exploratória de Dados.

A autora citada ainda enfatiza que o discurso do professor não condiz com

sua prática, uma vez que em suas falas mostram-se preocupados e dizem

perceber a importância da filosofia da Análise Exploratória dos Dados, mas, em

suas práticas, eles se restringem às técnicas que enfatizam o uso de algoritmos

(calcular medidas, sem qualquer preocupação ao dar significado aos resultados

obtidos).

Diante destas reflexões e dos resultados dos estudos que fomos buscar,

enfocamos nossa pesquisa no desenvolvimento dos conceitos da Estatística

Descritiva na Escola Básica, segundo o ponto de vista dos docentes de

Matemática desse nível de ensino.

O objetivo principal da presente pesquisa é verificar o nível de letramento

estatístico do professor da Escola Básica, que trabalha com a Estatística

Descritiva em sua prática docente (SHAMOS, 1995) e como o uso de um material

de apoio, no caso um software de Estatística Dinâmica (FATHOM), auxilia no

desenvolvimento dos níveis de leitura de gráfica (CURCIO, 1994) e possibilita

viabilizar a importância da utilização de diferentes registros de representação

semiótica (DUVAL, 2003).

Em outras palavras, desejamos estudar as consequências didáticas que

podem ser associadas ao uso de um software de estatística dinâmica no

conhecimento estatístico e pedagógico dos conteúdos estatísticos com

professores em exercício na Escola Básica. Desenvolveremos uma parte

destinada a explicar e situar essas teorias no âmbito deste trabalho.

Pretendemos com isso responder às seguintes questões:

Qual é o nível de letramento estatístico de professores de Matemática

do Ensino Médio que trabalham, em sua prática docente, com os conteúdos

da Estatística Descritiva?

Como estes percebem o uso simultâneo de vários registros de

representação semiótica para a análise de um conjunto de dados, com ou

sem o uso do ambiente informatizado?

Desta forma, depreendemos que a representação do objeto “distribuição de

frequências” ou do objeto “distribuição de um conjunto de dados” deve ser

realizada a partir de diferentes registros de representação semiótica: rol, tabelas,

gráficos, esquemas ou diagramas e medidas-resumo. Tais representações devem

ser favorecidas pela sequência de atividades preparadas pelo professor em seu

plano de aula, quando o objetivo é o trabalho com conceitos estatísticos, tais

como “distribuição”. Conjecturamos ainda que a utilização do ambiente

computacional, tal como o FATHOM, facilita a construção e a articulação dessas

representações.

Abordaremos também alguns conhecimentos pedagógicos, no entanto, não

nos aprofundaremos no assunto, por opção e por problemas de gestão do tempo.

Apenas faremos alguns questionamentos no intuito de perceber como o professor

se vê frente a esse tipo de perguntas, deixando-as para que ele possa refletir

sobre o assunto. Não acompanharemos o professor em suas aulas referentes à

abordagem da Estatística Descritiva, limitar-nos-emos a solicitar que analise um

plano de aula a ser trabalhado com seus alunos.

I.2 Os procedimentos metodológicos adotados

I.2.1 Estudo de Caso

Os procedimentos selecionados para responder a nossa questão de

pesquisa foram embasados nos princípios de um Estudo de Caso e em alguns

pressupostos da Engenharia Didática. Visto que um dos objetivos implícitos é

ensinar aos professores participantes o uso de ferramentas do software FATHOM.

O Estudo de Caso é uma metodologia usada em pesquisas qualitativas que

buscam realizar uma descrição densa dos fatos observados. Segundo André

(2005, p. 14), é um “estudo descritivo de uma unidade seja ela uma escola, um

professor, um grupo de alunos, uma sala de aula”.

Desse modo, percebemos a relação desta metodologia com nossa

pesquisa, uma vez que optamos por realizar uma pesquisa qualitativa com duas

professoras específicas, a partir de um “estudo denso” das interações dessas

docentes com os saberes da Estatística Descritiva em ambiente computacional.

Stake (1995, apud ANDRÉ 2005) distingue três tipos de Estudo de Caso:

Estudo de Caso Intrínseco, Estudo de Caso Instrumental e Estudo de Caso

Coletivo.

O Estudo de Caso Intrínseco acontece quando “o pesquisador tem um

interesse intrínseco naquele caso particular. Por exemplo, quando se deseja

investigar a prática pedagógica de uma alfabetizadora bem-sucedida, o interesse

é no caso em si, quer se conhecer mais aquela unidade específica” (ANDRÉ,

2005, p. 19). Optamos por este tipo de Estudo de Caso, já que a escolha pelas

professoras participantes teve suas particularidades, que explicaremos após

descrever os outros tipos de Estudo de Caso,

O Estudo de Caso Instrumental acontece quando o pesquisador possui

uma questão a ser respondida, na qual um caso particular vai ajudar a resolvê-la.

No Estudo de Caso Coletivo, o pesquisador concentra-se em mais de um

caso, várias escolas, vários professores, mas seu objetivo final é intrínseco ou

instrumental. O interesse não está especificamente nas escolas, nos professores,

mas no que eles revelam sobre um fato peculiar.

Em relação às particularidades das escolhas das professoras, percebemos

com a leitura de pesquisas recentes, que os resultados apontam que os

professores encontram-se em um nível de letramento estatístico cultural

(abordaremos letramento estatístico no capítulo II.1.1 deste trabalho), e que não

percebem a importância do trabalho com diferentes registros de representação

para o mesmo objeto estudado (abordaremos registros de representação

semiótica no capítulo II.1.3). Desta forma optamos por escolher duas professoras

que já haviam trabalhado com Estatística na Escola Básica, para verificar se

existem mudanças nos dados apontados. A seguir, a descrição de cada uma das

professoras entrevistadas.

A professora A trabalha com o 3º ano do Ensino Médio, há quase 5 anos

ininterruptos e em todos estes anos ela abordou com seus alunos conceitos da

Estatística Básica. Ela trabalha tanto em uma Escola da Rede Estadual de

Ensino, como na Rede Privada de Ensino, sua formação é licenciatura plena em

Matemática.

A professora B já trabalhou, algumas vezes, com os conceitos da

Estatística Básica; relata em sua entrevista que isto acontece em outras séries,

não apenas no 3º ano do Ensino Médio, mas que também desenvolveu alguns

trabalhos com esta série. Ela trabalha em uma Escola da Rede Estadual de

Ensino, sua formação é licenciatura plena em Matemática, especialização em

Educação Matemática e está em fase de conclusão do seu mestrado em

Educação Matemática.

Assim, optamos por estas duas professoras, para que possamos perceber,

se o seu trabalho com estes conceitos, uma sequência didática especifica e

estando frente a um recurso didático diferenciado (software de estatística

dinâmica), seu letramento estatístico seria apenas cultural, ou se existiriam

mudanças nesse fato.

Retornemos a discussão dos princípios do Estudo de Caso. Merrian (1988)

apud ANDRÉ (2005) concluiu que quatro são as características essenciais em um

estudo de caso qualitativo: particularidade, descrição, heurística e indução.

Particularidade significa que o estudo de caso focaliza uma

situação, um programa, um fenômeno particular. O caso em si tem

importância, seja pelo que representa. É, pois, um tipo de estudo

adequado para investigar problemas práticos, questões que

emergem do dia-a-dia.

Descrição significa que o produto final de um estudo de caso é um

descrição “densa” do fenômeno em estudo. Por descrição densa

entende-se uma descrição completa e literal da situação

investigada. [...]. O estudo de caso engloba um grande número de

variáveis e retrata suas interações ao longo do tempo.

Heurística significa que os estudos de caso iluminam a

compreensão do leitor sobre o fenômeno estudado. Podem

revelar a descoberta de novos significados, estender a experiência

do leitor ou confirmar o já conhecido.

Indução significa que em grande parte, os estudos de caso se

baseiam na lógica indutiva. “Descoberta de novas relações,

conceitos, compreensão, mais do que verificação ou hipótese pré-

definida caracteriza o estudo de caso qualitativo”. (MERRIAN,

1988, p. 13, apud ANDRÉ, 2005, p. 17 - 18)

Para contemplar estas características, focalizaremos nosso estudo nas

duas professoras participantes, investigando sua postura em relação aos

conceitos da Estatística Descritiva. Faremos, também, uma descrição “densa” dos

fatos no momento da análise a posteriori de nossa pesquisa, buscando

compreender como elas evoluem nos níveis de letramento estatístico e na

mobilização dos diversos registros de representação semiótica de um mesmo

conceito estatístico: a distribuição de frequência.

O Estudo de Caso caracteriza-se em três fases: fase exploratória ou de

definição dos focos de estudo, fase de coleta dos dados ou de delimitação do

estudo e fase de análise sistemática dos dados. Podemos supor que ele está

diretamente ligado à Engenharia Didática que, também, possui fases distintas, a

utilizaremos, juntamente com o Estudo de Caso para elaborar, aplicar e analisar

nossa pesquisa.

Em relação ao Estudo de Caso, os núcleos centrais da fase exploratória,

segundo André (2005), voltam-se às experiências cotidianas do sujeito, sua

linguagem, suas produções culturais e formas de interações sociais.

A fase exploratória é o momento de definir a(s) unidade(s) de

análise – o caso –, confirmar – ou não – as questões iniciais,

estabelecer os contatos iniciais para entrada em campo, localizar

os participantes e estabelecer mais precisamente os

procedimentos e instrumentos de coleta de dados, (ANDRÉ, 2005,

p. 48)

Em relação a esta primeira fase, para contemplá-la faremos um estudo de

algumas pesquisas recentes no âmbito da Educação Estatística, quanto ao

letramento, aos registros de representação semiótica e aos níveis de

compreensão de gráficos. Em relação aos procedimentos e instrumentos de

coleta de dados, escolhemos adaptar a sequência didática desenvolvida por

Vieira (2008) para nosso público-alvo, professores, uma vez que ela trabalha

tanto com os registros de representação como com os níveis de compreensão

gráfica e o mesmo ambiente informatizado que trabalhamos em nossa pesquisa.

Retomando as fases do estudo de caso, percebemos que: “Uma vez

identificados os elementos-chave e os contornos aproximados do estudo, o

pesquisador pode proceder à coleta sistemática de dados”. (ANDRÉ, 2005, p. 50-

51).

Bassey “considera que há três grandes métodos de coleta de dados nos

estudos de caso: fazer perguntas (e ouvir atentamente), observar eventos (e

prestar atenção no que acontece) e ler documentos”. (BASSEY, 2003 p. 81-83

apud ANDRÉ 2005, p. 51)

Neste momento de coleta de dados, voltaremos nossa pesquisa para a

observação das professoras no momento da resolução dos problemas propostos,

atentando-nos a seus registros, tanto orais como escritos. Segundo Vianna, “a

observação é uma das mais importantes fontes de informações em pesquisas

qualitativas em educação”. (VIANNA, 2003, p. 12)

Vianna ressalta que Bailey (1994) estabelece diferentes e sucessivas fases

do processo de observação, fases estas que tentamos desenvolver em nosso

trabalho e citamos abaixo.

− definir os objetivos do estudo;

− decidir sobre o grupo de sujeitos a observar;

− legitimar sua presença junto ao grupo a observar;

− obter confiança dos sujeitos a observar;

− observar e registrar notas de campo durante semanas;

− gerenciar possíveis crises que possam ocorrer entre os sujeitos

e o observador;

− saber retirar-se do campo de observação

− analisar os dados;

− elaborar um relatório sobre os elementos obtidos. (BAILEY,

1994, apud VIANNA, 2003, p. 30)

Para a última fase do Estudo de Caso, a fase de delimitação do estudo e

de análise sistemática dos dados, André afirma que:

A elaboração do relatório final é um grande desafio na condução

do estudo de caso, pois exige certa habilidade de escrita por parte

do pesquisador. Os relatos de caso apresentam geralmente um

estilo informal, narrativo, ilustrado por figuras de linguagem,

citações, vinhetas narrativas, exemplos e ilustrações. A

preocupação é com a transmissão direta, clara e bem articulada

do caso, num estilo que se aproxime da experiência pessoal do

leitor (ANDRÉ, 2005, p. 56-57).

As formas de análise dos dados e de elaboração do relatório final

não estão absolutamente prontos em roteiros para serem

seguidos, havendo necessidade de que o pesquisador se baseie

em seus próprios talentos, sua criatividade e suas habilidades

pessoais. (ANDRÉ, 2005, p. 36)

Em nosso trabalho, a fase da elaboração do relatório final será orientada

pelas análises a posteriori do observado, segundo os princípios da Engenharia

Didática que apresentaremos a seguir.

I.2.2 Pressupostos da Engenharia Didática

Conforme cita Artigue (1996, p.4), a Engenharia Didática evoluiu como uma

metodologia de pesquisa que é vista como: “… em desenvolvimento de uma

pesquisa ou de uma prática, a Engenharia Didática é certamente uma prática de

intervenção controlada, e esta intervenção é teoricamente fundamentada.”

(tradução nossa). Para a autora citada, a validação se dá pelo confronto entre as

análises a priori e a posteriori.

A Engenharia Didática é uma metodologia de pesquisa com diferentes

fases: as análises prévias, a análise a priori, a experimentação, a análise a

posteriori e a validação. Um dos objetivos da primeira fase da Engenharia

Didática é: “identificar os problemas de ensino e aprendizagem do objeto de

estudo e delinear de modo fundamentado a(s) questão(ões), as hipóteses, os

fundamentos teóricos e metodológicos da pesquisa” (ALMOULOUD, 2007, p.

172).

Para contemplar esta primeira fase, nesta pesquisa faremos uma

abordagem detalhada do quadro teórico escolhido (Registro de Representações

Semióticas), assim como dos quadros complementares saídos das teorias da

Educação Estatística, tais como: os níveis de letramento estatístico (SHAMOS,

1995) e os níveis de leitura e compreensão de gráficos (CURCIO, 1994).

Além disso, o quadro também será constituído pelos resultados

encontrados em pesquisas recentes sobre o ensino e a aprendizagem da

Estatística aos quais tivemos acesso. O software FATHOM será analisado

didáticamente.

Voltando à apresentação de nossos procedimentos, passamos a segunda

fase de uma Engenharia Didática que, segundo Almouloud (2007, p. 176), é o

momento que o pesquisador elabora e analisa uma sequência de situações-

problema. “O objetivo de uma análise a priori é determinar como as escolhas

didáticas efetuadas permitem controlar os comportamentos dos alunos e explicar

seu sentido”.

Conforme citamos no Estudo de Caso, nesta fase utilizaremos como

situações-problema as atividades desenvolvidas por Vieira (2008), com as

modificações necessárias para nosso público-alvo, professores. Partimos da

hipótese de que estes não conhecem o ambiente computacional escolhido, assim

como têm pouco conhecimento de conceitos estatísticos, conforme os resultados

de pesquisas recentes em nossa revisão bibliográfica. Desta forma, optamos por

deixar até mesmo o teste diagnóstico da sequência de Vieira (2008).

Neste momento, vale ressaltar que Vieira (2008) realizou sua pesquisa

também com o ambiente informatizado FATHOM. No entanto, seu objetivo de

pesquisa foi: “a partir do desenvolvimento de uma seqüência didática, estudar as

interações entre o aluno e um ambiente de estatística dinâmica, introduzindo a

análise exploratória de dados para o nível do segundo ano do Ensino Médio”

(VIEIRA, 2008, p. 16).

A terceira fase de uma Engenharia Didática, a da experimentação, é o

momento no qual observamos como os professores participantes desenvolvem

um raciocínio estatístico adequado à resolução dos problemas propostos, sejam

estes relativos aos conhecimentos estatísticos como aos didáticos.

A quarta fase, segundo Almouloud, é a análise a posteriori:

... é o conjunto de resultados que se pode tirar da exploração dos

dados recolhidos e que contribui para a melhoria dos

conhecimentos didáticos que se têm sobre as condições da

transmissão do saber em jogo. Ela não é crônica da classe, mas

uma análise feita à luz da análise a priori, dos fundamentos

teóricos, das hipóteses e da problemática da pesquisa,...

(ALMOULOUD, 2007, p. 177)

A última fase, a validação é o confronto entre as análises a priori e a

posteriori, e é a principal característica da Engenharia Didática.

Em um primeiro momento, foi realizado um “piloto” para verificarmos a

adequação das atividades em relação aos resultados pretendidos. O piloto foi

realizado com uma professora que leciona há aproximadamente 4 anos na rede

pública de ensino e não conhecia o software Fathom. A seguir apresentamos um

esquema representando o projeto traçado para a realização da pesquisa com

professores do Ensino Médio.

Figura 1: Esquema traçado para a realização da fase experimental da Engenharia Didática

Em nossa fase experimental, inicialmente, aplicamos um teste diagnóstico

com o objetivo de perceber o nível de conhecimento estatístico do sujeito da

pesquisa. A aplicação deste diagnóstico ficou fortemente fundamentada, uma vez

que pesquisas recentes (apresentadas a seguir neste texto) mostram que o nível

de letramento estatístico do professor é cultural (os níveis de letramento

estatístico considerados serão apresentados no próximo capítulo). Para esta fase,

é previsto um encontro com duração de 30 minutos.

Em seguida, nossa sequência didática (parte A) busca familiarizar o

professor com o ambiente FATHOM, além de trabalhar e/ou recordar alguns

conhecimentos estatísticos. Esta parte da sequência é subdividida em outras três

fases, cada uma com um enfoque mais especifico. A primeira evidencia as

variáveis, os tipos de variáveis e a construção de tabelas de distribuição de

frequências. A segunda apresenta e sugere a análise de algumas representações

gráficas. A última fase da parte A, além de trabalhar com as medidas-resumo

propõe uma inter-relação entre os diversos registros de representação. Para esta

parte, serão previstos dois encontros com duração de 40 minutos.

Na parte B de nossa pesquisa, sugerimos ao professor a construção de um

plano de aula, no qual a finalização por parte de seus alunos seria a construção

de um relatório estatístico que apresentasse sua escola a um aluno de uma outra

escola. Nesta parte, trazemos algumas sugestões de atividades e solicitamos

para o professor verificar a viabilidade da aplicação destas, evidenciando

mudanças, sugestões. Para esta parte, será previsto um encontro com duração

de 30 minutos.

As análises dos resultados observados no teste diagnóstico e nas fases A

e B de nossa fase experimental fornecerão os elementos para o nível de

letramento estatístico do professor que já trabalha com conceitos da Estatística

Descritiva em sua prática docente e, também, como ele percebe o uso simultâneo

dos diferentes registros de representação semiótica.

. ALGUMAS PESQUISAS QUE FUNDAMENTAM O

ESTUDO

Para melhor delinear nosso trabalho, fomos buscar os resultados de

algumas pesquisas realizadas na área, além de estudar determinadas teorias

importantes para o desenvolvimento desta pesquisa.

II.1 Um primeiro esboço do quadro teórico

Neste trabalho, assumimos a Estatística como uma ciência de análise de

dados que usa a Matemática como ferramenta. O ensino da Estatística contribui

para a formação de indivíduos capazes de compreender e interpretar melhor o

mundo que os rodeia, visto que percebemos cada vez mais que a sociedade vem

se utilizando de dados para fazer previsões e tomar decisões.

A concepção da Estatística como ciência vai ao encontro da ideia

apresentada por Wild e Pfannkuch (2005), sobre como deve acontecer a

compreensão da investigação estatística:

Tomamos como ponto de partida a concepção de que o objetivo

fundamental da investigação estatística (aplicada) é a

aprendizagem na esfera do contexto do problema e que o

“pensamento estatístico” é a interação entre o estatístico e o

contextual (WILD e PFANNKUCH, 2005, p. 1, tradução nossa)

Atualmente percebemos um aumento no número de pesquisas na área da

Educação Estatística. Grandes teóricos têm estudado como acontece o

pensamento estatístico, a compreensão e a análise dos dados.

Segundo Morais:

As pesquisas têm mostrado que o conceito estatístico, quando é

desenvolvido na escola, não possibilita a construção do

pensamento estatístico do aluno. Normalmente é trabalhado de

maneira isolada e desarticulado, formando, assim, consumidores

despreparados e inseguros no trato com dados... (MORAIS, 2006,

p. 16)

Desta forma, julgamos ser interessante definir o que seria para nós

pensamento estatístico. Segundo Snee (1990, apud WILD e PFANKKUCH, 2005),

o pensamento estatístico define-se como:

processos do pensamento que reconhecem que a variação está

em tudo que nos rodeia e presente em qualquer coisa que

fazemos, todo o trabalho é uma série de processos

interconectados, e a identificação, a caracterização, a

quantificação, o controle e a redução da variação proporcionam

oportunidades para o crescimento. (SNEE, 1990 apud WILD e

PFANNKUCH, 2005, p. 2, tradução nossa)

Morais ao desenvolver sua pesquisa com base nessa definição de

pensamento estatístico, afirma que:

O pensamento estatístico possibilita visualizar o processo como

um todo com interação, justificação e compreensão do

relacionamento dos dados, além da mensuração da variação

presente. Assim é possível explorar os dados para além do que

está prescrito no texto, de modo que gere novos questionamentos

e tomadas de decisões conscientes e críticas. (MORAIS, 2006, p.

23)

Com isso, podemos observar que, para que a análise dos dados seja feita

de maneira crítica, é necessário que se realize a análise do contexto das

informações. Para que uma análise seja bem-feita, devemos olhar além dos

dados apresentados, considerando o objetivo da pesquisa e a situação nos quais

os dados foram coletados.

Campos (2007) resume e completa a reflexão de Wild e Pfannkuch e de

outros teórico da seguinte maneira:

o Pensamento Estatístico ocorre quando os modelos matemáticos

são associados à natureza contextual do problema em questão,

ou seja, quando surge a identificação da situação analisada e faz-

se uma escolha adequada das ferramentas estatísticas

necessárias para sua descrição e interpretação (CAMPOS, 2007,

p. 40)

Wild e Pfannkuch relatam que “o objetivo fundamental da investigação

estatística é a aprendizagem na esfera do contexto”, e ainda que “cada problema

sobre o qual se trabalhe uma estatística aplicada está dentro de um problema

maior, “o problema real”. Ao redor deste problema maior está um corpo conhecido

de “contexto””. (WILD e PFANNKUCH, 2005, p. 2, tradução nossa)

Ao fazer um paralelo com a teoria desenvolvida por Curcio (1994) que

propõe três níveis de leitura dos dados que serão apresentados mais adiante

neste texto, percebemos que o nível de leitura dos dados mais desenvolvido

acontece quando o indivíduo consegue inferir com base em seus conhecimentos

e nas informações do contexto.

Wild e Pfannkuch (2005) buscam desenvolver uma discussão sobre o que

é o pensamento estatístico; procuram detalhar como deve acontecer esse

pensamento, e para isto organizam em subitens como:

− a concepção da estatística aplicada (a aprendizagem na esfera do

contexto);

− os fundamentos do pensamento estatístico (conhecer a variação, a

construção, o raciocínio com base nos modelos e a integração entre os

conhecimentos estatísticos e do contexto);

− os modos do pensamento (estratégico, interrogativo, perceptivo,

descritivo, interconexão, dedução, imaginação (conjeturas) e avaliação);

− as atitudes do sujeito (curiosidade, consciência, franqueza, buscar um

significado profundo, compromisso);

− as restrições (coisas que limitam o aprofundamento e a qualidade do

pensamento, como o conhecimento das pré-concepções, tempo,

dinheiro, restrições impostas por clientes); e

− as técnicas (uso de técnicas de experiências passadas, modelos).

Ao observar as ideias até aqui apresentadas, podemos perceber uma

grande preocupação com o contexto, com a situação na qual o problema está

inserido, além dos processos do pensamento necessários para a compreensão

geral do problema em questão.

Existem outros autores que abordam este tema, no entanto, tomaremos

para nossa pesquisa o pensamento estatístico, conforme é apresentado neste

capítulo.

Para a construção do pensamento estatístico, fazemos a hipótese da

importância do trabalho com diferentes representações para o mesmo objeto de

estudo; no caso, o conjunto de dados ou distribuição de frequências. Assim, a

seguir, apresentaremos o referencial teórico deste trabalho e, com isso,

justificaremos esta importância.

Tomaremos como referencial teórico a Teoria dos Registros de

Representação Semiótica (DUVAL, 2003) assim como os níveis de leitura de

gráficos propostos por Curcio (1994) e por Friel et al. (2001) e, também algumas

ideias sobre os níveis de letramento científico propostos por Shamos (1995).

O primeiro referencial será usado para analisar o uso das diferentes

representações de um mesmo objeto da distribuição de frequência como os

registros de representação semiótica; o segundo, para analisar o nível de leitura

de gráficos dos professores, o terceiro, para analisar a relação entre a

mobilização dos registros, os níveis de leitura gráfica e o letramento estatístico.

Duval (2003) propôs sua teoria para a geometria e para a álgebra. No

entanto, Vieira (2008) sugeriu um paralelo entre a teoria de Duval (2003) e as

representações dos conceitos estatísticos que utilizaremos em nossa pesquisa.

Em relação ao uso do ambiente computacional, pesquisas recentes

apresentam que o computador está cada vez mais presente em nossas vidas e

que seu uso pode auxiliar na aprendizagem dos alunos.

Nos dias atuais, a utilização de computadores é uma realidade em

praticamente todas as áreas de atividade humana e, no cenário

educacional, a importância desta utilização está sendo cada vez

mais reconhecida por profissionais da área.

Diversas pesquisas indicam que tanto calculadoras como

computadores podem auxiliar os alunos na aprendizagem de

diversos conceitos matemáticos. No caso da estatística as

planilhas eletrônicas ajudam os estudantes a visualizar e explorar

melhor um conjunto de dados. (SANTOS, 2003, p. 19)

A mesma autora ressalta em seu trabalho que o uso do ambiente

computacional pode auxiliar nas interpretações dos gráficos, e é uma grande

ferramenta que fornece diferentes formas para representar o mesmo conjunto de

dados.

II.1.1 Os níveis letramento (ou literacia) estatística propostos por Shamos

Shamos (1995) propõe uma organização do letramento científico em três

níveis diferentes e hierárquicos: nível de letramento cultural, nível de letramento

funcional e nível de letramento científico.

O primeiro nível, o cultural refere-se às pessoas que apenas compreendem

os termos que utilizam em seu cotidiano, elas apenas reconhecem os termos

mais simples. As pessoas que se encontram nesse nível não utilizam termos

científicos em suas conclusões, apenas fazem breves observações sobre as

informações apresentadas.

Para o segundo nível, o funcional, o autor relata que nesta etapa a pessoa

já é capaz de compreender, ler e escrever corretamente alguns termos científicos.

Shamos relata ainda que a maioria dos adultos encontram-se no nível funcional

de letramento, pois segundo o autor: “... a recordação da ciência da maioria dos

adultos é muito pobre, mesmo para a maioria dos termos e conceitos que durante

o tempo da escola estivessem na “ponta da língua” durante os anos de

escolaridade”. (SHAMOS, 1995, p. 87, tradução nossa).

Gal (2002) considera que a compreensão estatística neste nível é maior do

que no anterior, visto que as pessoas já não utilizam apenas conceitos de seu

cotidiano, mas fazem uso de alguns termos científicos. Mas, nesse nível, o

individuo utiliza alguns conteúdos de Estatística, consegue empregar certos

conceitos corretamente, compreende a maioria das informações observadas na

imprensa popular, mas não possui o conhecimento do emprego de todos os

termos científicos corretamente.

Shamos aponta para uma distinção interessante entre estes dois níveis

(cultural e funcional):

Uma distinção útil entre estes dois níveis de letramento é que o

sujeito letrado funcionalmente deve estar capacitado a se engajar

e um discurso significativo sobre a maioria dos artigos científicos

que aparece na imprensa popular, ao menos, colocando questões

inteligentes; enquanto que uma pessoa letrada culturalmente está

na posição de quem conhece uma língua estrangeira apenas

superficialmente, podendo apenas ficar inerte quando uma pessoa

fluente no idioma tenta iniciar uma conversação fluente.

(SHAMOS, 1995, p. 89, tradução nossa)

O último nível do letramento científico é o científico. Neste nível, a pessoa é

capaz de compreender e utilizar os conceitos científicos da Estatística

corretamente. Para Shamos (1995), aqui o indivíduo possui a compreensão global

dos termos estatísticos e sente segurança em suas escolhas. O indivíduo possui

uma preocupação com a investigação científica, com a pesquisa e, segundo o

autor: “Este individuo também aprecia os elementos da investigação científica, a

importância de um questionamento adequado, o raciocínio analítico e dedutivo, os

processos lógicos do pensamento”. (SHAMOS, 1995, p. 89, tradução nossa)

Em relação aos três níveis, Shamos menciona que o letramento cultural

(primeiro nível) é encontrado em quase todos os formados da Escola Básica, e o

segundo nível (o cultural) em todos os alunos formados na Escola Básica, que

levaram seus estudos mais a sério que eram “superiores” à sua classe. Já, para

alcançar o terceiro nível, os estudantes de nível superior precisam, segundo o

autor, extrapolar suas habilidades, percebendo que não existem limites para a

ciência, isto acontece quando estes são fortemente motivados e tiveram um bom

ensino.

Nesse sentido, podemos inferir pautados em Shamos (1995), que os

professores da Escola Básica podem atingir um nível científico de letramento

estatístico, e seus alunos alcançam apenas o nível funcional.

Vale aqui nos reportarmos aos trabalhos de Friolani (2007) e Simone Neto

(2007), ao mostrarem que os livros didáticos tendem a oferecer condições para

apenas, ao limiar entre o cultural e o funcional.

II.1.2 Os níveis de leitura gráfica propostos por Curcio

Segundo Curcio:

Os gráficos são meios de comunicar e classificar dados,

permitindo a comparação e exibindo relações. Embora a leitura

literal dos dados apresentados seja uma habilidade importante na

compreensão desse tipo de representação, o seu potencial

máximo será atingido quando o leitor for capaz de interpretar e

generalizar dados” (CURCIO, 1994, p. 1).

Curcio (1994) e Friel et al (2001) estabelecem três diferentes níveis de

leitura de um gráfico: leitura dos dados; leitura entre os dados; leitura além dos

dados. No primeiro nível, o mais elementar apenas se levantam os fatos do

gráfico, sem nenhuma interpretação, leitura simples dos eixos. Segundo Vieira:“...

este tipo de compreensão é uma tarefa que requer poucos recursos cognitivos.”

(VIEIRA, 2008, p. 21)

A seguir, um exemplo de atividade proposta por Curcio (1994) para este

nível.

Como John gasta dinheiro diariamente na escola.

almoço; $ 1,00

diversão; $ 0,50

transporte; $ 0,20

suprimentos

escolares; $ 0,30

Use o gráfico acima para responder as questões:

1. O que o gráfico conta para você?

a. Como John gasta seu dinheiro nos finais de semana.

b. Como John gasta seu dinheiro durante uma semana completa.

c. Como John gasta seu dinheiro durante as férias

d. Como John gasta seu dinheiro durante um dia na escola.

2. Quanto John gasta em suprimentos escolares em um dia?

a. $0,20 c. $0,50

b. $0,30 d. $1,00

Figura 2: Exemplo Leitura dos Dados (CURCIO, 1994, p. 71) – tradução nossa

Para solucionar as atividades propostas acima, não é necessário fazer

nenhuma interpretação dos dados, basta buscá-los diretamente no gráfico.

No nível seguinte (leitura entre os dados – pesquisas recentes mostram

que a maior parte das pessoas é capaz de responder questões neste nível),

começam a existir interpretações, sendo feitas algumas comparações. Segundo

Curcio:

Este nível de compreensão inclui a interpretação e integração dos

dados no gráfico. Requer a habilidade para comparar quantidades

(como: melhor que, maior que, menor que) e usar outras

concepções e habilidades matemáticas (como: adição, subtração,

multiplicação, divisão) que permita o leitor combinar e integrar

dados e identificar as relações matemáticas expressas no gráfico.

(CURCIO, 1994, p. 6, tradução nossa)

A seguir, um exemplo de atividade para este nível proposta pelo autor

citado, referindo-se ao mesmo gráfico do exemplo anterior:

Como John gasta dinheiro diariamente na escola.

almoço; $ 1,00

diversão; $ 0,50

transporte; $ 0,20

suprimentos

escolares; $ 0,30

Use o gráfico acima para responder as questões:

3) Qual é o total de diários gastos de John na escola?

a. $1,90 c. $3,00

b. $2,00 d. $4,00

4. Quanto a mais John gasta no almoço do que no transporte?

a. $ 0,50 c. $ 0,80

b. $0,70 d. $1,20

Figura 3: Exemplo Leitura entre os Dados (CURCIO, 1994, p. 71) – tradução nossa

Neste caso, podemos observar que as soluções das atividades acima

requerem pequenas interpretações, fazem uso de comparações e de alguns

conceitos matemáticos, como as operações fundamentais. Não basta a simples

leitura dos rótulos, para fornecer a resposta desejada.

O terceiro e último nível é o da leitura além dos dados. Neste caso, o

indivíduo faz inferências com seus conhecimentos próprios e as informações do

contexto, completando a simples leitura de um gráfico com a análise dos dados

obtidos. Segundo Vieira:

Este nível de compreensão requer do leitor uma predição ou

inferência a partir dos dados, extraindo os esquemas existentes

(por exemplo, conhecimento anterior, conhecimento na memória)

para informação que não é nem explícita nem implicitamente

apresentada no gráfico.... Podemos dizer que este nível de leitura

exige, ainda mais que os níveis anteriores, um profundo

conhecimento do contexto no qual os dados foram coletados.

(VIEIRA, 2008, p. 22)

A seguir, um exemplo de atividade proposta por Curcio (1994) que

privilegia este nível de leitura de dados, também, para o mesmo gráfico dos

exemplos anteriores.

Como John gasta dinheiro diariamente na escola.

almoço; $ 1,00

diversão; $ 0,50

transporte; $ 0,20

suprimentos

escolares; $ 0,30

Use o gráfico acima para responder as questões:

5. Quanto dinheiro John precisa para pagar o almoço por 5 dias na escola?

a. $1,00 b. $2,00 c. $4,00 d. $5,00

6. Qual é o total de dinheiro que John precisa para 5 dias na escola?

a. $ 2,00 b. $7,00 c. $ 10,00 d. $14,00

Figura 4: Exemplo Leitura além dos Dados (CURCIO, 1994, p. 71) – tradução nossa

Podemos observar que a solução desta atividade não está apresentada

diretamente nas informações contidas no gráfico, é necessário que a pessoa faça

inferências ou relações para conseguir solucioná-las: com base no conhecimento

de quantos dias por semana John vai à escola, resolve o problema com os dados

do gráfico.

II.1.3 A teoria dos registros de representação semiótica

“O acesso aos objetos matemáticos passa necessariamente por

representações semióticas” (DUVAL, 2003, p. 21). Logo, acreditamos que a

compreensão do objeto “distribuição de frequências” deva acontecer pela

articulação de seus registros de representação semiótica. Tomaremos como

objeto de estudo os gráficos e as tabelas, usados como registros de

representação semiótica de uma distribuição de frequências.

Segundo Duval (2003, p. 15: 16), “existem dois tipos de transformações de

representações semióticas que são radicalmente diferentes: os tratamentos e as

conversões”. Os tratamentos são transformações dos registros de representações

semiótica que permanecem no mesmo sistema. Em seu artigo, Duval cita alguns

exemplos: “efetuar um cálculo ficando estritamente no mesmo sistema de escrita

ou de representação dos números; resolver uma equação ou um sistema de

equações; completar uma figura segundo critérios de conexidade e de simetria”.

Já as conversões são transformações de um mesmo objeto por registros

de representações com conteúdos diferentes. Assim, há mudança de sistema,

mas conservam-se as referências ao mesmo objeto. A seguir, um exemplo

apresentados por Duval (2003, p. 16): “passar da escrita algébrica de uma

equação à sua representação gráfica”.

A teoria de Duval está mais intimamente ligada à geometria e à álgebra. No

entanto Vieira (2008) apresentou estudo para o uso desta teoria para a análise de

objetos do campo da Estatística Descritiva.

Em relação ao acesso aos objetos pela sua representação, Vieira (2008)

ressaltou que, em Estatística podemos representar uma distribuição de

frequências para uma variável de diferentes maneiras, como uma representação

gráfica ou uma tabela. Observe os exemplos de representações da mesma

distribuição de frequência para a variável “gênero”, supondo uma pesquisa feita

com determinado grupo de pessoas.

Tabela 1: Enumeração

Figura 5: Gráfico de colunas

Em relação aos tratamentos descritos por Duval, Vieira (2008) apresenta

um paralelo na Estatística com as transformações que ocorrem em tabelas.

Enumerar para passar à tabela de distribuição de frequências.

Tabela 2: Tabela de distribuição de frequências para a variável “gênero”

Podemos ilustrar uma segunda forma de tratamento em uma tabela, pela

mudança da amplitude das classes que agrupam os dados de uma variável

quantitativa contínua. Muitas vezes, este tipo de transformação é utilizado para

preparar os dados para a aplicação de testes de hipóteses ou outros tratamentos

estatísticos.

Figura 6: Tratamento em uma tabela pela modificação da amplitude das classes

Um terceiro exemplo de tratamento seria a mudança na escala de um eixo

de uma representação gráfica.

Já o exemplo de conversão pode acontecer, por exemplo, com a mudança

da representação de uma tabela para um gráfico, ou do valor calculado de uma

medida resumo para a representação gráfica desse valor.

Figura 7: Conversão de uma tabela de distribuição de frequências para um gráfico de colunas

para a variável gênero

A seguir, apresentamos outro exemplo que é a conversão da enumeração

dos dados para a representação da medida resumo “média das idades” (em anos)

de um determinado grupo de adolescentes.

Tabela 3: Enumeração das idades

Cálculo da média:

16 15 17 15 15 18 15 17 15 16 15 14 16 17 221

14 14

15 7857ou seja, , anos

+ + + + + + + + + + + + +

= =

Localização da média no gráfico:

Gráfico 1: Localização da média no gráfico

O box-plot também seria outra representação gráfica, mas em um sistema

distinto do histograma, pois esta representação não utiliza sistema de eixos

cartesianos nem se fundamenta na distribuição de frequências, mas sim na

distribuição dos dados.

Conteúdo do histograma: valor da variável (organizado em intervalos reais)

e frequência observada em cada intervalo.

Conteúdo do box-plot: valores assumidos pela variável, destacando ponto

mínimo, primeiro quartil, mediana, terceiro quartil e valor máximo, ou seja o

conteúdo é a representação dos valores, segundo quatro partições de mesmo

número de elementos.

Uma observação importante entre estes dois conteúdos é que, no

histograma, a área dos retângulos representa a frequência, e no box-plot, ela

representa a dispersão dos dados

Explicaremos a construção e a representatividade desta representação

gráfica no capítulo Princípios da Análise Exploratória de Dados

Gráfico 2: Box-plot

Nesse caso, temos representações distintas, em sistemas diferentes para

um mesmo objeto, para uma mesma variável estatística, as idades (em anos) de

um grupo de adolescentes.

Nesta pesquisa, assim como em Vieira (2008), buscaremos o uso

simultâneo dos diversos registros de representação semiótica do objeto

“distribuição de frequências’, fazendo com que o aluno realize a análise dos

dados com base na compreensão dos tratamentos e conversões efetuados pelo

software (mas sob o comando dos sujeitos).

Duval (1995 apud Almouloud, 2003) distingue quatro formas de apreensão

para a interpretação dos problemas em geometria, abaixo apenas a citaremos,

pois no capítulo II.3 veremos as possíveis inter-relações destas apreensões para

a estatística:

1. sequencial: é solicitada nas tarefas de construção ou nas

tarefas de descrição com objetivo de reproduzir uma figura;

2. perceptiva: é a interpretação das formas da figura em uma

situação geometria;

3. discursiva: é a interpretação dos elementos da figura

geométrica, privilegiando a articulação dos enunciados,

levando em consideração a rede semântica de propriedades

do objeto;

4. operatória: está centrada nas modificações possíveis de uma

figura de partida e na reorganização perceptiva que essas

modificações sugerem. (ALMOULOUD, 2003, p. 127)

II.1.4 Saberes docentes

Segundo Moreira e David:

Uma das questões recorrentes nos debates sobre a formação de

professores através da licenciatura é a falta de uma articulação

adequada entre a formação específica e a formação pedagógica,

tendo em vista a futura prática profissional na educação básica

(MOREIRA e DAVID, 2005, p. 50)

Nesse artigo, os autores relatam que a Matemática da escola não pode ser

reduzida a uma matemática científica didatizada, e que a prática do professor de

Matemática é complexa e não pode ser minimizada a uma simples técnica de

transmissão de conteúdos previamente definidos.

Para Shulman (2001), os saberes docentes são muitos e que se estes

pudessem ser organizados em um manual, abrangeriam no mínimo os seguintes

itens:

− Conhecimento do conteúdo;

− Conhecimento didático geral, levando em conta especialmente

aqueles princípios e estratégias gerais de manejo e

organização da classe;

− Conhecimento do currículo, com um especial domínio dos

materiais e dos programas que servem como “ferramenta para

o ofício” do docente;

− Conhecimento didático do conteúdo: em especial a inter-

relação entre a matemática e a pedagogia que constituem uma

esfera exclusiva dos professores, sua própria forma de

compreensão profissional;

− Conhecimento dos alunos e de suas características;

− Conhecimento dos contextos educativos, que abrangem desde

o funcionamento do grupo ou da classe, a gestão e o financeiro

da escola, as características das comunidades e a cultura; e

− Conhecimento dos objetivos, as finalidades e os valores

educativos, e de seus fundamentos filosóficos e históricos.

(SHULMAN, 2001, p. 11, tradução nossa).

O autor ainda afirma que é o conhecimento didático do conteúdo que

representa a mescla entre matéria e didática e, ainda, é ele que permite a

distinção entre o especialista da área e o professor, pois o professor precisa

pensar na didática de como abordar os conteúdos.

Desta forma, como nosso público-alvo são professores da Escola Básica,

percebemos a necessidade de abordar na parte prática de nossa pesquisa,

questões que abeirassem, tanto o conhecimento do objeto de estudo como

questões que possibilitem o professor refletir sobre sua prática docente e suas

escolhas didáticas.

II.2 Algumas pesquisas sobre o ensino e a aprendizagem da estatística

Colaborando para a construção do que é o pensamento estatístico dos

sujeitos para esta pesquisa, utilizamos alguns resultados observados em Morais

(2006). O objetivo da pesquisa realizada pela autora citada foi investigar as

concepções dos professores sobre o pensamento estatístico. Em seu trabalho, a

autora relata uma conclusão de Santos (2003) que acreditamos ser importante

ressaltar neste momento:

As pesquisas têm mostrado que o conceito estatístico, quando é

desenvolvido na escola, não possibilita a construção do

pensamento estatístico do aluno. Normalmente é trabalhado de

maneira isolada e desarticulada, formando, assim, consumidores

despreparados e inseguros no trato com dados, não permitindo a

construção do raciocínio estatístico do aluno. Em levantamentos

feitos com professores em exercício, podemos perceber que estes

também não se sentem seguros para trabalhar nesse domínio por

atestarem pouco conhecimento sobre o tema. (SANTOS, 2003

apud MORAIS, 2006, p. 16).

A autora, também, afirma que a Estatística está cada vez mais presente no

cotidiano das pessoas e que, atualmente, há um aumento dos grupos de

pesquisas, encontros e seminários. Desta forma, ela percebe a importância de

iniciar o Ensino da Estatística, desde as séries iniciais e, para isto, Morais (2006)

descreve quatro razões que Batanero (2002) aborda para ensinar estatística:

1- a Estatística é à parte da Educação geral desenvolvida para

futuros cidadãos adultos que precisam adquirir a capacidade

de leitura, interpretação de tabelas e gráficos que aparecem

nos meios de comunicação;

2- é útil para a vida posterior, já que, em muitas profissões, se

fazem necessários alguns conhecimentos básicos do tema;

3- seu estudo ajuda no desenvolvimento pessoal, baseado na

valorização da objetividade;

4- 4 - a Estatística ajuda a compreender as outras disciplinas do

currículo, tanto da Educação Básica quanto de cursos

superiores, onde, com frequência aparecem gráficos ou

conhecimentos estatísticos. (BATANERO, 2002 apud

MORAIS, 2006, p. 19-20)

A autora conclui seu trabalho relatando a necessidade de novas pesquisas

na área, pois ela percebe que trabalhos futuros podem “auxiliar o professor em

sua prática docente, de modo a complementar satisfatoriamente as atividades

propostas nos livros didáticos” (MORAIS, 2006, p. 114).

A seguir, apresentamos algumas pesquisas também relacionadas de

alguma maneira com nosso tema que também colaboraram para embasar nosso

trabalho.

Santos (2003, p. 5) realizou um estudo referente ao Ensino da Estatística,

com o objetivo de “investigar as possibilidades oferecidas pelo ambiente

computacional do Tabletop no processo de formação dos conhecimentos

elementares de estatística, a fim de responder à seguinte questão de pesquisa”.

Sua questão norteadora foi:

“

como se dá o processo de formação e

desenvolvimento de conceitos matemáticos referentes ao bloco de conteúdos

‘Tratamento da Informação’, por parte do professor, com auxilio do ambiente

computacional?”.

A pesquisa foi realizada como um estudo de caso com uma professora das

séries iniciais do Ensino Fundamental de uma escola da rede pública estadual,

dividiu-se em dois grandes momentos. O primeiro, com a formação da professora

e o segundo, com a atuação desta com outros professores e com seus alunos.

Santos realizou sua pesquisa nos contextos lápis e papel e no contexto

computador, com o software Tabletop.

A pesquisa de Santos (2003) torna-se importante para nosso trabalho, pois

também trabalha em um ambiente computacional. É interessante ressaltar que o

computador nessa pesquisa desempenhou um importante papel na formação dos

conceitos estudados.

A autora ressalta que:

O computador desempenhou um importante papel na formação

dos conceitos estudados. Primeiramente, vale ressaltar que o

software trabalhado oferecia várias possibilidades de se explorar

um mesmo conjunto de dados e a medida que Maria ia se

apropriando dos vários recursos que o software disponibiliza ela

acabava apropriando-se da matemática que estava por trás

desses recursos ou então estes lhe ajudavam a tirar conclusões

sobre o conjunto

de dados estudados. (SANTOS, 2003, p. 228)

Por isso, também, acreditamos ser interessante o trabalho com o ambiente

computacional; no nosso caso, o software Fathom que da mesma maneira que o

Tabletop trabalha com várias possibilidades de diferentes representações para

um mesmo conjunto de dados.

Como resultado de sua pesquisa, Santos (2003) evidenciou a necessidade

de se vivenciar situações de organizar, descrever, analisar e interpretar dados

oriundos de uma pesquisa. Em nosso trabalho, tentamos enfatizar estas

situações, algumas já na parte A da sequência didática e todas na parte B. A

autora citada descreve a necessidade de pesquisas futuras relacionadas com a

formação de professores (de maneira individual ou coletiva), podendo acontecer

até em um ambiente computacional. Outra sugestão dela foi referente ao estudo

dos conceitos do bloco tratamento de informação, pois cita como sugestão o

trabalho com a média aritmética simples.

Em relação à pesquisa de Cardoso (2007, p. 15) podemos perceber uma

preocupação com o nível de letramento estatístico dos professores, o que para

nossa pesquisa é bastante relevante, pois sua questão norteadora buscava

perceber o nível de letramento estatístico de professores da Escola Básica sobre

os conceitos de medidas de Tendência Central e a Variabilidade. O objetivo de

seu trabalho foi: “verificar de que forma os professores de Matemática do Ensino

Médio mobilizam os conhecimentos estatísticos, quando confrontados com

problemas que envolvem Medidas de Tendência Central, Variabilidade e

representação Gráfica de um conjunto de dados”.

Vale ressaltar que Cardoso (2007) aplicou um questionário, que chamou de

“questionário-diagnóstico” para 29 professores, que foram selecionados

aleatoriamente. Estes atuam no Ensino Médio de escolas públicas do Estado de

São Paulo. Em sua pesquisa, os professores eram convidados a resolver

problemas individualmente. O questionário-diagnóstico de Cardoso (2007) foi

dividido em três momentos. O primeiro, trabalha com os dados apresentados por

um banco de dados fictícios, sem nenhum tipo de organização; o segundo,

apresenta os dados por tabelas de distribuição de frequências e o último, traz

representações gráficas das tabelas de distribuição de frequência da segunda

parte. O autor ainda relata que o intuito desta divisão é “identificar os níveis de

dificuldade relacionados às diferentes formas de apresentação de uma situação-

problema” (CARDOSO, 2007, p. 20)

Para aprofundar suas análises, o autor utilizou o software CHIC

(Classificação Hierárquica Implicativa e Coesiva) que “possibilita a análise

hierárquica de similaridade e/ou coesitiva dos dados qualitativos coletados,

evidenciando as inter-relações encontradas entre as respostas dadas por

professor” (CARDOSO, 2007, p. 71). Em geral, observou que os professores

encontram-se no nível cultural de letramento estatístico, pois, segundo suas

análises, eles não sabem justificar o uso dos cálculos e alguns utilizam a

calculadora e o livro didático como ferramentas fundamentais para resolução de

problemas, sem questionar o algoritmo ou os resultados obtidos. Neste sentido,

segundo Cardoso:

o procedimento algorítmico com o uso de calculadora é

perfeitamente dominado pelos professores, que, no entanto, não

conseguem explicar a própria construção destes procedimentos

ou mesmo interpretar os resultados. Neste sentido, podemos

supor que eles estejam em um nível cultural de alfabetização.

(CARDOSO, 2007, p. 80)

Desta maneira, achamos interessante permanecer com o teste diagnóstico

de Vieira (2008) em nossa pesquisa, mesmo que nosso público-alvo seja

composto de professores e não alunos, buscando assim compreender melhor o

apontado por Cardoso (2007).

Bigattão (2007, p. 101) também se preocupou com o letramento estatístico

dos professores da Escola Básica. No entanto, sua pesquisa não foi voltada

apenas ao ensino da estatística, mas à probabilidade, também, visto que o

objetivo central foi: “investigar as concepções dos professores de Matemática do

Ensino Fundamental II sobre os componentes e a formação do pensamento

estatístico e probabilístico”.

Para o autor (p. 29), no entanto, sua questão central foi estruturada de

maneira mais voltada à Estatística: “Qual o nível de letramento estatístico que

podemos identificar nos professores de Matemática do Ensino Fundamental II

pesquisados?”

A pesquisa envolveu 23 professores e foi também analisada com o auxílio

do software CHIC (Classificação Hierárquica Implicativa e Coesiva) que

possibilitou ao autor evidenciar as inter-relações encontradas nas respostas. A

resposta obtida por Bigattão vai ao encontro da obtida por Cardoso, pois ambos

classificam que o professor da Escola Básica possui um nível cultural de

letramento estatístico, mesmo tendo trabalhado com grupos diferentes e questões

distintas nos instrumentos produzidos, os resultados obtidos pelos dois foram

semelhantes.

Nossa análise comprova que a grande maioria dos professores

pesquisados não atendeu as exigências do nível cultural de

alfabetização estatística, já que nem sempre analisam e

interpretam resultados de pesquisa que possibilitem uma resposta

adequada para o problema, nem estudam a variação existente

nesses dados, não dando, assim, reais condições ao aluno de

tomar decisões baseadas nos dados, inclusive muitos não

atingem o nível funcional. (BIGATTÃO, 2007, p. 103).

Com isto, mais uma vez fica ressaltada a importância de nossa pesquisa

ser realizada com professores, pois são estes que conduzirão seus alunos na

construção dos conceitos trabalhados, durante a aplicação das sequências

didáticas. Bigattão, tanto como todos os outros autores apresentados até o

momento, levanta a importância de um número maior de pesquisas nessa área.

O autor cita a necessidade de trabalhos que investiguem o pensamento

estatístico e probabilístico em todos os níveis de escolaridade e também outros

que auxiliem o professor em sua prática docente, para que aconteça um avanço

nos níveis de letramento, como se é esperado.

O trabalho de Silva (2007, p. 319) teve como objetivo “identificar o

raciocínio de variação/variabilidade dos professores em cada etapa do ciclo

investigativo, de maneira que permitisse compreender a relação entre

pensamento estatístico e raciocínio sobre variação”.

Assim, sua pesquisa foi realizada com nove professores do Ensino

Fundamental e Médio e dois alunos do curso de Matemática da Universidade de

São Paulo. Destes, quatro professores e um aluno já haviam participado de

pesquisas antecedentes à de Silva (2007). A autora realizou uma formação

continuada com estes professores que se deu em 16 encontros. Vale ressaltar

que ela expõe que três dos professores obtiveram um frequência muito baixa, em

torno de 50%. Ela também aplicou um questionário para definir o perfil e a

experiência de Estatística dos professores envolvidos. Com a análise deste,

percebeu que três dos professores nunca tinham trabalhado com os conceitos de

Estatística e que os outros, em sua grande maioria, trabalham com gráficos.

Como resultados de suas análises, Silva (2007) observou que mesmo que

os professores (anterior à pesquisa) já tivessem aprendido sobre desvio padrão,

em quase todos identificou a ausência de significação deste conceito.

Ela também observou que:

os poucos professores que já utilizavam a pesquisa como

metodologia de ensino de Estatística, o faziam de maneira restrita,

utilizando apenas a distribuição de freqüência e sua respectiva

representação gráfica para analisar os resultados, o que indicou a

não abordagem do conceito de variação em suas aulas.(SILVA,

2007, p. 319)

Com isso, concluiu que a “não utilização das medidas de tendência central

e dispersão, como ferramentas de análise dos dados da pesquisa pode ser em

decorrência do tipo de variável utilizada, geralmente qualitativa” (SILVA, 2007, p.

319).

Desta forma, percebeu que as dificuldades para compreender e ensinar as

medidas de tendência central podem estar acontecendo pelo fato de se ensinar

mais as variáveis qualitativas, não dando a devida importância às variáveis

quantitativas e, também, pelo fato de que, muitas vezes, utiliza-se uma única

variável na pesquisa. Esta escolha de variável, que está sendo realizada pelos

professores da Escola Básica, segundo a autora, não favorece a comparação de

grupos, o que dificulta o estímulo para observar a variabilidade.

Trataremos agora da dissertação de mestrado de título: “Análise

Exploratória de dados: Uma abordagem com alunos do Ensino Médio” de Vieira

(2008) que foi a base de nossa pesquisa, pois é a que efetivamente é parte do

mesmo elo do projeto PEA-ESTAT do qual nosso projeto faz parte. O objetivo

desta pesquisa foi:

... a partir do desenvolvimento de uma seqüência didática, estudar

as interações entre o aluno e um ambiente de estatística

dinâmica, introduzindo a análise exploratória de dados para o

nível do segundo ano do Ensino Médio, permitindo que o sujeito

desenvolva a capacidade de organizar, analisar e interpretar os

dados. Esta seqüência didática será desenvolvida com uso de um

ambiente de estatística dinâmica, que é o software Fathom

(VIEIRA, 2008, p. 16)

Nossa pesquisa, também, utilizará o ambiente informatizado Fathom. No

entanto, nosso público-alvo serão os professores da Escola Básica. Visamos com

isso fazer um paralelo entre os resultados obtidos por Vieira (2008) e os nossos

dados analisados. A autora também mostra na estatística a importância dos

diferentes registros de representação, por isso, um dos fatores importantes e

marcantes de seu trabalho são as relações hipotéticas entre as Teorias de Duval

e Curcio.

Sua pesquisa foi realizada com nove alunos do 2º ano do Ensino Médio do

período noturno de uma escola estadual que foram divididos em três grupos

distintos.

A autora observou como um dos resultados de sua pesquisa que, no início

das entrevistas, os alunos conseguiam ler alguns dados em gráficos e tabelas,

mas apresentavam dificuldades para representar os dados. Muitos alunos tinham

a tendência de construir gráficos de pontos, o que segundo Vieira (2008, p. 148),

pode acontecer “talvez por serem influenciados pelo ensino do conceito de função

do primeiro ano do Ensino Médio”.

Em relação à análise e obtenção das medidas-resumo, a autora observa

que a grande maioria dos alunos apresentava várias dificuldades. Durante sua

pesquisa, com a aplicação das situações-problema, a autora afirma que foi

possível observar um avanço na compreensão e análise de alguns conceitos de

Estatística. No entanto, salienta que “uma das limitações do trabalho dela diz

respeito ao desenvolvimento da compreensão do conceito de quartis e da

construção do Box-plot” (VIEIRA, 2008, p. 152)

Ela também conclui o trabalho apresentando a relevância das múltiplas

representações de um conjunto de dados na construção de conhecimentos e

ideias. Novamente, a autora relata o paralelo entre as teorias de Duval e Curcio,

enfatizando que apenas foi criado um quadro com relações hipotéticas que

apresentaremos na sequência deste texto. A confirmação deste paralelo apenas

se dará por um estudo empírico, ainda a ser planejado

A autora relata que o ambiente computacional foi:

... fundamental no sentido de possibilitar a visualização dos

diferentes tipos de registros de representação semiótica de uma

distribuição de freqüências, principalmente no caso da

representação gráfica de medidas como média e mediana,

contribuindo para a compreensão destes conceitos. Apesar de os

alunos ainda não terem compreendido o significado de outros

conceitos, como quartis e a construção do Box-plot, acreditamos

que o uso desse ambiente possa contribuir com a compreensão

de tais conceitos, desde que seja desenvolvida uma seqüência de

atividades específica, com maior tempo de duração. (VIEIRA,

2008, p. 151)

Ela também relata que mesmo tendo acesso a todas as informações no

ambiente computacional, algumas vezes, os alunos não faziam uso da

multiplicidade de registros, e preferiam as tabelas para ler os dados ou procurar

informações e os gráficos para representá-las.

Em seu trabalho, a autora sugere outras questões para futuras pesquisas:

Uma delas seria a verificação da equivalência entre as teorias de

Duval (1994) sobre os tipos de apreensões de uma figura, e de

Curcio (1989) sobre os Níveis de Compreensão Gráfica,

verificação que pode ser realizada através de estudos empíricos,

necessitando de ferramentas de validação estatística. Uma das

limitações deste trabalho diz respeito ao desenvolvimento da

compreensão do conceito de quartis e da construção do Box-Plot.

Uma terceira questão a ser investigada em trabalhos futuros é se

o desenvolvimento de uma seqüência didática com uso do

software Fathom simultaneamente ao uso de ambiente não

computacional, que dedicasse um maior tempo para o estudo

destes conceitos, possibilitaria a sua compreensão (VIEIRA, 2008,

p. 152)

O objetivo principal da pesquisa de Canossa (2009, p. 99) foi “levantar

pontos para trabalhar em oficinas de formação de professores, no que se refere

ao desenvolvimento dos níveis de raciocínio estatístico dos professores da rede

pública do Estado de São Paulo, mais especificamente na região de Diadema.” A

questão norteadora para o desenvolvimento de seu trabalho foi a seguinte:

Quais as características didáticas de uma formação continuada

para professores do Ensino Médio, visando o trabalho com

conceitos de mediana e quartis, para que os alunos possam tomar

decisões a partir da análise da variação percebida, com o auxílio

do Dot-Plot e do Box-Plot? (CANOSSA, 2009, p. 99)

Desse modo, essa pesquisa foi bastante relevante para o desenvolvimento

da nossa, pois, também, tem como público-alvo os professores do Ensino Médio

da rede pública, recentemente foi concluída e, também, utilizou o software

FATHOM em uma parte da formação.

Os procedimentos desenvolvidos por esse autor foram a aplicação de um

questionário diagnóstico, oficinas de formação continuada (desenvolvida com

base nos resultados obtidos no teste diagnóstico) e a observação das aulas de

uma professora que foi denominada como professora colaboradora. A pesquisa

caracterizou-se como um estudo de caso.

Em suas análises, ele percebeu que:

Com o desenvolvimento da formação da professora colaboradora,

percebemos que, apesar de possuir certo conhecimento básico de

estatística, a professora nunca havia tido contato com os gráficos

Dot-Plot e Box-Plot, chegando a relatar certa aversão em utilizar

esses gráficos e insistindo em utilizar o gráfico de barra e

colunas.” (CANOSSA, 2009, p. 100)

Ao analisar os resultados obtidos, resolvemos por manter estes tipos de

gráficos em nossa pesquisa, para também analisar o comportamento do professor

frente a estas representações, uma vez que o software FATHOM permite sua

construção de forma relativamente simples, restando ao usuário a interpretação.

O autor também ressalva que mesmo depois da formação a professora não

se sentia totalmente segura na aplicação das atividades, além de aplicar em suas

aulas, apenas a reprodução das atividades sugeridas na formação. Com isso, ele

concluiu que

isso parece revelar que a professora ainda não se apropriou

adequadamente dos conceitos de variabilidade e representações

gráficas diversas, limitando-se ao abordado usualmente nos livros

didáticos (tabelas e gráficos de colunas) e permanecendo no nível

de raciocínio verbal (CANOSSA, 2009, p. 100)

Em suas análises, ele utiliza os níveis de raciocínio estatístico propostos

por Garfield (2002); na pesquisa, o autor salienta a necessidade de pesquisas

futuras, sobretudo no que diz respeito aos conceitos e procedimentos relativos ao

Ensino da Estatística.

II.3 Relações entre os níveis de leitura de dados de Curcio e os registros

de representação semiótica de Duval, (VIEIRA, 2008)

Vieira (2008) estabeleceu um quadro com as relações hipotéticas entre as

apreensões de uma figura, segundo Duval e os níveis de leitura de dados (níveis

de compreensão gráfica) propostos por Curcio que buscaremos identificar no

estudo da mobilização dos conhecimentos estatísticos, em situação de resolução

de problemas e de elaboração de um plano de aula.

Tipos de apreensões possíveis de uma figura Níveis de Compreensão Gráfica

Apreensão perceptiva Nível 1: Leitura dos Dados

Apreensão Discursiva

Nível 1: Leitura dos Dados +

Nível 2: Leitura entre os Dados

Apreensão Operatória

Apreensão Seqüencial

Nível 1: Leitura dos Dados +

Nível 2: Leitura entre os Dados +

Nível 3: Leitura além dos Dados

Quadro 1: Relações hipotéticas entre as Teorias de Duval e Curcio elaborado por Vieira

(2008, p. 38)

Na apreensão perceptiva, apenas se identifica o objeto matemático em

questão, “é a interpretação das formas da figura, em uma situação geométrica”

(DUVAL, 1995 apud ALMOULOUD, 2003, p. 127). Para Vieira:

Acreditamos que este tipo de apreensão está presente no “nível1”

de compreensão gráfica de Curcio, “leitura dos dados”, pois o

sujeito apenas levanta dados e informações explícitas no gráfico.

Ele visualiza a figura e levanta os dados apresentados

explicitamente nela. (VIEIRA, 2008, p. 38)

Para verificarmos este paralelo, podemos tomar a seguinte situação

descrita em Curcio (1994), na qual apenas se faz necessário a leitura dos dados.

O número de crianças na classe do sr. Kahn que celebram aniversário durante cada mês no

ano

FEV

REIRO

MAR

ÇO

ABRIL

MAIO

UNH

AGOSTO

EMB

OUT

BRO

NOVE

BRO

DEZ

MBR

Número de crianças

Use o gráfico acima para responder às questões:

1. Quantas crianças celebram aniversário em Fevereiro?

a. 0 c. 2

b. 1 d. 4

2. Em que mês há oito crianças que celebram aniversário?

a. Maio c. Setembro

b. Julho d. Novembro

Figura 8: Exemplo 1 do paralelo entre as apreensões e os níveis de leitura de gráfico (atividade

retirada de Curcio, 1994, p. 74) – tradução nossa

Para solucionar estas duas questões, o indivíduo apenas precisa observar

o gráfico, não há a necessidade de se fazer análise a partir da representação

apresentada.

Neste caso, para responder a este tipo de questionamento, a interpretação

acontece diretamente pela visualização do gráfico, conforme Vieira (2008), uma

apreensão perceptiva, pois se fizermos um paralelo com a teoria das

representações semióticas, nesta apreensão, a interpretação das figuras

geométricas acontece na própria representação geométrica. Já no âmbito de

Curcio, é facilmente observado que este tipo de pergunta apenas exige um nível

de leitura dos dados, ou seja, para responder a uma questão que exige apenas

uma leitura dos dados, o sujeito precisa apenas de uma apreensão perceptiva da

figura, no caso o gráfico de colunas.

Em relação à apreensão discursiva, Duval afirma que é o momento que o

indivíduo faz explicitação dos elementos das figuras, algumas propriedades da

figura já são especificadas e, também, leva-se em consideração as propriedades

do objeto. Segundo Vieira:

Em estatística, cremos que para este tipo de apreensão, o sujeito

deve ler os dados e ler entre os dados, estando no “nível 2” de

compreensão gráfica segundo Curcio, pois, ao explicitar as

propriedades do gráfico, o sujeito interpreta e identifica relações

nele. (VIEIRA, 2008, p. 38)

Para verificação deste paralelo, podemos tomar a seguinte situação

descrita em Curcio (1994), na qual apenas se faz necessário a leitura entre os

dados.

O número de crianças na classe do Sr. Kahn que celebram aniversário durante cada mês no

ano

JANEIRO

IRO

MAIO

NHO

STO

SETEMBRO

UTU

EZE

Número de crianças

Use o gráfico acima para responder as questões:

3. O que este gráfico diz para você?

a. Há mais aniversários durante junho e novembro do que durante os outros meses do ano.

b. Há mais aniversários durante maio do que durante os outros meses do ano.

c. Há menos aniversários durante junho e novembro do que durante os outros meses do ano

d. Enquanto o ano progride de janeiro a dezembro, o número dos aniversários diminui.

4. Quantas crianças são da classe do Sr. Kahn?

a.10 c. 44

b. 30 d. 55

Figura 9: Exemplo 2 do paralelo entre as apreensões e os níveis de leitura de gráfico (atividade

retirada de Curcio, 1994, p. 74) – tradução nossa

Para responder à questão 3 referente ao gráfico, o indivíduo precisa

perceber que as colunas mais altas são referentes aos meses de junho e

novembro, a solução não é mais tão imediata quanto no exemplo anterior. Aqui

ele precisa ter algum conhecimento sobre a representação apresentada, no caso,

por exemplo, que o gráfico em sua totalidade apresenta todos os pesquisados,

pois cada barra mostra as pessoas que possuem uma característica em comum,

e a altura de cada barra mostra o número de elementos de cada variável.

Logo, para responder a este tipo de questionamento, o indivíduo precisa

conhecer algumas propriedades do gráfico, realizando, segundo Vieira (2008),

uma apreensão discursiva, algumas propriedades da figura também já são

explicitadas. Em nível de Curcio, estas questões requerem uma leitura dos dados

e entre os dados.

Para solucionar a questão 4, o indivíduo precisa reorganizar os dados para

conseguir determinar o número de alunos na classe do Sr. Kahn, ou seja, precisa

somar todos os valores encontrados: 2+4+2+5+8+2+4+6+2+8+1 e obter como

solução que na classe referida existem 44 alunos. Na apreensão operatória, há

modificações da figura inicial em outras prováveis figuras, e a apreensão

sequencial refere-se à reprodução dos passos para a construção da figura em

questão.

Vale ressaltar que o paralelo que Vieira faz entre a apreensão operatória

de Duval exige do indivíduo os três tipos de leitura de dados propostos por Curcio.

Assim, o indivíduo no nível mais avançado de leitura de dados, pois: “ao modificar

um gráfico, o sujeito vai além dos dados e das informações explícitas no mesmo”.

(VIEIRA, 2008, p. 39). Isso também pode significar que a pessoa precisa estar no

nível científico do letramento estatístico.

Já com a apreensão seqüencial, Vieira afirma:

Em estatística, acreditamos que este tipo de apreensão exige a

leitura dos dados, a leitura entre os dados e a leitura além dos

dados, pois a seqüência de passos exigida para a construção de

gráficos requer que o sujeito reflita além dos dados e das

informações disponíveis. (VIEIRA, 2008, p. 39)

O número de crianças na classe do sr. Kahn que celebram aniversário durante cada mês no ano

EIR

FEVEREIRO

RÇ

MAIO

ULH

AGOST

OUTUBRO

NOVEM

Número de crianças

Use o gráfico acima para responder as questões:

5. Qual é a probabilidade que o aniversário comemorado em dezembro aconteça no dia

25 de dezembro?

d. 1

6. O aniversário de Sally é em fevereiro. De acordo com o gráfico qual das seguintes

afirmações está correta?

a. Sally provavelmente nasceu em 29 de fevereiro.

b. Sally não é da classe do Sr. Kahn.

c. Sally é da classe do Sr. Kahn.

d. Sally é a única que comemora aniversário em fevereiro.

Figura 10: Exemplo 3 do paralelo entre as apreensões e os níveis de leitura de gráfico (atividade

retirada de Curcio, 1994, p. 74) – tradução nossa

Para responder a estas duas questões, o individuo precisa, segundo

Curcio, uma leitura além dos dados, logo, neste caso, necessita compreender o

contexto em que a questão está inserida, para fazer as intervenções necessárias

é preciso que se possua um conhecimento científico sobre o conceito estudado.

As soluções para estas duas questões seriam. Para a questão 5, como

temos apenas um aniversário a ser comemorado em dezembro (verificação pelo

gráfico) e este mês tem 31 dias (compreensão do contexto) a probabilidade de

que este aniversário seja no dia 25 é de:

Para a 6ª questão o indivíduo precisa

perceber que, como na representação gráfica, não há coluna no mês de fevereiro,

logo, esta classe não possui aniversariantes nesse mês.

Neste caso, para Vieira (2008), as apreensões são a sequencial e a

operatória. Também acreditamos que para compreender como acontece a

construção da figura e, assim, conseguir reproduzi-la (apreensão sequencial) e

para conseguir fazer modificações na figura de maneira a auxiliar nas soluções do

problema (apreensão operatória) o individuo também precisa de conhecimentos

mais profundos e específicos, da mesma maneira do que para atingir a leitura

além dos dados.

Em nosso trabalho, assumiremos as mesmas relações hipotéticas

enunciadas por Vieira (2008), pois também buscamos identificar as condições de

mobilização simultânea destas duas teorias. No entanto, não realizamos o estudo

empírico sugerido, limitando-nos à busca de uma complementação do diagnóstico

sobre a construção e mobilização das representações semióticas, foco de nossa

pesquisa.

III

. PRINCÍPIOS DA ANÁLISE EXPLORATÓRIA DE

DADOS E O SOFTWARE FATHOM

III.1 A análise Exploratória de Dados

A Estatística Descritiva é o pano de fundo de nossa pesquisa, possui

alguns registros de representações semióticas para o conjunto de dados que são

universalmente aceitos pela comunidade científica, como as tabelas, os gráficos,

as medidas-resumo. Segundo Witte e Witte (2005), estas representações são de

extrema importância no sentido de organizar e resumir informações em relação a

um conjunto de dados apresentados, de forma que se torne uma linguagem

comum e utilizada por toda a comunidade científica e não apenas por um

indivíduo ou grupos de indivíduos.

O software Fathom é uma ferramenta que pode auxiliar no momento de se

construir ou mobilizar esses registros, assim como no momento de analisá-los de

forma conjunta, integrada, visto que a conversão entre eles acontece de forma

rápida, dinâmica, sem provocar dificuldades operatórias que podem gerar

obstáculos didáticos na construção dos significados.

Batanero (2001, p. 29) considera que “uma ideia fundamental da análise

exploratória dos dados é que o uso de representações múltiplas dos dados se

transforma em um meio de desenvolver novos conhecimentos e perspectivas”

(tradução nossa). Aqui se evidencia a importância do trabalho com diversas

representações para a análise exploratória de dados. Este trabalho pode ser

facilitado com o uso do ambiente informatizado FATHOM, pela agilidade e

facilidade com que ele “constrói” essas diversas representações.

Acreditamos que o uso aliado de ferramentas diferenciadas que priorizem o

significado (como é esperado), auxiliem em uma melhor compreensão e

mobilização dos registros de representação semiótica dos objetos envolvidos. O

software Fathom é uma ferramenta que, na nossa visão, prioriza mais o

significado e a compreensão dos dados observados do que a própria construção

destes, oportunizando ao indivíduo uma preocupação mais centrada na

interpretação das informações.

As capacidades de cálculo e das representações gráficas dos

computadores atuais, permitem obter uma ampla variedade de

gráficos estatísticos e diferentes formulários estatísticos de forma

simples e fizeram aparecer uma nova filosofia nos estudos

estatísticos: a análise exploratória dos dados, introduzida por

Tukey, que compara o trabalho do estatístico com o de um

detetive. (BATANERO, 2001, p. 27, tradução nossa)

A citação anterior relata que o uso de computadores facilita na construção

de uma variedade de gráficos, além de colaborar no desenvolvimento dos

relatórios (análises). A comparação feita entre a Análise Exploratória dos Dados e

o trabalho de um detetive, acreditamos que pode acontecer em razão de ambos

analisarem os acontecimentos como um todo, não se restringindo ao que é

apresentado, mas buscando fundo as relações entre todo o conjunto de dados, e

também é o aspecto investigativo, olhar, observar um fato ou um conjunto de

fatos buscando questionar o observado para a obtenção de respostas. Assim, de

um conjunto de dados poder obter informações importantes para a resolução do

problema proposto.

III.2 Registros de representação e suas construções no software

FATHOM

A seguir, abordaremos alguns registros de representação utilizados na

estatística, e como o Fathom os apresenta. Com a finalidade de evidenciar os

diversos registros de representação semiótica de uma distribuição de frequências,

as tabelas constituem um tipo de registro numérico que nos auxilia no momento

de organizar as respostas obtidas ao coletarmos os dados de uma pesquisa,

sendo seu principal intuito mostrar a ordem em que os dados foram obtidos

(função de enumeração) ou representar a distribuição das frequências que podem

ser associadas ao conjunto de dados coletados (função de síntese dos dados).

Abaixo apresentaremos uma figura da representação tabular de um banco

de dados inserido no ambiente computacional Fathom, e outra que apresenta

uma tabela de distribuição de frequências para a variável “matéria preferida”. Vale

ressaltar que os exemplos deste capítulo de nosso trabalho estão se referindo ao

banco de dados apresentado na Figura 11.

Os dados da tabela de distribuição de frequências são um registro que

evidencia o número de ocorrências de cada valor assumido pela variável

observada. Consideramos, assim, o objeto “distribuição de frequências” e suas

diversas representações (ou seja, os registros de representação semiótica

utilizados na reificação do objeto). Nesse sentido, consideramos uma distribuição

de frequências como uma função empírica que associa a cada valor da variável o

número de vezes que esse valor ocorre.

O banco de dados foi constituído por um conjunto de variáveis (e os

valores por elas assumidos) que busca caracterizar o grupo de alunos observados

de um 1º ano do Ensino Médio de uma Escola Estadual de São Paulo.

Figura 11: Tratamento entre um banco de dados (à esquerda) e uma tabela de distribuição de

freqüências (à direita)

Observe que, na Figura 11, a representação da esquerda (um banco de

dados) apresenta apenas os dados, e cada linha da tabela representa um

indivíduo e cada coluna uma variável, e a representação da direita (uma tabela de

distribuição de frequências) mostra a quantidade de pessoas que prefere cada

uma das disciplinas envolvidas, ou seja, representa a distribuição de frequências

da variável “matéria preferida”. Percebemos um tratamento realizado para a

visualização da variável “matéria preferida”.

Já os gráficos constituem os registros de representação semiótica que

podem facilitar a detecção de padrões nos dados coletados, além de cumprir

também algumas das funções da tabela, como representar a distribuição de

frequências. Vale ressaltar que:

... para a escolha da representação gráfica mais adequada, faz-se

necessário considerar a natureza dos dados. Se a variável for

qualitativa ou quantitativa com dados discretos, podemos fazer um

gráfico de barras, colunas, setor. O objetivo da análise também é

importante para esse tipo de decisão. Assim, por exemplo, se o

que se pretende é uma visão do tipo “parte/todo”, o mais

adequado é o diagrama de setores, enquanto que uma

comparação entre as partes é favorecida pelos diagramas de

barras ou colunas. (NOVAES e COUTINHO, 2008, p. 23)

Em relação à natureza das variáveis, segundo as autoras (p. 16) as

variáveis qualitativas são aquelas que: “revelam um certo tipo de características

relacionadas ao grupo pesquisado, por exemplo, cor de olhos, sexo, grau de

satisfação com serviços prestados e outras”. Ou seja, são características que não

podem ser expressas por números.

Já as variáveis quantitativas são as que:

Assumem valores numéricos, definida em um intervalo real,

podendo ser discreta ou continua.... Discreta: dados procedentes

de contagem, por exemplo, número de filhos, número de objetos,

entre outros; Contínua: os dados podem assumir qualquer valor

dentro de um intervalo real, por exemplo, altura de uma pessoa,

massa (peso) de um individuo, entre outros (NOVAES e

COUTINHO, 2008, p. 16)

Neste momento, acreditamos ser interessante ressaltar algumas

representações gráficas estatísticas, suas construções e utilizações, sempre em

um olhar didático (ou seja, visando ao ensino e à aprendizagem)

No gráfico de setores, a representação permite uma comparação parte-

todo, ele pode ser usado para representar variáveis qualitativas ou quantitativas.

Neste gráfico, reparte-se um círculo em setores circulares proporcionais à

porcentagem da frequência de cada valor da variável em questão. A seguir, um

exemplo de um gráfico de setores, envolvendo a porcentagem da preferência dos

alunos por matéria.

Matéria preferida

21%

13%

29%

artes

biologia

filosofia

história

inglês

matemática

português

química

Gráfico 3: Gráfico de setores para a variável matéria preferida

Acreditamos ser importante ressaltar que o software FATHOM não tem a

ferramenta para a construção do gráfico de setores, conforme descrito acima.

Este ambiente informatizado possui uma representação que também realiza uma

comparação parte/todo, no entanto, de uma maneira um pouco diferenciada do

gráfico de setores. Observe o Ribbon Chart abaixo construído no FATHOM:

Gráfico 4: Ribbon Chart para a variável matéria preferida

Nos gráficos de colunas e barras, a comparação é feita ou pela a altura do

retângulo (gráfico de colunas), ou pelo comprimento do retângulo (gráfico de

barras). A representação destes dois gráficos é feita no sistema cartesiano.

No gráfico de colunas, o eixo das abscissas apresenta os valores da

variável, e o eixo das ordenadas as frequências. Já no gráfico de barras, as

frequências ficam dispostas no eixo das abscissas, e a variável no eixo das

ordenadas. A seguir um exemplo do gráfico de colunas apresentando a variável

“matéria preferida” é importante observar que aqui a ênfase está na relação

“parte-parte” da leitura.

Matéria preferida

ogia

história

inglês

áti

tug

uê

uí

Gráfico 5: Gráfico de colunas para a variável matéria preferida

Ao observar estas duas representações gráficas, fazemos a hipótese de

que a passagem de uma para a outra é uma conversão, embora sejam

representações gráficas, pois, uma está no sistema cartesiano e trabalha com

valores absolutos e a outra não está plotada no sistema cartesiano e trabalha com

valores relativos, é uma representação parte-todo.

Além do que o gráfico de colunas apresenta como conteúdo associações

entre as frequências e os valores da variável, sem a preocupação com o

estabelecimento das proporções que permitem a comparação parte-todo. Daí sua

ênfase na comparação entre as partes.

Já o gráfico de setores apresenta como conteúdo as proporções de cada

parte em relação ao todo, expressas pelas porcentagens indicativas das

frequências relativas.

Isto mostra a necessidade de mais pesquisas neste sentido para

aprofundar os estudos dos Sistemas de Representação descritos por Duval, se

pretendemos utilizar esta teoria na análise no domínio teórico da Estatística.

O dot-plot é um gráfico que utiliza pontos para a representação de cada

indivíduo observado. As variáveis percebidas são apresentadas no eixo horizontal

e cada ponto é referente a cada valor da variável que é “empilhado”. Abaixo a

representação gráfica dot-plot para as idades dos alunos de um 1º ano do Ensino

Médio e para a variável “altura”

Gráfico 6: dot plot para as variáveis idade e altura

Aqui acreditamos ser importante salientar que o software nos permite

“mexer” no gráfico, modificando o conjunto de dados.

Acreditamos que o software permite esta modificação e pode ocasionar um

obstáculo didático, uma vez que o banco de dados não deve ser alterado pelas

modificações gráficas. O inverso também é permissível por este ambiente e

deveria ser a única maneira de modificação dos dados, já que se trata de uma

pesquisa.

Figura 12: Modificação do banco de dados pela alteração do ponto no gráfico

A seguir, apresentamos um gráfico de colunas construído no software

Fathom, no qual estão representadas duas variáveis simultaneamente. É

interessante ressaltar que o software relaciona facilmente duas variáveis na

mesma representação gráfica. Isso acontece quando ele subdivide as barras

feminino e masculino, conforme a legenda pelas matérias preferidas ou vice-

versa. Acreditamos que esta ferramenta do software seja interessante para

facilitar a percepção que são os mesmos sujeitos que responderam para as duas

variáveis (tanto gênero como matéria preferida), contribuindo assim na percepção,

ainda que intuitiva da correlação entre duas variáveis.

Gráfico 7: Gráfico de colunas para a variável gênero, subdividindo as barras para a variável

matéria preferida

Gráfico 8: Gráfico de colunas para a variável matéria preferida, subdividindo as barras para a

variável gênero

Outra representação gráfica importante para a Estatística é o histograma,

que é construído por colunas justapostas, adjacentes, onde também as alturas

servem para a comparação entre as partes. Este tipo de gráfico é usado para as

variáveis quantitativas contínuas. A seguir, a representação do histograma para a

variável altura dos alunos.

Gráfico 9: Histograma para a variável altura dos alunos

Vale ressaltar que o software Fathom trata qualquer variável numérica

como contínua, ou seja, na construção do gráfico, se for variável numérica ele

apresentará um histograma, ainda que a variável seja quantitativa discreta. Isto

pode se tornar um obstáculo didático se não for bem trabalhado pelo professor,

caso ele venha escolher este software como recurso didático.

Outras representações importantes para a Estatística são as medidas-

resumo. Na Estatística, há uma representação gráfica, o Box-plot, que apresenta

um grupo destas medidas: valor máximo e mínimo, mediana e quartis. Este

gráfico pode ser usado para perceber a variabilidade dos dados.

Para construir esta representação, construímos uma caixa de tal forma que

seu limite superior ou direito represente o terceiro quartil e o limite inferior ou

esquerdo da caixa represente o primeiro quartil. Há uma linha dentro da caixa que

representa a mediana e duas linhas (uma de cada lado) que seguem do limite da

caixa até o valor máximo e o valor mínimo. Abaixo a representação box-plot dos

dados apresentados no gráfico histograma.

Gráfico 10: Box-plot da variável altura

Vale ressaltar que o ponto que circulamos de vermelho no Gráfico 10 é um

valor discrepante na distribuição identificado pelo software.

Na sequência, discutiremos os significados destas medidas e suas

representações em outros gráficos. Em relação às medidas, acreditamos que

mais do que conseguir calculá-las, é importante saber quando utilizar cada uma

delas (conhecimento conceitual e não simplesmente procedimental). Segundo

Novaes e Coutinho (2008, p. 55), “a escolha da medida a ser utilizada para

representar um conjunto de dados dependerá do objetivo da pesquisa e da forma

em que se apresentam os dados a serem estudados”.

A média é o valor em torno do qual os valores observados oscilam. Em

analogia com a Física, podemos dizer que a média é comparável ao centro de

massa, ao ponto de equilíbrio do conjunto de valores observados. Para calculá-la,

somamos todos os valores observados e dividimos pelo número de observações.

Vamos determinar a média das idades dos indivíduos no mesmo banco de dados

considerado nos exemplos anteriores.

Ao observar o banco de dados em qualquer de suas representações,

podemos perceber facilmente que 24 indivíduos responderam à pesquisa. Assim

temos: uma pessoa com 14 anos, 12 pessoas com 15 anos, sete pessoas com 16

anos, três pessoas com 17 anos e uma pessoa com 18 anos. Para calcular a

média

1 14 12 15 7 16 3 17 1 18

375

15 625,

x x x x x

anos

+ + + +

Já em relação à mediana, segundo Novaes e Coutinho (2008): “pode ser

mais adequada, quando existe uma grande variabilidade entre os dados

quantitativos”. Esta é a medida que divide um conjunto de observações ordenado

em duas partes, com o mesmo número de elementos.

Esquematicamente:

Uma das maneiras para encontrar a mediana é organizando os dados e

buscando o valor central. Vamos determinar a mediana das idades do mesmo

grupo de alunos. Para isso, devemos organizar os dados pesquisados em ordem

crescente ou decrescente e observar a posição que os elementos ocupam nesse

rol.

{14, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 16, 16, 16,

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º 12º 13º 14º 15º 16º

16, 16, 16, 16, 17, 17, 17, 18}

17º 18º 19º 20º 21º 22º 23º 24º

Ao observar a distribuição acima, percebemos que como existe número par

de elementos (24 elementos), não é possível determinar diretamente o termo

central (que divide a distribuição). No entanto, como os 12º e 13º elementos são

representados pela idade 15 anos, a mediana desta distribuição também será 15

anos (média aritmética dos 12º e 13º elementos)

Esquematicamente:

No caso da distribuição ter um número ímpar de elementos, um dos valores

dela será o representativo para a mediana. Vamos supor que, ao invés de 24

elementos, nossa pesquisa compreendesse 23 observações. Logo, teríamos 11

elementos antes da mediana, 11 elementos depois da mediana e o 12º elemento

seria o valor da mediana.

{14, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 15, 16, 16, 16,

1º 2º 3º 4º 5º 6º 7º 8º 9º 10º 11º 12º 13º 14º 15º 16º

16, 16, 16, 16, 17, 17, 17}

17º 18º 19º 20º 21º 22º 23º

Esquematicamente:

O recurso que o software Fathom possui para visualizar a posição das

medidas no gráfico de um ponto de vista cognitivo, é um facilitador para a

compreensão de como esta medida está localizada em relação ao conjunto dos

dados observados. A seguir, apresentamos a representação gráfica para a média

da variável altura (Gráfico 11) e, também, para a mediana da variável altura

(Gráfico 12).

Gráfico 11: Histograma com a localização da média

Gráfico 12: Histograma com a localização da mediana + Box-plot

Vale ressaltar que o software permite que estas duas visualizações (das

duas medidas) sejam realizadas no mesmo gráfico. Desta forma, podemos

verificar mais facilmente que nem sempre essas duas medidas coincidem (a

mediana representada em azul e média, em vermelho), ou melhor, que a

coincidência é um caso especial para distribuições simétricas.

Gráfico 13: Histograma com a localização simultânea da média e da mediana + Box-plot

Esta ferramenta do software que permite a representação das duas

medidas simultaneamente, é facilitadora para a percepção da representatividade

das medidas e a variação em torno delas, sem a necessidade de se utilizar um

grande ferramental matemático. Ou seja, não exige dos alunos conhecimentos

matemáticos complexos, mas apenas certo grau de abstração para que possa

interpretar a variação dos dados.

Assim, no momento que o professor resolver utilizar este ambiente

informatizado com seus alunos, ele deverá levar em conta todas estas

informações importantes (é um dos conhecimentos explicitados por Shulman).

Podemos fazer, então, a inferência de que com a apreensão perceptiva,

segundo Duval (2003), ou seja, permite ao aluno o acesso a essa discussão,

ainda que não tenha o ferramental matemático, provocando a evolução no

letramento estatístico (ainda que dentro de um mesmo nível).

Quanto aos quartis são medidas raramente ou nunca trabalhadas na

Escola Básica brasileira, mas fazem parte do currículo em outros países, como

Estados Unidos da América (EUA), França, Espanha, entre outros.

Os quartis são os valores que dividem a distribuição em quatro conjuntos

com exatamente o mesmo número de elementos. Observamos, assim, que de um

ponto de vista cognitivo apresenta grau de complexidade compatível com os

desejados para o Ensino Fundamental.

Esquematicamente:

Gráfico 14: Histograma para a variável altura com a localização dos 1º, 2º e 3º quartis + Box-plot

A moda é outra medida bastante utilizada que representa o valor de maior

frequência da distribuição. Para observá-la no gráfico de colunas, por exemplo,

basta verificar qual é a coluna mais alta.

Outra ferramenta interessante que o software FATHOM possui é conseguir

selecionar em todas as representações construídas todos os indivíduos com os

mesmos atributos ao que é selecionado, basta “clicar” sobre um dos gráficos ou

no banco de dados que o software “ilumina” todos os indivíduos com as mesmas

características da selecionada.

Esta ferramenta relaciona (de maneira muito rápida) as diferentes

representações construídas no ambiente informatizado, isto facilita as análises

dos dados por todas as suas representações, percebendo o conjunto como um

todo, o que é esperado pela Análise Exploratória dos Dados.

Na Figura 13, observamos que o software destaca todas as pessoas do

gênero feminino, no exemplo a seguir, quando clicamos em cima da barra do

gênero feminino. Com esta seleção, conseguimos ter uma visão global do

conjunto de dados, ela permite construções de relações entre as informações

observadas (variáveis) de maneira mais rápida e ampla, aumentando as

condições didáticas para o desenvolvimento do pensamento e do letramento

estatístico.

Figura 13: Ferramenta do FATHOM para selecionar uma mesma característica em diferentes

registros

Observando a Figura 13, acreditamos que interpretação do tipo a maioria

das meninas prefere vôlei, nenhuma garota gosta de basquete, são mais

facilmente identificadas. Assim, com a presença do software podemos construir

rapidamente qualquer representação gráfica da variável que desejarmos, e,

também, “clicamos” sobre qualquer gráfico, desta maneira, a grande maioria das

análises necessárias seria facilmente realizada.

Relacionando tudo isto com as apreensões descritas por Duval, a leitura de

dados de Curcio e as relações hipotéticas levantadas por Vieira, acreditamos que

esta ferramenta do software seja um facilitador, para que o indivíduo alcance, pelo

menos, a apreensão discursiva e a leitura além dos dados, já que o sujeito

precisa refletir sobre as informações observadas, identificando relações entre as

representações construídas em relação ao contexto da pesquisa.

. A SEQUÊNCIA DIDÁTICA

Neste trabalho, a sequência didática desenvolvida foi adaptada com base

no trabalho de Vieira (2008). Fizemos apenas pequenas modificações para que

as atividades propostas se adequassem de maneira mais significativa a nosso

público-alvo, professores, uma vez que a autora trabalhou com alunos do Ensino

Médio.

Dessa forma, decidimos preservar a estrutura, acrescentando questões

específicas sobre o conhecimento didático do conteúdo. As atividades foram

organizadas em três grandes categorias: o teste diagnóstico, a familiarização com

o software e a análise de um plano de aula, conforme esquema apresentado na

Figura 1, do capítulo I.

Ressaltamos que no trabalho de Vieira (2008), a última parte trazia um

problema de análise de um banco de dados, que tinha por objetivo levantar as

formas de mobilização dos registros de representação semiótica feitas pelos

alunos participantes. Alterando para a análise do plano de aula, buscamos

identificar com o professor mobiliza, ele mesmo, seus conhecimentos estatísticos

e conhecimentos sobre o ensino de conteúdos estatísticos para organizar um

conjunto de atividades para que seus alunos possam construir e mobilizar de

maneira espontânea e adequada, os registros de representação semiótica

relativos a estes conteúdos.

IV.1 Análises a priori e a posteriori do teste diagnóstico

O intuito do teste diagnóstico foi identificar os conhecimentos específicos e

pedagógicos que o professor possui sobre a Estatística Descritiva antes de iniciar

o processo de formação. Este é composto de quatro questões.

1ª questão:

Em certa empresa, a distribuição do número de funcionários (segundo o gênero), para os

diversos cargos e seus respectivos salários é a seguinte:

Responda

a) Quantos funcionários têm a empresa?

b) Quantos funcionários são do gênero feminino?

c) Qual a porcentagem de funcionários do gênero masculino?

d) Quais são as variáveis desta pesquisa?

e) Você considera que as variáveis da pesquisa são do mesmo tipo ou são de tipos

diferentes? Justifique.

f) Qual a média salarial dos funcionários desta empresa?

g) Se colocarmos esses funcionários em ordem crescente de salários, qual será a posição

do funcionário que dividiria essa fila em dois grupos com o mesmo número de

funcionários. Escreva o cargo e o salário deste funcionário. Você saberia dizer qual

medida-resumo você está encontrando?

h) Qual o salário que você considera que melhor representa o salário pago por esta

empresa? Por quê?

i) Construa um gráfico que represente os cargos dos funcionários desta empresa.

j) Construa um gráfico que represente os gêneros dos funcionários desta empresa.

k) Construa um gráfico que represente os salários dos funcionários desta empresa.

1.1) Em relação a esta questão, como e quando você a abordaria com seus alunos?

1.2.) Você acredita que eles responderiam todos os itens com facilidade? Que

conhecimentos os alunos precisam? Quais itens eles teriam mais dificuldade? Por

quê?

Análise a priori

Para resolver os dois primeiros itens desta questão, primeiro o professor

precisaria buscar os dados na tabela e, em seguida, adicionar os valores

encontrados para solucionar a questão. Para o item “a)”, esperava-se como

solução que ele percebesse que deveria somar todos os itens da coluna “nº de

funcionários”, o que totalizaria 37 funcionários e para o item “b)”, 18 funcionários

do gênero feminino (soma dos valores associados ao item “feminino” na coluna

“gênero”).

No terceiro item, além de identificar os dados da tabela, adicionar os

valores, seria necessário que professor transformasse o valor encontrado em

representação percentual. Segundo Witte e Witte (2005, p. 23), frequência relativa

é “a frequência de cada classe como uma parte ou fração da freqüência total para

toda a distribuição”.

O resultado esperado para este item poderia ser calculado da seguinte

forma: seja N o total de funcionários, N

o total do gênero masculino e N

o total

do gênero feminino. Seja também F

a frequência relativa do total de

observações do gênero masculino.

N = 37

= 18

=19

100

. %

51 35

, %

≅

Observamos que o professor não precisaria explicitar ou mesmo conhecer

o conceito de frequência relativa, mas, apenas porcentagem. Neste caso, ele

estaria em um nível cultural de alfabetização, mobilizando apenas um tipo de

registro de representação semiótica (registro numérico), fazendo o tratamento na

organização tabular desse registro. Se fizermos um paralelo entre os níveis de

Curcio para a leitura gráfica, e os níveis de leitura tabular, esta atividade

necessitaria que o professor fizesse uma leitura entre os dados.

Nos itens “d)” e “e)” poderíamos identificar os conhecimentos do professor

em relação à variável estatística, se ele conseguisse identificar quais seriam as

variáveis e os tipos das variáveis (qualitativa ou quantitativa). As soluções

esperadas para o item “d)” seriam cargo, gênero, número de funcionários e

salário; e para o item “e)” seriam as variáveis de tipos diferentes, pois existem

variáveis qualitativas (cargo e gêneros) e variáveis quantitativas (número de

funcionários e salário).

Nestes itens, esperariamos que, mesmo que o professor respondesse que

as categorias pudessem ou não ser expressas numericamente, ele perceberia e

explicitaria o que seria uma variável, como sendo a característica observada com

tipos diferentes. Neste caso, dependeria da maneira como o professor

explicitasse as variáveis que seriam um índice de um letramento funcional ou

científico.

No item “f)”, analisaríamos como o professor faria para encontrar a média

salarial, e como ele (apenas no seu discurso) perceberia o que este valor

representaria para o conjunto de dados, ou seja, que tipo de significado ele

atribuiria à média. Como resposta esperaríamos que o professor somasse os

salários dos 37 funcionários da empresa (que ele não esquecesse de verificar que

existem salários iguais para mais de um funcionário) e, em seguida, dividisse o

valor encontrado por 37, ou seja:

Seja

a média dos salários dos funcionários, então

657 84

$ ,

, pois:

3500 820 8 540 22 400 6 24340

657 84

37 37

x x x

+ + +

= = =

Como análise deste valor, esperava-se que o professor percebesse que

este refletisse o fato de que os salários observados oscilam em torno de R$

657,84. Ou seja, o professor precisaria perceber que os valores observados não

seriam todos iguais ao valor da média, mas que variariam em torno dele.

Poderíamos dizer que neste caso, dependendo das explicitações do professor o

nível de letramento estatístico necessário seria o funcional. Neste caso o

professor, passaria do registro tabular (um tipo de registro numérico, mas que

obedece a uma organização em linhas e colunas) para o registro numérico que

seria o valor da média.

Poderíamos dizer que, para passar do registro tabular para o registro

numérico, o professor passaria, ainda que de forma implícita, pelo registro

algébrico, ao mobilizar a expressão que permitisse o cálculo da média,

No item “g)”, identificaríamos os conhecimentos de mediana. Uma primeira

estratégia que o professor poderia utilizar, seria a organização dos dados em

ordem crescente ou decrescente, a fim de determinar o termo central. Para

resolver a questão desta maneira, utilizamos as cores para facilitar a visualização

dos elementos que se encontram antes da mediana, o elemento que representa a

mediana e os que se encontram após a mediana.

Primeiros 18 elementos (em azul)

[400 - 400 - 400 - 400 - 400 - 400 - 540 - 540 - 540 -

540 - 540 - 540 - 540 - 540 - 540 - 540 - 540 – 540] –

19º elemento (em vermelho)

540 -

últimos 18 elementos (em verde)

[540 - 540 - 540 - 540 - 540 - 540 - 540 - 540 - 540 - 820 -

820 - 820 - 820 - 820 - 820 - 820 - 820 – 3500]

Assim, o elemento central seria o que ocupa a 19º posição, uma vez que

há 18 elementos antes dele e 18 depois. Neste caso, o salário é de R$ 540,00 e o

cargo de vendedor. Nesse caso o professor trabalharia com os registros

numéricos

Uma segunda estratégia seria organizar os dados em uma tabela de

distribuição de frequências com os valores dos salários em ordem crescente,

como facilitador para encontrar as frequências acumuladas.

Seja N o número de funcionários e F

a frequência acumulada da classe,

obtemos:

(variável) salário N F

Posição

400 6 6 (1º ao 6º)

540 22 28 (7º ao 28º)

820 8 36 (29º ao 36º)

3500 1 37 37º

Tabela 4: Tabela de distribuição de frequências com os valores em ordem crescente

Se quisermos dois grupos com o mesmo número de elementos, então,

cada grupo deverá ter (

37 2

) 18 elementos, sobrando um, que seria o elemento

central (19º elemento, em ordem crescente de salários). Para localizar o salário

que representa a mediana, há a mobilização do conceito de frequência

acumulada crescente ou contagem (primeira estratégia). Nesta estratégia,

também, o professor precisaria determinar que a solução seria 540 que é o salário

de um vendedor desta empresa. Um erro bastante comum seria a indicação do 19

(posição ocupada) ou da frequência 22, relativa à mediana. Aqui o professor,

passaria do registro numérico, para o registro tabular e voltaria ao registro

numérico, então, determinaria o valor observando o registro tabular.

Como terceira estratégia, o professor poderia utilizar, para resolver este

item, o algoritmo que usualmente encontramos nos livros de estatística:

onde n é o número de dados observados, para determinar a posição do termo

mediano. Pesquisas recentes abordam que o conhecimento do professor, tanto

em relação ao conteúdo como ao pedagógico estaria baseado no que se encontra

nos livros didáticos e, por isso, a consideração dessa estratégia. Nesta última

estratégia, o professor passaria do registro numérico, para o registro algébrico em

seguida, pelo registro tabular e/ou numérico para então determinar o valor da

mediana.

Para responder ao item “h)”, esperávamos que o professor escolhesse uma

das medidas-resumo (média ou mediana) como representativa para o salário

desta empresa e justificasse os motivos da escolha. Para fazer esta justificativa,

esperaríamos que, caso o professor viesse a escolher a média ele ressaltasse a

importância de se analisar também a dispersão dos dados, seja a amplitude total,

seja o desvio-padrão, indicando que ele tem construído o significado de média

como ponto ao redor do qual os demais se distribuem. Se ele escolhesse a

mediana, que saliente que este seria o valor que divide os dados observados em

dois grupos de mesma quantidade de elementos.

Pelas pesquisas recentemente concluídas, julgaríamos que os professores

viessem a escolher como representativa para o conjunto de dados a média

salarial; no entanto poderiam ter uma justificativa equivocada, isto fica bem claro

quando Silva (2007) diz que há equívocos nas medidas de tendência central por

parte de alguns professores que eles visualizam a média, como ponto central do

conjunto de dados.

As justificativas deveriam basear-se na dispersão dos dados (muito

dispersos indicariam pouca representatividade da média) e/ou na simetria ou não

da distribuição (distribuições muito assimétricas seriam melhores representadas

pela mediana). O professor também poderia justificar pela complementaridade

das informações contidas nas duas medidas, o que significaria o uso simultâneo

das representações. Estas justificativas exigiriam do professor um nível de leitura

da tabela além dos dados, letramento, pelo menos, funcional e apreensão

operatória do registro tabular de representação semiótica. (transformar tabela em

medida-resumo e “visualizar

” a distribuição representada na tabela, com a

localização das medidas-resumo encontradas).

Os últimos três itens buscariam identificar as escolhas do professor para a

construção do gráfico, além de verificar como este faria a mudança de registro de

representação semiótica (da representação de uma tabela para a representação

gráfica) e se o professor utilizaria apenas um tipo de representação gráfica ou

variadas. Neste caso a solução pode ser um gráfico de barras, colunas, setores

e/ou dot-plot. A Figura 14 ilustra alguns possíveis gráficos para os itens i, j e k.

____________

A “visualização” aqui significaria que o professor deveria “imaginar” o diagrama de colunas ou dot-plot.

Figura 14: Possíveis soluções dos itens “i”, “j” e “k” da primeira questão do teste diagnóstico

As questões 1.1 e 1.2 referem-se aos saberes docentes, para estas

questões esperaríamos que o professor pensasse em sua prática em sala de

aula. Como já dissemos, não nos aprofundaremos no assunto, por opção e por

problemas de gestão do tempo, apenas faremos alguns questionamentos no

intuito de perceber como o professor se vê à frente deste tipo de perguntas e

deixá-las (as questões sobre os saberes docentes) para que o professor possa

refletir sobre o assunto. Vale ressaltar que as questões 1.1, 1.2, 2.1, 2.2, 3.1 e,

assim, sucessivamente referem-se a saberes docentes.

Análises a posteriori

Para esta questão, percebemos que as duas professoras participantes de

nossa entrevista não apresentaram maiores dificuldades no momento de

responder à maioria dos itens. Tanto que para os itens “a”, “b”, “c”, “d”, “f”, “i” e “j”

suas respostas foram as esperadas em nossa análise a priori.

No caso do item “f”, ambas as professoras utilizaram o registro algébrico

(implicitamente), em seguida, o registro numérico para determinar o valor da

média. Vale ressaltar que elas apenas calcularam o resultado não nos sugerindo

preocupação com os desvio entre os valores.

Para o item “i” e “j”, ambas as professoras construíram gráficos de colunas

e as duas não se preocuparam com a escala, conforme observaremos à frente no

Protocolo 7. Isto pode ter acontecido, pelo fato de que atualmente a maioria dos

livros didáticos não dá a devida importância às escalas nos gráficos. Segundo

Cardoso (2007), os professores apoiam-se muito no que está escrito nos livros

didáticos

Em relação ao item “e”, as duas professoras relataram que havia

diferenças entre as variáveis envolvidas. A professora A justificou sua resposta

classificando as variáveis como qualitativas ou quantitativas, e a professora B

justificou a questão pela observação do tipo de dados, sua resposta foi mais

subjetiva, conforme o protocolo a seguir.

Abaixo os protocolos das professoras para os itens de a) até f), em seguida

a análise a posteriori para estes itens.

Protocolo 1: Respostas da professora A para a primeira questão do teste diagnóstico itens de “a”

até “f”

Protocolo 2: Resoluções da professora B para a primeira questão do teste diagnóstico itens de

“a”, “b”, “c” e “f”

Protocolo 3: Respostas da professora B para a primeira questão do teste diagnóstico itens de “a”

até “f”

Ao analisar o item “e” da professora B, notamos que ela distingue variável

contínua e variáveis que não utilizam números, que chama de discretas. Parece

haver confusão entre as variáveis qualitativas e as quantitativas discretas. A

mesma confusão foi identificada na pesquisa de mestrado de Déborah Maria de

Almeida, em andamento.

Observando os protocolos apresentados e a entrevista de maneira global

percebemos que existe maior preocupação com a organização das informações e

com a apresentação dos resultados pela professora A, que durante a entrevista,

também podemos notar que se utilizou mais dos algoritmos. Já a professora B

não usou fórmulas, apenas o raciocínio envolvendo os conceitos abordados.

A seguir, os protocolos para os itens “g” e “h”:

Protocolo 4: Respostas da professora A para a primeira questão do teste diagnóstico itens de “g”

e “h”

Protocolo 5: Resolução da professora B para encontrar a mediana de um conjunto de dados

Protocolo 6: Respostas da professora B para a primeira questão do teste diagnóstico itens de “g”

e “h”

Aqui ficam bastante evidenciadas as diferenças dos tipos de resoluções de

cada professora quando verificamos as respostas para o item “g”. A professora A

usou o algoritmo, verificou se os dados estavam organizados em ordem crescente

e encontrou o valor desejado. Este tipo de comportamento é relatado por Cardoso

(2007), ao afirmar que muitos professores utilizam os algoritmos, sem ao menos

questioná-los. A professora B organizou os dados, em uma linha, em ordem

crescente e descartou o primeiro e o último valor do conjunto de dados, depois o

segundo e o penúltimo, o terceiro e o antepenúltimo e, assim, sucessivamente até

restar apenas um valor, o da mediana. Quando sobram dois valores, a professora

realiza a média aritmética destes valores para determinar a mediana, com

veremos adiante

Vale ressaltar que esta estratégia realizada pela professora B, não

havíamos previsto em nossa análise a priori. No entanto, a professora utilizou um

raciocínio diferente do que previmos fazendo um tipo de enumeração dos dados.

Adiante os protocolos que envolvem a construção de gráficos:

Protocolo 7: Respostas da professora A para a primeira questão do teste diagnóstico itens de “i”,

“j” e “k” – construções gráficas

100

Protocolo 8: Respostas da professora B para a primeira questão do teste diagnóstico itens de “i”,

“j” e “k” – construções gráficas

Nos itens que sugerem a construção dos gráficos, as professoras

respeitaram as escalas no eixo vertical, no entanto no item “k” não respeitaram a

escala no eixo horizontal, mesmo assim optaram por gráficos propícios para cada

variável.

A professora B solicitou um espaço maior (uma folha de sulfite inteira) para

realizar suas construções, ela disse acreditar que, desta forma, as escalas

ficariam melhores. A professora A não construiu o gráfico de barras utilizando os

dois eixos, como era esperado. Ela construiu as barras utilizando as proporções,

mas colocou o valor da frequência sobre a barra. Assim, podemos depreender

que isto pode ser influência dos livros didáticos, pois alguns destes estão

apresentando os gráficos desta forma, segundo Canossa (2009) os professores

utilizam os livros didáticos, como fonte de formação continuada.

Podemos inferir que ambas não perceberam o conteúdo das

representações escolhidas: setores para relações do tipo parte/todo e colunas

101

para a relação parte/parte. Parece que escolheram o gráfico apenas pelo número

de categorias que seriam representadas. A professora A utilizou mais de um tipo

de registro, já a professora B optou apenas pela construção de gráficos de

colunas. Quando questionamos a professora A em relação à construção do

gráfico de setores esta ressalvou que acreditava ser mais interessante esta

construção para a variável sexo do que o gráfico de colunas, mas não justificou os

motivos.

Em nossa entrevista piloto, é interessante ressaltar que a professora

participante construiu um gráfico, empregando pares ordenados em um plano

cartesiano para representar os dados. Este tipo de erro também foi verificado no

teste diagnóstico aplicado por Vieira (2008), no qual os alunos representaram os

dados dessa forma (referência ao gráfico de função ou utilizados na Geometria

Analítica)

Protocolo 9: Entrevista piloto – construção de gráficos com a utilização de pares ordenados

102

Apresentamos agora os protocolos dos itens referentes aos saberes

docentes:

Protocolo 10: Respostas da professora A para a questão 1.1. do teste diagnóstico

Protocolo 11: da professora B para a questão 1.1. do teste diagnóstico

Protocolo 12: da professora A para a questão 1.2. do teste diagnóstico

103

Protocolo 13: da professora B para a questão 1.2. do teste diagnóstico

Em relação ao momento de abordar questões como estas, as duas

referiram-se que são trabalhadas, sobretudo, no 3º ano do Ensino Médio, mas a

professora B relatou que já trabalhou alguns destes conceitos em outras séries,

tanto que ela escreveu que já o fez no 5ª série do Ensino Fundamental II, mas

enfatizou que o aprofundamento ocorre na última série do Ensino Médio.

As duas professoras relataram que, para responder a estas questões

alguns alunos não teriam facilidade, enfatizaram que isso aconteceria

principalmente por eles não saberem trabalhar com as medidas de tendência

central e com diferentes representações para a distribuição de frequência.

Segundo Silva (2007), os professores não utilizam as medidas de

tendência central e a dispersão como ferramentas de análise de dados, pois

ensinam mais as variáveis qualitativas e também, uma única variável. Talvez por

esse motivo, as professoras relataram que os alunos teriam dificuldades para

resolver questões que abordassem este conteúdo, os próprios professores não o

desenvolvem na escola.

104

Assim, a professora A não percebeu o objetivo geral, o pensar em como

ensinar estes conceitos. Nos termos de Shulman, podemos inferir certo

desconhecimento do currículo que atualmente introduz o trabalho com tabelas e

gráficos estatísticos já no Ensino Fundamental.

2ª questão:

O gráfico abaixo, publicado pela revista Veja (1999), mostra como são divididos os 188

bilhões de reais do orçamento da União, entre os setores de saúde, educação, previdência e

outros.

57,00%

25,00%

8,00%

10,00%

Outros

Previdência

Educação

Saúde

Construa uma tabela que mostre os valores em reais gastos em cada um dos setores.

2.1.) Em sua opinião, os alunos possuem conhecimentos necessários para a construção

desta tabela?

2.2) Qual seria o momento propício para trabalhar este tipo de questões?

2.3.) Qual seria o “caminho” que o aluno escolheria para solucionar esta questão?

Análise a priori

O objetivo principal desta questão seria diagnosticar, como o professor faz

a conversão do registro gráfico para a tabela e, ainda, como ele lida com as

informações em porcentagem para transformá-las em valores absolutos (reais),

no que tange ao conhecimento específico do conteúdo.

Nesta questão, seria possível perceber que o professor precisaria fazer

uma conversão do registro gráfico para o tabular, que segundo pesquisas

recentes, é menos utilizado em sala de aula. Aqui acreditávamos que seria

necessário um nível de letramento pelo menos funcional, pois o professor deveria

trabalhar em dois tipos de representações semióticas (o registro gráfico, o tabular

e o numérico) fazendo a conversão entre estes registros. Em relação aos níveis

de Curcio, esta questão apela para uma leitura entre os dados.

105

Para Duval (2003), a compreensão do objeto de estudo apenas acontece

de forma global, quando este consegue compreender as diferentes

representações do objeto envolvido e suas conversões e tratamentos de registros.

Pensando nas apreensões, percebemos a necessidade da discursiva, pois para

determinar os valores absolutos, o professor precisa saber que o gráfico de

setores apresenta uma relação parte/todo.

A solução esperada seria a tabela que segue:

Tabela 5: Tabela esperada como solução da segunda questão do Teste Diagnóstico (Registro

Tabular)

setores Dinheiro gasto (em bilhões)

Saúde 18,8

Educação 15,04

Previdência 47

Outros 107,16

Total 188

A seguir apresentamos os cálculos necessários para se completar a tabela

acima.

188 18 8

100

. , bilhões para Saúde

188 15 04

100

. , bilhões para Educação

188 47

100

. bilhões para Previdência

188 107 16

100

. , bilhões para Outros

Para realizar estes cálculos, o professor mobilizaria conhecimentos básicos

de porcentagem. No entanto, a conversão do gráfico para a representação tabular

e do tratamento entre os valores percentuais e absolutos proporcionaria uma

análise dos dados de maneira mais global com uma visão real dos gastos em

cada um dos setores descritos. A análise a posteriori desta questão faremos com

a da 3ª questão.

Registro

Numérico

106

3ª questão:

Para analisar um conjunto de dados, podemos utilizar medidas que resumem os dados e

descrevem suas características, permitindo assim a análise da variação destes dados. Em sua

opinião, como os alunos compreendem e analisam as medidas abaixo em relação ao conjunto

de dados?

Média aritmética:________________________________________________________

Moda:_________________________________________________________________

Mediana:______________________________________________________________

Quartis:_______________________________________________________________

Esta questão tem por objetivo diagnosticar, qual(is) medida(s)-resumo o

professor conhece. Nesta pergunta, não pretendíamos verificar se o professor

sabia calcular as medidas-resumo, mas se percebia se os alunos as conheciam e

sabiam analisá-las. Assim, não seria necessário realizar nenhum tipo de

conversão ou tratamento. Para conhecer as medidas e conseguir explicar como

acontece sua análise, acreditávamos ser preciso um nível cientifico de letramento

estatístico.

Análise a posteriori da segunda e terceira questões:

Protocolo 14: Conversão do registro gráfico para o tabular – questão 2 do teste diagnóstico

107

Protocolo 15: Resposta da professora A para os itens de saberes docentes da questão 2 do teste

diagnóstico

Protocolo 16: Resposta da professora A para os itens de saberes docentes da questão 2 do teste

diagnóstico

108

Primeiro, apresentamos os protocolos observados para a questão 2 e suas

análises:

Nesta questão, as duas professoras realizaram os cálculos sem

dificuldades, no entanto, divergiram de opinião em relação se os alunos

conseguiriam ou não realizá-la. Esta discordância pode ser explicada pelos

diferentes níveis de conhecimento dos alunos, conforme relata Shulman. A

professora B citou que eles teriam facilidade e que, talvez, o único dificultador

fosse o fato dos números se tratarem de bilhões, segundo ela, números muito

“grandes”. Desta forma, poderia existir a necessidade de se trabalhar com

notação científica. Vale ressaltar que ela não usou esse tipo de registro para a

apresentação dos seus dados. Já a professora A acreditava que os alunos, em

sua maioria, não realizariam esse exercício, ela justificou o fato dos alunos não

saberem realizar a relação dos dados apresentados no gráfico e o cálculo da

porcentagem. Ela ainda complementou que, apenas fariam o exercício depois da

explicação do professor.

Embora fizessem parte do currículo, várias pesquisas mostram que esses

conteúdos não são usualmente abordados. Na pesquisa de Vieira (2008), a

autora afirma que os alunos tinham dificuldades para resolver esse tipo de

questão. A professora B confirmou o fato com suas preocupações, indicando o

conhecimento dos alunos e do contexto educativo.

Segundo Morais (2006), atualmente os conceitos estatísticos são

trabalhados de maneira isolada e desarticulada, talvez por esse motivo os alunos

possam ter dificuldades nas inter-relações entre os diversos registros de

representação e na conversão desses registros. Ambas as professoras não

tiveram dificuldade para realizar a conversão, no entanto, elas relatam as

dificuldades dos alunos.

Optamos por colocar apenas um protocolo da construção da tabela, visto

que as duas construções eram muito parecidas. Escolhemos o protocolo da

professora B para que pudéssemos perceber que ela salienta a necessidade do

uso da notação cientifica, mas na sua construção não a utiliza. Além disso,

porque podemos observar que a própria professora se atrapalha na utilização da

109

representação numérica para o orçamento, ao escrever, por exemplo,

18.800.000.000 bilhões para Saúde, quando a palavra “bilhões” não é necessária,

observe este fato no protocolo 15.

Observe agora os protocolos da 3ª questão, seguidos das análises:

Protocolo 17: Resposta da professora A para a questão 3 do teste diagnóstico

110

Protocolo 18: Resposta da professora B para a questão 3 do teste diagnóstico

Em relação a 3ª questão, percebemos que as duas professoras apenas

explicaram cada uma das medidas, não referiram como poderia ser uma possível

análise destas. Podemos observar também que algumas respostas foram muito

subjetivas, dando indícios que talvez a professora não soubesse como explicar

estas medidas. Não podemos afirmar que elas não as conhecessem, visto que na

questão seguinte elas sabiam calculá-las, talvez não conseguissem explanar

todas as medidas. (Conhecimento dos procedimentos, e não de seus

significados).

Referindo-nos à professora A, verificamos que tanto para a média

aritmética, como para os quartis, ela disse que eram medidas que representavam

o conjunto de dados e que auxiliavam na análise dos dados, ao ser questionada

reafirmou que eram usadas na análise dos dados. Já a professora B, em seu

discurso disse que a média é o ponto de equilíbrio entre os dados. No entanto, no

momento de relatar sua explicação poderia causar confusão com mediana. Ela

também relatou nunca ter abordado quartis com seus alunos e, por isso, não

sabia dizer como eles compreenderiam.

111

Embora o nível de letramento estatístico seja global, ou seja, é analisado

em relação ao conjunto de conhecimentos estatísticos, podemos identificar

indícios desse nível na evolução das atividades. Assim, até este momento de

nossa sequência, podemos inferir que ambas as professoras oscilaram entre os

níveis cultural e funcional.

Aqui, apresentamos uma questão a ser considerada em pesquisas futuras:

existiriam subníveis de letramento estatístico?

4ª questão:

As idades das quarenta pessoas que prestaram um concurso de seleção para uma

determinada instituição são as seguintes:

18, 18, 20, 22, 21, 18, 19, 20, 22, 18,

19, 20, 21, 18, 20, 19, 20, 19, 22, 19,

20, 21, 20, 18, 19, 18, 22, 21, 20, 19,

20, 18, 21, 18, 18, 19, 20, 19, 18, 18

a) Construa um gráfico de barras que represente as idades destas pessoas.

b) Quantas pessoas têm idade menor ou igual a 20 anos?

c) Qual a idade você considera mais apropriada para representar esta distribuição?

Justifique.

d) Tente relacionar cada um dos valores das idades desta distribuição com as respectivas

medidas:

I. Média Aritmética ( ) 18 anos

II. Mediana ( )19,5 anos

III. Moda ( ) 19 anos

IV. Primeiro Quartil ( ) 20 anos

V. Terceiro Quartil ( ) 18 anos

4.1) Em sua opinião, para que o aluno construa o gráfico de barras, que é solicitado no

item “a)” desta pergunta, é necessário que ele reorganize os dados de outra forma?

Se sim, qual seria?

4.2.) Para resolver o item “b)” qual (is) dos registros

apresentados e/ou construídos você

acredita que ele utilizaria? Por quê?

*Chamamos de registros as diferentes representações do objeto de estudo, no nosso

caso distribuição de freqüências, aqui podemos considerar registros as representações

gráficas, tabulares, banco de dados, medidas entre outras.

4.3) Em que fase de escolaridade você acredita que seja interessante abordar questões

como essa que envolvem construções e análise de gráfico e medidas? Os alunos

conseguem resolvê-las?

112

Análise a priori

No primeiro item desta questão, pediríamos que o professor realizasse a

construção de um gráfico de barras. Neste caso, em nenhum momento,

solicitaríamos que ele organizasse os dados, por exemplo, montando uma tabela,

mas para que ele construísse o gráfico com facilidade, haveria necessidade da

organização dos dados, nessa questão esperávamos que isso acontecesse,

mesmo sem a instrução para isto.

Esperávamos como solução da organização dos dados, antes mesmo da

construção do gráfico, uma tabela, como no exemplo abaixo, para que o professor

percebesse com mais clareza a distribuição de frequência para cada dado

observado.

Idade Freqüência

18 12

19 9

20 10

21 5

22 4

Total 40

Tabela 6: Tabela para organização dos dados

Segundo Vieira (2008), também, poderia ser possível como organização

dos dados nesta questão com a construção do gráfico “dot-plot”. Vale lembrar que

neste gráfico (gráfico de pontos), cada valor observado é representado por um

ponto. Se o professor optasse pela construção do “dot-plot”, antes do gráfico de

barras, ele já conseguiria perceber quais seriam as alturas das barras, sem a

necessidade de ordenar os dados ou organizar a tabela. O dot-plot sugere o

gráfico de colunas, caso recorresse a essa estratégia o professor deveria

conhecer a equivalência entre um diagrama de barras e um de colunas.

113

Gráfico 15: Dot-plot para organização dos dados

Em seguida, esperaríamos que o professor construísse o gráfico de barras,

conforme solicitado na questão, que percebesse a necessidade das barras não

serem justapostas se o tratamento escolhido para a variável fosse o de variável

discreta e, também, que a largura de todas as barras deveria ser a mesma. Na

realidade, o gráfico adequado aqui seria um gráfico de bastões, mas como ele

não é usualmente abordado na Escola Básica, decidimos não trabalhar esse tipo

de representação. Caso o professor construísse um histograma, também seria

adequado, visto que a grandeza associada à variável é contínua. Nesse caso, ele

precisa explicitar as classes a serem adotadas.

Nessa questão, também, proporíamos uma conversão, no caso de um

banco de dados para a representação gráfica. Vale ressaltar que, dependendo

das escolhas do professor para realizar a construção do gráfico de barras, ele

poderia realizar em primeiro lugar um tratamento do banco de dados para a

representação tabular (ambos registros numéricos) e, em seguida, uma

conversão da representação tabular para a gráfica (registro numérico para

registro gráfico), ou primeiro uma conversão, do banco de dados para o dot-plot,

seguido de um tratamento entre as duas representações gráficas. Acreditamos

que mesmo que o gráfico de barras fosse construído no plano cartesiano e o dot-

plot eixo implícito, ambas as representações trabalhariam com o mesmo tipo de

dados (valores absolutos) e a mesma visualização.

114

Gráfico 16: Gráfico de barras para a variável idade

Para solucionar a questão, seria necessário um nível de letramento, pelo

menos, funcional e uma leitura dos dados e entre os dados, pois seria necessário

que se conhecesse a representação do gráfico de barras, algumas de suas

propriedades para que a construção fosse correta e não tendenciosa (calibração

da escala), e para isto verificamos a necessidade de uma apreensão discursiva.

No item “b”, seria necessário verificar o total de pessoas com idade menor

ou igual a 20 anos. Aqui seria necessária uma leitura entre os dados e, pelo

menos, um nível funcional de letramento estatístico, uma vez que seria preciso

adicionar os valores observados, pois a resposta não é direta. Em relação à teoria

dos registros de representação semiótica, o professor poderia realizar um

tratamento no registro tabular construído anteriormente.

Para solucionar o item “b”, esperávamos que o professor determinasse a

frequência acumulada dessa distribuição e isto poderia ser feito com o auxilio de

uma tabela, como a apresentada abaixo.

115

Tabela 7: Tabela para auxiliar na identificação da mediana

Idade Frequência (F)

Frequência

acumulada (Fac)

18 12 12

19 9 21

20 10 ... .......31 →

21 5 36

22 4 40

Total 40

Quantidade de

pessoas com idade

menor ou igual a 20

anos

Pelos dados da tabela, observando a coluna da frequência acumulada

seria fácil perceber que são 31 pessoas com idade igual ou inferior a 20 anos.

No item “c”, o professor precisaria escolher uma das medidas-resumo para

justificar a idade que ele consideraria mais representativa para a distribuição de

frequências.

Nesta questão, o professor necessitaria estar em um nível pelo menos

funcional, pois existe a necessidade da justificativa da escolha e sua leitura deve

ser além dos dados para identificar o salário mais apropriado à pesquisa.

Em relação aos registros de representação semiótica, percebemos o

tratamento entre os registros numéricos (rol e representação tabular) e, também,

a apreensão operatória, visto que há necessidade de modificação do registro

tabular para o registro numérico que é o de valor representativo para a

distribuição de frequências calculadas.

No item “d”, precisaria encontrar os valores das medidas envolvidas nesse

banco de dados. Na questão, observa-se que o professor deveria conhecer o

conceito de medida-resumo, logo, para este problema como o enunciado fornece

qual a medida a ser calculada, o professor precisaria apenas lembrar como

calculá-la, o que significa que ele precisaria ter um nível funcional de letramento

estatístico.

Média aritmética:

Em relação à média aritmética, seja

a média das idades, logo:

12 18 9 19 10 20 5 21 4 22 780

19 5

40 40

x x x x x

anos

+ + + +

= = =

116

Como análise deste valor, esperávamos que o professor percebesse que

ele indica que as idades dos pesquisados variam em torno de 19,5 anos. Aqui o

professor somente mobilizaria um único registro de representação semiótica

(registro numérico).

Mediana:

No caso da mediana, esperávamos que o professor mobilizasse seu

conhecimento de que este é o valor que divide os elementos (ordenados

crescentemente) do banco de dados em duas partes de mesmo número de

elementos. Da mesma forma que, na primeira questão, o professor poderia

escolher entre duas estratégias. A primeira, seria organizar os dados e verificar o

termo central.

Diferentemente da primeira questão, neste caso quando buscamos

determinar o termo central perceberíamos que teríamos (

40 2

) 20 elementos em

cada grupo, não sobrando nenhum. Nesse caso, para determinar o termo central

(este poderia ser um valor não apresentado nos dados pesquisados, mas nem por

isso deixaria de ser representativo para a pesquisa), assim, precisaríamos

encontrar a média entre os valores das 20ª e 21ª posições.

Primeiros 19 elementos (em azul)

18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 18, 19, 19,

19, 19, 19, 19, 19,

20º e 21º elementos

19, 19,

Últimos 19 elementos (em verde)

20, 20, 20, 20, 20,

20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 22, 22, 22, 22

20º e 21º elementos

19 , 19

termo central média entre o elementos das posições 20 e 21

19 19 38

2 2

anos

= =

A segunda estratégia seria organizar os dados em uma tabela de

distribuição de frequências com os valores em ordem crescente e determinar a

frequência acumulada e a posição.

117

Tabela 8: Tabela com as frequências acumuladas e posição no rol

Idade

Número de

pessoas

Frequência

acumulada (Fac)

Posição

18 12 12 1ª a 12ª

19 9 21 13ª a 21ª

20 10 31 22ª a 31ª

21 5 36 32ª a 36ª

22 4 40 37ª a 40ª

Total 40

Como o termo central desta distribuição de frequências fica entre as

posições 20 e 21, pela visualização da tabela ficaria facilmente identificada a

mediana como 19 anos, pois ambas as posições são representadas por esse

mesmo valor.

Moda

Em relação à moda, esperava-se que o professor mobilizasse o

conhecimento de que é o valor mais frequente da distribuição. Aqui também ele

poderia escolher entre duas estratégias. A primeira, seria observar na tabela o

elemento com maior frequência.

Tabela 9: Tabela para identificação do valor máximo

Idade Frequência (F)

18 12

19 9

20 10

21 5

22 4

Total 40

A segunda estratégia seria observar, no gráfico, a barra mais comprida.

Como resposta, o professor encontraria que o valor representativo da moda é 18

anos.

118

Gráfico 17: Gráfico de barras para a variável idade localizando o valor máximo

Esta atividade exigiria apenas a leitura dos dados, a apreensão perceptiva

da figura (ou da tabela) e um letramento cultural.

Primeiro e Terceiro Quartis:

Ao buscarmos determinar os quartis perceberíamos que teríamos (

40 4

)

10 elementos em cada grupo, não sobrando nenhum. Nesse caso, para

determinar os quartis devemos prosseguir da seguinte forma.

Para encontrar o valor do primeiro quartil, faríamos a média entre os

valores da 10ª posição (18 anos) e da 11ª posição (18 anos). Como em ambos os

casos, o valor encontrado seria 18 anos, este seria o valor representativo para o

primeiro quartil.

Para verificar o valor do terceiro quartil, faríamos a média entre os valores

da 30ª posição (20 anos) e da 31ª posição (20 anos). Como em ambos os casos o

valor encontrado seria 20 anos este seria o valor representativo para o terceiro

quartil.

Da mesma maneira que na mediana, o professor poderia determinar o

valor de primeiro quartil pela organização dos dados em ordem crescente ou

decrescente no rol, ou pela observação do registro tabular com as frequências

acumuladas.

119

Assim, a solução esperada para este item seria:

I. Média Aritmética (III) 18 anos

II. Mediana ( I )19,5 anos

III. Moda ( II ) 19 anos

IV. Primeiro Quartil ( V ) 20 anos

V. Terceiro Quartil ( IV ) 18 anos

Análise a posteriori

A seguir, apresentamos os protocolos das professoras para o item “a”

desta questão. Vale ressaltar que a observação feita em vermelho foi realizada

pela pesquisadora e não pelas professoras participantes, com a finalidade de

explanar os procedimentos escolhidos por elas.

Protocolo 19: Conversões realizada pela professora A para responder a questão 4 do teste

diagnóstico

120

Protocolo 20: Conversões realizada pela professora B para responder a questão 4 do teste

diagnóstico

Mesmo não solicitando às professoras que organizassem os dados de

outra maneira (antes de construir o gráfico), como por exemplo, uma tabela, as

duas perceberam a necessidade desse registro (mesmo que feitos como um

rascunho) para, em seguida, realizar a construção do gráfico. Aqui podemos

inferir que elas perceberam a necessidade da conversão entre os registros. Desta

forma acreditamos que elas apresentem a seus alunos a importância destas

conversões, como é esperado.

121

Outra hipótese foi que o conhecimento de conteúdo tenha se construído

apoiado no uso dos livros didáticos e nestes a construção de gráficos é assim

apresentada.

Para a construção do gráfico, as duas professoras tiveram cuidado de

respeitar as escalas. Nos dois casos, o único equívoco foi a construção do gráfico

de colunas e não o de barras como foi solicitado, mas no nosso entender ambas

as representações evidenciaram os mesmos fatores de uma maneira muito

similar.

No entanto, a professora B explicitou que construiu um gráfico de colunas e

como seria um gráfico de barras, o que a professora A não fez. Esta apenas fez a

construção sem qualquer comentário explicativo. Isto pode indicar que ela não

distingue esses dois tipos de gráficos (tal confusão também ocorre em alguns

livros).

Os protocolos com as respostas das professoras para o item “c” e “d” da

questão são apresentados:

Protocolo 21: Respostas da professora A para responder à questão 4 do teste diagnóstico, itens

“c” e “d”

122

Protocolo 22: Respostas da professora B para responder a questão 4 do teste diagnóstico, itens

“c” e “d”

No item “c”, a professora B escolheu 20 anos como o valor representante

da distribuição e justificou sua escolha, ressaltando que esse valor se refere a

média dos dados (depois de realizar um arredondamento para 20 anos, pois a

média era 19,5); já a professora A escolheu 19 anos, justificando que esse era o

valor da mediana e aproximava-se da média. Nenhuma das professoras cogitou

no momento da pesquisa em usar as duas medidas.

É interessante ressaltar que as duas professoras preocuparam-se em

justificar as suas escolhas por uma medida de tendência central, mas nenhuma

123

delas, pelo menos, citou a necessidade da análise da dispersão dos dados da

pesquisa. Esta atitude foi evidenciada também por Silva (2007).

Para resolver o item “d”, a professora A utilizou um algoritmo para

determinar a média; as demais medidas, ou ela já as determinou anteriormente,

ou ela as encontrou pela observação dos dados apresentados. A professora B,

para o cálculo da média, utilizou a estrutura do algoritmo, mas não o fez com

muito rigor, e para a mediana ela repetiu o processo descrito anteriormente

(“cancelar o primeiro e o último”). Aqui é interessante lembrar que a professora B

relatou não perceber a necessidade de se trabalhar com “tantos” dados, disse

que, com menos dados, também seria possível perceber a compreensão do

conceito. Acreditamos que talvez, a professora apenas encontre o valor da

mediana desta forma e quando existem muitos dados, este processo se torna

muito trabalhoso e inviável.

A seguir, as respostas das professoras à questão 4.1.

Protocolo 23: Resposta da professora A referente a importância das conversões

Protocolo 24: Resposta da professora B referente a importância das conversões

124

As duas professoras perceberam a necessidade de uma reorganização dos

dados em um outro registro de representação, para somente então realizar a

construção do gráfico. Como relatamos anteriormente, elas fizeram essa

reorganização. No entanto, ambas indicaram a construção de tabela, que é a

representação mais usual nos livros. Nenhuma delas recorreu a outro tipo de

representação, como por exemplo, o dot-plot.

As respostas das professoras à questão 4.2 foram as seguintes

Protocolo 25: Resposta da professora A para a utilização dos diferentes registros

Protocolo 26: Resposta da professora A para a utilização dos diferentes registros

Em relação à utilização dos registros para a análise de alguns dados, a

professora A disse que os alunos escolheriam apenas um dos registros, e a

professora B relatou que eles poderiam utilizar qualquer um dos registros

observados. No entanto, nenhuma delas pareceu observar que o gráfico favorecia

a interpretação pela apreensão perceptiva.

Referente aos níveis de letramento propostos por Shamos, nesta primeira

etapa da pesquisa, podemos observar que, em alguns momentos as professoras

estão no nível cultural e em outros no funcional. Talvez estejam em um processo

de transição entre estes dois níveis de letramento estatístico.

125

Pela análise global dos resultados obtidos nesta etapa de nossa fase de

experimentação, percebemos que as professoras envolvidas apresentavam

alguns equívocos sobre algumas construções gráficas, uma delas não possuia a

distinção dos tipos de variáveis e que também fazem poucas ou quase nenhuma

análise dos resultados obtidos. As análises apenas acontecem de maneira

superficial quando são solicitadas na questão.

Acreditamos ser interessante ressaltar que a pesquisadora fez algumas

colocações com as professoras referente ao que era resolvido, como forma de

institucionalizar alguns conceitos. No entanto, não foi proposto que elas

alterassem suas respostas, mas também não faríamos nenhuma objeção, caso

elas tivessem essa atitude, o que não ocorreu durante nossa entrevista.

IV.2 Análises a priori e a posteriori da primeira fase da parte A das

atividades de familiarização com o software Fathom

A seguir, analisaremos a parte A da sequência didática, que tem como

objetivo principal a familiarização do professor com o software Fathom. A parte A

das atividades de familiarização está dividida em três fases distintas.

A primeira fase possui nove questões; a segunda fase seis questões e a

terceira fase, 14 questões, a maioria delas deve ser resolvida com o auxilio do

software.

Vieira (2008) quando elaborou estas atividades salientou que, nesta parte,

além de se apropriar das ferramentas do software, as questões possibilitariam a

revisão de alguns conceitos estatísticos.

Essas atividades permitem trabalhar conceitos de construção do banco de

dados, usando o software Fathom, variáveis quantitativas e qualitativas,

construção de tabelas de distribuição de frequências, construção e análise de

diferentes tipos de registros, construção e interpretação de algumas medidas-

resumo (média, mediana, quartis e desvios).

126

Com o uso do software Fathom, ressaltamos que temos acesso

rapidamente a diferentes registros do mesmo objeto e, com isto, colocamos o

professor ao mesmo tempo frente ao banco de dados, tabelas, gráficos e medidas

para que ele possa perceber a importância de se trabalhar simultaneamente com

mais de um registro. Desta forma, segundo Duval, a compreensão do objeto de

estudo torna-se completa (uso simultâneo de diversas representações).

Questão preliminar:

Observe o seguinte conjunto de dados de uma pesquisa realizada com 20 funcionários de

uma empresa:

A partir deste conjunto de dados podemos levantar inicialmente as seguintes questões:

− Quais as características dos sujeitos observados que estão sendo alvo desta pesquisa?

− Se fôssemos classificar estas características, quais critérios poderiam ser usados? Por

quê?

Obs.: Lembre que as características observadas constituem o que chamamos de “variável

estatística”.

127

Análise a priori

Nesta questão, seria necessário que o professor conhecesse e soubesse

classificar as variáveis estatísticas, seria preciso necessária uma justificativa para

explicar o motivo da classificação. Por isso, acreditamos ser preciso um nível de

letramento estatístico entre o funcional e o cientifico, dependendo das

explanações do professor. A questão trabalha com o conhecimento específico do

professor.

Assim, esperava-se que o professor conseguisse separar as variáveis

qualitativas (gênero, cargo e escolaridade) das quantitativas (idade e salário). E

também explicasse estas variáveis por suas características comuns, ou seja, as

qualitativas representam as qualidades, os atributos dos indivíduos pesquisados,

e as quantitativas, os dados que podem ser expressos numericamente, possuem

uma estrutura nitidamente numérica.

A questão não solicitava uma análise mais detalhada, mas seria possível

que o professor (por já ter estudado estatística anteriormente) relatasse que as

variáveis quantitativas podiam ser subdivididas em dois grupos, os das

quantitativas discretas e os das quantitativas contínuas.

Em nossa questão, salário seria uma variável quantitativa discreta, pois

admite uma unidade mínima e indivisível e o tratamento dado à variável idade

(considerando apenas anos completos), também, poderia ser considerado uma

variável quantitativa discreta.

Análise a posteriori

Todas as questões da parte A, nas quais apenas foram indicados

procedimentos para a construção das representações do conjunto de dados no

ambiente computacional, questões estas cujo objetivo principal foi familiarizar o

professor com algumas das ferramentas do software, as professoras realizaram

sem maiores dificuldades. Isto aconteceu nas questões: 2, 3, 4, 6, 7, 8 e 9 da 1ª

fase, 1 da 2ª fase e 1, 2, 4, 5, 7, 8, 11 da 3ª fase, por isso, optamos por fazer

agora uma análise a posteriori única para estas questões. Vale ressaltar que

128

traremos estas questões no corpo deste trabalho, para que a compreensão das

atividades seja de maneira global.

Nestas questões, pudemos observar que o interesse maior das professoras

era perceber como funcionava o ambiente computacional Fathom e quais os

recursos desse software. A professora A mostrou-se bastante entusiasmada pela

facilidade e agilidade de se realizar as diferentes construções. Já a professora B,

também, achou interessante a agilidade nas construções, mas não se mostrou

muito entusiasmada com a interface do software, dizendo que alguns comandos

(quando, por exemplo, há necessidade de segura o shift e “arrastar” os dados)

não eram tão fáceis de serem realizados.

Quando houve a necessidade da intervenção da pesquisadora na

construção e/ou análise por parte das professoras perante o conjunto de dados,

ou, até mesmo, quando aconteceu algum comentário (escrito ou oral) relevante,

ou ainda quando havia questões do cunho docente, abordaremos mais

detalhadamente sua análise a posteriori. Por exemplo, isso aconteceu na questão

preliminar que além de ser de construções no software, abordava duas perguntas

relacionadas às variáveis estatísticas. Os protocolos destas respostas seguem:

Protocolo 27: Respostas da professora A referente a variáveis estatísticas

Protocolo 28: Respostas da professora B referente a variáveis estatísticas

129

A respeito das características dos sujeitos que são representados no banco

de dados, as duas professoras categorizaram todas as variáveis, como era

esperado. No momento de classificar estas variáveis, a professora A relatou

(oralmente) que eram classificadas como qualitativas e quantitativas e justificou

que essa classificação acontecia pelas definições de cada tipo de variável. A

professora B também relatou que as características eram diferentes e que sua

classificação acontecia pela diferença de estrutura. Ela disse não recordar a

classificação correta para as variáveis estatísticas, mas, algumas eram de

estrutura numérica e outras não. Tal distinção, apenas por não apresentar o

vocabulário científico, mostrou que a percepção da gênese da variável era

possível, independente do nível de letramento.

Referente ao uso do ambiente computacional na escola, as professoras

responderam:

Protocolo 29: Resposta da professora A referente ao uso do ambiente computacional na escola

Protocolo 30: Resposta da professora B referente ao uso do ambiente computacional na escola

As duas professoras acreditavam ser importante o uso de ambiente

computacional na escola, mas também relataram que seu uso é muito tímido por

parte dos professores, pois muitas vezes a escola não possui uma infraestrutura

130

adequada para este tipo de abordagem, ou até que alguns professores não

possuam os domínios mínimos de informática para desenvolver uma aula nesse

ambiente. Isto também foi observado em pesquisas sobre informática na

educação.

1ª questão:

Primeira Fase : Elaboração de tabelas no Fathom

1) Inicialmente, construiremos o banco de dados do exemplo a ser trabalhado no software

Fathom. Para isso, siga os procedimentos abaixo

a) Clique no ícone do Desktop , para iniciar o software

b) Clique em “new collection” , e arraste até a tela.

c) Clique duas vezes em cima da palavra “collection1”, aparecerá a caixa “rename

collection”, onde você pode inserir um nome para o seu banco de dados.

d) Agora, clique em “new case table” e arraste até a tela.

e) Insira os dados da pesquisa na tabela do Fathom. Para isso, clique em “new” e escreva

o título da coluna. Depois, tecle “enter”, para continuar inserindo os dados nas linhas

(Obs.: não utilize acentuação, pontuação ou espaçamentos nos nomes das variáveis).

131

A 1ª questão apenas indicou como qualquer pessoa deveria proceder para

iniciar o Fathom e a maneira de inserir um banco de dados no software. Vale

ressaltar que, neste momento, não estávamos trabalhando a análise de dados

estatísticos, mas apenas algumas construções para familiarização com o

ambiente computacional. O resultado obtido é apresentado na Figura 15.

Figura 15: Tela do FATHOM esperada como solução da inserção de dados no software

132

2ª e 3ª questões:

2) Agora, construiremos uma tabela de distribuição de freqüências para a variável

“gênero”.

a) Clique em “new summary table” e arraste até a tela

b) No banco de dados do Fathom, selecione a coluna “gênero” e arraste-a até a nova

tabela.

3) Seguindo o mesmo procedimento, construa também as tabelas de distribuição de

freqüências para as variáveis “cargo” e “escolaridade”.

Estas questões forneceram informações para auxiliarem o professor a

construir tabelas de distribuição de frequência para variáveis qualitativas. Nesse

momento, ressaltamos a importância da apresentação dos passos para a

construção das tabelas no ambiente computacional, visto que o professor não

conhecia o software anteriormente.

Nesses itens, não solicitamos nenhuma análise estatística dos dados

levantados, apenas pedimos as construções.

Em relação às construções, é importante abordar que o enunciado da 2ª

apresentava uma tabela (tabela horizontal de distribuição de frequências); no

entanto, o software promove duas possibilidades para o desenho da mesma

distribuição de frequência (horizontal e vertical), mas, como em ambos os casos,

as construções possuem a mesma representatividade não acreditamos que fosse

um obstáculo para o professor. Logo, caso o professor “arrastasse” a variável

gênero até a seta que indica para a direita, o desenho da tabela seria o

apresentado a seguir.

133

Tabela 10: Tabela de distribuição de frequências para a variável gênero

Agora, se o professor arrastasse para a seta que indica para baixo, o

desenho da mesma representação seria o apresentado abaixo.

Tabela 11: Tabela vertical de distribuição de frequências para a variável gênero

A 3ª questão apenas solicitava que o professor construísse outras tabelas

de distribuição de frequência, para que ele pudesse ir se acostumando com as

ferramentas do software.

Tabela 12: Tabelas de distribuição de frequências para as variáveis cargo e escolaridade

134

4ª questão:

4) Você considera que a variável “gênero” e a variável “idade” são de mesmo tipo? Por

quê?

4.1.) O aluno consegue fazer esta distinção para os tipos de variáveis? Se sim, como

ele faria?

Aqui esperávamos que o professor percebesse que as variáveis gênero e

idade não são do mesmo tipo, conforme a atividade já realizada no teste

diagnóstico. Percebeu-se a necessidade de verificar que a variável gênero é

qualitativa, pois se refere a um atributo (qualidade) do indivíduo pesquisado; no

entanto, a variável idade é quantitativa, pois expressa quantos anos a pessoa

tem, ela possui uma estrutura numérica,

Para solucionar esta questão eram necessários um nível cultural de

letramento estatístico e uma apreensão perceptiva, uma vez que era apenas

trabalhada uma categorização que poderia ser intuitiva.

Análise a posteriori

Apresentamos as respostas das professoras para esta questão:

Protocolo 31: Resposta da professora A para a questão 4 da parte A

Protocolo 32: Resposta da professora B para a questão 4 da parte A

135

Nesta questão, a professora A classificou cada uma das variáveis e afirmou

que elas não eram do mesmo tipo. A professora B também considerou que estas

variáveis não eram do mesmo tipo e as classificou como de estrutura numérica e

não numérica (novamente). Aqui discutimos com a professora B sobre a

classificação dessas variáveis, mas como ela também é pesquisadora (concluindo

mestrado em educação matemática), optou por não alterar as respostas para que

a pesquisa fosse o mais fiel possível ao que pensava.

A seguir, apresentamos como as professoras acreditam que seus alunos

realizariam a classificação das variáveis:

Protocolo 33: Resposta da professora A para a questão 4.1. da parte A

Protocolo 34: Resposta da professora B para a questão 4.1. da parte A

É interessante ressaltar que a professora A fez a classificação das

variáveis estatísticas de uma maneira muito segura e em sua opinião os alunos

conseguiriam fazer a classificação facilmente. Ela disse que trabalhava esses

conceitos com eles e que não percebeu dificuldade por parte de seus alunos.

136

Já a professora B acreditava que os alunos não conseguiriam fazer a

classificação e justificava que o fato acontece, pois os professores não trabalham

com esta distinção, ela afirmou em seu discurso que eles não teriam facilidade,

porque não tinham contato com a abordagem dos diferentes tipos de variáveis.

5ª e 6ª questões:

5) Construa uma tabela de distribuição de freqüências para a variável “idade”.

Para isso, clique em “new summary table” , selecione a coluna da variável “idade”

no banco de dados e arraste-a até a nova tabela.

Obs.: Para tabelas com dados numéricos (ou seja, variáveis quantitativas), mantenha

apertada a tecla shift enquanto arrasta a variável até a tabela.

6) Construa uma tabela de distribuição de freqüências para a variável “salário”.

Estas questões tinham instruções para a construção de tabelas de

distribuição de frequência para as variáveis quantitativas. Para a construção das

tabelas era necessário que, enquanto se arrastava a variável desejada,

mantivesse pressionada a tecla “shift”. Caso isso não acontecesse o software não

construía a tabela de distribuição de frequências, mas calculava a media

aritmética dos dados numéricos.

No caso, se não apertássemos a tecla shift o resultado obtido, que não

seria o esperado, seria uma tabela com o cálculo da média das idades, como o

apresentado na figura 16.

Figura 16: Tabela com o valor da média

Como solução correta para essas questões, esperávamos que o professor

construísse as tabelas de distribuição das frequências apresentadas a seguir.

137

Tabela 13: Tabela de distribuição de frequências para a variável idade

Tabela 14: Tabela de distribuição de frequências para a variável salário

7ª e 8ª questões:

7) Podemos também construir tabelas combinando algumas variáveis. Por exemplo,

vamos construir uma tabela que mostre o nível de escolaridade dos funcionários de

gênero masculino e feminino.

a) Clique em “new summary table” para construir a tabela;

b) Clique na variável “escolaridade” e arraste até o lado direito da tabel:

c) Agora, clique na variável “gênero” e arraste até o lado de baixo da tabela.

8) Construa uma tabela que mostre os cargos dos funcionários de gênero masculino e

feminino.

138

Estas questões propunham a construção de tabelas de dupla entrada, esta

atividade pode ser tomada como um exemplo de tratamento, conforme Duval,

(2003) uma vez que não mudamos o registro, apenas fizemos uma transformação

nos registros (tabelas de distribuição de frequências) apresentados. Com estas

atividades, pretendíamos que o professor percebesse mais um recurso do

software que é a construção de tabelas de distribuição de frequência envolvendo

duas variáveis distintas.

Como solução da 7ª questão, esperávamos que o professor elaborasse

uma tabela igual à apresentada na questão. A tabela para a 8ª questão é

apresentada nos dados da tabela 15.

Tabela 15: Tabela de dupla entrada para as variáveis gênero e cargo

9ª e 10ª questões

9) Você acredita estar claro, neste momento da atividade, para o aluno as diferenças entre

as variáveis qualitativas e as quantitativas?

10) O fato do Fathom trabalhar todas as variáveis de estrutura numérica como uma

variável quantitativa contínua pode dificultar a aprendizagem deste conceito? Se sim,

qual (is) procedimento (s) podemos tomar para que isso não aconteça?

Com estas duas questões, queríamos identificar os elementos do

conhecimento pedagógico do professor para os fatores abordados nelas. E

mostrar ao professor um obstáculo do trabalho com este software, pedimos para

que ele nos indicassem maneiras de minimizar este obstáculo.

139

Análises a posteriori

Após o trabalho com as diversas variáveis que compõem o banco de dados

a professora B não afirmou que os alunos não fariam a distinção entre elas. Ela

relatou que poderia até ser que eles conseguissem realizar esta classificação,

talvez, nesse momento pudéssemos perceber um avanço no conhecimento

pedagógico e no conhecimento específico, mas para que isto aconteça novos

conceitos devem ser criados e/ou antigos devem ser reestruturados de maneira

correta.

A professora começou a ter a percepção exata da distinção após responder

às questões da sequência e das discussões que tivemos, pelo seu discurso

pudemos notar isso. Então, podemos dizer que a sequência influenciou esta

professora, pelo menos, nesse conceito.

Protocolo 35: Resposta da professora B para a décima questão da parte A

Na 10ª questão, as respostas obtidas foram as seguintes:

Protocolo 36: Resposta da professora A para a décima primeira questão da parte A

140

Protocolo 37: Resposta da professora A para a décima primeira questão da parte A

Em relação ao fato do software trabalhar todas as variáveis de estrutura

numérica, como as quantitativas contínuas a professora A acreditou não ser um

obstáculo, se o conceito fosse bem trabalhado com os alunos anteriormente ao

uso do computador e explicado aos alunos que este software tratava as variáveis

desta maneira. A professora B acreditou ser um obstáculo e que a maneira de

resolvê-lo seria com a alteração das ferramentas do FATHOM. Assim, deveria se

criada uma função que fizesse essa distinção. É interessante lembrarmos que

esta professora não aprovou totalmente o software, mostrando resistência a ele,

algumas vezes, relatou que algumas questões poderiam ser realizadas no Excel,

que é um software mais conhecido e, portanto, mais fácil de trabalhar.

Além disso, o Excel faz a distinção entre gráfico de colunas e histograma.

Efetivamente, o conhecido provoca mais segurança do que o desconhecido, e

alguns livros de Estatística já trazem os comandos do Excel. Lembramos que

nosso trabalho é sobre o uso dos registros de representação semiótica e os níveis

de letramento estatístico, e que o software FATHOM é apenas uma ferramenta

que nos auxilia a alcançar nosso objetivo.

Até o momento de nossa fase experimental, observamos que para alguns

conteúdos, foi possível perceber um avanço nos conhecimentos específicos por

parte das professoras, como por exemplo, variáveis estatísticas. Em relação aos

conhecimentos pedagógicos, ainda notamos pouca preocupação por parte das

professoras.

141

IV.3 Análises a priori e a posteriori da segunda fase da parte A das

atividades de familiarização com o software Fathom

1ª questão:

Nesta fase, utilizaremos o software Fathom para construir os gráficos, que constituem um

outro tipo de representação de uma Distribuição de Freqüências.

a) Clique no ícone para construir o gráfico, e arraste até a tela;

b) Clique na coluna variável “gênero” para selecioná-la e arraste até a área do gráfico,

sobre a caixa “drop na anttribute here”.

Este gráfico é chamado “diagrama de colunas”, e é normalmente utilizado para representar

variáveis qualitativas ou mesmo variáveis quantitativas discretas. Ele coloca em evidência a

comparação entre os valores observados.

142

Esta 1ª questão apenas mostra como construir gráficos no Fathom.

Acreditamos que esta segunda fase seja muito importante, pois após trabalhar

com as tabelas de distribuição de frequência este será o primeiro momento que o

professor terá acesso a outro registro de representação semiótica para os dados

observados.

Como solução da questão, esperávamos que o professor construísse a

representação gráfica para a variável gênero desenhada no enunciado.

Nesta questão, também, apresentamos uma informação relevante sobre o

diagrama de colunas, que acreditamos ser relevante para o professor recordar

qual o uso correto para este tipo de representação gráfica.

2ª e 3ª questões:

2) Clique no ícone “bar chart” escolha outro tipo de gráfico. O que você observa? É o

mesmo tipo de comparação que ele representa?

2.1) Em sua opinião, os alunos percebem a distinção dessas duas representações?

Qual delas proporciona maior possibilidade de compreensão? Por quê?

3) Construa os gráficos para as variáveis “cargo” e “escolaridade”.

Para estas questões, o professor precisaria construir outras representações

gráficas, às outras variáveis envolvidas na pesquisa. Esta é uma maneira dele se

familiarizar com a ferramenta do software, além de perceber que, com os mesmos

dados, o Fathom apresenta diferentes representações.

Mais especificamente na segunda questão, o professor precisaria perceber

que, quando mudamos de “Bar chart” para “Ribbon chart”, o software passa a

trabalhar com os valores relativos (percentuais) e não mais absolutos. Aqui se

pode notar uma conversão ao nível da teoria das representações semióticas de

Duval, embora as duas representações sejam gráficas, uma está disposta no eixo

cartesiano, indicando valores absolutos, enquanto a outra trabalha com a

representação parte/todo, com porcentagem. Desta forma, percebemos que elas

não permanecem no mesmo sistema, para que seja considerado um tratamento,

altera o conteúdo da representação, uma vez que “Ribbon chart” é equivalente ao

diagrama de setores.

143

Como solução para a questão, esperamos que seja a representação

gráfica do “Ribbon Chart” (como o que está apresentado abaixo). Com a análise

destas duas representações gráficas, consideramos que o professor perceba que

o “Ribbon Chart” parece com o gráfico de setores, mas para que aconteça esta

percepção acreditamos que o nível de letramento estatístico tenha de ser entre o

funcional e o cientifico, pois é necessário que o professor compreenda as

propriedades do gráfico de setores para então conseguir fazer a associação.

Também acreditamos na necessidade das apreensões discursivas e operatórias

para que seja possível ser feita comparação.

Gráfico 18: Representação gráfica “Ribbon Chart” para a variável gênero

Como solução da 3ª questão, esperávamos apenas as construções de

outros gráficos (apresentados abaixo), mas a questão não solicita alguma

explicação ou análise dos dados. Ou seja, é mais um item de familiarização com o

software, para que o professor aproprie-se dessa ferramenta para incorporar tal

apropriação a seus saberes.

144

Gráfico 19: Gráficos de colunas para as variáveis cargo e escolaridade

Análise a posteriori

Apresentamos os protocolos com as respostas das professoras para esta

questão:

Protocolo 38: Resposta da professora A para a questão 2 da segunda fase da parte A

Protocolo 39: Resposta da professora B para a questão 2 da segunda fase da parte A

Em relação à questão 2, ambas as professoras afirmaram que a distinção

entre as duas representações gráficas ocorreu pelo fato de uma utilizar valores

absolutos e a outra trabalhar com valores relativos. Assim, não percebemos

145

indícios de nenhuma das duas ao analisar o “ribbon chart”, como uma

representação gráfica que realiza uma comparação parte/todo diferente do “bar

chart”, mas notaram a diferença de conteúdos entre as duas representações.

Cardoso (2007) afirma que, muitos professores não conseguem explicar suas

construções, desta forma, podemos conjecturar que, talvez, elas não conheçam a

distinção do uso entre as duas representações gráficas.

A seguir, optamos por colocar apenas um protocolo para a questão 2.1.)

pois as duas professoras fizeram basicamente o mesmo relato:

Protocolo 40: Resposta da professora A referente a distinção de duas representações gráficas.

As duas professoras salientaram que, no momento de escolher uma das

duas representações, os alunos teriam mais facilidade com a comparação

realizada pelo gráfico de colunas (Bar chart). Isto pode ter acontecido, pelo fato

desta representação gráfica estar mais presente nos livros didáticos (comparação

entre as partes), já que a comparação parte/todo, quando feita nos livros didáticos

acontece com o gráfico de setores que basicamente possui as mesmas

propriedades do Ribbon chart, mas seu design é diferente.

Novamente citamos Canossa (2009) quando este afirma que os

professores limitam-se ao que é abordado nos livros didáticos. Optamos por

colocar apenas um protocolo, uma vez que as duas professoras fizeram

basicamente o mesmo relato.

146

4ª e 5ª questões:

4) Construa agora um histograma para a variável idade. (Escolha o Histogram).

5) Construa um gráfico de pontos para a variável “idade” (Escolha :Dot Plot). Explique a

diferença entre os dois gráficos. Como você explicaria a variação dessa variável pela

observação dos dois gráficos?

5.1) Como os alunos podem perceber estas distinções entre o tipo de informação

fornecida em cada gráfico?

Obs.: A variável “idade” é uma variável quantitativa contínua, mas pode ser tratada como

discreta, por ser apresentada em número de anos completos (uma contagem). O

software Fathom, por definição, trata toda variável numérica como contínua. Então,

para construir o gráfico Histograma, o software faz uma “correção de continuidade”,

ou seja, soma e subtrai meia unidade ao valor da variável, construindo assim um

intervalo e propiciando a percepção da continuidade. Sendo assim, para variáveis

discretas, é mais adequado utilizar o gráfico Dot Plot (neste tipo de gráfico, cada

ponto representa um valor observado).

Estas questões têm como objetivo a construção de gráficos às variáveis

quantitativa, além de trazer ao professor uma informação bastante importante em

relação ao software usado na pesquisa, caso o professor realize atividades com o

software Fathom em suas aulas, ele já terá conhecimento do modo como o

software trata as variáveis quantitativas.

Como solução da 4ª questão, esperávamos a construção do histograma no

software, como o apresentado no Gráfico 20.

Gráfico 20: Histograma para a variável idade

147

Na 5ª questão, esperávamos como solução a construção do “Dot-plot”

(esta representação encontra-se no Gráfico 21), além da construção esperava-se

que o professor percebesse que o dot-plot é uma representação gráfica mais

próxima do gráfico de colunas do que o histograma. Assim, o gráfico de colunas é

utilizado para a representação de variáveis qualitativas e quantitativas discretas, e

o histograma é usado para a representação de variáveis quantitativas contínuas.

Em nossa sequência, como o tratamento utilizado para a variável idade

(tempo variável contínua) é discreto, seria mais adequado à representação “dot-

plot”. Neste momento, poderíamos evidenciar uma limitação do software para as

variáveis quantitativas discretas, o que poderia ocasionar um obstáculo didático,

caso não fosse bem trabalhado pelo professor com seus alunos. Como já foi

abordado na questão anterior.

Gráfico 21: Gráfico de pontos (Dot Plot) para a variável idade

Análise a posteriori

A seguir, as respostas das professoras para as questões:

148

Protocolo 41: Respostas da professora A para as questões “5” e “5.1” da segunda fase da parte A

Protocolo 42: Respostas da professora B para as questões “5” e “5.1” da segunda fase da parte A

A professora B relatou que o tratamento dado por cada gráfico foi diferente,

tanto que disse que um (gráfico de pontos) é utilizado para representar variáveis

discretas, e que o histograma é representado para as contínuas. Vale lembrar que

o dot-plot não é trabalhado na Escola Básica. Ela, também, salientou que esta

conclusão é possível pela observação das representações, em que uma possui

colunas “juntas” (dando indícios de continuidade) e a outra, pontos separados (o

que indica tratamento discreto). Seus relatos escritos foram bastante

simplificados, mas também apresentaram esta informação. Aqui podemos

149

perceber que a professora B encontra-se em um nível funcional de letramento

estatístico, já que realiza uma análise, além do que é observado.

Em relação à professora A, citou que o histograma trabalha com dados

agrupados, e que o gráfico de pontos, com dados simples. Em nenhum momento,

relatou sobre a continuidade ou não das variáveis. Aqui percebemos novamente

uma forte influência do livro didático, pois respondeu que o histograma é a melhor

escolha e, em sua justificativa, referiu-se que a representação do gráfico de

pontos é mais difícil, isto pode ter acontecido pelo fato dos livros trazerem mais a

representação de histogramas e gráficos de colunas que gráfico de pontos.

Vale ressaltar que os currículos não contemplam o gráfico de pontos; no

entanto, no discurso das professoras percebemos que elas se interessam por

esta representação semiótica e disseram que pode ser um facilitador para a

conversão de uma tabela para o registro gráfico, antes da construção de, por

exemplo, um gráficos de barras.

6ª questão:

6) Agora, no gráfico da variável gênero, clique sobre a barra que indica o gênero

masculino. O que você observa no banco de dados e nos outros gráficos?

6.1.) Em relação a esta ferramenta do software, você acredita ser um facilitador para a

compreensão da inter-relação entre as representações apresentadas?

150

Esta questão apresenta para o professor mais uma ferramenta do software

em que é possível selecionar, em todos os registros presentes na tela, uma

característica comum a alguns elementos da pesquisa. Na atividade, pedimos que

o professor selecionasse (clicando em cima) a barra do gênero masculino, com

isso o Fathom seleciona em todos os demais gráficos e, também, no banco de

dados os gêneros masculinos.

Com o auxílio do ambiente informatizado, seria possível ressaltar a relação

entre os registros de representação semiótica que se torna mais visível, uma vez

que todos são construídos rapidamente e relacionam-se. Temos a visão

simultânea de vários registros de uma única vez e a interação dos dados nas

diversas representações, o que não pode ser feita fora do ambiente, nem temos

conhecimento de outro ambiente que o faça.

Com essa ferramenta (selecionar um dado especifico da pesquisa)

podemos perceber com maior facilidade e clareza que as diversas representações

realizadas no Fathom referem-se ao mesmo objeto de estudo, ou seja, ao mesmo

banco de dados. Segundo Duval, os objetos matemáticos somente são

compreendidos de forma global por suas diferentes representações.

Como solução desta questão, esperávamos que o professor percebesse

que o gênero masculino ficou destacado em todas as representações.

Análise a posteriori

A seguir, os protocolos com as respostas das professoras:

Protocolo 43: Resposta sobre a ferramenta do software que realiza a inter-relação entre os

diferentes registros apresentados na tela

151

Protocolo 44: Resposta da professora A à questão 6.1. da segunda fase da parte A

Protocolo 45: Resposta da professora B à questão 6.1. da segunda fase da parte A

Em relação à ferramenta do software de destacar todos os itens referentes

da mesma variável selecionada, as professoras perceberam que isso acontece,

mas não relataram nada sobre o ganho cognitivo com o uso desta ferramenta. No

entanto, na última questão da pesquisa, em que foram pedidas algumas análises,

elas utilizaram esta ferramenta, como um facilitador para conseguir as respostas.

A professora B acredita que isto facilitaria a compreensão das inter-relações entre

as variáveis e, além do mais, disse que poderia ser um facilitador para a análise

dos dados.

Acreditamos, sobretudo porque ambas utilizaram deste recurso na análise

dos dados e pelos discursos também, que elas perceberam que este era um

facilitador da análise dos dados que o ambiente informatizado nos proporciona,

diferente do ambiente lápis e papel. Ou seja, essa ferramenta do software parece

passar a integrar os saberes dessas professoras, visto que seu discurso mostrou

a percepção da importância da articulação entre os registros de representação

semiótica.

152

IV.4 Análises a priori e a posteriori da terceira fase da parte A das

atividades de familiarização com o software Fathom

1ª e 2ª questões:

1) Construa uma tabela de distribuição de freqüências para a variável “idade”, da mesma

maneira que você fez na primeira fase, mas agora sem apertar a techa shift (somente

arraste a variável até a tabela).

Observe que apareceu somente um valor na tabela. Este é o valor da “média aritmética”

para a variável “idade” (no Fathom, quando construímos tabelas de variáveis quantitativas, se

não mantivermos apertada a tecla shift, a tabela mostra a média aritmética).

A média aritmética é uma medida que resume e representa um conjunto de dados

em um único valor. A média de um conjunto é o valor ao redor do qual os valores

observados se distribuem, é calculada como a soma dos valores dividida pelo número

total de observações. Podemos fazer uma analogia entre a média de um conjunto de

dados e o fiel de uma balança em equilíbrio.

2) Seguindo o mesmo procedimento, obtenha o valor da média aritmética para a variável

“salário”.

Nestas duas questões, o professor teria de encontrar o valor da média das

idades e dos salários, utilizando a ferramenta do software. Vale ressaltar que o

Fathom não apresenta, como foi realizado este cálculo. Ele apenas viabiliza o

resultado final. Como estamos trabalhando com professores, não acreditamos ser

um obstáculo didático; no entanto, se este resolver tratar das medidas-resumo

com seus alunos, este ambiente informatizado apenas contribuiria em parte.

Poderá ser usado como ferramenta de validação do resultado do cálculo ou como

ponto de partida do processo de análise.

Quanto às medidas-resumo, o software calcula apenas os resultados finais,

não apresenta os algoritmos, nem os procedimentos utilizados para encontrar os

valores apresentados. No entanto, uma ferramenta bastante interessante do

software é apresentar essas medidas nos registros gráficos, auxiliando na

percepção da integração entre registros do mesmo objeto e as distribuições de

153

frequências. Estas representações gráficas serão trabalhadas posteriormente,

nesta mesma fase da sequência.

As construções esperadas para a questão foram as duas seguintes

representações:

Figura 17: Valor da média de idades e da média salarial

3ª questão:

Iremos agora representar o valor da média no gráfico.

a) Construa um gráfico (histogram) para a variável “salário”;

b) Clique em “graph”, “plot value”;

c) No menu que se abrirá, clique em “functions”, “statistical”, “one attribute”.

d) Clique (duas vezes) em “mean”, em seguida clique em “OK”.

154

Veja o gráfico:

“A média sozinha é suficiente para que se possa analisar um conjunto de dados? Pense,

por exemplo: Qual o intervalo de variação dos valores observados? Qual é a posição da média

dentro deste intervalo?”.

Uma outra medida que podemos utilizar para sintetizar e representar um conjunto de

dados é a mediana. A mediana é o valor que ocupa a posição central dos dados

ordenados, ou seja, é o valor que é maior ou igual a 50% dos dados ordenados e menor

ou igual a 50% dos dados observados. Podemos fazer uma analogia entre a mediana e o

ponto médio de um segmento.

Nesta questão, o professor deparou-se com uma conversão de registros

em relação ao anterior (conversão do valor numérico da medida para o registro

gráfico), pois agora o valor da média foi apresentado no registro gráfico. Com os

questionamentos realizados, esperávamos que o professor percebesse que a

média sozinha não era suficiente, e o desvio-padrão deveria ser associado para

que tivesse sentido em relação aos dados observados.

A sequência teve sua continuidade com o estudo dos quartis e não com o

estudo do desvio-padrão. No entanto, Vieira relata que:

Em nossa seqüência, optamos por não trabalhar diretamente com

o desvio-padrão, e ao invés disso, passamos para o estudo da

mediana e dos quartis, cognitivamente menos complexos do que a

variância e o desvio-padrão, e que permitam a introdução de mais

um registro de representação semiótica: o Box-plot. (VIEIRA,

2008, p. 112)

Não modificamos a ordem da sequência proposta por Vieira (2008), não

porque as medidas-resumo, variância e desvio padrão, são mais complexas do

que mediana e quartis, uma vez que estamos trabalhando com professores, mas

155

porque acreditamos ser interessante abordar um novo registro de representação

semiótica, Duval (2003) afirma que os objetos somente são compreendidos

plenamente pelo entendimento de seus registros de representação.

Percebemos que o professor, para responder às perguntas propostas,

precisa fazer uma leitura além dos dados apresentar uma apreensão operatória e

possuir um nível funcional de letramento estatístico.

4ª e 5ª questões:

4) Na mesma tabela da média das idades (construída no item 1), vamos mostrar também a

mediana.

a) No Fathom, clique na tabela acima, depois em “summary”, “add formula”.

b) No menu, clique em “functions”,”statistical”, “one attribute”. Clique (duas vezes)

em “median” e “OK”.

Você terá o valor que ocupa a posição central nas idades ordenadas.

5) Representaremos a mediana no gráfico (pode ser no mesmo gráfico do item 3).

a) Clique no gráfico da variável salário no qual você construiu a média;

b) Clique em “graph”, “plot value”

c) No menu que se abrirá, clique em “functions”, “statistical”, “one atribute”,

“median” (duplo clique).

156

Analogamente, como foi trabalhada a média, trabalhamos nestas questões

a mediana, mostrando ao professor os dois registros para a medida, tanto o valor

como a localização desse valor no histograma (representação gráfica). Aqui

percebemos uma apreensão discursiva para atribuição de significados.

Assim, acreditamos ser de grande importância que estas medidas sejam

calculadas na mesma tabela e apresentadas no mesmo gráfico pois, desta forma,

a visualização de suas diferenças ficará mais aparente e possíveis confusões

entre estas medidas poderão ser sanadas. Ambas são medidas de tendência

central e, algumas vezes, são representadas pelo mesmo valor, quando a

distribuição é simétrica. Diversas pesquisas, entre elas Novaes (2004) e Canossa

(2009) mostram a confusão entre elas.

Como solução para as questões, esperávamos a construção do valor

dessa medida na tabela e a representação desse valor no gráfico. Em ambos os

casos, o próprio enunciado indica como estes devem aparecer na tela do

software.

Para dar significado à mediana, pela observação do gráfico é necessário

que o professor faça uma transformação (DUVAL, 2003), “empilhando”

mentalmente as colunas (as quatro primeiras) e as seis outras, comparando os

resultados obtidos que devem ser iguais.

6ª questão:

6) Como os valores representados se distribuem em relação a média? E em relação à

mediana?

6.1.) Na sua opinião, os alunos tem clareza da distinção destas duas medidas? Caso não

tenham esta clareza, por que isso acontece?

Para responder à questão, esperávamos que o professor analisasse os

resultados obtidos anteriormente e, com isso, percebesse como esses valores se

relacionam com o conjunto de dados.

Em relação à média, esperava-se que o professor percebesse que essa

medida é o valor em torno do qual os outros se distribuem, que não precisa ficar

157

necessariamente “no meio” do conjunto de dados e que a análise completa desse

valor, para saber sua representatividade para os elementos pesquisados,

somente estará completa quando pareada a uma medida de variabilidade, como o

desvio-padrão. Para esta medida, o professor deveria percebe que quanto menos

simétrica for a distribuição de frequências mais distante da mediana estará o valor

da média aritmética.

Para a mediana, esperava-se que o professor percebesse que esta medida

divide o conjunto ordenado de dados em dois conjuntos, com exatamente o

mesmo número de elementos.

Para que existam estas conclusões, observamos que o nível de letramento

estatístico deveria ficar entre o funcional e o científico; no entanto, mais próximo

ao científico e que a leitura deveria ser além dos dados, uma vez que o professor

precisa perceber as relações entre os valores encontrados, suas representações

e a possibilidade de se determinar a variabilidade dos dados em relação à média

para que a análise seja completa.

A articulação entre os registros tabular e gráfico é fundamental para a

atribuição de significado.

Análise a posteriori

A seguir, apresentamos os protocolos com as respostas das professoras:

Protocolo 46: Respostas da professora A para as questões “6” e “6.1.” da terceira fase da parte A

158

Protocolo 47: Respostas da professora B para as questões “6” e “6.1.” da terceira fase da parte A

A professora B trouxe em seus relatos indícios dos conceitos de média e

mediana corretamente, mas não conseguiu escrever no papel exatamente o que

significa uma medida e a outra, assim verificamos que ela percebeu a distinção

entre as duas. Já a professora A trouxe uma resposta muito subjetiva, não nos

mostrou em seu relatos (escritos e orais) a diferença entre as duas medidas.

Ambas acreditavam que os alunos teriam dificuldade de perceber a

distinção entre as duas medidas e justificaram. A professora A disse que isso

acontece pela dificuldade que os alunos têm para interpretar, e a professora B

que isso acontece, pois os alunos apenas calculam as medidas e não se

preocupam se esta é ou não solução para o problema em questão.

O fato é evidenciado por Silva (2007), ao perceber que os professores não

utilizam as medidas de Tendência Central, como ferramentas de análise de

dados. Podemos, assim, conjecturar que os alunos apresentam dificuldade para

compreender as medidas, pois o ensino usual limita-se apenas ao cálculo dessas

medidas.

Nessa questão, podemos dizer que a professora B encontra-se entre os

níveis cultural e funcional de letramento estatístico, ou seja, em um processo de

159

transição entre um nível e outro, já que em seus relatos orais ela conseguiu

diferenciar as duas medidas envolvidas, mas apresentou dificuldade para

escrever estes conceitos.

7ª questão:

Vamos determinar, além da mediana, dois valores tais que 25% das observações

ordenadas serão menores ou iguais a um deles e 75% serão menores ou iguais ao outro. Tais

valores são denominados, respectivamente, primeiro quartil e terceiro quartil. Note que a

mediana representa o segundo quartil.

Para representar os quartis, utilizaremos ainda o mesmo histograma da variável salário.

a) Selecione o gráfico e clique em “graph”, “plot value”.

b) No menu, clique em “functions”, “statistical”, “one attribute”, “percentile” (duas

vezes)

c) Na caixa de funções aparecerá “percentile ( )”. Dentro dos parênteses escreva (25,

salario), e clique em “OK”. Você terá representado no gráfico o primeiro quartil

d) Repita o mesmo procedimento, e na caixa da função percentile, escreva (75, salario), e

clique em “OK”. Será representado o terceiro quartil.

160

Nesta questão, apresentamos a construção, no ambiente computacional,

das representações do primeiro e terceiro quartis. A pergunta apresenta o

conceito de quartis, isto é, de muita importância visto que, muitas vezes, não é

possível verificar um trabalho efetivo dos professores sobre este conceito, uma

vez que o conceito de “quartis” não faz parte do currículo da Escola Básica

Com o estudo dos quartis, ressaltando a mediana, como segundo quartil,

as diferenças entre as medidas média e mediana evidenciam-se, já que os quartis

separam os dados em 25%, 50% e 75%, e a média é o valor que os outros dados

se distribuem ao redor.

Aqui não pedimos nenhuma interpretação nem análise dos resultados

obtidos, mas limitamo-nos apenas aos procedimentos para a localização das

medidas no histograma.

Vale ressaltar que, da mesma maneira que a média, o software não

apresenta os cálculos e/ou o algoritmo utilizado para se determinar os valores dos

quartis. Logo, aqui também devemos levar em conta que quando se trabalha com

alunos no ambiente informatizado, o Fathom apenas contribui em parte para

esses conceitos. A atividade deveria, assim, ter foco no significado e na análise, e

não no procedimento algorítmico.

8ª questão:

Uma representação gráfica envolvendo quartis, mediana, valor máximo e valor mínimo é o

“box-plot”. No box-plot, define-se uma “caixa” com o limite esquerdo dado pelo primeiro quartil

e o limite direito pelo terceiro quartil. A mediana é representada por um traço no interior da

caixa, e segmentos de reta são colocados da caixa até os valores máximo e mínimo.

Construa um novo gráfico para a variável salário, e no canto superior direito do gráfico,

clique na tela e selecione “box-plot”, para representar este gráfico.

161

O intuito desta questão foi apresentar uma nova representação gráfica para

o professor que poderia comparar essa representação gráfica com a anterior. O

box-plot é uma representação que, muitas vezes, não é conhecida. Além disso,

segundo Vieira:

Nesta fase, era esperado que o aluno comparasse os dois

gráficos relacionando a mediana, os quartis e os valores máximo e

mínimo da distribuição. Consideramos que a seqüência de passos

necessária para a passagem do histograma para o box-plot

caracteriza uma apreensão seqüencial, na perspectiva de Duval,

e, para realizar tal apreensão, é necessário que o aluno atinja

nível de leitura “alem dos dados. (VIEIRA, 2008, p. 116)

Aqui, esperávamos que o professor percebesse que a representação

gráfica “Box-plot” trazia muitas informações. Neste gráfico, as medidas-resumo

estão representadas de uma maneira de fácil compreensão. No entanto, pode ser

que isso não tenha acontecido pelo fato dessa representação não ser muito

conhecida, como vimos em pesquisas recentes, os professores, muitas vezes,

nunca tiveram contato com esta representação e apresentam dificuldades para

construí-la, sobretudo, para compreendê-la.

9ª e 10ª questões:

9) Em relação aos últimos gráficos utilizados para representar os quartis responda:

Qual tipo de gráfico você prefere? Justifique

9.1.) Um aluno, na tentativa de explicar para um colega, a relação de dimensões

diferentes à mesma porcentagem (fato que acontece no box-plot) fez a seguinte

colocação: “É fácil, se a gente pensar em duas latas de sardinha com três

sardinhas dentro, na lata grande as sardinhas estão mais espalhadas, mas, na

pequena, as três ficarão pertinho uma da outra, e de qualquer forma as duas tem a

mesma quantidade”. Como você avalia esta explicação?

10) Compare os dois tipos de gráficos, dizendo as principais diferenças entre eles e quais

informações são mais evidentes em um ou em outro.

Na 9ª questão, solicitamos que o professor escolhesse o gráfico que

acreditasse representar melhor os quartis. No entanto, pedir que faça esta

escolha se faz apenas por motivos didáticos, para instigar a observação pelos

dois registros, pois pela análise exploratória de dados o correto é trabalhar

simultaneamente com os dois registros, uma vez que, desta forma, poderemos ter

mais informações.

162

No momento de comparar as duas representações gráficas esperávamos

que o professor percebesse que ambas mantêm o conteúdo das medidas-

resumo: média, mediana e quartis, mas, que os valores são mais visivelmente

representados pelo Box-plot. No histograma, a quantidade de indivíduos para

cada observação é mais evidente, o conteúdo principal são as frequências,

enquanto que no box-plot o conteúdo principal é a distribuição dos elementos em

quattro grupos com o mesmo número de elementos.

Em relação à preferência dos gráficos, esperávamos que o professor

justificasse sua escolha, evidenciando as propriedades de cada representação e

não pelo uso rotineiro de uma delas. Para que a justificativa de sua escolha fosse

feita pela visualização das medidas em cada gráfico e pelas propriedades de cada

representação, acreditávamos na necessidade de um letramento entre o funcional

e a científico, dependendo das justificativas levantadas pelo professor. Aqui

também fazia necessário no mínimo uma leitura entre os dados, para que esta

justificativa pudesse ter alguma coerência.

Análise a posteriori

A seguir, as respostas das professoras á questão 9:

Protocolo 48: Resposta da professora A referente a representação gráfica box-plot

163

Protocolo 49: Resposta da professora B referente a representação gráfica box-plot

Acreditamos que a professora A tenha tido mais familiaridade com esta

representação, uma vez que para representar os quartis ela a escolheu,

justificando que a representação destas medidas é de visualização imediata. A

professora B, também, conhece o box-plot, mas relatou que preferiu utilizar o

histograma. Neste caso, conjecturamos, que possuía maior familiaridade com

esta representação, uma vez que o box-plot não consta no currículo da Escola

Básica.

Seguem os protocolos da questão 9.1.:

Protocolo 50: Resposta da professora A para a questão 9.1. da terceira fase da parte A

164

Protocolo 51: Resposta da professora B para a questão 9.1. da terceira fase da parte A

Para o item 9.1., a professora A disse que era bastante interessante a

explicação da criança; no entanto, não se faz suficiente, pois é preciso outros

exemplos e, trabalhar com a média e a mediana diferentes. Já a professora B

gostou da explicação dada pela criança; no entanto, em seu relato houve um

equívoco na justificativa, quando ela afirmou que na segunda parte (lata menor),

as sardinhas estavam mais dispersas (há uma variação maior).

Para esta questão, percebemos em alguns relatos um letramento funcional

por parte das professoras e em outros momentos apenas cultural.

Notamos, também, que a professora A ainda não compreendeu

efetivamente o conceito de quartis e sua aplicação. Continua usando, como

referência apenas a média, que é a medida mais trabalhada na Escola Básica.

Estudos, como os de Bigattão (2007), Cardoso (2007) entre outros, indicam que

os quartis também são pouco abordados nos cursos de Licenciatura em

Matemática.

165

A seguir, os protocolos da questão 10.

Protocolo 52: Resposta da professora A para a comparação do histograma e o box-plot

Protocolo 53: Resposta da professora B para a comparação do histograma e o box-plot

A resposta da professora A para as diferenças entre as duas

representações foi muito superficial (mesmo em seus relatos orais), não nos

permitindo conjecturar se ela realmente compreendeu as diferenças entre as duas

166

representações, nada foi acrescentado em relação à resposta anterior. Já a

professora B, separou a explicação de cada uma das representações,

evidenciando o que cada uma possui, mas não realizou um paralelo entre as

duas.

Ambas as professoras perceberam a importância de se trabalhar com as

diferentes representações, concordando com Duval que a escolha da

representação depende do que se pretende responder, esta percepção é

fundamental no desenvolvimento da Análise Exploratória de Dados.

Para esta questão, acreditamos que o nível de letramento estatístico fosse

o funcional (para as duas professoras), uma vez que, nenhuma delas conseguiu

realizar um paralelo entre as principais diferenças e as informações mais

evidentes entre as duas representações gráficas, mas sabiam os termos e seus

significados e tinham a percepção da variação, “espinha dorsal” da análise

estatística.

Após as professoras responderem às questões, também, houve um

momento de comentários orais sobre as duas representações, a fim de

institucionalizar estes conceitos. Comentamos que as medidas-resumo

apresentadas pelo box-plot são imediatas e de fácil compreensão e que o

principal fator abordado pelo histograma eram as frequências. No entanto,

ressaltamos que o box-plot não é uma representação gráfica trabalhada na

Escola Básica

11ª e 12ª questões:

Veremos agora como inserir uma nova coluna no banco de dados inicial. Vamos assim

considerar a distância entre cada valor observado para a variável “idade” e o valor obtido para

a média. Chamaremos cada uma dessas distâncias de “desvio”. Podemos nomear esta nova

coluna de “idadedesvios”.

a) Na tabela, clique em <new> e insira o título para a coluna;

b) para calcular os desvios, clique na coluna “idadedesvios”;

c) No menu, clique em “edit”, “edit formula”;

d) Na caixa, escreva “idade-mean(idade)” e clique em “OK” (será calculado para cada

valor da variável, a diferença entre o valor observado e a média aritmética).

167

12) Observe o resultado na tabela. O que significa o resultado “positivo” nesse cálculo? E

o “negativo”?

Nesta questão, as instruções apresentadas ao professor facilitam a

construção dos desvios observados entre a idade e a média aritmética das

idades. Deveria também compreender que a soma dos desvios é sempre igual a

zero.

168

Como solução da questão 11, esperávamos que o professor construísse

uma nova coluna no banco de dados com os valores dos desvios entre as idades

e a média das idades, com o auxílio do ambiente informatizado.

Para a questão 12, esperava-se que o professor percebesse que os

desvios apresentados eram em relação à média das idades, por isso há valores

negativos e valores positivos. Ele deveria relatar que, quando o valor da idade for

maior do que a média, a diferença será positiva, e que o resultado negativo

acontece quando o valor da idade é menor do que a média, a diferença será

negativa.

Aqui, acreditamos ser necessário, pelo menos, um nível funcional de

letramento e uma apreensão discursiva da representação tabular.

Análise a posteriori

Em relação aos desvios das idades em relação à média, as professoras

constataram, conforme esperado que os positivos eram os que possuíam a idade

maior que a média e os negativos os que possuíam a idade menor do que a

média. Em nenhum momento elas evidenciaram o motivo deste acontecimento,

talvez porque tenham percebido isso apenas pela observação da tabela ou talvez

ainda porque realmente compreenderam o comportamento dos desvios em

relação à média.

Nos comentários, nenhuma citou o fato de que como os dados se

distribuem ao redor do valor médio, é de se esperar que a soma de todos os

desvios seja igual a zero. As justificativas dadas e os diálogos indicaram que a

apreensão foi discursiva, mas não ainda operatória. Também não cogitaram

mudar a representação para favorecer ou simplificar o tratamento numérico das

células.

169

13ª, 14ª e 15ª questões:

Vamos inserir os desvios na tabela de distribuição de freqüência da variável idade (que foi

construída na primeira fase da atividade).

Clique na coluna “idadedesvios”, e arraste até o canto esquerdo da tabela

14) Construa também uma coluna para os desvios da variável salário, e depois insira na

tabela de distribuição de freqüências do salário.

15) Em sua opinião, como os alunos interpretam o fato da adição de todos os desvios

resultar em zero?

Como construção da tabela de distribuição de frequência para os desvios

da variável salário, esperávamos a construção apresentada a seguir. Vale

ressaltar que o intuito desta construção era reforçar que a soma dos desvios

resulta em zero, além de proporcionar ao professor uma nova oportunidade de

utilizar esta ferramenta do software.

Tabela 16: Tabela de distribuição de frequências com os desvios salariais

Summary TableEmpresa

SalarioSalarioSalarioSalarioSalarioSalarioSalarioSalarioSalarioSalario

700 800 850 950 1200 1300 1500 1700 2000 2200

salariodesvios

-552.5

-452.5

-402.5

-302.5

-52.5

47.5

247.5

447.5

747.5

947.5

Row

Summary

S1 =

(

)

count

S2 =

( )mean

A questão forneceria informações para inserir o desvio das idades em uma

tabela de distribuição de frequências. O intuito da construção seria evidenciar que

a soma dos desvios resulta em zero e, isso, esperávamos que o professor

percebesse relatando que isso acontece, pois como os dados se distribuem ao

redor da média, os desvios positivos “anulam” os negativos.

Para perceber isto, com a observação da construção da tabela

apresentando os desvios, é necessário apenas uma leitura dos dados; no entanto,

para compreender o motivo disto acontecer é preciso entender as propriedades

170

da medida-resumo, média e como acontece o comportamento dos desvios em

relação à média e, para isto, é necessário um letramento científico, já que implica

a compreensão de propriedade teórica específica.

Análise a posteriori

A professora B disse nunca ter pensado o motivo das soma dos desvios

resultar em zero, mesmo depois de questionada resolveu escrever “não sei” para

a questão. A professora e a aplicadora discutiram sobre o assunto, a professora

disse ter entendido e relatou que era lógico isto acontecer, mas preferiu manter a

resposta inicial, antes da discussão (vale lembrar que ela é também pesquisadora

e, por esse motivo, optou por não modificar os fatos, tentando deixar o mais real

possível).

Já a professora A relatou que os próprios alunos conseguiriam

compreender esta soma ser zero, uma vez que os desvios são cada valor menos

a média (a qual é a medida de equilíbrio da distribuição). No entanto, percebemos

que a explicação dela foi apenas a descrição do algoritmo e não indicou a

compreensão do conceito.

16ª questão:

16) Baseando-se nas atividades desenvolvidas até o momento, responda:

a) Quantos funcionários responderam à pesquisa?

b) Do total de entrevistados, qual é a quantidade de funcionários do gênero feminino?

E do masculino?

c) Em relação ao nível de escolaridade, quantas mulheres têm nível superior? E

quantos homens?

d) Entre as idades observadas, qual a idade máxima e a idade mínima?

e) Qual é o menor salário nesta empresa? E o salário máximo? E a média dos

salários?

f) Quais são os cargos que têm salário acima da média nesta empresa?

g) Quantos funcionários recebem salário abaixo da média nesta empresa?

h) Quantos funcionários do gênero masculino recebem salário acima da média na

empresa? E do gênero feminino?

i) Quantos funcionários do gênero feminino recebem mais que R$ 1900,00? E do

gênero masculino?

j) Quantos funcionários do gênero feminino recebem menos que R$ 900,00? E do

gênero masculino?

k) Qual valor você utilizaria para representar o salário desta empresa? Justifique:

171

Neste último item, o professor precisaria responder a algumas questões,

utilizando os diversos registros de representação semiótica que construiu no

Fathom ao longo da pesquisa. Aqui apresentamos questões que, para serem

respondidas seria necessário uma leitura além dos dados nos termos de Curcio.

Para responder aos itens “a)” e “b)”, o professor pode realizar apenas uma

leitura dos dados em uma ou em várias representações de registros construídas

no Fathom. Uma das maneiras de se determinar estas respostas, seria pela

observação da tabela de distribuição de frequências para a variável gênero ou,

até mesmo, pela visualização do gráfico de colunas para esta mesma variável.

Como resposta para o item “a)”, era esperado 20 funcionários e para o item “b)” 7

de gênero feminino e 13 do masculino. Observe aqui que a questão fazia uso de

uma apreensão apenas perceptiva, pois somente com a observação dos dados

apresentados seria possível respondê-la.

O item “c)” já requeria uma leitura entre os dados, uma vez que para

responder era necessário combinar as informações referentes às variáveis gênero

e escolaridade. Vale ressaltar que, para resolver este item, o professor poderia

utilizar uma tabela de dupla entrada para as variáveis: gênero e escolaridade

construída facilmente no software. Esta não era a única maneira de solucionar a

questão, pois ele poderia combinar outras representações semióticas, para

encontrar a solução esperada. Caso o professor viesse a construir a tabela de

distribuição de frequências, poderíamos identificar um tratamento ao nível de

Duval da representação do banco de dados, para a tabela de distribuição de

frequências. Como resposta para este item esperava-se que duas mulheres

possuíssem nível superior e três homens possuíssem nível superior.

Tabela 17: Tabela de dupla entrada das variáveis gênero e escolaridade

172

Para responder ao item “d)”, o professor apenas deveria buscar a menor e

a maior idade. Neste caso, salientamos que poderia encontrar, facilmente, a

resposta observando qualquer uma das representações presentes, inclusive, o

“box-plot” que traz estas informações ressaltadas. Vale ressaltar que mesmo que

implicitamente estamos trabalhando com os conceitos de valor máximo e mínimo.

Acreditamos que o professor também poderia se utilizar de diferentes

representações semióticas, além dos distintos recursos que o software nos

possibilita, como por exemplo, a ferramenta de selecionar alguns elementos da

pesquisa (ferramenta esta que apresentamos no final da segunda fase da parte A

desta sequência didática). Como soluções seriam esperadas para a idade

máxima 43 anos e mínima 23 anos.

No item “e)” era preciso que o professor buscasse informações sobre a

variável salário, podendo acontecer em várias representações semióticas para

que suas respostas fossem mais facilmente encontradas. Um exemplo disso era

para determinar os valores de máximo e mínimo da variável e poderia observar o

box-plot que fornece estas informações rapidamente. O valor da média até

poderia ser encontrado também nessa representação gráfica, mas, outra maneira

seria observar, por exemplo, a tabela que apresenta o salário médio.

Para responder a esta questão, seria preciso que se realizasse uma leitura

entre os dados. Como solução do maior salário deveria ser encontrado o valor

2.200, para menor 700 e para média 1.252,50.

Como análise deste resultado, esperava-se que o professor percebesse

que esta distribuição não é simétrica, uma vez que a média dos salários encontra-

se mais próxima do extremo superior. Para isto, acreditávamos ser necessário um

nível científico de alfabetização.

Para o item “f)”, se faz necessária uma leitura além dos dados, uma vez

que o professor precisaria tirar conclusões com a observação da média e das

diversas representações, mas haveria necessidade da intervenção dele,

determinando quais eram os valores maiores do que a média. Em relação ao

letramento estatístico, o nível deve estar entre o funcional e o cientifico. As

respostas esperadas para este item seriam os cargos de encarregado (1.300),

173

vendedor (1.500), gerente (2.100) e engenheiro (2.200). Este item diferiu-se muito

do anterior pelo tipo de questionamento realizado, pois ao invés de apenas

perguntar quais, questionamos quem recebe acima ou abaixo (no caso do item

“g)”) da média salarial.

Os itens “h)”, “i)” e “j)” também se referem à leitura entre os dados. Para

solucioná-los, esperávamos que o professor utilizasse os recursos do software,

criando tabelas de dupla entrada, representações gráficas, cálculos de medidas,

como ele acreditasse ser mais conveniente. Esperávamos como solução para

estes itens: “h)” do gênero masculino cinco funcionários receberiam salário acima

da média, e do gênero feminino três funcionários receberiam salário acima da

média; “i)” apenas uma funcionária receberia salário acima de 1.900, e três

funcionários receberiam mais do que 1.900; “j)” apenas um funcionário do gênero

masculino receberia menos do que 900 e quatro funcionários do gênero feminino

receberiam menos do que 900. Aqui observamos, também, um nível entre o

funcional e o cientìfico para solucionar estes itens.

No último item esperávamos do professor uma leitura além dos dados, uma

vez que ele teria de escolher um salário para representar a empresa, mas mais do

que isto justificar os motivos de sua escolha. Este item não possui uma única

solução, no entanto esperavámos que o professor escolhesse entre as medidas-

resumo e explicasse os motivos de sua escolha. Para fazer esta justificativa

esperávamos que, caso o professor viesse a escolher a média, ele ressaltasse a

importância de se analisar, também, a dispersão dos dados, seja a amplitude

total, seja o desvio-padrão, indicando que ele tem construído o significado de

média como ponto ao redor do qual os demais se distribuem. No entanto, se ele

escolhesse a mediana, que conseguisse justificar os motivos da

representatividade ser feita pelo valor que divide os dados observados ao meio.

Em relação à moda esta seria representada pelo valor mais frequente da

pesquisa.

As justificativas deveriam basear-se na dispersão dos dados e/ou na

simetria ou não da distribuição. O professor, também, poderia justificar pela

complementaridade das informações contidas nas duas medidas, o que

significaria o uso simultâneo das mesmas análises dos dados.

174

Análise a posteriori

Na última questão desta parte de nossa sequência, percebemos que todas

as respostas numéricas das professoras foram, conforme esperávamos em nossa

análise a priori, diferente de nosso piloto, as professoras fizeram uso das

ferramentas do software, até realizaram construções novas quando perceberam

necessidade.

Vale ressaltar que as professoras usaram tanto representações gráficas

como tabulares para suas análises. Percebemos, também, que elas fizeram uso

da ferramenta do software para selecionar os elementos com a mesma

característica, ressaltando que isto é uma grande maneira de agilizar e facilitar o

entendimento das representações. Ou seja, as professoras parecem ter se

apropriado das ferramentas oferecidas pelo software.

No entanto, precisamos fazer uma ressalva para a professora A. Enquanto

ela realizava as construções, em um determinado momento da entrevista ela

“mexeu” no conjunto de dados sem querer, pois mexer no gráfico implica na

alteração dos valores do banco de dados, conforme discutimos no capítulo III.2.

deste trabalho. Desta forma, algumas de suas análises deram-se pelas

representações apresentadas no papel (questões para ela responder).Nesse

caso, podemos afirmar que o software não foi um facilitador e poderia ocasionar

alguns erros, caso ela não tivesse percebido. Se o conceito estiver bem

construído, tal mudança provocaria erro nos valores, mas não na forma da

análise.

175

Figura 18: Modificação no banco de dados pelo manuseio das representações gráficas

Quando observamos o gráfico acima, é quase imperceptível a mudança no

deslocamento da coluna em vermelho à direita.

No item “k)”, percebemos que a professora B escolheu a moda para

representar os salários da empresa e sua justificativa mostrou fortemente essa

escolha. A professora A escolheu a média para representar o salário da empresa

e sua justificativa deu-se pela própria medida, ou seja, não conseguiu explicar os

176

motivos da escolha, apenas justificou dizendo que a média era a medida que

melhor resumia os dados observados. No entanto, elas não apresentaram

nenhuma análise relacionada à dispersão dos dados. Desta forma, acreditamos

que, para este conceito, as professoras apresentem um nível cultural de

alfabetização. Em alguns momentos faziam a leitura além dos dados, mas grande

parte de suas interpretações basearam-se na leitura dos dados ou no máximo

entre os dados.

Na maioria das respostas, as professoras buscaram utilizar o recurso do

software de “iluminar” todos os registros, conforme clicamos em uma das

características. Em outros momentos, também, foi possível observar as

professoras utilizando mais de uma representação para responder às questões.

Neste caso, comentávamos a importância do trabalho com diversas

representações semióticas.

Elas mostraram bastante interesse no trabalho com as inter-relações entre

os diversos registros apresentados e afirmaram a importância de se trabalhar com

a maioria deles. A professora A ficou bastante entusiasmada com o ambiente

computacional, até mesmo dando indícios de querer trabalhar com este ambiente

com seus alunos.

A seguir, trazemos os protocolos com as respostas obtidas pelas

professoras, diferente do teste diagnóstico, em que elas tiveram de realizar

cálculos e/ou construções para responder à questão. Aqui, com o uso do software

e pela observação e manuseio destas representações, elas apenas apresentaram

as respostas finais.

177

Protocolo 54: Respostas da professora A para a questão 16 da terceira fase da parte A

178

Protocolo 55: Respostas da professora B para a questão 16 da terceira fase da parte A

17ª questão:

Quais seriam as possíveis estratégias dos alunos para responder os itens da questão

anterior?

(Observação: Se quiser, leve em consideração o aluno com a possibilidade do uso do

Fathom)

Para essa questão, queríamos perceber se o professor notou a importância

do uso de diferentes registros de representação semiótica, como ele percebeu o

179

uso do ambiente informatizado e se o professor verificou que para solucionar os

itens anteriores, se faz necessário o uso simultâneo de várias representações e,

em alguns casos, a leitura além dos dados. Queríamos também observar a

evolução do conhecimento pedagógico e do conhecimento dos alunos.

Análise a posteriori:

As duas professoras relataram a importância de se utilizar as diferentes

representações semióticas e disseram que as escolhas deram-se pela

necessidade de cada questão.

Protocolo 56: Resposta da professora A para a última questão da terceira fase da parte A

Protocolo 57: Resposta da professora B para a última questão da terceira fase da parte A

Ao observar as respostas das duas professoras, pudemos inferir que o

conhecimento específico do conteúdo ainda não provocou evolução no

conhecimento didático do conteúdo, pois as professoras não relataram as

estratégias utilizadas por seus alunos. Limitaram-se a uma afirmação bastante

genérica que parecia estar fundamentada nas próprias atividades da sequência.

180

IV.5 Análises a priori e a posteriori da parte B da sequência didática

Nesta última parte da sequência didática, propusemos ao professor que ele

analisasse uma atividade, verificando a viabilidade de se construir um plano de

aula com esta atividade.

A atividade instruiria na construção de um relatório sobre as informações

de uma pesquisa, e, para realizar esta pesquisa ele teria de escolher: as variáveis

estatísticas que achasse conveniente, explicar os motivos da escolha das

variáveis; criaria os questionamentos para realização de sua pesquisa;

organizaria os dados das pesquisas. Para isso, deveria utilizar registros diferentes

(tabelas, gráficos e medidas) e escreveria pequenos textos explicativos sobre os

dados encontrados.

Primeira questão:

Vamos supor professor, que você irá trabalhar com os conceitos estatísticos com seus

alunos. Para isto é necessário a construção de um plano de aula para trabalhar estes

conteúdos. Abaixo descrevemos uma atividade que propõe aos alunos a construção de um

relatório sobre os estudantes da sua escola.

O objetivo deste relatório é a criação de uma pesquisa que deve se iniciar pela coleta e

organização dos dados, pela preparação dos registros (tabelas, gráficos, medidas) e se findar

com a organização das informações em um relatório explicativo que deverá ser enviado

“ficticiamente” a um aluno de outra escola.

Professor, gostaríamos que você observasse cada uma das etapas e sugerisse mudanças

(se assim achar conveniente) e relatasse sua opinião de como seria a realização destas etapas

pelos alunos, se eles achariam fácil resolver uma atividade destas, se seria interessante, entre

outras informações que julgar conveniente.

ATIVIDADE PARA SER DESENVOLVIDA COM OS ALUNOS

Suponha que você queira comunicar a um outro aluno, como são os estudantes de sua

escola. Para isso, você irá prepara um relatório que mostre resumidamente as características

principais destes estudantes.

1) Preparação das questões de investigação:

a) Quais dados (físicos, sociais, culturais etc) devem entrar na caracterização do aluno

típico?

b) Seria necessário traçar um perfil para as meninas e outro para os meninos? Por quê?

1.1.) Em sua opinião, como os alunos desenvolveriam esta etapa da atividade?

181

Nesta primeira questão, o professor deveria perceber que aqui tratamos

das variáveis estatísticas, que este é o primeiro momento do aluno pensar nas

variáveis estatísticas pertinentes para sua pesquisa.

Esperava-se que o professor percebesse a importância desta fase do plano

de aula para a organização da coleta de dados que virá a ser feita na próxima

fase. Seria interessante ele ressaltar a importância de se trabalhar com variáveis

qualitativas e quantitativas.

Segunda questão:

2) Preparação da coleta de dados:

- Prepare folhas de registro para os dados que serão pesquisados;

- Escolha as variáveis da pesquisa;

- Peça aos alunos de sua escola que respondam as perguntas da pesquisa.

2.1.) Que tipo de variáveis os alunos escolheriam para descrever os indivíduos de sua

escola?

2.2.) Você acredita que eles levariam em consideração tanto variáveis qualitativas como

quantitativas?

2.3.) Em sua opinião, eles teriam facilidade de realizar esta pesquisa em sua escola?

Para a segunda parte, esperamos que o professor percebesse a

importância da organização e coleta de dados para a pesquisa. Aqui seria

importante que ele relatasse como o trabalho seria realizado pelos alunos, que os

dados pesquisados seriam reais. Esta é uma maneira de motivá-los, pois no final

da pesquisa, com a construção do relatório, conseguirão traçar um perfil dos

estudantes de sua escola.

Terceira questão:

3) Organização e representação dos dados:

- Organize seus dados adequadamente;

- Para cada tipo de variável da sua pesquisa, construa os tipos de representações

(gráficos, tabelas) que você considerar mais apropriado para representar tal variável.

Quando considerar conveniente, utilize também as medidas-resumo;

- Escolha uma das variáveis para fazer as representações somente utilizando lápis e

papel, para as demais, utilize o software Fathom;

- Acompanhando estas representações estatísticas, redija pequenos textos que

servirão como relatórios, descrevendo os estudantes de sua escola pelo conjunto de

dados que você coletou.

182

3.1.) Você acredita que os alunos sabem como trabalhar com as inter-relações entre os

diferentes registros para a construção do relatório?

3.2.) Em sua opinião, os alunos conseguem realizar corretamente as construções das

tabelas e dos gráficos para as diferentes variáveis?

Aqui ressaltamos a importância das múltiplas representações para a

mesma distribuição de frequências, por isso sugerimos que apenas uma das

variáveis fosse representada no lápis e papel, e as outras com o uso do software,

pois desta forma as construções tornar-se-iam mais rápidas.

Esperávamos que o professor percebesse a necessidade das

interpretações (pequenos textos) dos dados observados, mas, para que estas

informações tenham sentido seria necessário que se usassem algumas medidas

para acontecer a análise dos dados.

Análise a posteriori

As professoras relataram que o desenvolvimento da atividade seria

bastante interessante. A professora A até ressalvou que gostaria de realizar com

seus alunos do 3º ano do Ensino Médio (acompanhamos a professora, mas ela

não teve tempo hábil, por diversos acontecimentos escolares, para realizar com

seus alunos).

Para a 1ª questão, a professora B acreditou que estava bom e que era

muito interessante. A professora A também relatou que era bastante oportuna e

afirmou a necessidade de se traçar um perfil aos meninos e outro às meninas,

como maneira de enriquecer a pesquisa.

Protocolo 58: Resposta da professora A para o item b da primeira questão da parte B

183

Protocolo 59: Resposta da professora B para o item b da primeira questão da parte B

Em relação como os alunos desenvolveriam a primeira etapa da atividade,

as duas professoras relataram que não teriam dificuldades, escolheriam as

variáveis e sairiam pela escola realizando a pesquisa.

Para a segunda parte, a professora B sugeriu que o professor pedisse aos

alunos que confeccionassem folhas de registros para facilitar a coleta de dados.

Em relação às possíveis variáveis que os alunos escolheriam, as duas

professoras relataram tanto variáveis qualitativas como quantitativas e afirmaram

que os alunos também levariam em conta os dois tipos de variáveis. Citaram

também que os alunos não teriam dificuldades para realizar o trabalho na escola

e ainda seria uma atividade do agrado deles por ser diferenciada.

Protocolo 60: Respostas da professora A para as questões “2.1”, “2.2” e “2.3” da parte B

184

Protocolo 61: Respostas da professora B para a questão 2 completa da parte B

Em relação a terceira parte, elas não sentiram tanta segurança pela sua

realização por parte dos alunos, tanto que a professora B até sugeriu que se

tivesse um relatório como amostra para os alunos consultarem, afirmaram ainda

que eles teriam dificuldades e que algumas construções, em lápis e papel,

poderiam ser feitas erradas que, neste caso, o ambiente informatizado seria um

facilitador. Mas em nenhum momento as professoras disseramm que a atividade

era inviável

185

Protocolo 62: Respostas da professora A para as questões “3.1”e, “3.2” da parte B

Protocolo 63: Respostas da professora B para a questão 3 completa da parte B

187

ONSIDERAÇÕES FINAIS

Esta pesquisa teve como objetivo verificar o nível de letramento estatístico

de duas professoras da Escola Básica, que trabalham com estatística em suas

aulas, e, também, como o uso de um ambiente computacional de Estatística

Dinâmica, no caso o software FATHOM, auxilia no desenvolvimento dos níveis de

leitura gráfica e possibilita ao professor viabilizar a utilização de diferentes

registros de representação semiótica.

A metodologia escolhida seguiu alguns pressupostos da Engenharia

Didática e constituiu um Estudo de Caso, com isso pudemos organizar o corpus

desta pesquisa visando responder a nossa primeira questão de pesquisa “Qual é

o nível de letramento estatístico de professores de Matemática do Ensino

Médio que trabalham, em sua prática docente, com os conteúdos da

Estatística Descritiva?”

Analisamos os dados obtidos por meio de entrevistas com duas

professoras de Matemática da Escola Básica, que já tinham trabalhado com

conceitos da Estatística Descritiva. Percebemos que ambas oscilaram entre os

níveis de letramento funcional e científico, nos termos de Shamos (1995). Tal

constatação veio do fato de que na resolução das atividades que compunham

nossa sequência, em muitos momentos, elas mobilizavam adequadamente os

conhecimentos estatísticos, sem, no entanto, conseguir expressar uma

formalização ou mesmo sem conhecer os termos científicos adequados para

expressar os conceitos mobilizados.

Com base nas análises realizadas, questionamo-nos sobre a necessidade

de estabelecer subníveis de letramento estatístico que permitissem melhor

188

modelar o conhecimento específico do conteúdo das professoras, nos termos de

Shulman (2001). Sugerimos que, futuramente, seja realizada uma pesquisa

empírica para identificar características possíveis para estes subníveis.

Percebemos que este resultado diferiu dos anteriores observados em

pesquisas, pois indicaram que os professores pesquisados apresentavam nível

cultural de alfabetização estatística. Mas como nenhum estudo quantitativo foi

realizado para um efetivo mapeamento do nível de letramento dos professores,

apontamos para a necessidade de tal pesquisa, que permitirá, assim, uma melhor

fundamentação ás escolhas feitas para o desenvolvimento de formações

continuadas e de materiais didáticos a serem usados, tanto nessas formações

como com os alunos da Escola Básica.

Optamos por realizar este estudo de caso com estas duas professoras,

pelo conhecimento que tínhamos de sua prática docente e por sabermos que elas

já haviam abordado estes conteúdos com seus alunos. Acreditamos que estes

fatores possam ter influenciado nos resultados obtidos, tal como era esperado.

Podemos, assim, inferir que encontramos, entre os professores em exercício na

rede pública (sujeitos das pesquisas realizadas até o momento das quais tivemos

acesso aos resultados), comportamentos de mobilização de conhecimentos

estatísticos, segundo os três níveis de alfabetização estatística.

Em relação a segunda questão, “Como estes percebem o uso

simultâneo de vários registros de representação semiótica para a análise de

um conjunto de dados, com ou sem o uso do ambiente informatizado?”

Notamos que as professoras utilizaram e perceberam a necessidade do

uso de diferentes registros de representação semiótica em suas respostas e nas

análises das questões sugeridas. Ou seja, perceberam a necessidade do uso

simultâneo dos registros na análise de um banco de dados.

No entanto, não foi possível analisar, por questão de tempo, como elas

tratam o uso desses diferentes registros com seus alunos em sala de aula, ou

seja, como incorporam o uso desses registros no conhecimento pedagógico do

conteúdo, nos termos de Shulman (2001). Nestas condições, abre-se aqui mais

uma perspectiva para futuras pesquisas que possam verificar, como acontece o

189

uso dos diferentes registros de representação semiótica de uma distribuição de

frequências no processo de ensino e aprendizagem. Sugerimos, também, o

estudo da mobilização desses registros pelos alunos nos distintos níveis de

escolaridade.

Em relação ao uso do software de Estatística Dinâmica, observamos que,

muitas vezes, foi um forte aliado na construção de diversas representações,

permitindo-nos um enfoque maior nas análises do que nas próprias construções.

Este software possui uma ferramenta bastante interessante (iluminar os

elementos de mesmo tipo em todas as representações de sua tela, conforme

explicamos no capítulo III desta pesquisa) o que facilita o trabalho com as inter-

relações entre os diferentes registros de representação semiótica. Entretanto,

também, notamos alguns possíveis obstáculos que podem surgir com o uso deste

software, como por exemplo, o tratamento de todas as variáveis quantitativas,

como contínuas e a permissão de modificação do banco de dados pela

movimentação dos registros gráficos.

Com nossa pesquisa, pudemos estudar como professores em exercício

mobilizam os registros de representação semiótica na resolução de problemas, e

com base nisso, identificar seu nível de letramento estatístico. O estudo dos

saberes docentes no que se refere à Estatística Descritiva ficou apenas como

pano de fundo, justificando a escolha dos registros e procedimentos para resolver

os problemas propostos com o uso do software Fathom.

Dessa forma, concluímos nossas considerações enunciando mais uma

questão para futuras pesquisas: quais elementos dos saberes docentes podem

ser mais facilmente desenvolvidos pelo uso de softwares de Estatística Dinâmica?

191

EFERÊNCIAS

ANDRÉ, M. E. D. A. Estudo de caso em Pesquisa e Avaliação Educacional,

Líber Livro Editora, Série Pesquisa, vol.13, Brasília, 2005.

ALMOULOUD, S. Ag. Fundamentos da didática da matemática, UFPR:

Curitiba, 2007.

______ Registros de representações semióticas e compreensão de conceitos

geométricos in MACHADO, S. D. A. org, Aprendizagem em Matemática:

Registros de Representação Semiótica, Campinas, (SP): Papirus Editora, pp

125-147, 2003

ARTIGUE, M. Engenharia Didática. In: BRUN, J. Didáctica das Matemáticas.

Lisboa: Instituto Piaget, 1996, p. 193-218

BATANERO, C. Didáctica de la Matemática – Departamento de Didáctica de la

Matemática - Universidade de Granada, 2001.

BIGATTÃO, P. A. Concepção do Professor de Matemática sobre o Ensino da

Estocástica, PUC–SP, Dissertação de Mestrado, 2007

CAMPOS, C. R. A Educação Estatística: Uma investigação acerca dos

aspectos relevantes à didática da estatística em cursos de graduação. Rio

Claro: UNESP, Tese de Doutorado, 2007.

CANOSSA, R. O Professor de Matemática e o Trabalho com Mediadas

Separatrizes, PUC–SP, Dissertação de Mestrado, 2009

CARDOSO, R. O professor de Matemática e a Análise Exploratória de Dados

no Ensino Médio, PUC–SP, Dissertação de Mestrado, 2007

COUTINHO, C. Q. S. Teaching Statistics in Elementary and High School and

Teacher Training, ICMI/IASE, 2008

CURCIO, F. R. Developing Graph Comprehension – Elementary and middle

school activities. National Council of Teachers of Mathematics, Second printing,

1994.

192

DUVAL, R. Registros de representações semióticas e funcionamento cognitivo da

compreensão em matemática in MACHADO, S. D. A. org, Aprendizagem em

Matemática: Registros de Representação Semiótica, Campinas (SP): Papirus

Editora, pp 1-31, 2003

FRIEL S. N.; CURCIO, F. R.; BRIGHT. G. W. Making Sense of Graphs: Critical

Factors Influencing Comprehension and Instructional Implications. Journal

for Research in Mathematics Education, 2001, vol. 32, nº 2, 124-158

GAL, I. Adult’s Statistical Literacy: meanings, components, responsibilities.

International Statistical Review, v. 70, n. 1, p. 1-25, 2002

GASCÓN, J. In: Educação Matemática Pesquisa – La necessidad de utilizar

modelos em didáctica de lãs matemáticas, vol. 5, nº 2, São Paulo, 2003, p.11-

37.

MORAIS, T. M. R. Um estudo sobre o pensamento estatístico: ‘componentes

e habilidades’. PUC–SP, Dissertação de Mestrado, 2006

MOREIRA, P. C.; DAVID, M. M. M. S. O conhecimento matemático do

professor: formação e prática docente na escola básica, Revista Brasileira de

Educação, 2005, nº 28, p. 50-61.

NOVAES, D. V.; COUTINHO, C. Q. S. Estatística para a Educação

Profissional. RBB, 2008

SANTOS, S. S. O desenvolvimento de conceitos elementares do bloco

tratamento da informação com auxílio do ambiente computacional: Um

estudo de caso com uma professora do 1º e 2º ciclos do Ensino

Fundamental, PUC–SP, Dissertação de Mestrado, 2003.

SHAMOS, M. H. The myth of scientific literacy, Library of Congress Cataloging

in – Publication Data, the United States of American, 1995

SHULMAN, L. S. Conocimiento y Enseñanza, Estudios Públicos, 83, 2001

SILVA, C. B. Pensamento estatístico e raciocinio sobre variação: um estudo

com professores de matemática. São Paulo: PUC–SP, Tese de Doutorado,

2007.

VIANNA, H. M. Pesquisa em Educação – a observação, Brasília: Plano, Série

Pesquisa em Educação, Vol. 5, 2003

VIEIRA, M. Análise Exploratória de dados: Uma abordagem com alunos do

Ensino Médio, PUC–SP, Dissertação de Mestrado, 2008.

193

WILD, C. e PFFANNKUCH, M. ¿Qué es el Pensamiento Estadístico?

Proceedings of the Fifth International Conference on Teaching of Statistics,

Singapore, Vol.1 pp. 333-339 – Publicado no jornal Hipótesis Alternativa Vol. 6

Nº2 – Septiembre 2005.

WITTE, R. S. e WITTE, J. S. Estatística, LTC, sétima edição, Rio de Janeiro,

2005.

195

PÊNDICE I

TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO

Pesquisa: Relações entre mobilização dos registros de representação

semiótica e os níveis de letramento estatístico com professores

Eu, ________________________________________________________,

portador (a) do R. G. _____________________________________, residente na

_________________________________________________________________

_______________, telefone: ___________________________________ e e-mail:

____________________________________________, abaixo assinado dou meu

consentimento livre e esclarecido para participar como voluntário (a) da pesquisa

supracitada sob a responsabilidade da pesquisadora Eliana Maria Bauschert de

Freitas, aluna do curso de Mestrado Acadêmico em Educação Matemática da

Pontifícia Universidade Católica de São Paulo e da Professora Dra. Cileda de

Queiroz e Silva Coutinho, orientadora da pesquisa.

Assinando este Termo de Consentimento, estou ciente de que:

1. O objetivo da pesquisa é verificar o nível de letramento estatístico do

professor da Escola Básica, que trabalha com estatística na sua prática docente,

e também como o uso de um material de apoio, um ambiente computacional

auxilia no desenvolvimento dos níveis de leitura gráfica e possibilita ao professor

viabilizar a utilização de diferentes registros de representação semiótica.

2. Durante a entrevista, estarei preenchendo questionários e realizando

construções no ambiente computacional FATHOM.

196

3. Quando a pesquisa terminar, terei acesso aos resultados globais do

estudo.

4. Estou livre para interromper, a qualquer momento, minha participação

nesta pesquisa.

5. A participação nesta pesquisa é voluntária, e os professores não

receberão qualquer forma de remuneração.

6. Os dados pessoais dos professores serão mantidos em sigilo, e os

resultados obtidos com a pesquisa serão apenas utilizados para alcançar os

objetivos do trabalho.

7. Poderei entrar em contato com os pesquisadores sempre que julgar

necessário. Com Eliana Maria Bauschert de Freitas, no e-mail: eliana-

[email protected] e com a pesquisadora Dra. Cileda de Queiroz e Silva

Coutinho pelo e-mail cileda@pucsp.br.

8. Obtive todas as informações necessárias para poder decidir

conscientemente sobre minha participação na referida pesquisa.

Este Termo de Consentimento é feito em duas vias, de maneira que uma

permanecerá em meu poder e outra com a pesquisadora.

São Paulo, _______ de _____________________ de 2009.

________________________________________________

assinatura do participante

________________________________________________

assinatura da responsável pela pesquisa

________________________________________________

assinatura da pesquisadora

197

PÊNDICE II

SEQUÊNCIA DIDÁTICA (ATIVIDADES ADAPTADAS DE VIEIRA, 2008)

Parte A – Familiarização com o software

Realizaremos essas atividades com o software de estatística dinâmica

Fathom. Nesta fase, nosso objetivo é que você conheça e familiarize-se com o

software, revendo alguns conceitos estatísticos.

Observe o seguinte conjunto de dados de uma pesquisa realizada com 20

funcionários de uma empresa:

Nome Gênero

Idade Cargo Escolaridade

Salário

Ana f 23 recepcionista

médio 850

Fabio m 25 operário fundamental

950

Mario m 30 operário fundamental

950

Mauricio

m 35 gerente superior 2200

Carlos m 29 engenheiro superior 2200

Mariana

f 31 gerente superior 2000

Lourdes

f 26 vendedor médio 1300

Sérgio m 27 operário médio 950

Marilda

f 36 aux. limpeza

fundamental

700

Rose f 32 aux. limpeza

fundamental

700

Ricardo

m 30 vendedor médio 1700

Rafael m 36 engenheiro superior 2200

Raquel f 40 encarregado

superior 1300

Cassio m 38 operário médio 950

Eduardo

m 33 operário fundamental

950

Felipe m 35 encarregado

médio 1200

Michel m 34 vendedor médio 1500

João m 40 operário fundamental

950

Miguel m 42 porteiro fundamental

800

Maria f 43 aux. limpeza

fundamental

700

198

A partir deste conjunto de dados podemos levantar inicialmente as

seguintes questões:

- Quais as características dos sujeitos observados que estão sendo alvo

desta pesquisa? ____________________________________________________

- Se formos classificar estas características, quais critérios poderiam ser

usados? Por quê? __________________________________________________

Obs.: Vale lembrar que as características observadas constituem o que

chamamos de “variável estatística”.

Como você percebe o uso do ambiente computacional na escola?

____________________________________________________________

_________________________________________________________________

Primeira Fase: Elaboração de tabelas no Fathom

1) Inicialmente, construiremos o banco de dados da empresa no software

Fathom. Para isso, siga os procedimentos abaixo

a) Clique no ícone do Desktop , para iniciar o Fathom

b) Clique em “new collection” , e arraste até a tela.

c) Clique duas vezes em cima da palavra “collection1”, aparecerá a caixa

“rename collection”, onde você pode inserir um nome para o seu banco de dados.

199

d) Agora, clique em “new case table” e arraste até a tela.

e) Insira os dados da pesquisa na tabela do Fathom. Para isso, clique em

“new” e escreva o título da coluna. Depois, tecle “enter”, para continuar inserindo

os dados nas linhas (Obs.: não utilize acentuação, pontuação ou espaçamentos

nos nomes das variáveis).

2) Agora, construiremos uma tabela de distribuição de freqüências para a

variável “gênero”.

a) Clique em “new summary table” e arraste até a tela

b) No banco de dados do Fathom, selecione a coluna “gênero” e arraste-a

até a nova tabela.

3) Seguindo o mesmo procedimento, construa também as tabelas de

distribuição de freqüências para as variáveis “cargo” e “escolaridade”.

200

4) Você considera que a variável “gênero” e a variável “idade” são de

mesmo tipo? Por quê?

____________________________________________________________

_________________________________________________________________

4.1.) O aluno consegue fazer esta distinção para os tipos de variáveis? Se

sim, como ele faria?

____________________________________________________________

_________________________________________________________________

5) Construa uma tabela de distribuição de freqüências para a variável

“idade”.

Para isso, clique em “new summary table” , selecione a coluna da

variável “idade” no banco de dados e arraste-a até a nova tabela.

Obs.: Para tabelas com dados numéricos (ou seja, variáveis quantitativas),

mantenha apertada a tecla shift enquanto arrasta a variável até a tabela.

6) Construa uma tabela de distribuição de freqüências para a variável

“salário”.

7)Podemos também construir tabelas combinando algumas variáveis. Por

exemplo, vamos construir uma tabela que mostre o nível de escolaridade dos

funcionários de gênero masculino e feminino.

a) Clique em “new summary table” para construir a tabela;

b) Clique na variável “escolaridade” e arraste até o lado direito da tabel:

201

c) Agora, clique na variável “gênero” e arraste até o lado de baixo da

tabela.

8) Construa uma tabela que mostre os cargos dos funcionários de gênero

masculino e feminino.

9) Você acredita estar claro, neste momento da atividade, para o aluno as

diferenças entre as variáveis qualitativas e as quantitativas?

____________________________________________________________

_________________________________________________________________

10) O fato do Fathom trabalhar todas as variáveis de estrutura numérica

como uma variável quantitativa contínua pode dificultar a aprendizagem deste

conceito? Se sim, qual (is) procedimento (s) podemos tomar para que isso não

aconteça?

____________________________________________________________

_________________________________________________________________

Segunda fase: Construção de gráficos no Fathom

1) Nesta fase, utilizaremos o software Fathom para construir os gráficos,

que constituem um outro tipo de representação de uma Distribuição de

Freqüências.

202

a) Clique no ícone para construir o gráfico, e arraste até a tela;

b) Clique na coluna variável “gênero” para selecioná-la e arraste até a

área do gráfico, sobre a caixa “drop na anttribute here”.

Este gráfico é chamado “diagrama de colunas”, e é normalmente utilizado

para representar variáveis qualitativas ou mesmo variáveis quantitativas discretas.

Ele coloca em evidência a comparação entre os valores observados.

2) Clique no ícone “bar chart” escolha outro tipo de gráfico. O que você

observa? É o mesmo tipo de comparação que ele representa?

____________________________________________________________

_________________________________________________________________

203

2.1) Em sua opinião, os alunos percebem a distinção dessas duas

representações? Qual delas proporciona maior possibilidade de compreensão?

Por quê?

____________________________________________________________

_________________________________________________________________

3) Construa os gráficos para as variáveis “cargo” e “escolaridade”.

4) Construa agora um histograma para a variável idade. (Escolha o

Histogram).

5) Construa um gráfico de pontos para a variável “idade” (Escolha :Dot

Plot). Explique a diferença entre os dois gráficos. Como você explicaria a variação

dessa variável pela observação dos dois gráficos?

____________________________________________________________

_________________________________________________________________

5.1) Como os alunos podem perceber estas distinções entre o tipo de

informação fornecida em cada gráfico?

____________________________________________________________

_________________________________________________________________

Obs.: A variável “idade” é uma variável quantitativa contínua, mas pode ser

tratada como discreta, por ser apresentada em número de anos completos (uma

contagem). O software Fathom, por definição, trata toda variável numérica como

contínua. Então, para construir o gráfico Histograma, o software faz uma

“correção de continuidade”, ou seja, soma e subtrai meia unidade ao valor da

variável, construindo assim um intervalo e propiciando a percepção da

continuidade. Sendo assim, para variáveis discretas, é mais adequado utilizar o

gráfico Dot Plot (neste tipo de gráfico, cada ponto representa um valor

observado).

204

6) Agora, no gráfico da variável gênero, clique sobre a barra que indica o

gênero masculino. O que você observa no banco de dados e nos outros gráficos?

_________________________________________________________________

6.1.) Em relação a esta ferramenta do software, você acredita ser um

facilitador para a compreensão da inter-relação entre as representações

apresentadas?

____________________________________________________________

_________________________________________________________________

205

Terceira fase: Medidas-Resumo, Tabelas e Gráficos no Fathom

1) Construa uma tabela de distribuição de freqüências para a variável

“idade”, da mesma maneira que você fez na primeira fase, mas agora sem

apertar a techa shift (somente arraste a variável até a tabela).

Observe que apareceu somente um valor na tabela. Este é o valor da

“média aritmética” para a variável “idade” (no Fathom, quando construímos

tabelas de variáveis quantitativas, se não mantivermos apertada a tecla shift, a

table mostra a média aritmética).

A média aritmética é uma medida que resume e representa um

conjunto de dados em um único valor. A média de um conjunto é o valor ao

redor do qual os valores observados se distribuem, é calculada como a

soma dos valores dividida pelo número total de observações. Podemos

fazer uma analogia entre a média de um conjunto de dados e o fiel de uma

balança em equilíbrio.

2) Seguindo o mesmo procedimento, obtenha o valor da média aritmética

para a variável “salário”.

3) Iremos agora representar o valor da média no gráfico.

a) Construa um gráfico (histogram) para a variável “salário”;

b) Clique em “graph”, “plot value”;

c) No menu que se abrirá, clique em “functions”, “statistical”, “one

attribute”.

206

d) Clique (duas vezes) em “mean”, em seguida clique em “OK”.

Veja o gráfico:

“A média sozinha é suficiente para que se possa analisar um conjunto de

dados? Pense, por exemplo: Qual o intervalo de variação dos valores

observados? Qual é a posição da média dentro deste intervalo?”.

Uma outra medida que podemos utilizar para sintetizar e representar

um conjunto de dados é a mediana. A mediana é o valor que ocupa a

posição central dos dados ordenados, ou seja, é o valor que é maior ou

igual a 50% dos dados ordenados e menor ou igual a 50% dos dados

observados. Podemos fazer uma analogia entre a mediana e o ponto médio

de um segmento.

207

4) Na mesma tabela da média das idades (construída no item 1), vamos

mostrar também a mediana.

a) No Fathom, clique na tabela acima, depois em “summary”, “add

formula”.

b) No menu, clique em “functions”,”statistical”, “one attribute”. Clique

(duas vezes) em “median” e “OK”.

Você terá o valor que ocupa a posição central nas idades ordenadas.

5) Representaremos a mediana no gráfico (pode ser no mesmo gráfico do

item 3).

a) Clique no gráfico da variável salário que você construiu a média;

b) Clique em “graph”, “plot value”

c) No menu que se abrirá, clique em “functions”, “statistical”, “one

atribute”, “median” (duplo clique).

208

6) Como os demais valores representados se distribuem em relação a

média? E em relação à mediana?

____________________________________________________________

_________________________________________________________________

6.1.) Na sua opinião, os alunos tem clareza da distinção destas duas

medidas? Caso não tenham esta clareza, por que isso acontece?

____________________________________________________________

_________________________________________________________________

Vamos determinar, além da mediana, dois valores tais que 25% das

observações ordenadas serão menores ou iguais a um deles e 75% serão

menores ou iguais ao outro. Tais valores são denominados, respectivamente,

primeiro quartil e terceiro quartil. Note que a mediana representa o segundo

quartil.

7) Para representar os quartis, utilizaremos ainda o mesmo histograma da

variável salário.

a) Selecione o gráfico e clique em “graph”, “plot value”.

b) No menu, clique em “functions”, “statistical”, “one attribute”,

“percentile” (duas vezes)

c) Na caixa de funções aparecerá “percentile ( )”. Dentro dos

parênteses escreva (25, salario), e clique em “OK”. Você terá representado no

gráfico o primeiro quartil

209

d) Repita o mesmo procedimento, e na caixa da função percentile, escreva

(75,salario), e clique em “OK”. Será representado o terceiro quartil.

Uma representação gráfica envolvendo quartis, mediana, valor máximo e

valor mínimo é o “box-plot”. No box-plot, define-se uma “caixa” com o limite

esquerdo dado pelo primeiro quartil e o limite direito pelo terceiro quartil. A

mediana é representada por um traço no interior da caixa, e segmentos de reta

são colocados da caixa até os valores máximo e mínimo.

8) Construa um novo gráfico para a variável salário, e no canto superior

direito do gráfico, clique na sela e selecione “box-plot”, para representar este

gráfico.

210

9) Em relação aos últimos gráficos utilizados para representar os quartis

responda:

Qual tipo de gráfico você prefere? ________________________________

Justifique ____________________________________________________

____________________________________________________________

9.1.) Um aluno, na tentativa de explicar para um colega, a relação de

dimensões diferentes à mesma porcentagem (fato que acontece no box-plot) fez a

seguinte colocação: “É fácil, se a gente pensar em duas latas de sardinha com

três sardinhas dentro, na lata grande as sardinhas estão mais espalhadas, mas,

na pequena, as três ficarão pertinho uma da outra, e de qualquer forma as duas

tem a mesma quantidade”. Como você avalia esta explicação?

____________________________________________________________

_________________________________________________________________

10) Compare os dois tipos de gráficos, dizendo as principais diferenças

entre eles e quais informações são mais evidentes em um ou em outro.

____________________________________________________________

_________________________________________________________________

211

11) Veremos agora como inserir uma nova coluna no banco de dados

inicial. Vamos assim considerar a distância entre cada valor observado para a

variável “idade” e o valor obtido para a média. Chamaremos cada uma dessas

distâncias de “desvio”. Podemos nomear esta nova coluna de “idadedesvios”.

a) Na tabela, clique em <new> e insira o título para a coluna;

b) para calcular os desvios, clique na coluna “idadedesvios”;

c) No menu, clique em “edit”, “edit formula”;

d) Na caixa, escreva “idade-mean(idade)” e clique em “OK” (será

calculado para cada valor da variável, a diferença entre o valor observado e a

média aritmética).

212

12) Observe o resultado na tabela. O que significa o resultado “positivo”

nesse cálculo? E o “negativo”?

____________________________________________________________

_________________________________________________________________

13) Vamos inserir os desvios na tabela de distribuição de freqüência da

variável idade ( que foi construída na primeira fase da atividade).

Clique na coluna “idadedesvios”, e arraste até o canto esquerdo da tabela

14) Construa também uma coluna para os desvios da variável salário, e

depois insira na tabela de distribuição de freqüências do salário.

213

15) Em sua opinião, como os alunos interpretam o fato da adição de todos

os desvios resultar em zero?

____________________________________________________________

_________________________________________________________________

16) Baseando-se nas atividades desenvolvidas até o momento,

responda:

a) Quantos funcionários responderam à pesquisa? ___________________

b) Do total de entrevistados, qual é a quantidade de funcionários do gênero

feminino? ____________ E do masculino? _______________

c) Em relação ao nível de escolaridade, quantas mulheres têm nível

superior? ___________ E quantos homens? ______________

d) Entre as idades observadas, qual a idade máxima e a idade mínima?

_________________________________________________________________

e) Qual é o menor salário nesta empresa? ________________ E o salário

máximo?______________ E a média dos salários? ________________________

f) Quais são os cargos que têm salário acima da média nesta empresa?

_________________________________________________________________

g) Quantos funcionários recebem salário abaixo da média nesta empresa?

_________________________________________________________________

h) Quantos funcionários do gênero masculino recebem salário acima da

média na empresa? _________________ E do gênero feminino? _____________

i) Quantos funcionários do gênero feminino recebem mais que R$ 1900,00?

____________________ E do gênero masculino? _________________________

j) Quantos funcionários do gênero feminino recebem menos que R$

900,00? ___________________ E do gênero masculino ? __________________

k) Qual valor você utilizaria para representar o salário desta empresa?

________________________ Justifique: _______________________________

_________________________________________________________________

214

17) Quais seriam as possíveis estratégias dos alunos para responder os

itens da questão anterior? (Observação: Se quiser, leve em consideração o aluno

com a possibilidade do uso do Fathom)

____________________________________________________________

_________________________________________________________________

Parte B – Verificando a viabilidade de um plano de aula (Adaptado de

VIEIRA, 2008).

Vamos supor professor, que você irá desenvolver uma atividade/aula com

os seus alunos relacionada com os conceitos de estatística que trabalhamos até o

momento. Para isto, percebemos a necessidade da organização desta aula.

Abaixo descrevemos uma atividade que propõe aos alunos a construção de um

relatório sobre os estudantes da sua escola.

O objetivo deste relatório é a criação de uma pesquisa que deve se iniciar

pela coleta e organização dos dados, pela preparação dos registros (tabelas,

gráficos, medidas) e se findar com a organização das informações em um

relatório explicativo que deverá ser enviado “ficticiamente” a um aluno de outra

escola.

Professor, gostaríamos que você observasse cada uma das etapas e

sugerisse mudanças (se assim achar conveniente) e relatasse sua opinião de

como seria a realização destas etapas pelos alunos, se eles achariam fácil

resolver uma atividade destas, se seria interessante, entre outras informações

que julgar conveniente.

215

ATIVIDADE PARA SER DESENVOLVIDA COM OS ALUNOS

Suponha que você queira comunicar a um outro aluno, como são os

estudantes de sua escola. Para isso, você irá prepara um relatório que mostre

resumidamente as características principais destes estudantes.

1) Preparação das questões de investigação:

a) Quais dados (físicos, sociais, culturais etc) devem entrar na

caracterização do aluno típico?

b) Seria necessário traçar um perfil para as meninas e outro para os

meninos? Por quê?

Sugestões:___________________________________________________

_________________________________________________________________

1.1.) Em sua opinião, como os alunos desenvolveriam esta etapa da

atividade?

____________________________________________________________

_________________________________________________________________

2) Preparação da coleta de dados:

- Prepare folhas de registro para os dados que serão pesquisados;

- Escolha as variáveis da pesquisa;

- Peça aos alunos de sua escola que respondam as perguntas da

pesquisa.

Sugestões:___________________________________________________

_________________________________________________________________

216

2.1.) Que tipo de variáveis os alunos escolheriam para descrever os

indivíduos da sua escola?

____________________________________________________________

_________________________________________________________________

2.2.) Você acredita que eles levariam em consideração tanto variáveis

qualitativas como quantitativas?

____________________________________________________________

_________________________________________________________________

2.3.) Em sua opinião, eles teriam facilidade de realizar esta pesquisa na

sua escola?

____________________________________________________________

_________________________________________________________________

3) Organização e representação dos dados:

- Organize seus dados adequadamente;

- Para cada tipo de variável da sua pesquisa, construa os tipos de

representações (gráficos, tabelas) que você considerar mais apropriado para

representar tal variável. Quando considerar conveniente, utilize também as

medidas-resumo;

- Escolha uma das variáveis para fazer as representações somente

utilizando lápis e papel, para as demais, utilize o software Fathom;

- Acompanhando estas representações estatísticas, redija pequenos textos

que servirão como relatórios, descrevendo os estudantes de sua escola pelo

conjunto de dados que você coletou.

217

Sugestões:___________________________________________________

_________________________________________________________________

3.1.) Você acredita que os alunos sabem como trabalhar com as inter-

relações entre os diferentes registros para a construção do relatório?

____________________________________________________________

_________________________________________________________________

3.2.) Em sua opinião, os alunos conseguem realizar corretamente as

construções das tabelas e dos gráficos para as diferentes variáveis?

____________________________________________________________

_________________________________________________________________

Livros Grátis
( http://www.livrosgratis.com.br )
 
Milhares de Livros para Download:
 
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas

Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo