Download PDF
ads:
Flávia Viegas de Andrade
ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM
CRIANÇAS SAUDÁVEIS DE 4 A 8 ANOS
Dissertação apresentada ao curso de pós-
graduação em Fonoaudiologia da
Universidade Veiga de Almeida, como
requisito parcial para a obtenção do grau
de Mestre.
Orientadora: Profª Dra. Heidi Elisabeth Baeck
Rio de Janeiro
2009
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
UNIVERSIDADE VEIGA DE ALMEIDA
SISTEMA DE BIBLIOTECAS
Rua Ibituruna, 108 – Maracanã
20271-020 – Rio de Janeiro – RJ
Tel.: (21) 2574-8845 Fax.: (21) 2574-8891
FICHA CATALOGRÁFICA
FICHA CATALOGRÁFICA
A553a Andrade, Flávia Viegas de
Análise de parâmetros espectrais da voz em
crianças saudáveis de 4 a 8 anos/ Flávia Viegas de
Andrade, 2009.
71p. ; 30 cm.
Dissertação (Mestrado) – Universidade Veiga de
Almeida, Mestrado em Fonoaudiologia, Rio de
Janeiro, 2009.
Orientação: Heidi Elisabeth Baeck
1. Crianças - voz. 2. Acústica da fala. I. Baeck, Heidi
Elisabeth. (orientador). II. Universidade Veiga de
Almeida, Mestrado em Fonoaudiologia. III. Título.
CDD – 616.855
DeCS
Ficha Catalográfica elaborada pela Biblioteca Setorial Tijucal/UVA
ads:
ii
FLÁVIA VIEGAS DE ANDRADE
ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM CRIANÇAS SAUDÁVEIS
DE 4 A 8 ANOS.
Dissertação apresentada ao curso de pós-graduação em
Fonoaudiologia da Universidade Veiga de Almeida, como
requisito parcial para a obtenção do grau de Mestre.
Aprovada em 07 de agosto de 2009.
BANCA EXAMINADORA
Prof
a
. Heidi Elisabeth Baeck, D. Sc.
Universidade Veiga de Almeida – UVA/RJ
Prof. Ciríaco Cristovão Tavares Atherino, D. Sc.
Universidade Veiga de Almeida – UVA/RJ
Prof. Domingos Sávio Ferreira de Oliveira, D. Sc.
Universidade Veiga de Almeida – UVA/RJ
Prof
a
. Zuleica Antonia de Camargo, D. Sc.
Pontifícia Universidade Católica de São Paulo - PUC/SP
iii
Esta pesquisa não poderia ter sido realizada se não a colaboração e
amor incondicionais de meus queridos pais, irmã gêmea e noivo.
iv
Meus profundos agradecimentos
A Deus e a todos os espíritos de luz que me acompanham, por me darem saúde e força para
realização deste estudo.
Aos meus amados pais, Norma e Hélio, que estão sempre presentes e, cuja formação que me
proporcionaram, ajudou a trilhar meu caminho até aqui.
À minha querida irmã gêmea e fonoaudióloga, Danieli, por estar sempre ao meu lado e
trilhar sua trajetória dentro da fonoaudiologia junto comigo.
Ao meu querido noivo, Marcos, pelo amor incondicional e paciência nas diversas horas em
que estive ausente.
À Profa. Dra. Heidi Elisabeth Baeck por me incentivar com seus conhecimentos de
engenharia aplicados à análise acústica de voz e por todo apoio, dedicação e disposição em toda
trajetória de elaboração deste trabalho.
Ao Prof. Dr. Ciríaco Cristovão Tavares Atherino por todo carinho e disposição em todos os
momentos.
Agradeço com imenso carinho
À Profa. Dra. Sílvia Maria Rebelo Pinho, por ter me conquistado desde sua primeira aula e,
pelo incentivo constante em basear meu raciocínio clínico na fisiologia vocal.
À Profa. Dra. Zuleica Camargo, por me ajudar a percorrer o fascinante mundo da análise
acústica da voz.
v
Agradeço ainda
Ao Prof. Dr. Domingos Sávio Ferreira de Oliveira pelas sugestões feitas na banca de
qualificação deste trabalho e ao professor Dr. John Van Borsel pelo auxílio na documentação da
viagem até a Universidade de Ghent, na Bélgica, durante o curso de mestrado.
À toda equipe da Policlínica Maria Cristina Roma Paugartten e às equipes de professores e
direção das escolas pelo encaminhamento das crianças e grande parceria formada.
Às amigas da turma de mestrado pelo companheirismo, apoio e entusiasmo com que me
acompanharam por todo o curso.
Às crianças e seus responsáveis por permitirem a realização deste trabalho.
vi
“Um cientista precisa manter a veneração pelo desconhecido. Se perder esse frescor, vai com ele
a flexibilidade que faz a criação científica”.
Marcelo Gleiser
vii
RESUMO
A presente pesquisa teve como objetivo investigar parâmetros espectrais descritivos da
voz de crianças saudáveis entre quatro e oito anos. Foram selecionadas 207 crianças sem
transtornos da expressão oral, de ambos os sexos, divididas por faixa etária. Os sinais de fala
foram obtidos a partir das gravações de sentenças-veículo. Foram selecionados segmentos das
sete vogais orais do português falado no Brasil em posição tônica para a estimação das medidas
de frequência fundamental (f
0
) e frequências dos formantes (F
1
, F
2
e F
3
). Foi ainda estimada a
largura de banda de F
1
da vogal [i]. O recorte e processamento dos sinais foram realizados com o
auxílio do software Praat. Os achados mostraram valores médios de cada parâmetro investigado,
sendo observado um decréscimo na frequência fundamental e nas frequências dos formantes com
o aumento da idade. A idade de seis anos foi apontada como determinante para as mudanças
acústicas das vocalizações infantis. Diferenças de gênero, no qual o sexo feminino tende a
mostrar freqüências mais elevadas também foram apontadas. O presente estudo refere-se a uma
investigação ampla, diferenciada em termos número de vogais investigadas e número de crianças
participantes e, portanto, os valores paramétricos apontados consistem em uma importante
contribuição para a língua portuguesa falada no Brasil.
Palavras-chave: análise acústica, processamento digital, crianças
viii
ABSTRACT
The aim of this study was to investigate spectral parameters on voices of healthy children
between four and eight years old. Two hundred and seven children of both genders without
speech or voice disorders were selected and separated by age groups. Recordings were obtained
from carrier phrases and segments of the seven oral vowels of Brazilian Portuguese in the
stressed syllable were selected to estimate the fundamental frequency (f
0
) and the frequencies of
the first three formants (F
1
, F
2
e F
3
), and also the bandwidth of F
1
of vowel [i]. Software Praat
was used to cut and process these recordings. Our findings showed medium values for each
parameter investigated and we observed that the formant frequency and fundamental frequency
values decreased as age increased. We pointed out that acoustical changes on voice of children
can be determinate at the age of six years old. We found gender differences which females
presented higher frequencies in these parameters. The present study refers to a wide investigation
which differs from others in number of vowels investigated and number of subjects. For this
reason, these parametric values consist in an important contribution to the Portuguese language
spoken in Brazil
Key Words: acoustic analysis, digital processing, children
ix
SUMÁRIO
1. INTRODUÇÃO, p.11
2. OBJETIVO, p.15
3. FUNDAMENTOS TEÓRICOS, p.16
3.1 PROCESSAMENTO DIGITAL DO SINAL, p.16
3.2 PARÂMETROS DESCRITIVOS DA VOZ, p.17
3.2.1 Frequência fundamental e frequências dos formantes, p.17
3.2.2 Largura de banda, p.18
3.3 TRATO VOCAL INFANTIL, p.19
4. REVISÃO DA LITERATURA, p.20
4.1 A VOZ ENQUANTO OBJETO DE PESQUISA, p. 20
4.2 A VOZ INFANTIL, p.22
4.3 O ESTADO DA ARTE, p.27
5. METODOLOGIA, p.31
5.1 CASUÍSTICA, p.31
5.2 MATERIAIS, p.32
5.2.1 Materiais de seleção de participantes, p.32
5.2.2 Materiais de aquisição e análise de dados, p.32
x
5.3. PROCEDIMENTOS, p.32
5.3.1 Procedimentos de seleção dos participantes, p.32
5.3.2 Aquisição de Dados, p.33
5.3.3 Processamento de Sinais, p.34
5.3.4 Análise estatística, p.35
6. RESULTADOS, p.36
7. DISCUSSÃO, p.49
7.1 MEDIDAS DOS PARÂMETROS ESPECTRAIS, p.49
7.2 DIFERENÇAS ENTRE FAIXAS ETÁRIAS E GÊNEROS, p.54
8. CONCLUSÃO, p.61
REFERÊNCIAS BIBLIOGRÁFICAS, p.62
ANEXO, p.67
(A) Escala RASATI, p.67
APÊNDICES, p.64
(A) Termo de Consentimento Livre e Esclarecido, p.68
(B) Roteiro de Avaliação do Sistema Ressonantal, p.71
11
1. INTRODUÇÃO
A voz sempre exerceu fascínio em seus estudiosos, sendo por vezes, considerada um
mistério a ser desvendado. Assim como comumente ocorre na ciência, avanços tecnológicos
representaram marcos na evolução da pesquisa de voz. Em 1877 Thomas Edison fez o que é
mundialmente reconhecida como a primeira gravação da voz humana, embora, recentemente,
já se discuta a possibilidade deste feito ter sido realizado 17 anos antes (em abril de 1860), por
um parisiense pouco conhecido, Édouard-Léon Scott de Martinville (The New York Times,
Nov 2008). A possibilidade de registrar vozes e produzi-las tantas vezes quanto necessário
introduziu um importante fator de confiabilidade aos resultados obtidos na pesquisa da voz
humana.
O século XX marca o período moderno da avaliação da voz. Avaliações vocais que
eram realizadas com base exclusivamente na percepção auditiva do avaliador, passaram a
contar com o auxílio de equipamentos capazes de relacionar diferentes características do som.
Os oscilógrafos, a partir da década de 1920, possibilitaram observar a amplitude do som em
função do tempo, enquanto os espectrógrafos analógicos, a partir de 1940, auxiliaram a
determinar a composição de frequências do som (BEHLAU e col., 2001). Ambos
contribuíram significativamente para o desenvolvimento da avaliação do som da voz, porém
tornaram-se obsoletos após o surgimento da avaliação computadorizada (JOTZ e col., 2001).
Um dos mais importantes avanços ocorreu em 1970, com a introdução do processamento
digital de sinais. Sistemas baseados em circuitos analógicos de tempo contínuo passaram a ser
12
implementados através de sistemas digitais de tempo discreto (MITRA, 2001). Os
computadores passaram a produzir espectrogramas semelhantes aos espectrógrafos, porém
com diversas vantagens, tais como a visualização do gráfico na tela do computador e o
armazenamento digital, além do significativo incremento na velocidade e confiabilidade de
obtenção dos parâmetros acústicos (BEHLAU e col., 2001).
Atualmente a avaliação da voz é basicamente realizada de duas formas: avaliação
perceptivo-auditiva e avaliação espectrográfica computadorizada. A avaliação perceptivo-
auditiva, por vezes denominada análise psicoacústica (JOTZ e col., 2001), se caracteriza por
não utilizar qualquer ferramenta além da sensibilidade auditiva. Capaz de avaliar detalhes de
sonoridade, em termos metodológicos, a subjetividade inerente a este tipo de avaliação vocal
pode ser considerada uma desvantagem. A avaliação perceptivo-auditiva é amplamente
utilizada na prática clínica fonoaudiológica e é base para seleção de amostras em diversas
pesquisas relativamente recentes (DORNELLES e col.; 2001; CARRARA-DE-ANGELIS e
col.; 2001; BENETON e col.; 2004; CORAZZA e col.; 2004; NEMR e col.; 2005). A análise
espectrográfica tem relevância e aplicabilidade indiscutíveis, porém não deixa de impor certo
grau de subjetividade à avaliação vocal, uma vez que a leitura dos espectrogramas depende do
avaliador que, necessariamente, deve apresentar um considerável grau de conhecimento
específico (CARRARA-DE-ANGELIS e col., 2001).
A partir de 1980, além do método matemático de estimação espectral que gera o
espectrograma (Short Time Fourier Transformer STFT / Fast Fourier Transformer FFT),
outros estimadores espectrais (como o Linear Predictive Coding - LPC) e diversos algoritmos
de extração de parâmetros acústicos (KENT e READ, 1996) ampliaram a análise acústica da
voz. Abriu-se, portanto, a possibilidade de realizar análises vocais exclusivamente
quantitativas, resultando em valores numéricos promediados. A objetividade concedida por
estes métodos viabiliza o uso dos parâmetros acústicos obtidos em sistemas de
13
reconhecimento automático de padrões vocais (BAECK e SOUZA, 2003; 2004). Sistemas
estes, que consistem na base do desenvolvimento de ferramentas de auxílio diagnóstico e
terapêutico.
Apesar da diversidade nas formas de avaliação vocal e da extensa possibilidade de
aplicação das mesmas, pode ser observada na literatura uma tendência de se investigar
parâmetros espectrográficos em uma população predominantemente adulta (PETERSON e
BARNEY, 1952; BEHLAU, 1984; BEHLAU e col.; 1988; ANDRIANOPOULOS e col.,
2001; NEMR e col.; 2005; GELFER e MIKOS, 2005). A população infantil é pesquisada de
forma mais restrita, tanto no que se refere à quantidade de pesquisas, quanto à diversidade de
parâmetros acústicos investigados.
Dentre as pesquisas que investigaram a voz infantil observa-se um número maior de
publicações que mostram achados referentes à fonte glótica, tais como medidas de frequência
fundamental e intensidade, com seus valores absolutos e/ou índices de perturbação
(NIEDZIELSKA, 2001; NIEDZIELSKA e col., 2001; WERTZNER e col., 2005,
NICOLLAS e col., 2008; CAPPELLARI e CIELO, 2008, BRAGA e col., 2009; SCHOTT e
col. 2009). Em número menor, algumas pesquisas apontam parâmetros descritivos do trato
vocal infantil (frequências dos formantes) (BEHLAU, 1984; BEHLAU e col.; 1988; BUSBY
e PLANT, 1995; HUBER e col., 1999). A amplitude dos formantes é pouco descrita na
literatura de vozes infantis (HUBER e col., 1999) enquanto que medidas de banda dos
formantes não foram encontradas nesta população.
A relevância de se buscar a padronização de parâmetros acústicos da voz infantil pode
ser apontada, no mínimo, em duas direções. A primeira refere-se ao potencial de aplicação
dos padrões em questão, no campo do auxílio diagnóstico de patologias vocais na infância. A
segunda está associada ao estudo das emissões orais (choro/vocalizações) em bebês. A
carência, na literatura, de padrões vocais em crianças que possam dar suporte às discussões de
14
relação entre o comportamento evolutivo das oralizações de bebês e o desenvolvimento dos
movimentos articulatórios na criança, tem sido apontada por grupos desta linha de pesquisa
(ROTHGÄNGER, 2003; BAECK e SOUZA, 2007).
Parece evidente a importância de se realizar pesquisas que contemplem as
características acústicas da voz infantil de forma ampla, gerando resultados cada vez mais
consistentes, que possam contribuir para a compreensão global do comportamento evolutivo
da voz humana.
15
2. OBJETIVO
Aplicando métodos de processamento digital de sinais, o presente estudo teve como
objetivo investigar as medidas de parâmetros espectrais (frequência fundamental, frequência
dos três primeiros formantes e largura de banda de F
1
da vogal [i]) descritivos da voz de
crianças saudáveis entre quatro e oito anos. Com amostras significativamente mais
consistentes do que aquelas até então apresentadas na literatura, pretendeu-se contribuir para a
determinação de padrões acústicos vocais infantis do português brasileiro.
16
3. FUNDAMENTOS TEÓRICOS
Os conceitos relacionados ao processamento digital do sinal, parâmetros descritivos da
voz e particularidades anatômicas do trato vocal infantil consistem em pontos importantes
para a compreensão do conteúdo global deste trabalho. Desta forma, tais conceitos serão
adequadamente abordados neste capítulo.
3.1 PROCESSAMENTO DIGITAL DO SINAL
Podem ser encontradas, na literatura da engenharia elétrica, diversas ferramentas
matemáticas essencialmente de tempo contínuo, como as transformadas de Laplace e de
Fourier (RABINER, 1978). Porém o advento da tecnologia digital gerou a necessidade de
obter ferramentas equivalentes no tempo discreto, como as Transformada Z e a Transformada
Discreta de Fourier. Os conhecimentos em torno destas e de diversas outras ferramentas
foram agrupados sob o nome de Processamento Digital de Sinais (Digital Signal Processing -
DSP) (NEBEKER, 1998).
São relativamente numerosos os métodos de estimação espectral e algoritmos de
extração de parâmetros (processados no tempo ou na frequência), aplicáveis à análise vocal.
Em geral, os nomes são associados aos procedimentos do método em si ou ao pesquisador que
os desenvolveu (como a Função de Autocorrelação para extração de f
0
ou o algoritmo de
McCandless para extração de formantes, respectivamente).
17
3.2 PARÂMETROS DESCRITIVOS DA VOZ
Os parâmetros capazes de descrever uma voz consistem nas características físicas do
som desta voz. Tais características são domínio da área de conhecimento da física acústica,
motivo pelo qual os parâmetros descritivos da voz são comumente denominados de
“parâmetros acústicos”. Da mesma forma, a análise que envolve obtenção de parâmetros
acústicos foi particularmente denominada de “análise acústica”, termo unânime na literatura
correlata.
É grande o número de parâmetros acústicos que podem ser estimados de um segmento
vocal, porém, a busca é sempre no caminho de definir quais parâmetros, associados ou
isolados, carregam informações a respeito da voz investigada. Os parâmetros temporais
(processados exclusivamente no domínio do tempo) estão associados à duração, de parte ou
de todo o segmento analisado, enquanto os espectrais (processados no domínio da frequência)
estão associados aos componentes da onda complexa (espectro da voz). A seguir serão
comentados os parâmetros investigados no presente trabalho.
3.2.1 Frequência Fundamental (f
0
) e Frequência dos Formantes (F
n
)
É amplamente conhecido que a voz é resultante do som produzido na glote a partir da
vibração das pregas vocais, acrescido de modificações nas cavidades de ressonância, que
funcionam como um filtro atenuando e enfatizando faixas de frequências (CARRARA-DE-
ANGELIS e col., 2001; PINHO, 2003). A frequência fundamental (f
0
)
e as frequências dos
formantes são parâmetros clássicos que caracterizam a fonte glótica e o filtro ressonantal,
respectivamente. Mais especificamente, a frequência fundamental corresponde ao
componente periódico mais baixo (grave) do som produzido na glote (GOLDFIELD, 2000) e
as faixas de frequência que apresentam picos de energia (determinados pelo filtro) são
denominadas de formantes (Fn)
(CARRARA-DE-ANGELIS e col., 2001; PINHO, 2003;
GREGIO, 2006; BAECK e SOUZA, 2007).
18
Em geral, os três primeiros formantes são os mais relevantes para os estudos da voz,
contudo, os dois primeiros, F
1
e F
2
, são os que apresentam uma associação clara com a
geometria do trato vocal, conferindo identidade fonética às vogais. (PINHO e CAMARGO,
2001; GREGIO, 2006; LIMA e col., 2007; MAGRI e col., 2007). A frequência do primeiro
formante está relacionada ao deslocamento da língua no plano vertical (altura da língua) e
com a abertura da mandíbula e a frequência do segundo formante relaciona-se ao
deslocamento ântero-posterior da língua (plano horizontal) (GREGIO, 2006). O terceiro
formante (F
3
) possui relação com as duas cavidades formadas pela posição da língua, ou seja,
uma cavidade atrás e outra à frente da constrição da língua (LIMA e col., 2007). No entanto,
correlações com os órgãos fonoarticulatórios ainda geram controvérsia na literatura.
A qualidade vocal de um indivíduo sofre influência da fonte sonora e do filtro, no
entanto, frequentemente a avaliação da fonte sonora é mais contemplada pelos pesquisadores
(STEFFEN e MOSCHETTI, 1997; NIEDZIELSKA, 2001; NIEDZIELSKA e col., 2001;
JOTZ e col., 2001; WERTZNER e col., 2005; FELIPPE e col., 2006; BRAGA e col., 2009,
SCHOTT e col., 2009).
3.2.2 Largura de Banda
A largura de banda do formante, simplesmente denominada de largura de banda ou
banda de formante consiste na extensão da faixa de frequência efetiva de resposta do
ressoador (MAGRI e col., 2009). Uma vez que a banda é variável em função da magnitude do
formante, em uma relação inversamente proporcional, os métodos de estimação da largura de
banda têm como base o intervalo entre dois pontos na envoltória espectral, que antecedem e
sucedem o pico, determinados por cortes onde a intensidade decresce 3 dB em relação à
frequência central do formante (pico da envoltória).
19
3.3 TRATO VOCAL INFANTIL
As bases anatômicas e fisiológicas da laringe infantil são relativamente pouco
conhecidas se comparadas às bases da laringe adulta. No entanto, sabe-se que a laringe
infantil não corresponde a uma miniatura da laringe do adulto, uma vez que existem diversas
diferenças entre elas (HERSAN, 2003).
O tamanho e o formato do trato vocal são fatores determinantes nas características do
som a ser emitido e dependem diretamente da idade e gênero. O trato vocal infantil é mais
curto que o trato vocal do adulto e, assim como nos adultos, observa-se uma diferença nas
medidas de comprimento se considerado o gênero da criança. Tendo como referência o trato
vocal adulto masculino, o trato infantil (oito anos) apresenta, em média, medidas 25% e 42%
menores, para meninos e meninas, respectivamente. Desta forma, as frequências dos
formantes são mais agudas em crianças do que em adultos, e mais agudas em meninas do que
nos meninos (BEHLAU e col., 2001).
Assim como o comprimento do trato vocal, o comprimento das pregas vocais infantis
também mostra suas particularidades. Hersan (2003) especifica que as medidas de
comprimento das pregas vocais mantêm-se bastante próximas, para ambos os gêneros, até a
idade de dez anos, quando começam a se diferenciar.
20
4. REVISÃO DA LITERATURA
4.1 A VOZ ENQUANTO OBJETO DE PESQUISA
As primeiras pesquisas de voz baseavam-se na percepção auditiva da mesma. As
avaliações da qualidade vocal eram realizadas através de julgadores treinados que, na maioria
das vezes, se concentravam nos aspectos glóticos e no campo das alterações vocais
(CAMARGO e MADUREIRA, 2004).
Embora a pesquisa sobre as alterações vocais exigisse grupos controle, ou seja,
indivíduos com as estruturas laríngeas saudáveis, a investigação da voz normal era
relativamente pouco enfocada. Com o surgimento de novas tecnologias de avaliação vocal
(análise acústica computadorizada) a possibilidade de investigar a voz patológica com um
conjunto de parâmetros sistemáticos, gerou a necessidade de se definir padrões paramétricos
de normalidade, motivando diversos pesquisadores a desenvolverem estudos focados na
produção da voz de indivíduos saudáveis (BUSBY e PLANT, 1995; HUBER e col., 1999;
CORAZZA e col., 2004; FELLIPE e col., 2006; BAECK e SOUZA, 2007, NICOLLAS e
col.; 2008, CAPPELLARI e CIELO, 2008, BRAGA e col., 2009, SCHOTT e col., 2009).
O uso da espectrografia na pesquisa da voz rendeu à literatura algumas publicações
fundamentais que deram luz a diversos estudos que se seguiram ao longo do tempo. Em 1952,
Peterson e Barney (citados em Behlau e col.,1988) investigaram parâmetros supraglóticos, ou
seja, as frequências dos três primeiros formantes de dez vogais do inglês americano em uma
amostra de 76 sujeitos (61 adultos e 15 crianças). Com base nos resultados deste trabalho, os
21
autores elaboraram o polígono acústico das vogais do inglês e formam historicamente
reconhecidos por tal contribuição. No entanto, quatro anos antes, 1948, Delattre (citado em
Behlau e col.,1988) já havia apresentado um triângulo acústico das vogais do francês,
elaborado com frequências dos dois primeiros formantes. Além do polígono vocálico francês,
Delattre desenvolveu um trabalho notável sobre a interpretação fisiológica dos
espectrogramas, relacionando as frequências dos três primeiros formantes com seus locais de
configuração no trato vocal (Delattre,1951).
As frequências dos dois primeiros formantes das vogais do português de Portugal
foram pesquisadas por Martins, em 1971 (citado em Behlau e col.,1988) a partir das vozes
normais de oito adultos do sexo masculino. Os achados de um estudo envolvendo o
português do Brasil, falado na cidade de São Paulo, foram publicados em 1984 (BEHLAU,
1984).
Com diversos objetivos específicos, vozes normais e/ou patológicas, aspectos glóticos
e/ou supraglóticos, a partir da década de 80, cresceu o número de publicações que utilizaram a
espectrografia computadorizada como ferramenta de avaliação da voz (GLAZE e col., 1988;
1990; BUSBY e PLANT, 1995; ANDRIANOPOULOS e col.; 2001; NEMR e col.; 2005). E,
a partir da década de 90, surgem os trabalhos com base na estimação de parâmetros
quantitativos com processamento digital de sinais e estimadores espectrais diferentes dos
implementados no espectrograma (HUBER e col., 1999, BAECK e SOUZA, 2004; 2007;
MAGRI e col., 2007, LIMA e col., 2007). Estas ferramentas vêm motivando pesquisadores
que apresentam um interesse especial pelo caráter objetivo proporcionado por essa
metodologia.
22
4.2 A VOZ INFANTIL
A voz infantil foi investigada de forma mais restrita em relação ao adulto. Os
primeiros estudos nesta população foram desenvolvidos na linha de estabelecer análises
comparativas com a voz adulta.
Já citados, Peterson e Barney, em 1952, desenvolveram um estudo que possivelmente
represente um dos pioneiros no que se refere à investigação da voz infantil (amostra de 61
adultos e 15 crianças). Além da análise perceptivo-auditiva com 76 julgadores, as frequências
dos três primeiros formantes das vogais da língua inglesa [a], [i], [u], [æ] foram analisadas a
partir do espectrograma. A amostra de falantes infantis foi composta por 15 crianças de ambos
os sexos na faixa etária de nove anos. Os resultados apontaram que as frequências dos
formantes diferiram substancialmente entre os indivíduos analisados de acordo com o sexo.
Eguchi e Hirsh (1969), citados em Busby e Plant (1995), pesquisaram através de análise
espectrográfica, as frequências dos dois primeiros formantes de vozes de 84 crianças entre
três e treze anos e adultos falantes do inglês americano. As vogais pesquisadas foram as
mesmas do estudo anterior, no entanto foram utilizadas sentenças no lugar de monossílabos.
O estudo mostrou decréscimo nas frequências dos formantes à medida que a idade da criança
aumentou e que estas mudanças foram mais significativas para crianças menores de cinco
anos e também para crianças de seis a treze anos.
Os estudos que se seguiram ao longo das décadas de 80 e 90 confirmaram, em linhas
gerais, tais achados, mostrando particularidades apenas nas faixas etárias. Behlau (1984)
investigou as frequências dos três primeiros formantes das sete vogais orais e cinco nasais do
português brasileiro a partir de espectrogramas gerados com tecnologia analógica. As vogais
foram emitidas de forma isolada e sustentada por 30 crianças entre oito e doze anos e 60
adultos entre 18 a 45 anos, todos pareados por sexo. A autora apontou que não foi possível o
registro espectrográfico da frequência do terceiro formante da vogal [u] em 37,7% das
23
emissões e apontou ainda que as relações entre as frequências de F
2
e F
1
foram praticamente
constantes para todas as vogais nos dois grupos de falantes. Segundo a autora, a constância
desta relação é que preserva a identidade fonética das vogais, mesmo que os valores absolutos
dos formantes sejam muito diferentes entre as idades e sexo. Os valores absolutos das
frequências dos formantes mostraram-se significativamente mais altos em crianças, em
relação aos 60 adultos. A diferença entre os formantes apresentados por crianças e adultos foi
atribuída às diferenças no tamanho do trato vocal destas populações. A autora não mencionou
ter investigado, nas crianças, diferenças nos parâmetros em função do gênero. Behlau refere
ter estimado também a frequência fundamental nessa mesma população, no entanto, somente
da vogal [a].
Glaze e col. (1988) investigaram os efeitos da idade, sexo, estatura e peso sobre a
produção vocal de 121 crianças com idades entre cinco e onze anos. A frequência
fundamental, jitter, shimmer e proporção harmônico-ruído foram estimados da vogal [a]
sustentada. Os autores obtiveram significância estatística na correlação entre frequência
fundamental e sexo, com valores maiores para as meninas. Num estudo semelhante,
envolvendo os mesmos parâmetros e faixa etária dos participantes, porém incluindo a vogal
[i] e três intensidades diferentes na emissão das vogais: fraca, normal e forte, os mesmos
autores investigaram uma amostra de 97 crianças (GLAZE e col., 1990). Os resultados
mostraram diferenças estatisticamente significantes com o aumento da intensidade, para os
quatro parâmetros investigados.
Em uma abordagem que incluiu vozes patológicas, Steffen e Moschetti (1997)
investigaram as medidas de jitter e shimmer em 131 crianças saudáveis e 117 disfônicas, entre
seis e dez anos. Os autores concluíram que estes parâmetros não foram eficazes para
determinar normalidade ou patologia vocal nestas crianças. Niedzielska e col. (2001), em
oposição, referiram que jitter, shimmer, assim como os demais parâmetros investigados,
24
frequência fundamental (f
0
), tremor da frequência fundamental e proporção harmônico-ruído,
se revelaram parâmetros relevantes na tarefa de diferenciar vozes normais e patológicas.
Neste estudo foram investigadas 46 crianças entre quatro e quatorze anos, nas condições pré e
pós-tratamento de nódulos vocais. No mesmo ano, a autora investigou os mesmos parâmetros
em desordens orgânicas e funcionais da voz, comparando 112 crianças portadoras de
diferentes distúrbios do aparelho fonador e 31 crianças sem alterações vocais (grupo
controle), com idades entre três e dezesseis anos (NIEDZIELSKA, 2001). Divergindo de suas
próprias conclusões, apontadas no trabalho anterior (NIEDZIELSKA e col., 2001), os achados
deste trabalho confirmaram diferença estatisticamente significante apenas para a proporção
harmônico-ruído.
Entre os trabalhos que priorizaram a investigação dos parâmetros acústicos
supraglóticos, as autoras chinesas Yang e Mu (1989) investigaram a frequência do terceiro
formante (F
3
) da vogal [a] em indivíduos saudáveis, sendo 209 crianças entre três e doze anos
(104 meninos e 105 meninas) e 40 adultos pareados por sexo. Contrariamente aos conceitos
tradicionais consagrados pela literatura, os resultados deste estudo mostraram que existe uma
significante diferença na frequência do terceiro formante da vogal [a] entre crianças do sexo
masculino e feminino. De acordo com as autoras, esta diferença começa a se desenvolver aos
três anos e se torna substancial aos seis anos de idade.
Em 1995, Busby e Plant estimaram a frequência fundamental e as frequências dos três
primeiros formantes do inglês australiano das vozes de 40 crianças divididas em quatro
grupos: cinco, sete, nove e onze anos, sendo cinco meninos e cinco meninas em cada grupo.
Os resultados mostraram que os valores da frequência fundamental decresceram com o
aumento da idade, porém não foram encontradas diferenças significativas deste parâmetro
entre os sexos. As frequências dos três primeiros formantes, da mesma forma, mostraram um
decréscimo em função do aumento da idade, sendo este decréscimo mais consistente nas
25
faixas de cinco a sete anos e nove a onze anos. Frequências mais altas para meninas
(diferenças entre sexos) foram observadas em F
1,
para vogais [æ], [a] e [u], e em F
2
para quase
todas as vogais.
Gilbert e col. (1997) inovaram no que se refere à faixa etária e ao delineamento
longitudinal da pesquisa. Foram investigadas as frequências dos dois primeiros formantes em
vocalizações espontâneas de quatro meninos entre 15 e 36 meses de vida. As gravações foram
realizadas em cinco momentos: aos 15, 18, 21, 24 e 36 meses de vida. Os resultados
indicaram que tanto o F
1
quanto o F
2
permaneceram relativamente imutáveis antes dos 24
meses de vida, porém passaram a assumir um comportamento descendente entre o 24º e 36º
mês.
Huber e col. (1999) desenvolveram um estudo abrangente envolvendo a f
0
e as
frequências e amplitudes dos três primeiros formantes em vozes de crianças e adultos falantes
do inglês norte americano. Cento e oitenta indivíduos foram pareados por sexo e dispostos em
grupos de 20 participantes cada, nas seguintes faixas etárias: 4,6,8,10,12,14,16,18 anos e 20 a
30 anos (adultos). A vogal [a] foi produzida três vezes por cada sujeito e as frequências dos
formantes foram obtidas através da análise de LPC (Linear Predictive Coding). As amplitudes
dos formantes foram medidas pela mais alta amplitude harmônica na área de cada formante.
Os resultados mostraram que a frequência do primeiro formante aumenta com a intensidade e
muda em função da idade e do sexo. As frequências de F
2
e F
3
mudam em função da idade e
do sexo. As amplitudes dos formantes seguiram as tendências das diferenças de níveis de
pressão sonora e não apresentaram mudanças em função do sexo e idade. A f
0
diminuiu com o
aumento da idade.
Lee e col. (1999) analisaram a variabilidade da duração, da frequência fundamental,
das frequências dos formantes e do envelope espectral em função do sexo e idade.
Participaram do estudo 436 crianças com idades entre cinco e dezessete anos e 56 adultos
26
(com idades entre 25 e 50 anos), falantes do inglês americano. Para obtenção das medidas, foi
utilizada uma sentença-veículo, porém para as crianças de cinco e seis anos foram utilizadas
repetições de palavras isoladas. As crianças foram divididas em grupos com intervalo de faixa
etária de um ano. Os resultados mostraram que a redução na variabilidade intra-sujeito dos
aspectos acústicos (temporais e espectrais) com a idade, é a maior tendência associada ao
desenvolvimento da fala/voz em crianças normais. Os autores ainda referiram que a
diferenciação entre a frequência fundamental masculina e feminina e entre os padrões de
frequências dos formantes, inicia-se aos onze anos e se torna totalmente estabelecida aos
quinze anos. Durante este período de tempo, as mudanças nas frequências dos formantes de
falantes masculinos mantêm uma relação aproximadamente linear com a idade, enquanto que
tal tendência é menos óbvia nos falantes do sexo feminino.
Perry e col. (2001) analisaram as medidas de frequência fundamental e frequência dos
três primeiros formantes de 80 crianças com idades de quatro a dezesseis anos. Os
participantes foram divididos em quatro grupos, nas seguintes faixas etárias: 4,8,12 e 16 anos,
sendo 20 em cada grupo, pareados por sexo. Os objetivos do estudo foram examinar estas
medidas acústicas e a habilidade de ouvintes em identificar os gêneros das vozes. Foram
analisadas sete vogais do inglês americano, sendo que as amostras vocais foram coletadas a
partir de uma sentença-veículo, na qual foram completados vocábulos com estas vogais. Num
segundo momento, 20 adultos tiveram a tarefa de identificar os gêneros das vozes gravadas.
Os resultados mostraram que a análise das frequências dos formantes pôde diferenciar os
gêneros, mesmo em crianças muito jovens (faixa etária de quatro anos), enquanto que a
análise da frequência fundamental pôde diferenciar os sexos após os doze anos.
27
4.3 O ESTADO DA ARTE
Nos últimos anos cresceu consideravelmente o número de publicações que
investigaram a voz infantil, sob seu aspecto patológico (BENETTON e col., 2004;
WERTZNER e col.; 2005; MOURA e col., 2008; HAMDAN e col., 2009; ANDRADE, 2009)
ou, em condições de normalidade (VANZELLA, 2006; FUCHS e col., 2007; NICOLLAS e
col., 2008; BAKER e col., 2008; CAPPELLARI e CIELO, 2008; SCHOTT e col., 2009;
BRAGA e col., 2009), mostrando que o estudo dessa população é uma tendência atual. Os
métodos utilizados para avaliar as vozes das crianças nestes estudos mostram-se
diversificados.
Benetton e col. (2004) investigaram os efeitos da rinite alérgica sobre a qualidade da
voz de 40 crianças alérgicas entre sete e doze anos, baseados exclusivamente em parâmetros
psicoacústicos. A análise comparativa com o grupo controle não confirmou diferenças
estatisticamente significantes para nenhum parâmetro investigado. Wertzner e col. (2005)
avaliaram 20 crianças com transtorno fonológico e 20 crianças sem o transtorno entre quatro e
dez anos, a partir das emissões isoladas e sustentadas das vogais [a], [ε] e [i]. A frequência
fundamental da vogal [ε] e as médias de intensidade vocal apresentaram-se menores no grupo
com transtorno fonológico em relação ao grupo controle. Andrade (2009) investigou a f
0
e as
frequências de F
1
, F
2
e F
3
das vogais [a], [i] e [u] em 50 crianças respiradoras orais de cinco a
dez anos e comparou ao grupo controle. A autora encontrou diferenças estatísticas na f
0
das
vogais [i] e [u], no entanto diferenças estatísticas nas frequências dos formantes não foram
encontradas entre os dois grupos.
Os parâmetros acústicos e psicoacústicos das vozes de crianças portadoras da
síndrome de Down (MOURA e col., 2008) e síndrome de déficit de atenção e hiperatividade
(HAMDAN e col., 2009) apontaram uma frequência fundamental mais grave para as crianças
com as síndromes, ao serem comparadas com os grupos controle. Além da diferença
28
observada na frequência fundamental, a pesquisa que envolveu crianças com síndrome de
Down, ainda apontou diferenças significativas nas frequências de F
1
e F
2
, sendo que a relação
entre as frequências de F
1
e F
2
revelou um prejuízo na distinção das vogais no grupo com a
síndrome, refletindo uma diminuição na inteligibilidade da fala.
Entre os autores que contribuíram para a compreensão das características da voz em
crianças normais, encontra-se Vanzella (2006), que investigou 182 crianças entre sete a dez
anos, de ambos os gêneros, frequentadores de escolas públicas e particulares de São Carlos
(SP). A partir de uma análise acústica computadorizada da vogal sustentada [a], a autora
referiu ter obtido, entre outros parâmetros pouco descritos na literatura, uma frequência
fundamental média de 237 Hz para os participantes.
Fuchs e col. (2007) analisaram vozes de 21 meninos que cantavam profissionalmente
em um coral, com objetivo de verificar o potencial da análise acústica para estimar o início da
muda vocal. Com um delineamento longitudinal, a mesma criança teve sua voz falada gravada
mensalmente, durante um período de três anos, entre nove e doze anos, e reavaliada uma vez
entre treze e quinze anos. Os resultados mostraram mudanças significativas nas medidas de
irregularidade da frequência fundamental e intensidade (jitter e shimmer, repectivamente) em
torno de seis meses antes da muda vocal, levando os autores a concluírem pela efetividade
destes parâmetros acústicos na detecção do início da muda vocal.
Nicollas e col. (2008) investigaram as vozes de 212 crianças entre seis e doze anos
com o objetivo de investigar mudanças nas vozes de crianças normais antes da muda vocal.
Além da estimação da frequência fundamental (f
0
), do jitter e do shimmer, foram estimados
outros parâmetros pouco descritos na literatura. Os participantes foram divididos nas
seguintes faixas etárias: seis anos (9 crianças); sete anos (24 crianças); oito anos (18 crianças);
nove anos (24 crianças); dez anos (27 crianças); onze anos (55 crianças); doze anos (54
crianças). Os sinais analisados referem-se a trechos de um segundo recortados da emissão
29
sustentada da vogal [a]. Os resultados mostraram que a f
0
decresceu de 268 Hz para 234 Hz
em meninos e 260 Hz para 239 Hz em meninas e que as medidas de jitter e shimmer não
variaram significantemente com o sexo e a idade. Os autores concluíram que a f
0
diminuiu
com a idade e foi menor para os meninos em relação às meninas mesmo antes do período de
mutação da voz.
Baker e col. (2008) investigaram a influência do tipo de tarefa vocal na medida da
frequência fundamental (f
0
), em 48 crianças saudáveis falantes do inglês americano, com
idades entre cinco anos e sete anos e onze meses. A frequência fundamental da vogal [a] foi
estimada em quatro situações vocais diferenciadas: a) sustentada por cinco segundos; b)
sustentada dentro de uma palavra, no final de uma frase; c) repetição de uma frase e d)
contagem de um até dez. Cada criança foi avaliada por dois julgadores treinados, sendo que os
resultados revelaram uma significante diferença neste parâmetro entre as tarefas. A contagem
apontou valores maiores de f
0
quando comparada com a sustentação da vogal no final da frase
e a repetição da frase, no entanto, não foram observados efeitos significativos das tarefas em
relação à idade e ao sexo. Os autores não mencionaram comparação com a vogal sustentada.
No mesmo ano, Cappellari e Cielo realizaram uma pesquisa que analisou medidas
acústicas de vozes saudáveis de 23 crianças brasileiras, dividas em três faixas etárias: 4,0 a
4,11 (n=7), 5,0 a 5,11 (n=11), 6,0 a 6,8 (n=5). Foram analisadas as medidas de f
0
, proporção
harmônico-ruído (PHR), índice de turbulência vocal e medidas de perturbação da intensidade
e f
0
, a partir da vogal [a] sustentada por no mínimo três segundos. Para seleção das crianças,
as autoras utilizaram questionário com os pais, triagem auditiva e avaliação perceptivo-
auditiva (Escala RASAT). Os resultados das médias mínimas e máximas para determinação
do intervalo de normalidade da frequência fundamental, por faixa etária, foram: 4 anos, sexo
masculino (M): 266 Hz a 375 Hz; 4 anos, sexo feminino (F): 285 Hz a 355 Hz; 5 anos, sexo
M: 247 Hz a 350 Hz; 5 anos, sexo F: 247 Hz a 355 Hz; 6 anos, sexo M: 274 Hz a 325 Hz e 6
30
anos, sexo F: 247 a 315 Hz. Os resultados mostraram ainda que no grupo de quatro anos de
idade, a f
0
foi discretamente menor em relação à literatura, o índice de variação da f
0
foi maior
em relação aos outros grupos e que houve significante diferença na PHR entre esse grupo e os
demais.
Um estudo realizado no estado do Rio de Janeiro (SCHOTT e col., 2009) avaliou a
frequência fundamental de 122 crianças normais de seis a oito anos, de ambos os sexos.
Foram realizadas análise perceptivo-auditiva, através da escala RASAT e análise acústica
computadorizada. Foi investigada a frequência fundamental
da vogal [ε] sustentada. Os
resultados mostraram que a média da f
0
foi 239 Hz para as meninas e 237 Hz para os meninos,
obtendo-se desta forma, uma média geral de 238 Hz. O estudo também contemplou valores de
moda de f
0
, sendo 237 Hz no sexo feminino e 233 Hz no sexo masculino, obtendo-se a média
da moda de 235 Hz.
BRAGA e col. (2009) analisaram a frequência fundamental da vogal [ε] do português
brasileiro em 100 crianças, na faixa etária de seis a oito anos, pareadas por sexo. Os
participantes passaram por uma triagem vocal realizada através de avaliação perceptivo-
auditiva (escala RASAT) e a investigação da f
0
foi realizada a partir de análise
computadorizada (com o auxílio do programa Voxmetria). Os resultados mostraram uma f
0
média de 249 Hz, com tendência significantemente decrescente à medida que a idade da
criança aumentou. Os autores ainda apontaram para diferenças estatísticas entre os sexos, de
forma que, aos seis anos, observaram-se valores de f
0
mais elevados nos meninos. A tendência
decrescente de f
0
, frente ao aumento da idade, mostrou-se mais significativa nos meninos, do
que nas meninas.
31
5. METODOLOGIA
O projeto deste trabalho foi aprovado pelo Comitê de Ética em Pesquisa da Secretaria
Municipal de Saúde da Prefeitura do Rio de Janeiro sob número: 180/2008, com necessidade
de assinatura do Termo de Consentimento Livre e Esclarecido (apêndice A). O estudo foi
realizado pela autora em uma sala do setor de fonoaudiologia da Policlínica Maria Cristina
Roma Paugartten (SMS - CAP. 3.1).
5.1 CASUÍSTICA
A amostra do presente trabalho foi constituída por segmentos vocais de crianças de
quatro a oito anos. Obteve-se uma amostra de 1.449 segmentos vocais de 207 crianças
divididas por sexo e idade. Esses segmentos geraram 13.041 valores numéricos relativos aos
parâmetros investigados.
As crianças foram pré-selecionadas nos setores de pediatria e odontologia da
Policlínica Maria Cristina Roma Paugartten e em duas escolas. A pré-seleção foi realizada
pelos profissionais de saúde e educação destas unidades, respeitando os critérios: condições
de expressão oral e saúde geral dentro dos padrões de normalidade, idade entre quatro e oito
anos.
Uma vez pré-selecionadas, as crianças foram encaminhadas para o setor de
fonoaudiologia da Policlínica Maria Cristina Roma Paugartten onde foram submetidas a
32
procedimentos de seleção (item 5.3.1). Foram selecionadas crianças cuja expressão oral e
qualidade vocal apresentaram-se dentro dos padrões de normalidade.
5.2 MATERIAIS
5.2.1 Materiais de seleção de participantes
- Escala RASATI (anexo A): Consiste em um protocolo de avaliação perceptivo-auditiva da
fonte glótica proposto por Pinho e Pontes (2008);
- Roteiro de avaliação do sistema ressonantal (apêndice B): Consiste em uma adaptação do
roteiro de avaliação perceptivo-auditiva do som nas cavidades supraglóticas proposto por
Pinho (2003).
5.2.2 Materiais de aquisição e análise de dados
- Um notebook, marca HP, modelo DV 1000, com sistema operacional Windows XP;
- Software de análise acústica Praat versão 5008 disponível on line no site:
http://www.fon.hum.uva.nl/praat/
- Microfone marca SHURE, modelo SM 58.
- Software aplicativo de análise estatística SAS versão 6.04
5.3 PROCEDIMENTOS
5.3.1 Procedimentos de seleção dos participantes
Assim como descrito na casuística, as crianças da presente pesquisa foram incluídas
mediante procedimentos de seleção. Neste item serão descritos os procedimentos realizados
após a pré-seleção e encaminhamento ao setor de fonoaudiologia.
No setor citado as crianças foram recebidas, juntamente com seus pais ou
responsáveis, em uma entrevista individual com a fonoaudióloga autora da presente pesquisa,
onde foram submetidas a uma triagem da expressão oral através do exame fonético REALFA.
A triagem teve como objetivo a exclusão de crianças com expressão oral desviante do padrão
33
adequado à faixa etária. Concomitantemente, a fala espontânea e as sentenças-veículo foram
gravadas com objetivo de dar suporte à posterior análise perceptivo-auditiva, fase de
prosseguimento seletivo, caso a criança não tivesse sido excluída por inadequação da
expressão oral. Os pais ou responsáveis assinaram o Termo de Consentimento Livre e
Esclarecido durante a entrevista.
A análise perceptivo-auditiva foi realizada por duas fonoaudiólogas especialistas em
voz com aplicação da Escala RASATI e roteiro de avaliação do sistema ressonantal (item
5.2.1). Foram incluídas as crianças que apresentaram resultados dentro dos padrões de
normalidade em ambas as avaliações. Foram consideradas normais na avaliação da fonte
glótica crianças que apresentaram: grau 0 nos seis itens avaliados, com exceção do item
soprosidade que poderia apresentar grau 0 ou 1. Esta tolerância foi permitida uma vez que a
população infantil pode apresentar soprosidade em grau 1 (discreto) como padrão de
normalidade (Behlau e col., 2001). Foram consideradas normais na avaliação de ressonância
as crianças que apresentaram ressonância equilibrada.
5.3.2 Aquisição de Dados
O protocolo de aquisição especificado a seguir é semelhante ao aplicado nos estudos
de Jorge e col. (2004); Lima e col. (2007) e Magri e col. (2007).
Os sinais de fala dos quais foram extraídos os segmentos analisados foram obtidos a
partir das gravações de sentenças-veículo (“Fale____ para mim”), que foram preenchidas com
os vocábulos “pápa”, “pépe”, “pêpe”, “pípi”, “pópo”, “pôpo” e “púpu”, de forma que estes
estímulos fossem registrados por meio de repetições destas frases. Foram selecionados
segmentos das sete vogais orais em posição tônica para a estimação das medidas de
frequência fundamental (f
0
), frequência dos formantes (F
1
, F
2
e F
3
) e largura de banda de F
1
da vogal [i].
34
As emissões foram gravadas em uma sala silenciosa, em mono canal, com uma taxa de
amostragem de 22.050 Hz, em formato “.wav”, através do software Praat versão 5008 em um
notebook com sistema operacional Windows XP, com um microfone da marca SHURE,
modelo SM 58, posicionado a distância de 10 cm dos lábios da criança.
5.3.3 Processamento de sinais
Os dados foram submetidos a procedimentos de pré-processamento (recorte dos
segmentos vocálicos), processamento (estimação de parâmetros acústicos) e análise
estatística. O pré-processamento e processamento foram realizados com auxílio do software
Praat (item 5.2.2.), enquanto que a análise estatística foi realizada com o software SAS 6.04
(SAS Institute, Inc., Cary, North Carolina)
O recorte das vogais foi realizado de forma manual, porém houve a preocupação em
definir e seguir critérios de recorte passíveis de serem implementados em um futuro sistema
de recorte automático. O marco inicial foi definido no trecho do sinal onde a energia
apresentava-se acima de 20% da energia máxima. Da mesma forma, o marco final foi
estabelecido onde a energia apresentava-se abaixo de 20% da mesma. Tal porcentagem foi
estabelecida empiricamente com base em investigação experimental. Este procedimento é
conservador no sentido de reduzir a probabilidade de obtenção de trechos não estacionários.
Foram estimados os parâmetros espectrais clássicos: frequência fundamental e
frequência dos três primeiros formantes, representantes da fonte glótica e de ressonância,
respectivamente. Além destes, foi estimada a largura de banda do primeiro formante da vogal
[i]. Esta análise não foi estendida aos demais segmentos vocálicos pesquisados por se tratar de
uma investigação complementar de caráter exploratório. A vogal [i] foi definida, em especial,
devido ao afastamento característico dos dois primeiros formantes observado na envoltória
espectral da mesma.
35
Devido ao grande número de estimações envolvidas, foi utilizado um script
(ferramenta que extrai automaticamente, de forma padronizada, as medidas paramétricas)
criado pelos autores, que viabilizou a otimização do tempo de processamento e evitou
possíveis erros de manuseio na sequência dos procedimentos de estimação.
5.3.4 Análise estatística
A análise estatística foi composta pelos seguintes métodos:
Para comparação das medidas de frequência fundamental e frequência dos formantes
entre os sexos foi utilizado o teste de Mann-Whitney e para comparação entre as quatro faixas
etárias foi realizada a análise de variância de Kruskal-Wallis e o teste de comparações
múltiplas de Duncan. Foi usado teste não paramétrico, pois a maioria das medidas de
frequências não apresentou distribuição normal (Gaussiana), devido à dispersão dos dados,
falta de simetria da distribuição e pela rejeição da hipótese de normalidade segundo o teste de
Shapiro-Wilk (W). O critério de determinação de significância adotado foi o nível de 5%, ou
seja, valor de p menor ou igual a 0,05.
36
6. RESULTADOS
Os achados da presente pesquisa encontram-se sumarizados nas tabelas expostas a
seguir. Além da descrição dos dados, testes estatísticos foram aplicados com o objetivo de
verificar a existência de diferenças estatisticamente significantes entre os valores paramétricos
obtidos para os sexos masculino e feminino, assim como para as quatro diferentes faixas
etárias investigadas.
São expostos os valores referentes à análise espectral, sendo que todos os valores
expostos referem-se à estimação de médias. A opção por expor diretamente valores médios
deu-se em função do grande número de estimações obtidas neste trabalho, um total de 13.041
valores numéricos. Pelo mesmo motivo, os achados referentes aos parâmetros acústicos foram
divididos em 23 tabelas, de acordo com cada vogal, para facilitar a visualização direta do
comportamento do parâmetro acústico ao longo do desenvolvimento infantil.
Tabela I - Distribuição dos informantes por faixa etária e sexo.
4-5 anos 5-6 anos 6-7 anos 7-8 anos
Masculino n = 22 n = 28 n = 24 n = 24
Feminino n = 21 n = 33 n = 29 n = 26
37
A seguir encontram-se expostos os valores referentes à análise da frequência
fundamental (f
0
) e das frequências dos três primeiros formantes das sete vogais orais do
português e os achados referentes aos testes de diferença estatística (Tabelas II a XXIIII).
Tabela II - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal [a]
4-5 anos 5-6 anos 6-7 anos 7-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 270 26,1 259 24,5 258 25,3 243 22,4
f
0
(Hz)
fem 259 24,1 247 22,1 256 27,5 246 28,0
masc 1093 193,9 1010 219,8 984 88,5 870 195,4
F
1
(Hz)
fem 1187 163,3 1256 154,3 1131 175,6 1048 132,1
masc 2003 156,4 1889 180,5 1814 157,6 1668 201,3
F
2
(Hz)
fem 2157 190,0 2141 143,8 2063 174,8 1914 187,2
masc 3593 408,7 3536 404,2 3480 224,0 3326 211,8
F
3
(Hz)
fem 3661 357,7 3528 310,5 3476 316,9 3402 276,0
Tabela III - Teste de Diferença Estatística para a Variável Sexo na Vogal [a]
Parâmetros p valor
[a] f
0
0,099
[a] F
1
0,0001*
[a] F
2
0,0001*
[a] F
3
0,24
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
38
Tabela IV - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [a]
Comparações Múltiplas de Duncan
Parâmetros p valor
G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 G3/G4
[a] f
0
0,001* * * *
[a] F
1
0,0001* * * *
[a] F
2
0,0001* * * * *
[a] F
3
0,001* * * *
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
Tabela V - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal [ε]
4-5 anos 5-6 anos 6-7 anos 7-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 266 21,5 248 34,2 266 21,9 245 23,5
f
0
(Hz)
fem 258 19,1 250 19,1 252 23,9 246 29,0
masc 719 106,6 666 125,6 735 86,0 656 108,4
F
1
(Hz)
fem 735 134,9 734 91,1 728 94,7 713 105,8
masc 2688 205,4 2659 157,2 2585 187,5 2521 187,8
F
2
(Hz)
fem 2850 128,0 2851 183,1 2721 233,3 2647 135,6
masc 3652 329,8 3656 278,3 3641 255,6 3519 268,1
F
3
(Hz)
fem 3824 357,8 3790 246,7 3678 240,6 3579 168,2
39
Tabela VI - Teste de Diferença Estatística para a Variável Sexo na Vogal [ε]
Parâmetros p valor
[ε] f
0
0,092
[ε] F
1
0,048*
[ε] F
2
0,0001*
[ε] F
3
0,007*
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
Tabela VII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [ε]
Comparações Múltiplas de Duncan
Parâmetros p valor
G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 G3/G4
[ε] f
0
0,0003*
* * *
[ε] F
1
0,15
[ε] F
2
0,0001*
* * * *
[ε] F
3
0,0005*
* * *
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
40
Tabela VIII - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal [e]
4-5 anos 5-6 anos 6-7 anos 7-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 275 24,5 258 25,3 271 20,9 252 25,1
f
0
(Hz)
fem 267 15,1 252 18,3 260 24,1 247 27,3
masc 534 52,7 496 55,4 530 46,0 493 54,1
F
1
(Hz)
fem 528 43,0 496 45,2 515 58,1 482 62,9
masc 2929 167,4 2924 184,1 2830 212,0 2739 164,6
F
2
(Hz)
fem 3043 162,6 3096 187,6 2913 226,9 2832 179,6
masc 3814 273,4 3806 213,6 3656 228,0 3553 232,0
F
3
(Hz)
fem 3837 256,8 3844 272,6 3728 236,5 3665 195,9
Tabela IX - Teste de Diferença Estatística para a Variável Sexo na Vogal [e]
Parâmetros p valor
[e] f
0
0,038*
[e] F
1
0,24
[e] F
2
0,0001*
[e] F
3
0,048*
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
41
Tabela X - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [e]
Comparações Múltiplas de Duncan
Parâmetros p valor
G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 G3/G4
[e] f
0
0,0001*
* * * *
[e] F
1
0,0001*
* * * *
[e] F
2
0,0001*
* * * * *
[e] F
3
0,0001*
* * * *
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
Tabela XI - Média e Desvio Padrão de Frequência Fundamental, Frequências do Primeiro,
Segundo e Terceiro Formantes e Largura de Banda de F
1
da vogal [i]
4-5 anos 5-6 anos 6-7 anos 7-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 301 30,8 279 30,6 288 24,1 275 34,0
f
0
(Hz)
fem 287 30,2 276 22,7 282 27,3 272 37,3
masc 354 46,3 363 57,2 325 28,1 319 26,4
F
1
(Hz)
fem 375 64,6 351 61,7 355 52,4 360 60,9
masc 3094 208,6 3073 167,0 3014 209,7 2999 172,3
F
2
(Hz)
fem 3233 142,8 3176 208,1 3105 257,3 3036 130,0
3868 294,4 3849 285,7 3665 246,3 3738 250,6
F
3
(Hz)
masc
fem
4077 341,8 3945 308,2 3856 271,6 3760 258,5
masc
85 52,7 66 37,7 69 32,9 68 32,4
Larg. Banda
fem
73 46,8 80 40,9 90 45,1 76 38,5
42
Tabela XII - Teste de Diferença Estatística para a Variável Sexo na Vogal [i]
Parâmetros p valor
[i] f
0
0,081
[i] F
1
0,050*
[i] F
2
0,002*
[i] F
3
0,003*
[i] Larg Banda 0,12
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
Tabela XIII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [i]
Comparações Múltiplas de Duncan
Parâmetros p valor G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 G3/G4
[i] f
0
0,003*
* *
[i] F
1
0,080
[i] F
2
0,0004*
* * *
[i] F
3
0,0008*
* * * *
Larg Banda 0,78
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
43
Tabela XIV - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal []
4-5 anos 5-6 anos 6-7 anos 7-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 271 24,2 254 26,4 263 19,9 256 26,1
f
0
(Hz)
fem 256 24,2 250 18,0 255 25,6 251 26,7
masc 733 117,4 691 112,1 753 107,0 755 140,5
F
1
(Hz)
fem 696 140,2 766 130,3 752 108,6 741 119,7
masc 1285 146,7 1158 162,0 1180 135,4 1177 157,8
F
2
(Hz)
fem 1255 170,1 1277 138,8 1246 143,2 1214 168,6
masc 3581 395,3 3528 413,7 3565 207,1 3512 308,2
F
3
(Hz)
fem 3843 276,7 3760 329,1 3659 278,1 3475 211,2
Tabela XV - Teste de Diferença Estatística para a Variável Sexo na Vogal []
Parâmetros p valor
[] f
0
0,013*
[] F
1
0,46
[] F
2
0,010*
[] F
3
0,001*
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
44
Tabela XVI - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal []
Comparações Múltiplas de Duncan
Parâmetros p valor G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 G3/G4
[] f
0
0,050*
* *
[] F
1
0,43
[] F
2
0,10
[] F
3
0,004*
* *
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos; G3=6 a 7 anos; G4=7 a 8 anos.
Tabela XVII - Média e Desvio Padrão de Frequência Fundamental e Frequências do
Primeiro, Segundo e Terceiro Formantes da vogal [o]
4-5 anos
5-6 anos 6-7 anos 7-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 281 26,3 261 22,7 267 22,4 257 23,8
f
0
(Hz)
fem 259 40,5 260 21,0 260 23,2 253 30,4
masc 572 65,6 532 59,8 552 55,8 512 83,2
F
1
(Hz)
fem 543 53,7 534 74,6 568 85,8 518 63,6
masc 1129 129,9 953 124,0 1049 126,0 1029 203,9
F
2
(Hz)
fem 1126 113,8 1040 124,1 1064 151,1 1022 141,9
masc 3652 314,7 3651 295,0 3578 251,8 3583 259,7
F
3
(Hz)
fem 3829 297,8 3778 282,1 3714 336,9 3592 248,0
45
Tabela XVIII - Teste de Diferença Estatística para a Variável Sexo na Vogal [o]
Parâmetros p valor
[o] f
0
0,046*
[o] F
1
0,99
[o] F
2
0,12
[o] F
3
0,005*
p=nível descritivo do teste de Mann-Whitney; *expressa diferença significativa (nível de 5%).
Tabela XIX - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [o]
Comparações Múltiplas de Duncan
Parâmetros p valor G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 G3/G4
[o] f
0
0,008*
*
[o] F
1
0,001*
* *
[o] F
2
0,0001*
* * *
[o] F
3
0,038*
* *
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
46
Tabela XX - Média e Desvio Padrão de Frequência Fundamental e Frequências do Primeiro,
Segundo e Terceiro Formantes da vogal [u]
4-5 anos 5-6 anos 6-7 anos 7-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 313 35,5 282 40,4 299 34,8 279 26,5
f
0
(Hz)
fem 295 25,9 298 39,9 284 27,8 277 40,7
masc 474 79,2 482 71,8 462 76,4 433 80,0
F
1
(Hz)
fem 476 65,3 478 97,5 495 57,8 453 59,0
masc 1515 905,8 1580 1015,7 1604 1053,8 1630 1078,1
F
2
(Hz)
fem 1596 880,1 1539 965,3 1771 1061,4 1583 1043,8
masc 3815 495,5 3850 513,4 3797 511,3 3708 439,9
F
3
(Hz)
fem 3808 347,4 3948 472,6 3976 457,0 3796 469,0
Tabela XXI - Teste de Diferença Estatística para a Variável Sexo na Vogal [u]
Parâmetros p valor
[u] f
0
0,42
[u] F
1
0,24
[u] F
2
0,90
[u] F
3
0,066
p=nível descritivo do teste de Mann-Whitney
47
Tabela XXII - Teste de Diferença Estatística para a Variável Faixa Etária (Gn) na Vogal [u]
Comparações Múltiplas de Duncan
Parâmetros p valor G1/G2 G1/G3 G1/G4 G2/G3 G2/G4 G3/G4
[u] f
0
0,008*
*
[u] F
1
0,052*
* * *
[u] F
2
0,90
[u] F
3
0,33
p=nível descritivo da ANOVA de Kruskal-Wallis; *expressa diferença significativa (nível de 5%);
G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
Embora os valores de diferença estatística já tenham sido expostos, a tabela XXIII
mostra uma visão global de tais achados para todos os parâmetros e vogais investigados no
presente trabalho.
48
Tabela XXIII – Análise Comparativa entre os Sexos e entre as Faixas Etárias
das Medidas de f
0
e Frequências dos Formantes para todas as Vogais Investigadas
e Largura de Banda de F
1
da vogal [i]
Sexo Fx etárias Comparações Múltiplas de Duncan
Parâm. p valor
a
p valor
b
G1 x G2 G1 x G3 G1 x G4 G2 x G3 G2 x G4 G3 x G4
[a] f
0
0,099 0,001* * * *
[a] F
1
0,0001* 0,0001* * * *
[a] F
2
0,0001* 0,0001* * * * *
[a] F
3
0,24 0,001* * * *
[ε] f
0
0,092 0,0003* * * *
[ε] F
1
0,048* 0,15
[ε] F
2
0,0001* 0,0001* * * * *
[ε] F
3
0,007* 0,0005* * * *
[e] f
0
0,038* 0,0001* * * * *
[e] F
1
0,24 0,0001* * * * *
[e] F
2
0,0001* 0,0001* * * * * *
[e] F
3
0,048* 0,0001* * * * *
[i] f
0
0,081 0,003* * *
[i] F
1
0,050* 0,080
[i] F
2
0,002* 0,0004* * * *
[i] F
3
0,003* 0,0008* * * * *
Larg Bd 0,12 0,78
[] f
0
0,013* 0,050* * *
[] F
1
0,46 0,43
[] F
2
0,010* 0,10
[] F
3
0,001* 0,004* * *
[o] f
0
0,046* 0,008* *
[o] F
1
0,99 0,001* * *
[o] F
2
0,12 0,0001* * * *
[o] F
3
0,005* 0,038* * *
[u] f
0
0,42 0,008* *
[u] F
1
0,24 0,052* * * *
[u] F
2
0,90 0,90
[u] F
3
0,066 0,33
a
nível descritivo do teste de Mann-Whitney;
b
nível descritivo da ANOVA de Kruskal-Wallis; *: expressa
diferença significativa, ao nível de 5%; G1=4 a 5 anos; G2=5 a 6 anos ; G3=6 a 7 anos; G4=7 a 8 anos.
49
7. DISCUSSÃO
A presente discussão foi desenhada de forma a contemplar dois itens principais: a
discussão sobre as medidas dos parâmetros espectrais da voz infantil e a discussão sobre a
hipótese da existência de diferenças paramétricas atribuídas à faixa etária e ao gênero da
criança.
7.1 MEDIDAS DOS PARÂMETROS ESPECTRAIS
Os parâmetros espectrais investigados no presente trabalho, frequência fundamental,
formantes e largura de banda serão comentados isoladamente, nesta sequência.
Frequência Fundamental
As medidas da frequência fundamental estimadas no presente estudo mostraram
valores que variam em torno de: vogal [a]: 243 a 270 Hz (média: 254 Hz), vogal [ε] 245 a 266
Hz (média: 253 Hz), vogal [e] 247 a 275 Hz (média: 260 Hz), vogal [i] 272 a 301 Hz (média:
282 Hz), vogal [] 250 a 271 Hz (média: 257 Hz), vogal [o] 253 a 281 Hz (média: 262 Hz) e
vogal [u] 277 a 313 Hz (média: 290 Hz). A literatura que investiga a voz infantil saudável
apresenta diversas publicações que contemplam a vogal [a] e algumas que contemplam a
50
vogal [ε]. De forma geral, os valores obtidos para a vogal [a] e [ε] no presente trabalho
corroboram aqueles descritos na literatura.
Cappellari e Cielo (2008) investigaram a frequência fundamental exclusivamente da
vogal [a] da voz de crianças de quatro a seis anos e oito meses falantes do português e
apontaram uma média de f
0
na amostra de 252 Hz. Além da convergência no que se refere ao
valor médio da f
0
de [a], podem ser observados valores semelhantes ao comparar os achados
das duas pesquisas, divididos por faixa etária e gênero. Enquanto os autores da literatura
mostraram intervalos de: 266-375 Hz e 285-355 Hz (4 anos); 247-350 Hz e 247-355 Hz (5
anos); 247-325 Hz e 247-315 Hz (6 anos) para os sexos masculino e feminino,
respectivamente, os dados do presente estudo mostraram valores médios de: 270 Hz e 259 Hz
(4 anos); 259 Hz e 247 Hz (5 anos); 258 Hz e 256 Hz (6 anos) masculino e feminino,
respectivamente.
Os resultados apresentados para a vogal [a] por Behlau (1984) mostram uma
frequência fundamental média mais grave, 235 Hz. Uma vez que a faixa etária investigada
pela autora, de oito a doze anos, não corresponde à faixa etária investigada no presente
trabalho, não é possível afirmar que os dois trabalhos não se corroboram entre si.
Autores internacionais também investigaram a frequência fundamental da vogal [a].
Ao contemplar vozes de crianças de seis a doze anos, Nicollas e col. (2008) observaram que a
f
0
decresceu de 268 Hz para 234 Hz em meninos e 260 Hz para 239 Hz em meninas. É
interessante observar que os valores iniciais, que correspondem à faixa etária mais próxima de
6 anos, encontram-se próximos aos resultados apontados no presente trabalho e os valores
finais correspondentes à faixa de 12 anos, corroboram os valores obtidos por Behlau (1984).
Busby e Plant (1995) investigaram a f
0
em crianças de cinco a onze anos em diversas vogais
do inglês e os resultados apontaram valores de frequência fundamental decrescentes com o
aumento da idade. Ainda no que se refere ao valor médio de f
0
da vogal [a] Baker e col.
51
(2008) encontraram uma média de 240 Hz na emissão sustentada em crianças de cinco a oito
anos, sendo este valor proximal à estimação mais baixa de f
0
para a vogal [a] obtida no
presente trabalho. Huber e col. (1999) apontaram valores médios de f
0
para ambos os sexos,
masculino e feminino, de: 266 Hz e 256 Hz (4 a 6 anos); 246 Hz e 261 Hz (6 a 8 anos). Se os
valores do presente trabalho forem agrupados com as mesmas faixas etárias poderão ser
observados achados basicamente convergentes: 263 Hz e 253 Hz (4 e 6 anos); 250 e 251 Hz
(6 e 8 anos), sendo o valor correspondente ao sexo feminino na faixa de 6 a 8 anos, sutilmente
mais elevado nos achados dos autores comentados.
Assim como a vogal [a], a medida de f
0
da vogal [ε] da voz infantil também foi
apresentada na literatura. Schott e col. (2009) investigaram valores de f
0
da vogal [ε] em
crianças de seis a oito anos. Os valores apontados variam entre: 233 Hz e 251 Hz, com média
de 238 Hz. Em estudo semelhante em termos de faixa etária e vogal analisada, Braga e col.
(2009) obtiveram variações de f
0
entre 226 Hz e 277 Hz, com média de 249 Hz. Os resultados
para a vogal [ε] do presente trabalho foram: 245 a 266 Hz, com média de 253 Hz. Os valores
apontados pelos dois autores da literatura não convergem entre si, sendo que o primeiro grupo
de autores citado mostra valores mais baixos. A outra pesquisa mostra um valor médio de f
0
semelhante ao valor apontado no presente estudo, porém apresenta uma faixa dinâmica
consideravelmente mais larga, tanto no que se refere à frequência fundamental mínima quanto
à máxima. Os trabalhos em questão apresentam algumas diferenças referentes ao tamanho da
amostra e metodologia de estimação da frequência fundamental.
Frequência de Formantes
As médias das frequências dos três primeiros formantes estimadas no presente estudo
foram: vogal [a] 1078 Hz, 1961 Hz e 3497 Hz; vogal [ε] 710 Hz, 2694 Hz e 3669 Hz; vogal
52
[e] 507 Hz, 2918 Hz e 3740 Hz; vogal [i] 350 Hz, 3092 Hz e 3845 Hz; vogal [] 737 Hz, 1224
Hz e 3616 Hz; vogal [o] 541 Hz, 1047 Hz e 3674 Hz e vogal [u] 470 Hz, 1603 Hz e 3845 Hz.
Dentro da língua portuguesa falada no Brasil, Behlau (1984) foi um dos pesquisadores
que investigou mais amplamente, em termos da quantidade de vogais analisadas, as
frequências dos três primeiros formantes da voz infantil. Além de ter apontado a existência de
diferenças nas medidas dos formantes entre adultos e crianças, a autora contribuiu apontando
valores médios das frequências dos três primeiros formantes para a voz infantil saudável:
vogal [a] 1086 Hz, 1721 Hz e 2873 Hz; vogal [ε] 902 Hz, 2606 Hz e 3243 Hz; vogal [e] 698
Hz, 2825 Hz e 3637 Hz; vogal [i] 465 Hz, 3176 Hz e 3980 Hz; vogal [] 913 Hz, 1371 Hz e
2793 Hz; vogal [o] 682 Hz, 1295 Hz e 2823 Hz e vogal [u] 505 Hz, 1350 Hz e 2667 Hz.
Muitas destas medidas não convergem com os resultados obtidos no presente trabalho, mesmo
que considerado um desvio padrão médio de 15%. No presente trabalho as medidas de F
1
se
mostram mais baixas, enquanto as de F
3
, mais altas. As medidas de F
2
variaram
aleatoriamente. Diferenças na faixa etária investigada (oito a doze anos), no tamanho da
amostra (N=30) e na ferramenta de análise do sinal (espectrografia analógica), no estudo da
autora, estão entre os principais aspectos que poderiam justificar a divergência de resultados.
Huber e col. (1999) estimaram as frequências dos três primeiros formantes da vogal
[a] em vozes de crianças falantes do inglês norte americano, entre quatro a oito anos. Os
resultados, para o gênero masculino e feminino, para F
1
foram: 981 Hz e 1139 Hz (4 a 6
anos); 992 Hz e 1030 Hz (6 a 8 anos). Para F
2
: 1676 Hz e 1817 Hz (4 a 6 anos); 1681 Hz e
1817 Hz (6 a 8 anos). Finalmente, para F
3
: 3902 Hz e 4064 Hz (4 a 6 anos), 3603 Hz e 3735
Hz (6 a 8 anos). Assim como na frequência fundamental, os valores do presente trabalho para
a vogal [a] foram agrupados com as mesmas faixas etárias propostas pelo autor. O presente
trabalho mostrou os seguintes valores, no gênero masculino e feminino, para F
1
: 1051 Hz e
1221 Hz (4 a 6 anos); 927 Hz e 1089 Hz (6 a 8 anos). Para F
2
: 1946 Hz e 2149 Hz (4 a 6
53
anos); 1741 Hz e 1988 Hz (6 a 8 anos). Finalmente, para F
3
: 3564 Hz e 3594 Hz (4 a 6 anos);
3403 Hz e 3439 Hz (6 a 8 anos). Na comparação é possível observar que há uma
convergência parcial dos valores absolutos apontados nos dois trabalhos.
Se observados os achados de Behlau (1984), Huber e col. (1999) e os do presente
trabalho pode ser observado que os valores absolutos dos formantes se mostram pouco
consistentes, com variações aleatórias entre um trabalho e outro. Embora haja diferenças
metodológicas, principalmente de técnicas de estimação paramétrica, que, por si só, poderiam
justificar as divergências entre os três trabalhos, a alta variabilidade que os formantes
apresentam frente à variabilidade intra-sujeitos (FIGUEIREDO, 1994) e inter-sujeitos parece
ser um fator relevante. Os grupos de diferentes faixas etárias são compostos por crianças
diferentes, uma vez que os três estudos citados apresentam um delineamento transversal.
Largura de Banda
A largura de banda do primeiro formante (B
1
) não representa um parâmetro clássico
da análise espectral. Tal parâmetro foi investigado no presente trabalho em caráter
exploratório, motivo pelo qual apenas a banda do primeiro formante (F
1
) de uma única vogal
foi pesquisada. Em especial, foi definida a vogal [i], por ser a vogal que apresenta o envelope
espectral com maior distanciamento entre os picos do primeiro e segundo formantes,
minimizando, portanto, a possibilidade de obter erro de estimação em função da eventual
fusão de picos. Não foram encontrados na literatura trabalhos que tenham investigado este
parâmetro na voz infantil, inviabilizando comparação de valores.
54
7.2 DIFERENÇAS ENTRE FAIXAS ETÁRIAS E GÊNEROS
Faixas Etárias
A análise de diferenças nos valores dos parâmetros espectrais para as diferentes faixas
etárias pesquisadas consiste em uma parte fundamental do presente trabalho, uma vez que a
definição da existência ou não de subgrupos dentro da voz infantil poderá contribuir para uma
metodologia concisa de futuros trabalhos que pretendam investigar vozes infantis patológicas.
Se observado o conjunto de resultados dos testes de diferença estatística para as faixas
etárias (Tabela XXIII) pode ser observado um aumento gradativo na ocorrência de
confirmações de diferenças estatísticas à medida que G1 (4 a 5 anos) foi sendo comparado
com os demais grupos G2, G3 e G4, de faixas etárias maiores. Entre G1 e G2 foi obtida
apenas 1 significância em 29 testes, enquanto na comparação entre G1 e G3 e G1 e G4 foram
obtidas 14 e 22 significâncias em 29 testes, respectivamente. Tais achados mostram a
existência de uma diferença clara entre os valores dos parâmetros espectrais da voz das
crianças entre 4 e 8 anos de idade. No entanto, não é tão definido o comportamento dos
parâmetros acústicos ao longo deste período. Pode-se dizer que entre 4 e 6 anos de idade não
ocorrem mudanças, uma vez que 96,55% dos testes de diferença estatística aplicados não
mostraram significância, dando suporte a tal conclusão. A partir dos seis anos, mudanças
significativas passam a ocorrer, porém de forma inconsistente em relação ao parâmetro, vogal
e faixa etária. Em especial, na vogal [e] pode ser observada uma predominância de diferenças
significativas das faixas G1 e G2 contra as faixas G3 e G4 sugerindo, além do agrupamento
G1 e G2 já comentado, o agrupamento da G3 com o G4. Nas demais vogais o agrupamento
G3 e G4 não é tão evidente, porém se observado o número reduzido de significâncias
envolvendo especificamente G3 contra G4 parece razoável concluir pelo agrupamento dos
55
mesmos. Assim sendo, a idade de seis anos parece ser determinante para as mudanças
acústicas das vocalizações infantis.
Alguns autores internacionais já haviam apontado a faixa etária em torno dos seis anos
de vida da criança como uma fase de transição, no que se refere a mudanças nas medidas
espectrais da voz. Apontando a existência de decréscimos nas frequências dos formantes
frente ao aumento da idade, Eguchi e Hirsh (1969) referiram ter observado mudanças mais
significativas em crianças menores de cinco anos e também em crianças de seis a treze anos.
Busby e Plant (1995) apontaram um decréscimo mais consistente dos formantes nas faixas de
cinco a sete anos e nove a onze anos. Yang e Mu (1989) observaram diferença substancial na
frequência de F
3
aos 6 anos de idade.
Além do apontamento com relação à idade de 6 anos, como marco importante para as
mudanças acústicas na voz infantil, os resultados do presente trabalho apontam, de uma forma
geral, a existência de uma relação decrescente dos parâmetros espectrais com a faixa etária,
ou seja, quanto maior a faixa etária, menor a medida de frequência observada. Tal
comportamento da frequência fundamental e dos formantes é descrito na literatura (EGUCHI
e HIRSH, 1969; BUSBY e PLANT, 1995, HUBER e col., 1999). Um estudo que se destaca
por seu delineamento longitudinal, investigou os dois primeiros formantes em quatro meninos
entre 15 e 36 meses de vida e mostrou um comportamento descendente das frequências dos
parâmetros investigados com o aumento da idade a partir do 24º mês de vida. (GILBERT e
col. 1997).
A seguir são expostas tabelas com medidas de média e desvio padrão dos parâmetros
analisados, nas quais os 4 grupos etários investigados foram divididos em 2 grupos (4 a 6 anos
e 6 a 8 anos), apresentando como limite entre eles a idade de 6 anos.
56
Tabela XXIV - Média e Desvio Padrão de Frequência Fundamental e Frequências do
Primeiro, Segundo e Terceiro Formantes das vogais [a] e [ε]
[a] [ε]
4-6 anos 6-8 anos
4-6 anos 6-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 264 25,3 250 23,8 257 27,8 255 22,7
f
0
(Hz)
fem 253 23,1 251 27,7 254 19,1 249 26,4
masc 1051 206,8 927 141,9 692 116,1 695 97,2
F
1
(Hz)
fem 1221 158,8 1089 153,8 734 113,0 720 100,2
masc 1946 168,4 1741 179,4 2673 181,3 2553 187,6
F
2
(Hz)
fem 2149 166,9 1988 181,0 2850 155,5 2684 184,4
masc 3564 406,4 3403 217,9 3654 304,0 3580 261,8
F
3
(Hz)
fem 3594 334,1 3439 296,4 3807 302,2 3628 204,4
57
Tabela XXV - Média e Desvio Padrão de Frequência Fundamental e Frequências do
primeiro, Segundo e Terceiro Formantes das vogais [e] e [i]
[e] [i]
4-6 anos 6-8 anos
4-6 anos 6-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 266 24,9 261 23,0 290 30,7 281 29,0
f
0
(Hz)
fem 259 16,7 253 25,7 281 26,4 277 32,3
masc 515 54,0 511 50,05 358 51,7 322 27,2
F
1
(Hz)
fem 512 44,1 498 60,5 363 63,1 357 56,6
masc 2926 175,7 2784 188,3 3083 187,8 3006 191,0
F
2
(Hz)
fem 3069 175,1 2872 203,2 3204 175,4 3070 193,6
masc 3810 243,5 3604 230,0 3858 290,0 3701 248,4
F
3
(Hz)
fem 3840 264,7 3696 216,2 4011 325,0 3808 265,0
58
Tabela XXVI - Média e Desvio Padrão de Frequência Fundamental e Frequências do
primeiro, Segundo e Terceiro Formantes das vogais [] e [o]
[]
[o]
4-6 anos 6-8 anos
4-6 anos 6-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP) ME (±DP) ME (±DP)
masc 262 25,3 259 23,0 271 24,5 262 23,1
f
0
(Hz)
fem 253 21,1 253 26,1 259 30,7 256 26,8
masc 712 114,7 754 123,7 552 62,7 532 69,5
F
1
(Hz)
fem 731 135,2 746 114,1 538 64,1 543 74,7
masc 1221 154,3 1178 146,6 1041 126,9 1039 164,9
F
2
(Hz)
fem 1266 154,4 1230 155,9 1083 118,9 1043 146,5
masc 3554 404,5 3538 257,6 3651 304,8 3580 255,7
F
3
(Hz)
fem 3801 302,9 3567 244,6 3803 289,9 3653 292,4
59
Tabela XXVII - Média e Desvio Padrão de Frequência Fundamental e Frequências do
primeiro, Segundo e Terceiro Formantes da vogal [u]
[u]
4-6 anos 6-8 anos
Parâmetros Sexo
ME (±DP) ME (±DP)
masc 297 37,9 289 30,6
f
0
(Hz)
fem 296 32,9 280 34,2
masc 478 75,5 447 78,2
F
1
(Hz)
fem 477 81,4 474 58,4
masc 1547 960,7 1617 1065,9
F
2
(Hz)
fem 1567 922,7 1677 1052,6
masc 3832 504,4 3752 475,6
F
3
(Hz)
fem 3878 410,0 3886 463,0
Gêneros
Embora a ocorrência de significâncias estatísticas não tenha se mostrado consistente
(Tabela XXIII) ao ponto de que pudesse levar à generalização do conceito de que a emissão
vocálica de meninos é diferente de meninas, os resultados do presente estudo apontam várias
diferenças pontuais, distribuídas de forma dispersa em termos de parâmetro e vogal,
mostrando que as meninas apresentaram medidas espectrais significativamente maiores que
os meninos.
Na literatura, é possível observar que a hipótese da existência de diferenças entre os
gêneros em parâmetros acústicos vem sendo descrita há anos. Corroborando os resultados do
60
presente trabalho, o estudo pioneiro de Peterson e Barney (1952) apontou diferenciação entre
os sexos nas frequências dos formantes, mesmo como uma amostra infantil pequena (15
crianças). Glaze e col. (1988) encontraram significância estatística entre os diferentes gêneros
na f
0
de vozes de crianças de cinco a onze com valores maiores para as meninas. Yang e Mu
(1989) investigaram a frequência do terceiro formante (F
3
) da vogal [a] em crianças três a
doze anos e observaram diferença significante deste parâmetro entre meninos e meninas.
Busby e Plant (1995) não encontraram diferenças significativas na f
0
, no entanto, observaram
frequências dos formantes mais altas para meninas em F
1,
para vogais [æ], [a] e [u] e em F
2
para quase todas as vogais. Corroborando esse estudo, no presente trabalho foi possível
observar diferenças entre os sexos nas frequências de F
2
em quase todas as vogais e nas
frequências de F
1
na vogal [a]. No entanto, na vogal [u], os resultados do presente trabalho
não mostraram diferenças entre os gêneros em nenhum parâmetro investigado. Ao estimar as
frequências de F
1
, F
2
e F
3
da vogal [a] em vozes de crianças e adultos, Huber e col. (1999)
encontraram diferenças entre os gêneros nos parâmetros investigados. Recentemente, Braga e
col. (2009) observaram diferenças significantes na f
0
entre os sexos em crianças de seis a oito
anos.
Alguns autores referiram ter encontrado diferenças de gênero apenas após uma
determinada idade. Ao avaliar a f
0
e frequências dos três primeiros formantes, Lee e col.
(1999) apontaram diferenças entre os sexos somente a partir dos onze anos de idade. Perry e
col. (2001) concluíram que embora a análise das frequências dos formantes tivesse permitido
a diferenciação entre os gêneros em crianças a partir quatro anos de idade, a análise da f
0
pôde diferenciar os sexos a partir dos doze anos.
61
8. CONCLUSÃO
Com base nos resultados do presente trabalho pode-se concluir que, de uma forma
geral, as meninas apresentaram medidas de frequência significativamente maiores que os
meninos e que existe uma relação decrescente com a faixa etária, ou seja, quanto maior a
faixa etária menor a medida de frequência observada.
Dentre as conclusões mais importantes está o apontamento de que a idade de seis anos
parece ser determinante para as mudanças acústicas das vocalizações infantis. Assim sendo,
as médias apresentadas para G1 e G2 podem ser agrupadas em uma única faixa etária. Da
mesma forma as médias paramétricas para G3 e G4 também podem ser agrupadas. Trabalhos
futuros que pretendam investigar vozes infantis patológicas possivelmente apresentarão
resultados mais consistentes se considerarem a divisão das faixas etárias em função da idade
de seis anos.
62
REFERÊNCIAS BIBLIOGRÁFICAS
ANDRIANOPOULOS, M. V.; DARROW, K.; CHEN, J. Multimodal standardization of voice
among four multicultural populations formants structures. J Voice, v. 15, n. 1, p. 61-77, 2001.
ANDRADE, Danieli Viegas de. Análise de parâmetros espectrais clássicos da voz em
crianças respiradoras orais de 5 a 10 anos. Rio de Janeiro, RJ, 2009. Dissertação de
mestrado. Universidade Veiga de Almeida, 2009.
BAECK, H. E.; SOUZA, M. N. A Bayesian classifier for babies’ cry pain and non-pain
contexts. In: Proceedings of 25
th
International Conference on the IEEE Engineering in
Medicine and Biology Society, Cancun, v. 1, p. 2944-2946, 2003.
BAECK, H. E.; SOUZA, M. N. “Sistema de Análise Automática da Dinâmica do Sinal de
Choro de Bebês”. In: Anais do III Congresso Latino Americano de Engenharia
Biomédica, João Pessoa, v. 5, p. 17-20, 2004.
BAECK, H. E.; SOUZA, M. N. Longitudinal study of the fundamental frequency of hunger
cries along the first 6 months of healthy babies. J Voice, v. 21, n. 5, p. 551- 559, 2007.
BAKER, S. e col. The effect of task type on fundamental frequency in children. Int J Pediatr
Otorhinol, v. 72, p. 885-889, 2008.
BEHLAU, Mara Suzana. Uma análise das vogais do português brasileiro falado em São
Paulo: perceptual, espectrográfica de formantes e computadorizada de frequência
fundamental. São Paulo, SP. Dissertação de Mestrado. Escola Paulista de Medicina, 1984.
BEHLAU, M. S. e col. Análise espectrográfica de formantes das vogais do português
brasileiro. ACTA AWHO, v. 7, n. 2, p. 74-85, 1988.
63
BELHAU, M. S. e col. Avaliação de voz. In:_________.Voz: O livro do especialista. Rio de
Janeiro: Revinter, 2001. cap. 3, p. 85 -180.
BENETON, G. e col. Comparação dos parâmetros vocais em crianças com e sem rinite
alérgica. Rev Fono Atual, v. 7, n. 29, p. 30-35, 2004.
BUSBY, P. A.; PLANT, G. L. Formant frequency values of vowels produced by
preadolescent boys and girls. J Acoust Soc Am., v. 97, n.4, p. 2603-2606, 1995.
BRAGA, J. N.; OLIVEIRA, D. S. F.; SAMPAIO, T. M. M. Frequência fundamental da voz
de crianças. Rev Cefac, v. 11, n. 1, p. 119-126, 2009.
CAMARGO, Z. A.; MADUREIRA, S. Análise acústica: revisão crítica de estudos no campo
das disfonias. In: FERREIRA, L. P.; BEFI-LOPES, D. M.; LIMONGI, S. C. O. (Org).
Tratado de Fonoaudiologia. São Paulo: Roca, 2004. cap. 3, p.25-33.
CAPPELLARI, V. M.; CIELO, C. A. Características vocais acústicas de crianças pré-
escolares. Rev Bras Otorrinolaringol., v. 74, n. 2, p. 265-272, 2008.
CARRARA-DE-ANGELIS, E.; CERVANTES, O.; ABRAHÃO, M. Necessidade de medidas
objetivas da função vocal: avaliação acústica da voz. In: FERREIRA, L. P.; COSTA, H. O.
Voz ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca, 2001. cap. 5, p. 53-72.
CORAZZA, V. R. e col. Correlação entre os achados estroboscópicos, perceptivo-auditivos e
acústicos em adultos sem queixa vocal. Rev Bras Otorrinolaringol., v. 70, n. 1, p. 30-34,
2004.
DORNELLES, S.; JOTZ, G. P.; GUILHERME, A. Capacidade discriminatória e
confiabilidade da análise perceptiva da voz de crianças institucionalizadas. In: FERREIRA, L.
P.; COSTA, H. O. Voz ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca,
2001. cap. 14, p. 167-181.
FELLIPE, A. C. N.; GRILLO, M. H. M. M.; GRECHI, T. H. Normatização de medidas
acústicas para vozes normais. Rev Bras Otorrinolaringol., v. 75, n. 2, p. 659-664, 2006.
FIGUEIREDO, Ricardo Molina. Identificação de falantes: aspectos teóricos e
metodológicos. Campinas, SP, 1994. Tese de doutorado. Universidade Estadual de Campinas,
1994.
64
FUCHS, M. e col. Predicting mutational change in the speaking voice of boys. J Voice, v. 21,
n. 2, p. 169-178, 2007.
GILBERT, H. R.; ROBB, M. P.; CHEN, Y. Formant frequency development: 15 to 36
months. J Voice, v. 11, n. 3, p. 260-266, 1997.
GELFER, M. P.; MIKOS, V. A. The relative contributions of speaking fundamental
frequency and formant frequencies to gender identification based on isolated vowels. J Voice,
v. 19, n. 4, p. 544-554, 2004.
GLAZE, L. E. e col. Acoustic characteristics of children’s voice. J Voice, v. 2, n. 4, p. 312-
319, 1988.
GLAZE, L. E.; BLESS, D. M.; SUSSER, R. D. Analysis of vowel and loudness differences
in children’s voice. J Voice, v. 4, n. 1, p. 321-323, 1990.
GOLDFIELD, E. C. Exploration of vocal tract properties during serial production of vowels
by fill term and preterm infants. Infant Behavior & Development, v. 23, p. 421-439, 2000.
GREGIO, Fabiana Nogueira. Configuração do trato vocal supraglótico na produção das
vogais do português brasileiro: dados de imagens de ressonância magnética. São Paulo,
SP, 2006. Dissertação de Mestrado. Pontifícia Universidade Católica de São Paulo, 2006.
HAMDAN, A. L. e col. Vocal characteristics in children with attention deficit hyperactivity
disorder. J Voice, v. 23, n. 2, p. 190-194, 2009.
HERSAN, R. C. P. G. A laringe infantil. In: PINHO, S. M. R. Fundamentos em
fonoaudiologia: Tratando os distúrbios da voz. 2ª. ed. Rio de Janeiro: Guanabara Koogan,
2003. cap. 3, p. 59-66.
HUBER, J. E. e col. Formants of children, women and men: the effects of vocal intensity
variation. J Acoustic Soc Am., v. 106, n. 3, p. 1532-1542, 1999.
JORGE, M. S.; GREGIO, F. N.; CAMARGO, Z. Qualidade vocal de indivíduos submetidos à
laringectomia total: aspectos acústicos de curto e de longo termo em modalidades de fonação
esofágica e traqueoesofágica. Rev Cefac, v. 6, n. 3, p. 319-328, 2004.
JOTZ, G. P. e col. Avaliação vocal na infância. In: FERREIRA, L. P.; COSTA, H. O. Voz
ativa: falando sobre a clínica fonoaudiológica. São Paulo: Roca, 2001. cap. 15, p. 183-194.
65
KENT, R. D.; READ, D. The Acoustic Analysis of Speech. London, Singular Publishing
Group, 1996
LEE, S. e col. Acoustic of children’s speech: developmental changes of temporal and spectral
parameters. J Acoustic Soc Am., v. 105, n. 3, p. 1455-1468, 1999.
LIMA, M. F. B. e col. Qualidade vocal e formantes das vogais de falantes adultos da cidade
de João Pessoa. Rev Cefac, v. 9, n. 1, p. 99-109, 2007.
MAGRI, A. e col. Correlatos perceptivos e acústicos dos ajustes supraglóticos na disfonia.
Rev Cefac, v. 9, n. 4, p. 512-518, 2007.
MAGRI, A.; STAMATO, T.; CAMARGO, Z. A. Influência da largura de banda de formantes
na qualidade vocal. Rev Cefac, v.11, n. 2, p. 296-304, 2009.
MITRA, S. K. Digital Signal Processing – A Computer-Based Approach. New York:
McGrawHill, 2001.
MOURA, C. P. e col. Voice parameters in children with Down syndrome. J Voice, v. 22, n. 1,
p. 34-42, 2008.
NEBEKER, F. Signal Processing – the emergence of a discipline - 1948 to 1998. New Jersey:
IEEE History Center, 1998.
NEMR, K. e col. Análise comparativa entre avaliação fonoaudiológica perceptivo-auditiva,
análise acústica e laringoscopias indiretas para avaliação vocal em população com queixa
vocal. Rev Bras Otorrinolaringol., v. 71, n. 1, p.13-17, 2005.
NICOLLAS, R. e col. Normal voice in children between 6 and 12 years of age: database and
nonliner analysis. J Voice, v. 22, n. 6, p. 671-675, 2008.
NIEDZIELSKA, G. Acoustic analysis in the diagnosis of voice disorders in children. Int J
Pediatr Otorhinol., v. 57, n. 3, p.189-193, 2001.
NIEDZIELSKA, G.; GLIJER, E.; NIEDZIELSKI, A. Acoustic analysis of voice in children
with noduli vocales. Int J Pediatr Otorhinol., v. 60, n. 2, p.119-122, 2001.
66
PINHO, S. M. R.; CAMARGO, Z. Introdução à análise acústica da voz e da fala. In: PINHO,
S. M. R. Tópicos em Voz. Rio de Janeiro: Guanabara Koogan, 2001. cap. 2, p. 19-44.
PINHO, S. M. R. Avaliação e tratamento da voz. In: ________. Fundamentos em
fonoaudiologia: Tratando os distúrbios da voz. 2ª. ed. Rio de Janeiro: Guanabara Koogan,
2003. Parte I, p. 3-40.
PINHO, S. M. R; PONTES, P. Desvendando os segredos da voz: Músculos intrínsecos da
laringe e dinâmica vocal. Vol. I. Rio de Janeiro: Revinter, 2008. p. 1-77.
PERRY, T. L. e col. The acoustic bases for gender identification from children’s voices. J
Acoustic Soc Am., v. 109, n. 6, p. 2988-2998, 2001.
RABINER, L. R.; SCHAFER, R. W. Digital Processing of Speech Signal. New Jersey,
Prentice Hall, 1978.
ROTHGÄNGER, H. Analysis of the sounds of the child in the first year of age and a
comparison to the language. Early Human Development, v. 75, p. 55-69, 2003.
SCHOTT, T. C. A.; SAMPAIO, T. M. M.; OLIVEIRA, D. S. F. Frequência fundamental de
crianças da cidade de Niterói. Rev Cefac, v. 12, n. 2, p. 290-295, 2009.
STEFFEN, N.; MOSCHETTI, M. B. Parâmetros acústicos de jitter e shimmer de 248 crianças
de 6 a 10 anos, estudantes de Porto Alegre. Rev Bras Otorrinolaringol., v. 63, n. 4, p. 329-
334, 1997.
VANZELLA, Thaís Perez. Normatização dos parâmetros acústicos vocais em crianças em
idade escolar. Ribeirão Preto, SP, 2006. Dissertação de Mestrado. Universidade de São
Paulo, 2006.
YANG, S.; MU, L. An investigation of the third formant of /a/ in prepuberal children. J
Voice, v. 3, n. 4, p. 321-323, 1989.
WERTZNER, H. F.; SCHREIBER, S.; AMARO, L. Análise da frequência fundamental,
jitter, shimmer e intensidade vocal em crianças com transtorno fonológico. Rev Bras
Otorrinolaringol., v. 71, n. 5, p. 582-588, 2005.
67
ANEXO A
ESCALA RASATI
(Pinho e Pontes, 2008)
Nome: ______________________________________________________
Data de nascimento: ___/__/__ Idade: __________
GRADUAÇÃO
-Rouquidão: ( ) 0 ( ) 1-2 ( ) 2 ( ) 2-3 ( ) 3
- Aspereza: ( ) 0 ( ) 1-2 ( ) 2 ( ) 2-3 ( ) 3
- Soprosidade: ( ) 0 ( ) 1-2 ( ) 2 ( ) 2-3 ( ) 3
- Astenia: ( ) 0 ( ) 1-2 ( ) 2 ( ) 2-3 ( ) 3
- Tensão: ( ) 0 ( ) 1-2 ( ) 2 ( ) 2-3 ( ) 3
- Instabilidade: ( ) 0 ( ) 1-2 ( ) 2 ( ) 2-3 ( ) 3
Graduação:
0 – ausente
1- grau leve
1-2 – grau leve a moderado
2 – grau moderado
2-3 – grau moderado a intenso
3 – grau intenso
Data: ___/___/___ ______________________
Fonoaudióloga
68
APÊNDICE A
CARTA PARA OBTENÇÃO DO CONSENTIMENTO LIVRE E ESCLARECIDO
Caro(a) Senhor(a),
Eu, Flávia Viegas de Andrade, fonoaudióloga, vou desenvolver uma pesquisa cujo
título é ANÁLISE DE PARÂMETROS ESPECTRAIS DA VOZ EM CRIANÇAS
SAUDÁVEIS DE 4 A 8 ANOS.
O presente estudo consiste em minha dissertação de mestrado em fonoaudiologia,
linha de pesquisa voz, da Universidade Veiga de Almeida.
O objetivo deste estudo é investigar medidas de frequência fundamental, frequências
dos três primeiros formantes e largura de banda da vogal [i] em crianças saudáveis de quatro a
oito anos, através do processamento digital do sinal da voz. Necessito que o (a) Sr.(a). forneça
informações à respeito de seu (sua) filho (a), devendo ocupá-lo(a) por 30 minutos para
avaliação de seu (sua) filho (a), através dos seguintes procedimentos:
Entrevista com a criança que deverá conversar com a autora da pesquisa de forma
espontânea, na qual será realizada uma triagem da expressão oral. Depois será solicitado que a
criança fale o próprio nome, idade e o que gosta de brincar. Em seguida a criança deverá
repetir a seguinte frase “Fale
_____ para mim”, que será preenchida com os vocábulos
“pápa”, “pépe”, “pêpe”, “pípi”, “pópo” “pôpo” e “púpu”. Estes procedimentos serão gravados
com o auxílio de um microfone em um programa de computador que processa os sinais de
fala e de voz. Posteriormente serão avaliados os parâmetros vocais de fonte glótica e
ressonância através da análise das amostras de voz colhidas.
A participação do (a) seu (sua) filho (a) nesta pesquisa é voluntária e a avaliação
clínica não determinará qualquer risco. A participação do (a) seu (sua) filho (a) não trará
qualquer benefício direto para ele (a), mas proporcionará um melhor conhecimento a respeito
das mudanças que ocorrem nos parâmetros vocais investigados ao longo do crescimento. I
Informo que o (a) Sr. (a). tem a garantia de acesso, em qualquer etapa do estudo, sobre
qualquer esclarecimento de eventuais dúvidas. Se tiver alguma consideração ou dúvida sobre
a ética da pesquisa, entre em contato com o Comitê de Ética em Pesquisa da Secretaria
Municipal de Saúde da Prefeitura do Rio de Janeiro, situado à Rua Afonso Cavalcante, 455,
69
sala 701 - Cidade Nova - Rio de Janeiro - RJ – Cep: 20.211-901 ou através do e-mail:
Também é garantida a liberdade da retirada deste consentimento a qualquer momento,
sem qualquer prejuízo ao (a) senhor (a) ou seu (sua) filho (a).
Garanto que as informações obtidas serão analisadas em conjunto com outras crianças,
não sendo divulgado a identificação de nenhum dos participantes.
O Sr. (a) tem o direito de ser mantido (a) atualizado (a) sobre os resultados parciais da
pesquisa e caso seja solicitado, darei todas as informações que solicitar.
Não existirão despesas ou compensações pessoais para o (a) participante em qualquer
fase do estudo, incluindo exames e consultas. Também não há compensação financeira
relacionada à participação do (a) seu (sua) filho (a). Se existir qualquer despesa adicional, ela
será absorvida pelo orçamento da pesquisa.
Eu me comprometo a utilizar os dados coletados somente para pesquisa e os resultados
serão veiculados através de artigos científicos em revistas especializadas e/ou em encontros
científicos e congressos, sem nunca tornar possível a identificação do (a) seu (sua) filho (a).
Anexo está o consentimento livre e esclarecido para ser assinado caso não tenha ficado
qualquer dúvida.
Termo de Consentimento Livre e Esclarecido
Acredito ter sido suficiente informado a respeito das informações que li ou que foram
lidas para mim, descrevendo o estudo “Análise de parâmetros espectrais da voz em crianças
saudáveis de quatro a oito anos”.
Eu discuti com a fonoaudióloga Flávia Viegas de Andrade a minha decisão em
permitir a participação de meu (minha) filho (a) nesse estudo. Ficaram claros para mim quais
são os propósitos do estudo, os procedimentos a serem realizados, seus desconfortos e riscos,
as garantias de confidencialidade e de esclarecimentos permanentes.
Ficou claro também que a participação do (a) meu (minha) filho (a) é isenta de
despesas e que tenho garantia do acesso aos resultados e de esclarecer minhas dúvidas a
qualquer tempo. Concordo voluntariamente em permitir a participação do (a) meu (minha)
filho (a) neste estudo e poderei retirar o meu consentimento a qualquer momento, antes ou
70
durante o mesmo, sem penalidade ou prejuízo ou perda de qualquer benefício que eu possa ter
adquirido.
___________________________________ Data:_______/______/______
Assinatura do pai, mãe ou responsável
Nome:
Endereço:
RG.
Telefone: ( )
__________________________________ Data _______/______/______
Assinatura da pesquisadora
Nome da criança: _____________________________________________
Contato:
Pesquisadora: Flávia Viegas de Andrade – [email protected]
71
APÊNDICE B
ROTEIRO DE AVALIAÇÃO DO SISTEMA RESSONANTAL
(Adaptado de Pinho, 2003)
FOCO DE RESSONÂNCIA:
a) ( ) nasal
Divisão: ( ) rinofonia aberta ( ) rinofonia fechada
( ) hiponasalidade ( ) denasalidade
b) ( ) faríngeo
c) ( ) cul de sac
d) ( ) laringo-faríngeo
e) ( ) equilibrado
Data: ___/___/___ ______________________
Fonoaudióloga
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo