Download PDF
ads:
i
Universidade Estadual de Londrina
PAULO GUERRA SOARES
CONTROLE DE ESTÍMULOS E HISTÓRIA
COMPORTAMENTAL EM HUMANOS
Londrina
2008
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ii
PAULO GUERRA SOARES
CONTROLE DE ESTÍMULOS E HISTÓRIA
COMPORTAMENTAL EM HUMANOS
Dissertação apresentada ao programa de
Mestrado em Análise do Comportamento da
Universidade Estadual de Londrina como
parte dos requisitos para obtenção do grau
de Mestre em Análise do Comportamento.
Orientador: Prof. Dr. Carlos Eduardo Costa
* Projeto parcialmente financiado pela FUNDAÇÃO ARAUCÁRIA
Londrina
2008
ads:
iii
PAULO GUERRA SOARES
CONTROLE DE ESTÍMULOS E HISTÓRIA COMPORTAMENTAL
EM HUMANOS
Dissertação apresentada para cumprimento dos
requisitos para obtenção do título de Mestre em
Análise do Comportamento.
COMISSÃO EXAMINADORA
_______________________________________
Prof. Dr. Carlos Eduardo Costa
Universidade Estadual de Londrina
_______________________________________
Prof. Dr. Sérgio Dias Cirino
Universidade Federal de Minas Gerais
_______________________________________
Prof
a
. Dr
a
. Silvia Regina de Souza Arrabal Gil
Universidade Estadual de Londrina
Londrina, junho de 2008.
iv
“O hoje é apenas um furo no futuro
Por onde o passado começa a jorrar...”
Raul Seixas
Marcelo Nova
v
DEDICATÓRIA
Para meus pais pois, no princípio, eram eles.
vi
AGRADECIMENTOS
O ano era 2005 e estávamos, eu e alguns amigos psicólogos, comendo
sanduíches enormes no Tosco Burguer”, em Belo Horizonte. Lembro-me que, ao tocar
no assunto “mestrado”, um dos meus amigos exclamou: “mestrado sem sofrimento não
existe! Nunca conheci alguém que tenha feito mestrado e não tenha chorado”! Confesso
que aquilo me assustou um pouco. Afinal, eu estava prestes a fazer a minha prova de
mestrado! Porém, agora, em 2008, ao final do processo, posso afirmar: se a regra era
chorar sempre, fui uma exceção. O que tenho para dizer sobre meu mestrado é que foi
uma das experiências mais enriquecedoras da minha vida! Aproveito a ocasião para
agradecer muito às pessoas que foram importantes durante este processo:
Primeiramente aos meus pais, seu Lau e dona Beth, e meus irmãos, Lipe e Zá.
Acreditem, sem vocês, nada do que está acontecendo hoje seria possível. Estar longe de
vocês ainda é o único fator que pode ter me feito querer chorar durante o mestrado.
Aos meus amigos de Belo Horizonte que, assim como minha família, não me
deixaram desistir. Muito obrigado, Gustavão, Tiagão, Filho, Lêta, Claret e Alysson,
mais uma vez, pela força, ainda que de longe.
Aos meus amigos da Análise do Comportamento, pessoas tão especiais pra mim
hoje, que foram importantíssimas na minha formação e tornaram o aprendizado o
reforçador: Sônia, André, Ana Maria, Adélia, Renata Horta, Ernani e Gustavo Teixeira.
Fico feliz em saber que existem pessoas como vocês caminhando ao meu lado.
Não posso deixar de agradecer também a duas das pessoas mais importantes na
minha vida: Sérgio Cirino e Carlos Cançado, ou simplesmente “Serjão e “Carlão”.
Seria necessário escrever um livro para narrar a importância que vocês têm em minha
vida e em minha formação. Eu nunca seria nada do que sou hoje se não tivesse
vii
trabalhado com vocês. Vocês me ensinaram a ser reforçador e crítico, obsessivo e
histérico. É muito importante saber que temos um ao outro para nos apoiar nos
momentos difíceis e celebrar nos momentos de alegria. E serão, ainda, muitos
momentos de alegria!
Meu mestrado também não seria possível sem as minhas colegas de turma:
Camila, Carol, Elissa, Fernanda, Ju, Lígia, Olivia e Renata. Muito obrigado, meninas,
por tudo! Um beijo especial para a Marina, que fez com que Londrina se tornasse um
lugar quentinho, mesmo quando o inverno bateu forte.
Agradeço também aos professores que conheci em Londrina e que me
acompanharam durante o mestrado: Verônica, Maura, Sílvia e Maria Luíza. O que
aprendi com vocês vai pra vida toda! Um forte abraço também para a Inês, sempre
prestativa, e para o Nelsinho e Carlos, pelas nossas conversas pelos corredores do
PGAC. Falando em PGAC, não posso deixar de agradecer aos companheiros de
laboratório: Rodrigo Salgado, Luiz de Freitas, Tatiany Porto, Murilo Ramos, Rodrigo
Becker e Raquel Lacerda. Com essa turma toda, não dava pra se sentir sozinho no
laboratório! Agradeço também à Fundação Araucária, por financiar parte deste projeto,
e aos meus participantes, pela várias e várias sessões experimentais!
Muito importante na minha caminhada foi o apoio da Prof.ª Elisabete Coelho,
coordenadora do curso de Psicologia da Faculdade Pitágoras Campus Metropolitana.
Obrigado pela oportunidade, pela confiança e por “segurar a barra” nos momentos em
que a dissertação tomava muito do meu tempo.
Queria também mandar um grande beijo para uma das pessoas mais importantes
desta trajetória: Íria, você sabe o quanto eu amo você. Se não fosse por você, nada disso
teria sido possível. Pelos beijos, abraços e carinhos. Que ainda durarão muito, muito
viii
tempo! Um grande abraço também para sua família, que sempre que me recebeu de
braços abertos.
Finalmente, mas não menos importante, gostaria de deixar um agradecimento
para meu orientador, Prof. Carlos Eduardo Costa. Caê, você foi um orientador perfeito
quando precisou ser e, principalmente, foi um amigo em todos os momentos. Obrigado
por fazer de mim o profissional e a pessoa que sou hoje. Fechamos este ciclo, meu
amigo. Mas se precisar de mim, sabe onde me achar. Um grande abraço!
ix
SUMÁRIO
Dedicatória........................................................................................................................... v
Agradecimentos................................................................................................................... vi
Sumário ...............................................................................................................................ix
Resumo................................................................................................................................. x
Abstract............................................................................................................................... xi
Introdução............................................................................................................................ 1
Definições de história comportamental............................................................................... 3
O que é um estudo de história comportamental? ............................................................... 5
Estudos experimentais sobre história comportamental...................................................... 7
Diferenças entre humanos e não-humanos em programas de reforço...................... 8
História recente e remota..................................................................................... 21
Controle de estímulos e história comportamental................................................. 25
Delimitação do problema................................................................................................... 32
Método................................................................................................................................ 36
Participantes............................................................................................................ 36
Equipamentos e Instrumento ................................................................................... 36
Local....................................................................................................................... 37
Procedimento.......................................................................................................... 38
Resultados .......................................................................................................................... 42
Discussão ............................................................................................................................ 54
Referências bibliográficas.................................................................................................. 63
Apêndices ........................................................................................................................... 69
x
Soares, P. G. (2008) Controle de estímulos e história comportamental em humanos.
Dissertação apresentada ao Programa de Mestrado em Análise do Comportamento da
Universidade Estadual de Londrina. 84 p.
Resumo
O objetivo foi observar o efeito de uma exposição a um mult FR-DRL sobre o
comportamento subseqüente em um mult FI-FI, quando os mesmos controles de
estímulo foram mantidos. Participaram quatro universitários, cuja tarefa experimental
consistia em pressionar o botão esquerdo do mouse com o cursor sobre um botão (botão
de resposta) que aparecia no monitor do computador. Ao ser cumprida a contingência de
reforço programada, um smile aparecia no canto superior direito do monitor e, para que
um ponto fosse creditado em um visor acima do botão de respostas, o participante
deveria clicar em um botão localizado acima do smile (botão de resposta de
consumação). Os participantes foram expostos a um programa mult FR-DRL até que
fosse obtida estabilidade na taxa de respostas em ambos os componentes. A cor do
botão de resposta era diferente para cada componente do programa múltiplo (verde para
FR e vermelha para DRL). Em uma fase seguinte, os participantes foram expostos a um
programa mult FI-FI. Cada componente deste múltiplo era correlacionado a uma das
cores do botão de resposta apresentadas anteriormente. Nas duas fases, um timeout de 5
segundos ocorria entre os componentes do programa múltiplo. De maneira geral, os
resultados replicaram aqueles obtidos por Freeman e Lattal. Observou-se que três dos
quatro participantes apresentaram efeitos da história de exposição ao mult FR-DRL
somente por algumas sessões. Com a exposição continuada ao mult FI-FI, o
comportamento destes participantes tendeu a ficar sob controle da contingência
presente. O comportamento de um dos participantes apresentou efeitos da história de
exposição ao mult FR-DRL durante toda a fase de teste (mult FI-FI). Este participante
foi exposto, então, a mais dez sessões de um mult FI-FI, mas as cores dos botões de
resposta foram trocadas para preto e branco. Observou-se que o comportamento deste
participante mudou, ficando semelhante ao dos outros três quando foram expostos ao
mult FI-FI. Os resultados do presente estudo sugerem que o comportamento de humanos
tende a ficar sob controle da nova contingência de reforço com a exposição continuada a
esta contingência e, portanto, os efeitos da história são transitórios. Quando a resistência
à mudança pareceu maior, a substituição dos estímulos cuja função havia sido
selecionada durante a fase de construção da história (i.e., a mudança na cor do botão de
respostas) foi suficiente para produzir uma mudança comportamental e produzir um
padrão que parecia sob controle da contingência presente.
Palavras-chave: história comportamental; controle de estímulos; programas de reforço;
humanos
xi
Soares, P. G. (2008) Stimulus control and behavioral history in humans. Dissertation
presented to the Masters Program in Behavior Analysis at Universidade Estadual de
Londrina. 84 p.
Abstract
The goal of the present study was to analyze the effects of a previous exposure to a mult
FR-DRL over subsequent behavior under a mult FI-FI, when similar stimuli were
maintained across conditions. Four undergraduate students served as participants. The
experimental task was pressing a mouse’s left button with the cursor over the response
button, displayed on the computer’s screen. When the reinforcement contingency in
effect was satisfied, a smile was displayed on the screen’s upper right corner and, after
the participant clicked on a button located above the smile (the consummatory response
button), a point was displayed on a counter located above the response button.
Participants were exposed to a mult FR-DRL until stable response rates were obtained
under both components. The color of the response button was different during each
component of the multiple schedule (green, during the FR and red during the DRL). On
a subsequent phase, participants were exposed to a mult FI-FI. Each component of this
schedule was correlated with one of the colors of the response button previously
presented. On both phases, a 5-s timeout occurred between components of the multiple
schedule. In general, the results replicated those obtained by Freeman and Lattal. Three
out of four participants presented effects of a history of exposure to the mult FR-DRL
for only a few sessions. With extended exposure to the mult FI-FI, the behavior of these
participants came under the control of the current contingency. The behavior of one
participant showed effects of the history of exposure to the mult FR-DRL during all the
test phase (mult FI-FI). This participant was exposed, then, to ten additional sessions
under the mult FI-FI, but the colors of the response button were changed to black and
white. The behavior of this participant changed, becoming similar to that of the other
three participants when exposed to the mult FI-FI. The results of the present study
suggest that human behavior may come under the control of a new contingency of
reinforcement with extended exposure to this contingency and, consequently, that
history effects are transitory. When resistance to change seemed higher, changing the
stimuli whose function was previously established during the history building
condition (i.e., changing the color of the response button) was sufficient to produce
behavioral change and a response pattern that seemed under the control of the current
contingency.
Key-words: behavioral history; stimulus control; schedules of reinforcement; humans
1
Introdução
Quando se examina a afirmação de Chiesa (1994) de que a “história pessoal
(experiência) é uma parte necessária das explicações do comportamento presente no
modelo causal de variação e seleção” (p. 122), percebe-se claramente a importância da
consideração e do estudo de variáveis históricas na Análise do Comportamento. O
modelo causal de variação e seleção é uma das bases do modelo skinneriano de
comportamento operante (Skinner, 1981). Para que se entenda como se dão os processos
de variação e seleção, deve-se recorrer a eventos históricos, ou seja, a explicação de tais
processos o está somente nos fatos atuais, muito menos em entidades internas. A
explicação última está na história. Os processos históricos que devem ser pesquisados,
para que se expliquem determinados padrões de comportamento, diferem para cada um
dos três tipos de variação e seleção: para o tipo filogenético, deve-se investigar a
seleção natural, ou seja, a história de evolução de uma determinada espécie; no tipo
ontogenético, a história comportamental de cada indivíduo é o foco de análise; já no
tipo cultural, o interesse está na história de um determinado grupo, sociedade ou
civilização e suas práticas culturais. O comportamento de seres humanos seria, dessa
forma, função de um conjunto de contingências
1
filogenéticas, ontogenéticas e culturais
(Baum, 1994/1999; Skinner 1981). Em relação à Análise do Comportamento, Skinner
(1974) afirma que “(...) uma análise do comportamento é (...) necessariamente
‘histórica’ (...)” (p. 236), ressaltando a importância da consideração e do estudo da
história ontogenética no entendimento do comportamento. Para isso, é importante que
se entenda como a noção e, posteriormente, as tentativas de definição de história
comportamental foram sendo propostas ao longo do tempo nas produções analítico-
comportamentais.
1
Contingências descrevem as condições sob as quais uma resposta produz determinada
conseqüência (Catania, 1998/1999).
2
À luz dos argumentos apresentados, observa-se que a noção de que as ações dos
organismos são determinadas pelo contato com contingências presentes em função de
uma exposição às contingências passadas (Branch, 1987; Ferster & Skinner, 1957;
Sidman 1960; Weiner, 1969) é considerada um consenso pela comunidade de analistas
do comportamento.
O que se constata, porém, é que os pesquisadores analistas do comportamento,
em geral, enfatizam o estudo do controle das variáveis presentes em detrimento dos
efeitos da história comportamental (Aló, 2005; Wanchisen, 1990). O esforço em se
estudar os efeitos de contingências passadas sobre o comportamento atual é tão pequeno
e assistemático, quando comparado com a literatura sobre efeitos de contingências
presentes (Tatham & Wanchisen, 1998), que se observa a existência de pouca clareza
até mesmo em torno do que os autores definem como "história comportamental". Isso
pode ser verificado quando se constata a alta profusão de termos utilizados para se
referir aos efeitos de contingências passadas sobre o comportamento atual - seja em
estudos que tenham por objetivo a verificação desses efeitos ou em estudos que
enfocam outros aspectos do desempenho de um organismo - como apontado por Cirino
(2001b): “hisria comportamental, história de condicionamento, hisria
operante, história passada, hisria de reforçamento, história de esquema, história
latente, história de desempenho, dentre outros (p. 2). Cançado, Soares, Cirino e
Dias (2006) verificaram a exisncia de 126 diferentes termos vinculados à
palavra história (history) em artigos do Journal of the Experimental Analysis of
Behavior (JEAB) e do Journal of the Applied Behavior Analysis (JABA). Destes,
20 termos eram utilizados para se referir à história comportamental propriamente
dita.
É necesrio que se entenda, dessa forma, o que os autores chamam de
3
história comportamental
2
, como ela é definida e, ainda, como as tentativas de
definição surgiram, levando em consideração o desenvolvimento da própria
Análise do Comportamento e a importância do estudo da história comportamental
nesta ciência. Deve-se, concomitantemente, entender como a pesquisa sica tem
buscado dados que elucidem tanto queses experimentais quanto questões
pticas. Dessa forma, o presente trabalho busca identificar (a) propostas de
definição de hisria comportamental, (b) o que pode ser considerado um estudo
de história comportamental e (c) descrições de estudos de história
comportamental. Após este esforço será proposto um delineamento experimental
que permita avaliar os efeitos de uma exposão anterior a continncias sobre o
comportamento atual.
1. Definições de história comportamental
Apesar de haver um consenso na Análise do Comportamento em relação à noção
de que o comportamento dos organismos é determinado pelas contingências atuais por
meio da exposição a contingências passadas (Sidman, 1960; Wanchisen, 1990; Weiner,
1969), o que se observa é que tal consenso não existe quando da definição de história
comportamental. Isso pode ser observado pela existência de diversas propostas de
definição encontradas na literatura. Cirino (2001a) identificou três destas propostas. A
primeira delas foi elaborada por Wanchisen (1990). Para ela, história comportamental
diz respeito à “exposição a contingências respondentes e operantes cuidadosamente
controladas em laboratório, antes da fase de ‘teste’ desejada” (Wanchisen, p. 32). Nesta
definição são enfatizadas apenas as contingências arranjadas no setting experimental às
2
Segundo Cançado et al. (2006), o termo comportamental” foi aquele mais
frequentemente vinculado à palavra história (“história de reforço” e “história de
condicionamento” o exemplos de outros termos frequentemente encontrados pelos
pesquisadores). Por essa razão, a expressão “história comportamental” será utilizada no
presente trabalho.
4
quais o organismo fora exposto, antes de uma fase de teste específica. A proposta de
Wanchisen enfatiza, dessa forma, as manipulações realizadas pelo experimentador,
anteriores à fase de teste. Esta definição identifica as variáveis independentes que serão
manipuladas e cujos efeitos serão observados no comportamento subseqüente.
E quais efeitos seriam estes? Para Freeman e Lattal (1992) “‘efeitos de história’
implicam fontes de controle sobre o comportamento presente que não foram eliminadas
pelo refinamento das contingências atuais e, conseqüentemente, obscurecem as relações
funcionais estabelecidas entre o comportamento e as contingências presentes” (p. 5).
Esta definição enfatiza o controle exercido pelas contingências presentes sobre o
comportamento atual. Para esses autores, os efeitos da história comportamental seriam
aqueles observados no comportamento atual do organismo na fase de teste de um
experimento.
Ou seja, enquanto a proposta de Wanchisen (1990) parece enfatizar o
procedimento nos estudos de história (i.e., ênfase nas variáveis independentes), a
proposta de Freeman e Lattal (1992) parece enfatizar o processo (i.e., os efeitos sobre o
comportamento presente a variável dependente). Parece, portanto, que, isoladamente,
as propostas de Wanchisen e de Freeman e Lattal não esgotam uma definição do que
seria história comportamental.
Segundo Metzger (1992), história comportamental deve ser definida “em termos
de exposições prévias a contingências tanto dentro quanto fora do laboratório” (p. 15).
A definição desta autora é mais ampla do que a de Wanchisen (1990), pois engloba os
eventos extra-experimentais como parte da definição de história comportamental. Não
enfatiza, contudo, quais seriam os efeitos destas exposições prévias sobre o desempenho
atual.
5
Nesse sentido, as propostas de Wanchisen (1990) e de Freeman e Lattal (1992)
parecem, em conjunto, mais úteis do que a de Metzger (1992), para o estudo
experimental da história comportamental, já que não é possível o acesso a todas as
contingências extra-experimentais as quais um organismo foi exposto. O pesquisador
enfatizaria a análise das experiências prévias do organismo, cuidadosamente construídas
no laboratório e cujos efeitos podem ser observados pelo menos por algum tempo sobre
o comportamento atual do mesmo.
Portanto, sintetizando as propostas analisadas, pode-se melhor definir história
comportamental como experiências prévias cujos efeitos podem ser observados no
comportamento atual do organismo. Colocada dessa maneira a definição aponta para
dois aspectos importantes da história comportamental: sua operação (i.e., seu
procedimento) e seu processo (i.e., o efeito sobre o comportamento atual). Todavia,
deve-se ressaltar que, para que a definição seja experimentalmente útil, é necessário que
as experiências prévias” sejam consideradas como os eventos arranjados no contexto
experimental e cujos efeitos possam ser observados no comportamento subseqüente.
2. O que é um estudo de história comportamental?
Após a adoção do termo história comportamental para se referir a esta área de
estudos e de uma definição útil na construção de um delineamento experimental, outro
ponto deve ser discutido: a identificação de um estudo como sendo um estudo de
história comportamental e o de outro tema qualquer. De maneira geral, qualquer
estudo da Análise Experimental do Comportamento pode ser considerado como tendo
uma dimensão histórica: “estudos de extinção, estados de transição, efeitos cumulativos
de certas variáveis, etc., todos podem ser classificados nessa categoria” (Sidman, 1960,
p. 384). Os estudos de programas de reforço mostram claramente esta noção. Em um
experimento básico de extinção, por exemplo, quando o reforçador que vinha mantendo
6
um determinado comportamento é suspenso, o indivíduo não deixa de se comportar
imediatamente. O período inicial de exposição à extinção indica claramente um efeito
da exposição prévia ao programa de reforço. Mesmo experimentos simples, como os de
programa de razão fixa (utilizados nas práticas de laboratório das aulas de graduação em
muitas faculdades de Psicologia) poderiam ser facilmente enquadrados como um estudo
de história. Um organismo dificilmente é exposto a uma contingência de FR 100, por
exemplo, sem antes passar por um treino que envolve responder em razões menores,
que vão aumentando segundo algum critério previamente definido pelo experimentador.
No entanto, como bem apontou Wanchisen (1990), dizer que todo estudo em
Análise Experimental do Comportamento é um estudo sobre história comportamental
comprometeria a utilidade do conceito, uma vez que se tornaria amplo em demasia.
Tatham e Wanchisen (1998) propuseram um modelo de classificação de estudos
de história comportamental baseado em três critérios: (a) que um estudo permita a
avaliação dos efeitos de uma manipulação anterior sobre uma condição subseqüente; (b)
demonstrar efeitos de história duradouros ou transitórios; (c) produzir efeitos de história
observáveis no comportamento atual, ou inobserváveis até que manipulações
experimentais específicas sejam arranjadas (como administração de drogas, por
exemplo). Segundo estes autores, um estudo deve satisfazer estes três critérios para que
possa ser considerado um estudo de história comportamental.
Cirino, Cançado, Soares e Dias (2006) apontaram para alguns problemas
relativos aos critérios propostos por Tatham e Wanchisen (1998). Segundo os autores, o
primeiro critério especifica não apenas estudos de história comportamental, mas
qualquer estudo experimental em Análise do Comportamento. O segundo critério seria
dependente do terceiro, visto que os efeitos poderiam ser classificados como
duradouros ou transitórios se eles pudessem ser observados. Além disso, especificar se
7
um efeito é transitório ou duradouro seria apenas uma informação adicional e não um
critério de classificação de um estudo como um estudo de história comportamental. Em
relação ao terceiro critério, Cirino et al. chamaram a atenção para um aspecto
aparentemente importante na identificação de um estudo de história: a ênfase do
experimentador em relação ao estudo, ou seja, as variáveis que controlam o
comportamento do cientista (por exemplo, a literatura consultada, arranjo experimental
proposto etc.). Se a ênfase do experimentador for a verificação dos efeitos de
manipulações anteriores sobre o comportamento atual de um organismo, mesmo que
estes efeitos não sejam encontrados, o estudo deve ser considerado um estudo de
história comportamental. Dessa forma, o fato de um efeito de história ser observado ou
não deveria ser considerada uma informação adicional e não um critério de identificação
de um estudo de história.
Após a identificação da principal característica que poderia identificar um estudo
analítico-comportamental como um estudo de história comportamental (critério da
ênfase), serão descritas pesquisas experimentais em que este critério pode ser
observado. Pesquisas de outras áreas da Análise Experimental do Comportamento
também serão descritas, de acordo com a manipulação de determinadas variáveis, que
serão importantes para o delineamento experimental proposto no presente estudo.
3 Estudos experimentais sobre história comportamental
Como a história comportamental e seus efeitos têm sido estudados por
pesquisadores analistas do comportamento? Uma revisão da literatura sugere que, de
uma maneira geral, estudos em história comportamental configuram-se como: (a)
estudos do comportamento mantidos por programas de reforço com delineamento
experimental inter-sujeitos (delineamento de grupos) no quais grupos de sujeitos são
submetidos a programas que produzem altas taxas de respostas ou baixas taxas de
8
respostas e, numa condição subseqüente, ambos são expostos a programas que
permitem alta variação na taxa de respostas, sem alteração substancial na taxa de
reforços (ver, por exemplo, Cole, 2001; Costa, 2004; Costa, Banaco & Becker, 2005;
Costa, Banaco, Longarezi, Martins, Maciel & Sudo (no prelo); LeFrancois & Metzger,
1993; Salgado (2007); Urbain, Polling, Millan & Thompson, 1978; Wanchisen, Tatham
& Mooney, 1989; Weiner, 1964; 1965; 1969); (b) estudos do comportamento mantidos
por programas de reforço com delineamento experimental intra-sujeitos (delineamento
de caso único) nos quais o sujeito é exposto a diferentes programas de reforço (com
ou sem controle de estímulos). Em uma condição subseqüente, o mesmo sujeito é
exposto a um programa que permite alta variação na taxa de respostas sem que a taxa de
reforços seja alterada substancialmente e, se houver controle de estímulos, eles são
apresentados novamente (e.g. Cirino, 1999; Doughty, Cirino, Mayfield, da Silva,
Okouchi & Lattal, 2005; Freeman & Lattal, 1992; Okouchi, 2003a; 2003b).
A seguir serão relatadas pesquisas experimentais sobre a história
comportamental cujos temas tratados são relevantes para o presente trabalho. Será
abordada a importância da história comportamental no entendimento das diferenças
entre humanos e não-humanos se comportando sob programas de reforço; os efeitos da
história recente e remota sobre o comportamento atual dos organismos e, por fim, o
papel do controle de estímulos nos efeitos da história comportamental.
3.1 Diferenças entre humanos e não-humanos em programas de reforço
Um dos tópicos que gera grande controvérsia entre pesquisadores analistas do
comportamento diz respeito às diferenças no comportamento de humanos e não-
humanos em programas de reforço. Entre as décadas de 1950 e 1960, havia um
interesse, por parte dos analistas do comportamento, em observar padrões de scallop e
9
break-and-run
3
em estudos de programas de FI
4
, encontrados nos estudos que
utilizavam sujeitos não-humanos. Alguns pesquisadores, como Azrin (1958),
observaram que os padrões encontrados em organismos não-humanos raramente
apareciam em humanos.
O estudo de Weiner (1969, Experimento 1), permite avaliar as diferenças no
padrão comportamental de humanos em FI. Participantes humanos foram distribuídos
em três grupos. Os participantes dos grupos foram expostos a contingências de FI 10 s,
FI 600 s ou FI 10 s com custo
5
. O aparato experimental era constituído por uma tela
com um marcador de pontos e luzes com cores diferentes eram acesas para cada
programa de reforço. Um botão foi instalado em uma mesa que ficava em frente à tela.
A resposta selecionada para este experimento foi a de pressão ao botão
6
. A instrução
fornecida aos participantes dizia que eles deveriam ganhar o maior número de pontos
possível, pressionando o botão “de alguma forma”. Cada conseqüência reforçadora era
constituída por 100 pontos creditados no marcador. Os participantes recebiam uma
quantia fixa de dinheiro por hora de participação, pagos ao final de cada sessão. Não
eram revelados ao participante os objetivos do experimento, nem aspectos do programa
de reforço vigente durante a sessão.
3
O padrão scallop se caracteriza por uma pausa no responder logo após o reforço e
uma retomada no responder, com aceleração positiva, até o próximo reforço. O nome
scallop foi dado a esse padrão em função de sua semelhança a uma concha do mar
(Argopecten irradians) quando visualizado a partir de um registro cumulativo. (...) O
padrão break-and-run se caracteriza por uma grande pausa e um jorro de respostas no
final do intervalo” (Cirino, 1999, p. 17-18).
4
FI, do inglês fixed interval (intervalo fixo). Em um programa de FI reforça-se a
primeira resposta que ocorrer após o intervalo determinado pelo programa (Ferster &
Skinner, 1957). Por exemplo, em um programa de FI 5 segundos, reforça-se a primeira
resposta que ocorrer após a passagem de cinco segundos.
5
Em uma contingência de FI com custo as respostas emitidas no intervalo do FI são
consequenciadas com a perda de um ponto (Weiner, 1964).
6
Este equipamento foi também utilizado nos outros estudos de Weiner que serão
descritos posteriormente (Weiner, 1965; Weiner, 1969)
10
Os resultados obtidos por Weiner (1969, Experimento 1) indicaram dois padrões
típicos de comportamento: alta taxa de respostas sem pausa pós-reforço
7
ou baixa taxa
de respostas (duas a três respostas no final do intervalo) com pausa pós-reforço, mas
sem o padrão de scallop. Nos grupos FI 10 s e FI 600 s, a maioria dos participantes
apresentou altas taxas de respostas, enquanto que no grupo FI 10 s com custo a maioria
dos participantes apresentou baixas taxas de respostas.
Outra pesquisa com objetivo de avaliar as diferenças comportamentais de
humanos em FI foi realizada por Okouchi (2002). O autor expôs 32 universitários a uma
contingência de FI 60 s. O equipamento era composto por um computador com tela
sensível ao toque. Os participantes deveriam tocar um círculo que aparecia no centro da
tela e ganhavam pontos durante as sessões e, ao final do experimento, eram pagos em
dinheiro pela participação, pelos pontos obtidos e recebiam, ainda, créditos na disciplina
que cursavam. O autor obteve resultados parecidos com aqueles de Weiner (1969,
Experimento 1), ou seja, padrões de altas e baixas taxas de respostas. Além disso, os
resultados de Okouchi indicaram também dois padrões de taxas intermediárias de
respostas (um padrão de responder constante, sem pausas pós-reforço e outro mais
parecido com padrões de scallop ou break-and-run, com pausas pós-reforço), sugerindo
que o desempenho de humanos respondendo em FI pode variar de alta para baixa taxa
de respostas, passando por valores intermediários.
Alguns autores (e.g. Wanchisen, 1990; Wanchisen et al., 1989; Weiner, 1983)
sustentaram que a diferença comportamental de humanos e não-humanos em FI pode
ser devida à história comportamental. O estudo de Weiner (1964) teve como objetivo
investigar experimentalmente o efeito de duas diferentes histórias sobre o
7
Pausa pós-reforço consiste no intervalo entre a resposta que produziu o reforço e a
próxima resposta emitida pelo organismo (Catania, 1998/1999).
11
comportamento subseqüente em FI, com seres humanos. Os participantes do
experimento foram seis enfermeiros de um hospital psiquiátrico, de ambos os sexos, que
foram distribuídos em dois grupos. Os participantes de cada grupo foram submetidos a
duas fases, compostas por 10 sessões de uma hora cada (a Fase 2 ainda contou com
mais 10 sessões de meia hora). Durante a Fase 1 (Fase de construção da história), os
participantes do Grupo 1 foram submetidos à contingência de FR 40
8
(contingência que
seleciona altas taxas de respostas), enquanto os participantes do Grupo 2 foram expostos
à contingência de DRL 20 s
9
(contingência que seleciona baixas taxas de respostas).
Posteriormente, na Fase 2 (Fase de teste), os participantes de ambos os grupos foram
expostos à contingência de FI 10 s. Luzes de cores diferentes estavam presentes quando
cada programa de reforço estava em vigor. Weiner observou que os participantes do
Grupo 1 apresentaram taxas altas de respostas quando expostos ao programa de FI, em
relação aos participantes do Grupo 2, que apresentaram baixas taxas de respostas
quando expostos ao mesmo programa.
Estes resultados sugerem que uma exposição prévia de humanos a uma
contingência de reforço pode influenciar o comportamento posterior em FI. As taxas de
respostas dos participantes do Grupo 1, no programa de FI, foram relativamente altas e
constantes, porém, demonstraram uma leve diminuição após o início da exposição ao
programa vigente. Da mesma forma, os participantes do Grupo 2, de forma geral,
tenderam a aumentar a taxa de respostas quando expostos à contingência de FI. Tais
resultados, apesar de não serem discutidos por Weiner (1964), podem apontar para um
8
FR, do inglês fixed ratio, (razão fixa). Em um programa de FR o reforço ocorre após
um número específico de respostas emitidas pelo organismo, independente do tempo
gasto para emiti-las (Ferster & Skinner, 1957; Cirino, 1999).
9
DRL, do inglês differential reinforcement of low rate (reforço diferencial de baixas
taxas [de respostas]). Em programa de DRL, a primeira resposta que ocorrer depois de
passado o um determinado intervalo é reforçada, desde que não tenha havido nenhuma
resposta durante o intervalo. Se ocorrer alguma resposta durante o intervalo, o mesmo é
reiniciado (Cirino, 1999).
12
gradual controle do comportamento pelo parâmetro temporal da contingência atual de
FI.
Buscando estudar o papel da história comportamental nas diferenças
comportamentais entre humanos e não-humanos em FI, Wanchisen et al. (1989),
realizaram um estudo utilizando ratos, cujas respostas de pressão à barra eram
reforçadas com alimento. Os ratos foram distribuídos em dois grupos: os ratos do grupo
controle foram expostos a 120 sessões de um programa de FI 30 s. Os ratos do grupo
experimental foram expostos a 30 sessões de um programa de VR 20
10
e a 30 sessões de
FI 30 s. Em uma fase seguinte, os ratos do grupo experimental foram novamente
expostos a 30 sessões de um programa de VR 20 e a 30 sessões de FI 30 s. A hipótese
dos autores era que ratos expostos a um programa de VR apresentariam, durante a
exposição ao FI, um padrão comportamental diferente daqueles do grupo controle e
semelhante ao padrão comumente encontrado em humanos (cf. Okouchi, 2002; Weiner,
1969, Experimento 1).
Os autores observaram que, ao serem expostos ao programa de FI, os ratos que
haviam passado por uma história de VR respondiam em altas taxas de respostas, quando
comparados ao grupo controle. Após algum tempo, as taxas de respostas dos ratos do
grupo experimental apresentaram uma queda, indicando um controle cada vez maior
pelo parâmetro temporal da contingência de FI presente. Em uma exposição posterior ao
VR e ao FI, o comportamento dos ratos do grupo experimental demorou menos tempo
para ficar sob controle da contingência presente. Os ratos deste grupo, porém,
apresentaram taxas mais altas no início da exposição ao programa de FI, quando
10
VR, do inglês variable ratio (razão variável). Em um programa de VR o reforço
ocorre após um número médio de respostas emitidas pelo organismo (Ferster & Skinner,
1957). Por exemplo, em um programa de VR 5 são reforçadas, em média, cada cinco
respostas emitidas. A distribuição é calculada arbitrariamente a partir de valores
extremos. Um programa de VR, em geral, produz altas taxas de respostas, sem pausa
pós-reforço.
13
comparados aos ratos do grupo controle. Os autores discutiram que o desempenho de
ratos em FI, após uma história de VR, apresentou padrões que se assemelhavam ao de
humanos se comportando em FI (i.e., um responder constante entre reforços sucessivos)
e argumentam que a história comportamental pode explicar a diferença comportamental
entre humanos e não-humanos em FI (cf. Weiner, 1983).
Entretanto, Baron e Leinenweber (1995) criticaram as análises realizadas por
Wanchisen et al. (1989). Segundo eles, as “conclusões sobre a natureza das variações
nas taxas dentro dos intervalos (‘scallop’) basearam-se demasiadamente nos registros
cumulativos” (p. 98). Dessa forma, propuseram uma replicação do estudo de Wanchisen
et al., realizando análises moleculares dos resultados (i.e., taxa local de respostas, o
quarter-life
11
e a distribuição das pausas pós-reforço).
Assim como esperado, os ratos que passaram por uma história de VR emitiram
altas taxas de respostas no programa de FI. Porém, com a exposição continuada ao FI,
as taxas tenderam a diminuir (cf. Weiner, 1964). As análises destes resultados estão em
concordância com aquelas realizadas por Wanchisen et al. (1989). Todavia, segundo
Baron e Leinenweber (1995), as análises moleculares não encontraram os padrões
comportamentais em FI semelhantes aos de humanos. As análises da taxa local de
respostas e do quarter-life sugeriram a formação de possíveis padrões de scallop. Os
autores chamaram a atenção que as interpretações baseadas apenas na observação dos
registros cumulativos podem levar a conclusões equivocadas.
11
O quarter-life refere-se ao tempo gasto para que os primeiros 25% das respostas de
um dado intervalo sejam emitidas (Freeman & Lattal, 1992). Pode ser expresso tanto em
unidades absolutas (i.e. o tempo gasto para emissão dos 25% das respostas) ou em
termos de porcentagem (i.e. porcentagem das respostas emitidas que correspondem aos
25% do total de respostas do FI).
14
Tomando-se estes resultados em conjunto, percebe-se que a história
comportamental pode ser uma, mas não o único evento que contribui para a diferença
no padrão comportamental entre humanos e não-humanos em programas de reforço.
3.1.1 Variações de procedimento
Outro fator que pode contribuir para as diferenças comportamentais entre
humanos e não-humanos em programas de reforço diz respeito às variações de
procedimento. Resultados aparentemente mais regulares obtidos em estudos com
organismos não-humanos provêm de um conjunto de procedimentos-padrão de
laboratório que não encontra, até o momento, contrapartida nos estudos com humanos
(Perone, Galizio & Baron, 1988).
Uma variável de procedimento é o custo da resposta operante estudada. Um dos
autores que estudou tal variável foi Chung (1965, Experimento 1). O autor expôs quatro
pombos a um programa de VI 1 min. A resposta requerida era a de bicar um disco e,
como conseqüência, os pombos recebiam alimento. O equipamento utilizado por Chung
permitia que a força necessária para que o disco funcionasse fosse ajustada.
Inicialmente, a força exigida era de, no mínimo, 25 gramas. Quando a taxa de respostas
estava estável, a força exigida para que o disco funcionasse foi aumentada para 100
gramas. Após duas semanas, a exigência foi novamente alterada. A ordem dos valores
de força manipulados pelo autor foi a seguinte: 25-100-150-50-200-250-75-100-300-25-
150 gramas.
Os resultados de Chung (1965) indicaram que existe uma relação direta entre o
custo e a taxa de respostas. De forma geral, quanto maior foi a força requerida para que
o disco funcionasse, menores foram as taxas de respostas. Foram observados ainda, de
forma sistemática, que quando os pombos passaram de uma condição de maior força
requerida para uma condição de menor força, apresentaram um aumento na taxa de
15
respostas, nas primeiras sessões, que se estabilizaram em taxas intermediárias com a
exposição continuada à nova condição. Da mesma forma, a mudança de uma condição
de menor força para uma de maior força produziu uma supressão na taxa de respostas,
nas primeiras sessões, que se estabilizaram em taxas intermediárias com a exposição
continuada
12
.
Estudos experimentais sobre o custo da resposta também foram realizados com
humanos. O estudo de Weiner (1965, Experimento 1), por exemplo, possibilitou a
avaliação dos efeitos da história em uma contingência subseqüente que apresentasse
custo para cada resposta emitida no intervalo do FI. Neste Experimento, seis
participantes foram distribuídos em três grupos de dois participantes cada. Os Grupos 1,
2 e 3 foram expostos a contingências de FR 40, DRL 20 s e FI 10 s, respectivamente,
durante a fase de construção da história. Cada conseqüência reforçadora era constituída
por 100 pontos. Os participantes recebiam uma quantia fixa de dinheiro por sessão,
independente da quantidade de pontos ganhos. Na fase seguinte, todos os participantes
foram expostos a uma contingência de FI 10 s com custo. Assim, o responder entre
reforços sucessivos no programa de FI era punido com a perda de um ponto por
resposta. Os participantes que passaram por uma história de responder em DRL 20 s e
FI 10 s emitiam padrões de baixa taxa quando expostos subseqüentemente ao programa
de FI com custo. Porém, os sujeitos que passaram por uma história de responder em FR
40 continuavam a emitir altas taxas de respostas no FI com custo, mesmo embora esse
padrão comportamental implicasse na perda de pontos. Esses resultados corroboram e
ampliam aqueles obtidos por Weiner (1964) uma vez que demonstraram que o efeito da
exposição prévia ao FR persiste durante a exposição a um FI subseqüente, mesmo
12
Estes resultados podem ser identificados enquanto efeitos de história, apesar de
Chung (1965) não realizar esta análise.
16
quando persistir no padrão de altas taxas implica em perda de parte dos pontos na
contingência atual.
Comparando-se os resultados de Chung (1965, Experimento 1) com os do
Grupo 3 de Weiner (1965, Experimento 1), percebe-se que quando contingências de
custo são introduzidas ou quando aumento no custo da resposta, a taxa de respostas
cai, tanto no programa de VI quanto no FI. Tais resultados sugerem que procedimentos
análogos podem demonstrar dados regulares entre diferentes espécies.
Outra variável de procedimento manipulada em estudos de história
comportamental foi a conseqüência programada para o comportamento. Normalmente,
o que se observa é que os experimentos com organismos o-humanos utilizam
reforçadores primários como conseqüências. Costa, Banaco e Becker (2005)
investigaram o efeito do tipo de reforçador sobre o comportamento atual em FI de
humanos. A partir de um delineamento experimental semelhante ao de Weiner (1964) e
tendo como participantes estudantes universitários, Costa et al. variaram a conseqüência
programada para cada grupo de participantes: pontos, dinheiro e créditos em fotocópias.
Participaram da pesquisa 11 estudantes universitários. O instrumento utilizado para
coleta dos dados foi o software ProgRef v 3.1 (Costa & Banaco, 2002; 2003). A
resposta exigida dos participantes era um clique no botão esquerdo do mouse. Os
participantes foram distribuídos em três grupos: Grupo 1 (Fotocópias, n=3) os
participantes ganhavam pontos que podiam ser trocados por créditos em fotocópias
(uma fotocópia por ponto que, à época da realização do experimento custavam R$
0,05); Grupo 2 (Dinheiro, n=3) os participantes ganhavam pontos que podiam ser
trocados por dinheiro ao final da sessão (R$ 0,05 por ponto); e Grupo 3 (Apenas
pontos, n=5) os participantes ganhavam pontos, mas estes eram trocados por nada. Na
segunda fase, a variação do tipo de reforçador continuou, mas o parâmetro da
17
contingência de FI foi alterado e os participantes foram expostos a uma das três
condições: FI 5, 20 ou 30 segundos.
Os resultados deste estudo indicam que a conseqüência programada para o
comportamento parece ter aumentado a probabilidade de que os participantes expostos
inicialmente a um programa de reforço em FI 10 s exibissem taxas de respostas altas e
constantes, sem pausa pós-reforço (participantes do Grupo 2 – Dinheiro). Em relação ao
comportamento dos participantes dos Grupos 1 e 3 (Fotocópias e Pontos), houve maior
variação inter-participantes (responder em taxas altas e constantes e em taxas
intermediárias e baixas de respostas). A conseqüência programada parece ter afetado
também o comportamento dos participantes quando o parâmetro do FI mudou de 10
para 5, 20 ou 30 segundos. O comportamento da maioria dos participantes das
Condições Fotocópia e Pontos mudou quando o parâmetro do FI foi alterado (as taxas
de respostas tenderam a diminuir), enquanto que o comportamento dos participantes da
Condição Dinheiro permaneceu o mesmo.
Outro estudo que buscou investigar o efeito de diferentes conseqüências
programadas sobre o comportamento atual em FI de humanos, após diferentes histórias
de reforço, foi realizado por Costa, Banaco, Longarezi, Martins, Maciel e Sudo (no
prelo). Participaram da pesquisa 20 estudantes universitários. O instrumento utilizado
para coleta dos dados foi o software ProgRef v 3.1. A resposta exigida dos participantes
era um clique no botão esquerdo do mouse. Os participantes foram distribuídos por dois
grupos (Grupo FR e Grupo DRL). Durante a primeira fase, os participantes foram
expostos a programas de FR 40 ou DRL 20s, dependendo do grupo a que pertenciam,
durante três sessões. Os participantes de cada um dos grupos eram distribuídos por três
condições de programação de conseqüência: (1) Condição Dinheiro os participantes
ganhavam pontos que podiam ser trocados por dinheiro ao final da sessão (R$ 0,05 por
18
ponto); (2) Condição Fotocópia os participantes ganhavam pontos que podiam ser
trocados por créditos em fotocópias (uma fotocópia por ponto que, à época da realização
do experimento custavam R$ 0,05); (3) Condição Pontos os participantes ganhavam
pontos, mas estes não eram trocados por nada. Na segunda fase, a variação da
conseqüência programada continuou, mas todos os participantes foram expostos a três
sessões de uma contingência de FI 10s.
Como resultado, foi observado que os participantes expostos ao FR
apresentaram um padrão de responder em taxa alta e constante independentemente do
tipo de reforçador utilizado. Quando a contingência mudou de FR para FI a taxa de
respostas permaneceu alta para os participantes da Condição Fotocópia e Condição
Dinheiro, mas diminuiu para a maioria dos participantes da Condição Pontos. Os
participantes expostos inicialmente ao DRL apresentaram um responder em taxa baixa
tanto sob a contingência de DRL quanto sob a de FI subseqüente, independentemente da
condição de reforço. Apesar desse efeito de persistência comportamental, houve uma
diminuição no intervalo entre respostas (IRT)
13
quando a contingência mudou, o que
sugere que o responder era controlado também pela contingência de FI presente.
Tomados em conjunto os resultados sugerem que: (a) o comportamento dos
participantes foi controlado tanto pela história de reforço quanto pelas contingências
presentes; (b) a conseqüência programada pode favorecer o responder em taxa alta e
constante sob FI. Os resultados sugerem que o tipo de reforçador pode ser uma variável
importante para modular os efeitos da história experimental sobre o comportamento de
seres humanos (cf. Costa, 2004).
13
IRT, do inglês inter-response time (intervalo entre respostas). O IRT mede o tempo
entre a emissão de uma resposta e a emissão da próxima resposta (Ferster & Skinner,
1957).
19
Outra variável aparentemente importante quando se avaliam as diferenças entre
humanos e não-humanos se comportando em programas de reforço é a resposta de
consumação. Quando se realizam estudos com não-humanos, a emissão das respostas
selecionadas comumente precisa ser interrompida para que o sujeito possa consumir o
reforço (e. g., quando ratos deixam de pressionar a barra, abaixam-se para lamber a gota
de água e logo após voltam a emitir as respostas de pressão à barra). A utilização da
resposta de consumação pode tornar os estudos com humanos mais próximos dos
estudos com não-humanos, visto que os participantes devem deixar de emitir as
respostas de pressão ao botão para emitir a resposta de consumação e, só então, voltar a
pressionar o botão.
Matthews, Shimmof, Catania e Sagvolden (1977, Experimento 2) realizaram um
estudo no qual testaram o papel da resposta de consumação e do modo de aquisição da
resposta (instrução vs. modelagem) sobre o comportamento de humanos em FI. Quatro
universitários foram expostos a um programa de FI 60 s após passarem por uma história
de VR e outros seis foram expostos a um FI cujo parâmetro foi gradualmente
aumentado a um FI 50 s. A resposta requerida era a de pressão a um botão e os
participantes tinham que emitir uma resposta de consumação (pressionar outro botão)
antes de receberem os pontos. A resposta de pressionar um botão em FI foi modelada,
ao invés de instruída. Os resultados indicaram baixas taxas de respostas no FI, com a
presença de alguns scallops, para os participantes cuja resposta operante foi modelada e
cuja resposta de consumação estava presente. Estes são padrões comportamentais que se
assemelham àqueles tipicamente encontrados em não-humanos.
De acordo com os resultados de Matthews et al. (1977), parece plausível supor
que a utilização de uma resposta de consumação é uma variável interessante quando da
tentativa de aproximação do comportamento de humanos daqueles padrões obtidos
20
tipicamente com não-humanos. A pesquisa realizada por Patsko, Becker e Costa (no
prelo, Experimento 2), aponta para uma direção semelhante. Oito universitários foram
igualmente distribuídos em dois grupos: Grupo 1, com exigência de resposta de
consumação (CR) e o Grupo 2, sem exigência de resposta de consumação (SR). Os
participantes de ambos os grupos foram expostos a três sessões de FI 30 s. O
instrumento utilizado foi o ProgRef v 3.1 e o comportamento de pressionar o botão do
mouse recebia, como conseqüência, pontos. Cada ponto era trocado, ao final de cada
sessão, por R$ 0,05.
Patsko et al. (no prelo, Experimento 2) observaram que os participantes do
Grupo 1 (CR) tenderam a exibir taxas de respostas menores do que os participantes do
Grupo 2 (SR). Foram encontrados, para os participantes do Grupo 1, inclusive alguns
padrões de scallop e break-and-run. Estes resultados vão ao encontro daqueles obtidos
por Matthews et al. (1977). Em ambas as pesquisas a resposta de consumação parece ter
tornado o comportamento de humanos semelhante ao comportamento de não-humanos
em programas de FI.
No entanto, no estudo de Costa et al. (2005) apresentado anteriormente, no qual
a conseqüência programada foi manipulada, os autores também utilizaram resposta de
consumação durante o procedimento. Nesta pesquisa, todos os participantes do Grupo 2
(Dinheiro) apresentaram um padrão comportamental de altas taxas de respostas, mesmo
com a presença da resposta de consumação. Como explicar esta discrepância? Algumas
diferenças no procedimento das três pesquisas podem ser responsáveis por estes
resultados divergentes. Por exemplo, Matthews et al. (1977) modelaram a resposta de
pressão ao botão, enquanto Costa et al. (2005) e Patsko et al. (no prelo, Experimento 2)
forneceram instruções aos participantes.
21
A questão da duração e quantidade de sessões também pode ser importante: os
participantes da pesquisa de Matthews et al. (1977) foram expostos a apenas uma sessão
experimental, enquanto nas pesquisa de Costa et al. (2005) e Patsko et al. (no prelo,
Experimento 2) os participantes foram expostos a, pelo menos, três sessões
experimentais. Os resultados da pesquisa de Aldinucci (2007), todavia, sugerem que
quantidades de treino diferentes em FR (três, seis ou nove sessões) tiveram pouca
influencia sobre o comportamento de humanos em um FI subseqüente.
Assim, pode-se concluir que a resposta de consumação é uma, mas não a única
variável que pode influenciar o comportamento humano em FI, pois quando a
conseqüência programada foi manipulada, os participantes que tiveram pontos trocados
por dinheiro se comportaram de maneira diferente em relação aos não-humanos.
Após a análise dos experimentos descritos nesta seção, percebe-se que o estudo
das variações de procedimento é um campo importante quando se considera as
diferenças comportamentais de humanos e não-humanos em programas de reforço. As
diferenças de procedimento, como será visto posteriormente, podem influenciar também
os resultados das pesquisas de história comportamental.
3.2 História recente e remota
Outro tema que vem sendo sistematicamente investigado por pesquisadores da
área de história comportamental e que também reflete divergências de resultados nas
pesquisas com humanos e não-humanos, diz respeito à comparação dos efeitos de
arranjos imediatamente precedentes (história recente) e dos efeitos de programas
arranjados em condições remotas (história remota).
22
Este tipo de manipulação foi empregado, por exemplo, no estudo de Weiner
(1969, Experimento 5). Neste experimento
14
, o autor investigou alguns efeitos de
história construída de forma seencial no comportamento subseqüente em FI. Seis
participantes foram expostos a uma das seguintes seqüências na fase de construção de
história: DRL 20 s e FR 40 ou FR 40 e DRL 20 s (três participantes expostos a cada
uma das seqüências). Em uma fase subseqüente, os participantes dos dois grupos foram
expostos a uma seqüência de FI 10 s e FI 10 s com custo, nessa ordem. Os resultados
indicaram que, independentemente da seqüência da história comportamental os
participantes, de modo geral, tenderam a apresentar baixas taxas de respostas no
programa de FI (com ou sem custo). Esses resultados sugerem que uma história de
exposição ao DRL, quer essa exposição seja remota ou recente, aumenta a probabilidade
de baixas taxas de respostas quando os participantes são expostos ao FI com ou sem
custo.
Utilizando um delineamento semelhante ao de Weiner (1969, Experimento 5),
LeFrancois e Metzger (1993) realizaram uma pesquisa cujo objetivo foi avaliar o efeito
de uma história imediata e de uma história remota sobre o comportamento atual de
ratos. Os ratos eram distribuídos em dois grupos e cada grupo era exposto a uma fase de
construção de história diferente. Os ratos do Grupo 1 eram expostos a um programa de
DRL, enquanto que os ratos do Grupo 2 eram expostos a um programa de DRL e FR.
Na última fase do experimento todos os ratos eram expostos a um programa de FI. Uma
preocupação interessante dos autores foi utilizar parâmetros diferentes nos programas
para cada rato nos grupos. Assim, após atingirem a estabilidade no programa de DRL,
os valores de FR (para o Grupo 2) e do FI (para ambos os grupos) foram calculados de
14
Weiner (1969) realizou outras manipulações no Experimento 5. Serão relatadas
apenas aquelas manipulações do subgrupo que se mostraram úteis para a discussão
desse tópico do presente trabalho.
23
modo a manter a taxa de reforços estável para cada rato. O comportamento em FI foi de
baixa taxa de respostas para os ratos do Grupo 1 e de alta taxa de respostas para os do
Grupo 2. Diferentemente dos resultados de Weiner (1969), os resultados deste estudo
indicaram que a história recente exerceu maior influência sobre o comportamento atual.
Outro estudo com ratos que sugere que o desempenho atual é mais afetado por
uma história recente, independentemente de qual contingência de reforço esenvolvida
nesta história, é o de Cole (2001). Foram utilizados 10 ratos experimentalmente
ingênuos, que foram distribuídos em cinco grupos: FI (controle); FR-FI; DRL-FI; DRL-
FR-FI e FR-DRL-FI. Após a exposição à história de reforço todos os ratos foram
expostos a uma mesma contingência de FI Esta exposição ao FI se deu por um período
de 80 a 100 sessões. Cole observou que, em todos os grupos (excluindo o controle), o
efeito da história recente foi maior do que o da história remota, independentemente
dessa história recente ser de FR ou DRL. Os ratos dos grupos FR-FI e DRL-FI
apresentaram, respectivamente, altas e baixas taxas de respostas no FI subseqüente.
Resultados parecidos foram observados para os ratos dos grupos DRL-FR-FI e FR-
DRL-FI. Nesses casos, o programa imediatamente precedente (história recente) pareceu
ter maior influência sobre o comportamento subseqüente em FI.
Como apontado anteriormente, os resultados obtidos por LeFrancois e Metzger
(1993), e Cole (2001) estão em contradição com aqueles obtidos por Weiner (1969,
Experimento 5). Segundo este último, a influência do programa de DRL não seria
eliminada mesmo que uma história recente de FR fosse fornecida ao participante. Os
resultados obtidos por LeFrancois e Metzger e Cole, porém, indicam que a história
recente exerceu maior influência sobre o responder atual, quer esta história tenha sido
de FR quer ela tenha sido de DRL. Os resultados discrepantes podem ser atribuídos a
algumas diferenças nos procedimentos destes experimentos: o fato de a taxa de reforços
24
entre as diferentes fases experimentais ter sido controlada no experimento de
LeFrancois e Metzger, e não no de Weiner
15
; no estudo de Weiner, luzes de cores
diferentes eram correlacionadas a cada um dos programas de reforço, enquanto
LeFrancois e Metzger não utilizam qualquer estímulo específico correlacionado com os
programas em vigor.
Outra explicação possível para as diferenças nos resultados de Weiner (1969,
Experimento 5) em relação aos de LeFrancois e Metzger (1993) e Cole (2001) diria
respeito às diferenças entre espécies: o comportamento atual de humanos e não-
humanos seria influenciado de maneira distinta pela história recente ou remota. Antes
que se possa recorrer a este tipo de explicação, uma análise da pesquisa de Salgado
(2007) sugere que diferenças no procedimento e não uma diferença entre espécies per se
podem ter contribuído para a discrepância nos dados das pesquisas citadas. O objetivo
do estudo de Salgado foi investigar o papel da conseência programada sobre o
comportamento de humanos em FI, após diferentes histórias comportamentais.
Participaram do estudo 12 estudantes universitários que foram distribuídos em quatro
grupos. Os participantes dos Grupos 1 e 3 foram expostos à seguinte seqüência de
programas de reforço: FR-DRL-FI. Para os participantes dos Grupos 2 e 4, a seqüência
dos programas de reforço foi: DRL-FR-FI. O instrumento utilizado para análise dos
dados foi o ProgRef v 3.1. Os participantes dos Grupos 1 e 2 tinham suas respostas de
pressão ao botão do mouse consequenciadas por pontos que, ao final das sessões eram
trocados por dinheiro (R$ 0,05 por ponto). Os participantes dos Grupos 3 e 4 tinham
como conseqüências para as respostas de pressionar o botão do mouse apenas os pontos.
Os resultados da pesquisa de Salgado (2007) indicaram que, quando os pontos
foram trocados por dinheiro, o comportamento dos participantes pareceu ser mais
15
A importância do controle da taxa de reforços será retomada mais adiante, na
descrição do experimento de Okouchi (2003a).
25
influenciado pela história recente, quer ela tenha sido de FR ou DRL (assim como nas
pesquisas de Cole, 2001 e LeFrancois e Metzger, 1997, com ratos). Quando a
conseqüência programada foram apenas os pontos, a história de DRL parece ter
exercido maior influencia sobre o comportamento em FI, quer tenha sido remota ou
recente (assim como a pesquisa de Weiner, 1969, Experimento 5).
Tomados em conjunto os dados das pesquisas de Cole (2001), LeFrancois e
Metzger (1993) e Weiner (1969, Experimento 5), em relação aos de Salgado (2007),
pode-se concluir que diferenças no procedimento podem ter sido responsáveis pela
discrepância nos resultados destas pesquisas. Quando condições específicas foram
arranjadas (neste caso, a conseqüência programada) o comportamento de humanos e
não-humanos variou em direções semelhantes.
Foi indicado anteriormente que a mudança de estímulo correlacionada com a
mudança nas contingências de reforço adotado em experimentos com humanos (Weiner,
1964; 1969), mas não com o-humanos (Cole, 2001; LeFrancois e Metzger, 1993)
pode ser uma das fontes de discrepância entre os resultados desses experimentos
relatados. Para se avaliar se esta hipótese tem sustentação é preciso analisar os estudos
de história comportamental que se propuseram a avaliar o papel do controle de
estímulos nos efeitos da história.
3.3 Controle de estímulos e história comportamental
Os estudos de história comportamental apresentados a então utilizaram
delineamento de grupos. A utilização de delineamentos de sujeito único, em estudos de
história comportamental, com sujeitos não-humanos, foi proposta por Freeman e Lattal
(1992). Para tanto, os autores realizaram manipulação dos estímulos correlacionados a
cada programa em vigor. Nos Experimentos 1 e 2, os pombos foram expostos a um
programa de FR e a um programa de DRL na Fase 1 (fase de construção da
26
história), sob diferentes controles de estímulo (a cor do fundo da caixa era preta
para FR e branca para DRL). Foram conduzidas duas sessões drias, com seis
horas de diferença entre elas. Os pombos eram expostos a um dos dois programas
em cada sessão, ou seja, eram expostos aos dois programas no mesmo dia. A
ordem de apresentação dos programas era sorteada, com a ressalva de que a
mesma ordem não acontecesse por mais de três vezes seguidas. Preocupados em
manter a taxa de reforços constante nos dois programas, os valores do FR foram
calculados a partir do desempenho dos pombos no programa DRL. Dessa forma,
os autores tentaram igualar o número de refoos obtidos pelos pombos nos dois
componentes de um programa múltiplo de reforço. Foram obtidas taxas de
respostas sistematicamente mais altas no programa de FR do que no programa de
DRL.
Em uma segunda fase, os pombos foram submetidos a seses de FI
(Experimento 1) ou VI
16
(Experimento 2), na presença dos estímulos que haviam
sido anteriormente correlacionados ao FR e ao DRL. Da mesma forma, os valores
do intervalo do FI e do VI foram calculados a partir do desempenho dos pombos
na Fase 1, com o objetivo de igualar a taxa de refoos na Fase 2 com aquelas da
Fase 1. Na Fase 2 foram obtidas, sistematicamente, taxas de respostas mais altas
nas sessões nas quais o estímulo presente era o mesmo utilizado durante o FR na
fase anterior e taxas mais baixas nas seses nas quais o estímulo presente era o
mesmo utilizado durante o DRL na fase anterior. Todavia, as taxas de respostas
dos pombos na presença do estímulo anteriormente correlacionado ao programa
16
VI, do inglês variable interval (intervalo variável). Em um programa de VI o
reforçador segue uma resposta após um intervalo de tempo que varia de reforçador para
reforçador de acordo com uma série randômica de intervalos. A média dos intervalos
entre reforços é que determina o VI. Os valores dos intervalos variam entre valores
extremos arbitrários. Programas de VI geralmente produzem taxas de respostas
constantes, i.e., sem pausa pós-reforço (Ferster & Skinner, 1957).
27
FR tenderam a diminuir com a exposição continuada às continncias de FI ou
VI, assim como as taxas de respostas na presea do estímulo anteriormente
correlacionado ao DRL tenderam a aumentar. Tal fato, segundo os autores,
sugere um aumento do controle pelas continncias presentes, tanto no programa
de FI quanto no programa de VI (Freeman & Lattal, 1992).
Os autores realizaram ainda um terceiro experimento no qual, na Fase 1,
os pombos foram submetidos a programa múltiplo
17
com componentes tandem
18
:
mult (tand VI-FR)-(tand VI-DRL). Dessa forma, neste experimento, os pombos
eram expostos a ambos os programas (FR e DRL) na mesma seso. Durante a
apresentão de cada um dos componentes do programa múltiplo, uma luz de cor
diferente também era apresentada (verde para o componente tand VI-FR e
vermelha para o componente tand VI-DRL). Os componentes foram apresentados
de maneira alternada, com um período de blackout (15 segundos) entre eles. As
taxas de respostas obtidas no componente tand VI-FR foram sistematicamente
mais altas em relão àquelas obtidas no componente tand VI-DRL.
Na Fase 2 deste experimento, os pombos foram expostos a um programa
mult VI-VI, cada componente do VI sendo apresentado juntamente a uma das
cores de luz que foi anteriormente correlacionada aos programas tand VI-FR e
tand VI-DRL. Os resultados encontrados por Freeman e Lattal (1992) foram
semelhantes àqueles dos Experimentos 1 e 2, ou seja, altas taxas de respostas no
17
Em um programa de reforço múltiplo, dois ou mais programas de reforço são
alternados, tendo um diferente estímulo presente durante cada um deles (Ferster &
Skinner, 1957).
18
Segundo Cirino (1999), “Tandem é uma palavra da língua inglesa que pode ser
traduzida pela expressão 'um atrás do outro'” (p. 18). Em um programa tandem, um
único reforço está programado para dois programas de reforço em vigor. Para que o
segundo componente do programa tandem entre em vigor é necessário que se complete
a exigência do primeiro. Não existem estímulos discriminativos correlacionados aos
componentes de um tandem (Ferster & Skinner, 1957).
28
componente VI no qual o estímulo presente era aquele que, na Fase 1, aparecia
juntamente ao componente de tand VI-FR. Da mesma forma, baixas taxas de
respostas foram obtidas no componente VI no qual o esmulo presente era o
mesmo que aparecia, na Fase 1, juntamente ao componente tand VI-DRL.
Os resultados de Freeman e Lattal (1992) sugerem que os efeitos da
história podem ficar sob controle de estímulos específicos (no caso, cores). O
delineamento utilizado pelos autores também serviu de base para a realizão de
diversos outros estudos de história comportamental.
Uma das pesquisas de história comportamental que utilizaram o delineamento
proposto por Freeman e Lattal (1992) foi a de Doughty, et al. (2005, Experimento 1). O
objetivo dos autores foi a avaliação dos efeitos da introdução de alimentação prévia
19
sobre o desempenho atual de pombos expostos a uma história comportamental
específica. Foram utilizados três pombos, cuja resposta de bicar um disco era reforçada
com alimento. Os pombos foram treinados a responder em um programa mult VR 45
DRL 8 s, cada componente sinalizado por uma luz de cor diferente. Após a obtenção de
estabilidade na taxa de respostas em ambos os componentes e atingirem um critério de
diferenciação entre a taxa de respostas dos dois componentes (taxas de respostas cinco
vezes maiores no componente VR em relação ao componente DRL), os pombos eram
expostos a um programa mult VI 90 s VI 90 s. As mesmas luzes apresentadas nos
programas de VR e DRL do componente múltiplo anterior foram apresentadas também
nessa fase, cada uma com um dos componentes do mult VI-VI. Os autores, então,
manipularam o estado de privação dos pombos pela introdução de alimentação prévia
(anteriormente, os pombos participavam das sessões experimentais privados de comida
a 80% do seu peso). Dois dos pombos, após algumas sessões, passaram a responder sob
19
Os sujeitos eram privados de alimento antes da fase de teste, mas poucos minutos
antes da sessão experimental o organismo tem acesso alimento e água livremente.
29
controle do programa VI-VI. Quando a alimentação prévia foi introduzida, o responder
desses dois pombos sofreu uma sensível alteração. As taxas de respostas no componente
VI, sinalizado pela luz anteriormente apresentada junto ao componente VR, foram
maiores que no componente VI sinalizado pela luz anteriormente apresentada junto ao
componente DRL. Doughty et al. sugerem, dessa forma, que tal desempenho poderia ser
atribuído à história comportamental à qual os pombos foram expostos (mult VR-DRL).
Em relação à introdução da alimentação prévia, os autores observaram uma sensível
alteração do responder dos sujeitos sob programa do mult VI-VI. Tais alterações,
porém, foram mais acentuadas no componente VI cujo estímulo foi anteriormente
correlacionado ao VR. O que se observou, todavia, é que tais efeitos tenderam a
diminuir com a exposição continuada ao mult VI-VI.
O delineamento proposto por Freeman e Lattal (1992) também foi utilizado com
participantes humanos. Okouchi (2003b) realizou uma pesquisa com o objetivo de
avaliar se os efeitos da história comportamental podem se generalizar para outras
dimensões dos estímulos. O autor dividiu sua pesquisa em dois experimentos. A
resposta exigida para cada participante (estudantes universitários) foi pressionar um
disco na tela do computador, o operandum (o monitor utilizado no estudo era sensível
ao toque) e um disco na parte inferior do monitor, a resposta de consumação. A
conseqüência programada eram pontos que apareciam na tela do monitor. Os
participantes eram pagos em dinheiro por seu desempenho na sessão e ao final do
experimento. No Experimento 1, os participantes foram submetidos a um programa
mult VR-DRL. Os valores de cada componente foram ajustados durante uma fase de
treino até os valores finais, ou seja, VR 30 e DRL 6 s. Durante a fase de treino, os
estímulos apresentados com cada componente foram linhas de diferentes comprimentos
que apareciam dentro do círculo de respostas (operandum) na tela do computador. Para
30
o programa de DRL foi apresentada uma linha de 13 mm de comprimento, enquanto
que para o VR foi apresentada uma linha de 25 mm de comprimento. Como esperado,
os participantes responderam em taxas mais altas no componente VR em relação ao
componente DRL. O autor passou, então, para a fase seguinte, na qual realizou um teste
de generalização utilizando as larguras das linhas anteriormente apresentadas como
parâmetro. Nessa fase, os participantes foram expostos à contingência de FI 6s. Foram
apresentadas 11 diferentes comprimentos de linhas, variando de 10 mm a 40 mm.
Okouchi observou que, de maneira geral, quando a linha variava de 22 a 28 mm de
comprimento, ou seja, valores próximos a 25 mm (comprimento apresentado junto ao
programa VR), os participantes respondiam em taxas mais altas do que quando o
comprimento da linha estava entre 10 e 16 mm, ou seja, valores próximos a 13 mm
(comprimento apresentado junto ao programa DRL). Dessa forma, o autor sugere que o
“comportamento foi generalizado para estímulos semelhantes fisicamente aos estímulos
da fase de treino” (p. 178).
No Experimento 2, Okouchi (2003b) propôs a utilização de extinção na fase de
teste. O método empregado foi praticamente o mesmo do Experimento 1, exceto que, na
fase de teste, o autor utilizou extinção em vez do programa de FI. Os resultados obtidos
também foram similares aos do Experimento 1, ou seja, houve generalização do
responder para os estímulos mais próximos fisicamente aos estímulos apresentados na
fase de treino (apesar de que, como ressaltado pelo próprio autor, os resultados tenham
sido menos sistemáticos e mais transitórios do que em relação ao Experimento 1).
Desse modo os resultados obtidos por este estudo de Okouchi estão de acordo com
aqueles obtidos por Freeman e Lattal (1992) e o além deles, pois demonstram que os
efeitos da história podem se generalizar para dimensões semelhantes do estímulo.
31
Okouchi (2003a) conduziu uma pesquisa com objetivo de avaliar se o intervalo
entre reforços (IRI)
20
poderia ser utilizado como controle de estímulos. O equipamento,
tarefa experimental e as conseqüências reforçadoras eram as mesmas utilizadas em
Okouchi (2003b). No Experimento 1, oito estudantes universitários foram expostos a
programas mistos (mix)
21
, distribuídos em dois grupos: Grupo 1, mix FR curto - DRL
longo”; Grupo 2, mix FR longo DRL curto”. Para os participantes do Grupo 1, os
valores do IRI para o “FR curto” foram ajustados de modo a serem menores que os do
“DRL longo”. Para os participantes do Grupo 2 aconteceu o inverso: os valores do IRI
para o “FR longo” foram ajustados de maneira a serem maiores do que os do DRL
curto”. Dessa forma, os valores do FR e do DRL foram diferentes para cada um dos
participantes, dependendo do ajuste do IRI. Na fase de teste, todos os participantes
foram expostos a um mix FI 5s-FI 20 s. O autor observou que os participantes do Grupo
1 tenderam a apresentar altas taxas de respostas no componente FI 5s (menor IRI,
correlacionado ao programa de FR-curto) e baixas taxas de respostas no componente FI
20 s (maior IRI, correlacionado ao programa de DRL-longo). os participantes do
Grupo 2 tenderam a apresentar altas taxas de respostas no componente FI 20 s (maior
IRI, correlacionado ao programa de FR-longo) e baixas taxas de respostas no
componente FI 5s (menor IRI, correlacionado ao programa de DRL-curto).
Os resultados de Okouchi (2003a) sugerem que o IRI também pode funcionar
como controle de estímulos, afetando o comportamento subseqüente. Dessa forma, um
20
IRI, do inglês inter-reinforcement interval (intervalo entre reforços). O IRI consiste
no tempo entre a apresentação de um reforço e a apresentação do próximo reforço
(Catania, 1998/1999).
21
“Os programas mistos são iguais aos múltiplos com a exceção de que o existem
estímulos correlacionados a cada componente do programa” (Ferster & Skinner, 1957,
p. 580)
32
experimento que proponha controle da taxa de reforços pode diminuir as influências
deste tipo de controle de estímulos sobre o desempenho dos organismos na fase de teste.
As pesquisas apresentadas anteriormente são estudos cujas características serão
importantes na construção do delineamento do presente projeto com, por exemplo,
trabalhos que utilizaram participantes humanos (e. g., Okouchi, 2003a; 2003b; Weiner,
1964; 1969), metodologia de sujeito único (e. g., Doughty et al., 2005; Freeman &
Lattal, 1992; Okouchi, 2003a; 2003b) e controle de estímulos (Freeman & Lattal, 1992;
Okouchi, 2003a; 2003b).
4 Delimitação do problema
O estudo realizado por Freeman e Lattal (1992) é um trabalho considerado
referência para os recentes estudos de história comportamental. Este estudo
agrega algumas características de experimentos de história anteriormente
relatados. Os sujeitos experimentais, pombos, eram expostos a uma fase de
construção de história, respondendo a programas de baixa taxa (DRL) e alta taxa
de respostas (FR) e, posteriormente, eram expostos a um programa que permitia
alta variação na taxa de respostas sem alteração na taxa de refoos (FI ou VI),
assim como em muitos outros estudos de história comportamental (por exemplo,
Cole, 2001; Costa, 2004; Costa, et al., 2005; Costa, et al., (no prelo); Salgado (2007);
Weiner, 1964; 1965; 1969, em estudos com humanos; Baron & Leinenweber,
1995; Cole, 2001; LeFrancois & Metzger, 1993; Urbain et al., 1978; Wanchisen et al.
1989, em estudos com o-humanos).
Porém, diferentemente dos delineamentos até eno propostos, Freeman e
Lattal (1992) utilizaram metodologia de sujeito único: cada sujeito foi exposto,
na fase de construção da história, tanto ao programa de FR quanto ao programa
de DRL de forma mais ou menos paralela, sendo cada programa correlacionado
33
sistematicamente com um esmulo (ou cor do fundo da caixa ou cor da luz da
chave de respostas). Após esta construção concomitante de diferentes histórias
de refoo sob controle de estímulos, os sujeitos eram expostos à fase teste em
programas de FI (Experimento 1) ou de VI (Experimentos 2 e 3), mantendo-se os
estímulos utilizados na fase anterior. De acordo com Freeman e Lattal, o
procedimento de hisrias paralelas permitiu uma avaliação (...) do desempenho
nos programas de FI e VI na presença de um estímulo historicamente
correlacionado com diferentes programas de reforço positivo” (p. 6-7). A partir
do delineamento de caso único em estudos de história comportamental proposto
por Freeman e Lattal, foram realizadas outras pesquisas como, por exemplo,
Doughty et al. (2005) com pombos e Okouchi (2003a; 2003b) com humanos.
Observando-se os dados das pesquisas citadas anteriormente, é importante
que novas pesquisas sejam realizadas, principalmente no que tange à questão da
generalidade entre as espécies (Sidman, 1960). Freeman e Lattal (1992) já
apontavam para esta queso ao justificar a utilizão de pombos como sujeitos
experimentais pela constatação de que a maioria dos estudos [sobre história
comportamental] conduzidos com o-humanos utilizou ratos como sujeitos
experimentais” (p. 6). Weiner (1964; 1965; 1969) e Okouchi (2003a; 2003b) utilizaram
humanos como participantes de pesquisa. Okouchi, inclusive, utilizou a metodologia de
sujeito único proposta por Freeman e Lattal. Os resultados encontrados sugerem
algumas similaridades entre o comportamento humano e o não-humano. Entretanto, a
realização de novas pesquisas pode auxiliar o desenvolvimento da história
comportamental enquanto área de pesquisa em Análise Experimental do
Comportamento.
34
O presente trabalho procurou realizar uma replicação sistemática do
estudo de Freeman e Lattal (1992 - Experimento 3). A diferença mais marcante
entre aquele estudo e o proposto aqui é a utilização de humanos como
participantes de pesquisa e outras diferenças originadas dessa mudança tais
como, tipo de reforçador, duração das sessões, instrumento de coleta de dados
utilizado etc.
Apesar de Okouchi (2003b) ter obtido resultados semelhantes aos de
Freeman e Lattal (1992), no que se refere ao papel do controle de estímulos nos
efeitos da história comportamental e tê-los ampliado, na medida em que
demonstrou que o controle de estímulos pode se generalizar para outros estímulos
com a mesma dimensão, algumas queses ainda precisam ser respondidas. Por
exemplo, no estudo de Okouchi não é possível avaliar com precisão o quanto o
comportamento estava sob controle da contingência atual (e.g., não há alises da
taxa de respostas entre reforços sucessivos). Além disso, Okouchi não se
preocupou em controlar a taxa de reforços entre as diferentes contingências
envolvidas no procedimento e o critério de mudança da fase de construção da
história para a fase de teste foi um número fixo de sessão (nenhum critério de
estabilidade foi utilizado). Por fim, mas não menos importante, uma replicação
sistemática do estudo de Freeman e Lattal poderia fornecer resultados mais claros
sobre a questão da discrepância entre o comportamento de humanos e não-
humanos em programas de reforço semelhantes.
O objetivo do presente trabalho foi contribuir, juntamente com os estudos
experimentais já realizados, para a compreensão do papel do controle de
estímulos nos efeitos da história com humanos. Mais especificamente foi
avaliado se cores diferentes do botão de respostas em cada componente de um
35
programa mult FR-DRL com controle da taxas de refoos, apresentado durante a
fase de constrão da hisria, controlam, de alguma forma, o comportamento
subseqüente de humanos em um programa mult FI-FI.
36
Método
Participantes
Participaram do presente estudo 4 (quatro) universitários de cursos de graduação
(um do sexo masculino e três do sexo feminino). Os participantes não eram estudantes
do curso de Psicologia, visto que experiências anteriores com exercícios utilizando
programas de reforço nas aulas da graduação poderiam influenciar os resultados do
presente experimento. Também foram excluídos participantes com suspeita ou
diagnóstico de Lesão por Esforço Repetitivo (L.E.R.), porque a tarefa experimental
exigida (pressões no botão do mouse) poderia agravar tais lesões.
Equipamentos e Instrumento
Foram utilizados dois computadores do tipo PC, ambos com monitor em cores
de 14 polegadas, mouse e teclado padrões e um gravador Panasonic® Slim Line, modelo
RQ-2103 com fones de ouvido Grove, modelo HD-3030, para emissão de um ruído
branco
22
.
Para coleta de dados, foi utilizado o software ProgRef v3.1 (Costa & Banaco,
2002; 2003). O software exibia no monitor uma tela cinza, contendo um retângulo no
centro inferior da tela (ver Figura 1). Sobre tal retângulo (botão de respostas) eram
emitidas as respostas que consistiam de pressões no botão esquerdo do mouse com o
cursor sobre o botão de respostas. Quando a exigência de um determinado programa de
reforço era cumprida, aparecia no canto superior direito da tela um ícone comumente
identificado como “smile”. O participante deveria, então, “clicar sobre outra barra,
situada também no canto superior direito (botão de resposta de consumação), para que o
22
Ruído branco é um som constante, presente durante toda a sessão, utilizado para
aumentar o controle experimental, evitando que o participante se distraia com outros
ruídos que possam ocorrer no momento da coleta de dados.
37
smile desaparecesse e um ponto fosse registrado no visor de pontuação localizado acima
do botão de respostas. Em um programa de reforço em FI ou DRL o intervalo tinha
início após o aparecimento do smile e o após a emissão da resposta de consumação.
Portanto, o tempo gasto pelo participante para deslocar o cursor do mouse do botão de
respostas até o botão de respostas de consumação e voltar novamente para o botão de
respostas é computado como parte dos intervalos do FI ou do DRL. A Figura 1 mostra o
layout da tela do ProgRef v3.1, com a qual os participantes interagiam. No programa de
reforço múltiplo o botão de respostas mudava de cor em cada um de dois componentes.
Figura 1. Layout da tela do computador com a qual os participantes interagiam.
Local
Os dados foram coletados no Laboratório de Análise Experimental do
Comportamento Humano (LAECH), localizado no Departamento de Psicologia Geral e
Análise do Comportamento, da Universidade Estadual de Londrina. A coleta foi
realizada em dois cubículos de aproximadamente 1,5 por 2,0 metros cada um, contendo,
além dos equipamentos, uma mesa, uma cadeira, e um ventilador.
Visor de pontuação
Botão de resposta de consumação
smile
Botão de respostas – Operandum
38
Procedimento
As sessões experimentais tiveram duração aproximada de 30 minutos e eram
diárias (exceto sábados, domingos e feriados). Os participantes receberam, ao final de
cada sessão, R$ 0,05 para cada ponto.
Para que o ruído de pessoas conversando ou de outras coletas de dados (outros
participantes emitindo respostas de clicar o botão do mouse) não influenciasse os
resultados do experimento, optou-se pela utilização do ruído branco. Os participantes
utilizaram um fone de ouvido, com volume regulável, em uma altura confortável
(definida pelo próprio participante).
Antes de começar o experimento, os participantes leram as informações sobre o
estudo (Apêndice A) e assinaram o “Termo de Consentimento Livre e Esclarecido”
(Apêndice B). Foi solicitado ao participante que deixasse seu material fora do cubículo
em que os dados foram coletados, e que retirasse o relógio e desligasse o celular. Ao
adentrar a sala de coleta, cada participante lia as instruções (Apêndice C), colocava o
fone de ouvido (com o ruído branco) e era, então, autorizado pelo experimentador a
começar a sessão. Para tanto, deveria clicar com o cursor do mouse sobre o botão de
início que estava presente na tela do computador. As fases do experimento estão
resumidas na Tabela 1.
39
Tabela 1. Seqüência das fases do experimento.
Componentes dos
programas de reforço
múltiplos
Fase
Verde Vermelho
Duração de
cada
componente
Duração de cada
sessão
Fase 1, Sessão 1
FR 10 DRL 2, 4, 6,
8, 10 s
10 pontos Aproximadamente
35 minutos
Fase 1, Sessão 2
FR 10 DRL 12, 14,
16, 18, 20 s
10 pontos Aproximadamente
35 minutos
Fase 1, Sessão 3
FR 10, 15,
20, 30, 40
DRL 20 s 10 pontos Aproximadamente
35 minutos
Fase 2 FR 40 DRL 20 s 5 minutos 30 minutos
Fase 3 FR n DRL 20 s 5 minutos 30 minutos
Fase 4 FI t s FI t s 5 minutos 30 minutos
Fase 1 Aquisição: Nesta fase, os participantes eram expostos a um programa mult
FR-DRL por três sessões. Na primeira sessão, os participantes eram expostos ao mult
FR 10 – DRL ts, no qual o valor de t era ajustado gradativamente, ou seja, 2, 4, 6, 8 e 10
segundos. Os componentes eram apresentados de forma alternada, sendo que o critério
de mudança de um componente para o outro era a obtenção de 10 pontos (critério
arbitrário). Portanto, a sessão teve início com um FR 10 e, quando o participante
ganhasse 10 pontos a cor do botão mudava e uma contingência de DRL 2 s entrava em
vigor; quando o participante ganhasse 10 pontos em DRL 2 s a contingência mudava
para FR 10. Após ganhar 10 pontos em FR 10, a contingência mudava para DRL 4s e
assim por diante. A primeira sessão terminava, dessa forma, quando o participante
obtivesse o vigésimo ponto no programa DRL 12 s. Na segunda sessão desta fase, o
40
valor do FR continuou fixo (10), enquanto que o valor do intervalo do DRL foi
novamente ajustado, agora começando em 12 segundos e aumentando para 14, 16, 18 e
20 segundos. Na terceira sessão, o valor do intervalo do DRL era sempre de 20
segundos e o valor do FR foi ajustado a cada 10 pontos ganhos, ou seja, 10, 15, 20, 30 e
40 respostas. O critério para alternação dos componentes, em todas as sessões desta
fase, foi a obtenção de 10 pontos em cada componente. A cor do botão de respostas era
verde no componente FR e vermelha no componente DRL. Um timeout de 5 s era
apresentado entre um componente e outro.
Fase 2 – Aproximação do intervalo entre reforços (IRI): Nesta Fase, os participantes
foram expostos, inicialmente, a um programa mult FR 40 DRL 20 s. A cor do botão
de respostas era verde para FR e vermelha para o DRL. Cada componente foi
apresentado alternadamente a cada 5 minutos. Toda sessão começava pelo componente
FR. Cada sessão tinha duração de 30 minutos. Ao final da primeira sessão da Fase 2, foi
verificado o IRI médio do componente de FR naquela sessão. Nas sessões subseqüentes,
o valor do FR era ajustado com base no IRI médio da sessão anterior para cada
participante, de tal modo que o IRI no componente de FR fosse aproximadamente o
mesmo que no componente de DRL (aproximadamente, 20 segundos). Tal
procedimento teve a função de igualar o máximo possível a taxa de reforços nos dois
componentes. Este procedimento foi adotado para que o IRI não se tornasse um controle
de estímulo adicional do mult FR-DRL (cf. Okouchi, 2003a). Um timeout de 5s era
apresentado entre um componente e outro.
Fase 3 Construção da linha de base: Os participantes foram expostos a um
programa mult FR n DRL 20 s, na presença de um botão verde no componente FR e
vermelho no componente DRL. Cada programa era apresentado alternadamente por 5
minutos cada e as sessões tiveram duração de 30 minutos. A Fase 3 foi mantida até que
41
a média da freqüência total da respostas de pressão ao botão nos dois componentes em
quatro sessões consecutivas fosse menor do que 10% da diferença entre a média das três
primeiras e três últimas destas quatro sessões (Schoenfeld, Cumming e Hearst,
1956/1968). Um timeout de 5s era apresentado entre um componente e outro.
Fase 4 Teste: Os participantes foram expostos a um programa de reforço mult FI ts
FI ts. O valor do intervalo dos componentes de FI (t) foi calculado com base na média
dos IRIs de ambos os componentes das quatro últimas sessões da Fase 3. Um timeout de
5s era apresentado entre um componente e outro. O botão de resposta era verde para o
primeiro componente de FI e vermelho durante o segundo componente de FI. Assim, os
estímulos presentes durante a apresentação de cada componente do programa múltiplo
foram mantidos constantes entre as Fases 1, 2, 3 e 4, porém as contingências de reforço
foram alteradas nesta Fase. Foram realizadas 15 sessões na Fase 4. No caso de P4,
foram realizadas mais quatro sessões nesta fase. A primeira destas quatro sessões teve
um intervalo de 38 dias em relação à última sessão anterior.
Fase 5 Mudança no controle de estímulos: Somente P4 foi exposto a esta fase. O
participante foi exposto a um programa mult FI ts FI ts, no qual o valor de t era o
mesmo da Fase 4. O botão de resposta era preto para o primeiro componente de FI e
branco durante o segundo componente de FI. Um timeout de 5 segundos era apresentado
entre um componente e outro. Esta fase foi realizada somente com P4 porque as taxas
de respostas permaneceram diferenciadas durante toda a Fase 4, isto é, o efeito da
história de exposição ao mult FR-DRL ainda era observado após 18 sessões da Fase 4.
42
Resultados
A Figura 2 a seguir indica as taxas de respostas (R/min) dos participantes em
todas as fases do experimento.
Figura 2: Taxas de respostas de P1, P2, P3 e P4 durante todas as fases do experimento.
As linhas pontilhadas indicam as mudanças de fase. Os círculos cheios indicam as taxas
de respostas nos componentes em que o botão de resposta era verde componente FR
(Fases 1, 2 e 3) e FI (Fase 4). Os círculos vazios indicam as taxas de resposta nos
componentes em que o botão de resposta era vermelho – componente DRL (Fases 1, 2 e
3) e FI (Fase 4). Na Fase 5 (P4), um programa mult FI-FI idêntico ao da Fase 4 foi
mantido, exceto que as cores do botão em cada componente mudou de verde
(Componente 1) e vermelho (Componente 2) para preto (Componente 1) e branco
(Componente 2).
43
Em relação à Fase 1 (aquisição), para todos os participantes, as taxas de
respostas na terceira sessão eram diferenciadas, ou seja, os participantes emitiam
taxas de respostas mais altas no componente FR do que no componente DRL. Hayes,
Brownstein, Haas e Greenway (1986) propuseram um critério para avaliar a
diferenciação do comportamento em dois componentes de um programa múltiplo de
reforço. Segundo este critério, considera-se que há diferenciação na freqüência de
respostas entre dois componentes de um programa múltiplo se o número total de
respostas no componente com menor freqüência, dividido pela freqüência total de
respostas em ambos os componentes, for menor que 0,25.
Aplicando esta fórmula da diferenciação após a coleta de dados foi possível
avaliar se havia diferenciação na taxa de respostas ao término da Fase 1 (aquisição). O
índice de diferenciação foi de 0,06 para P1, de 0,05 para P2, de 0,11 para P3 e de 0,08
para P4. Portanto, de acordo com o índice de diferenciação proposto por Hayes et al.
(1986) foi observada diferenciação na taxa de respostas de todos os participantes da
presente pesquisa nos componentes do programa múltiplo (altas taxas de respostas no
componente FR e baixas taxas no componente DRL).
Esse padrão se manteve durante a Fase 2 (aproximação do IRI), na qual os
valores do FR foram aumentados na tentativa de igualar a taxa de pontos ganhos em
ambos os componentes. Nesta fase cada participante foi exposto a um número diferente
de sessões, até que o critério para mudança de fase fosse atingido (IRI do componente
FR aproximadamente igual ao IRI do componente DRL e diferença de pontos ganhos
em cada componente menor do que dez). No caso de P1, o asterisco na Figura 1 indica
que entre a sessão 6 e a sessão 7 houve uma diferença menor do que dez pontos entre os
dois componentes do múltiplo (os IRIs médios da sessão 6 eram 25,5 para o
componente FR e 24,6 segundos para o componente DRL, enquanto que na sessão 7 os
44
IRIs médios eram 25,2 segundos para o componente FR e 25,1 para o componente
DRL), o que indicaria mudança da Fase 2 para a Fase 3. Porém, o IRI volta a ficar
diferenciado entre a sessão 7 e a sessão 8 (os IRIs médios da sessão 8 foram 22,2
segundos para o componente FR e 29,2 segundos para o componente DRL). Essa
diferenciação causou uma diferença no ganho de pontos no componente FR em relação
ao componente DRL maior do que dez nessa sessão. Dessa maneira, optou-se por
manter a Fase 2 por mais sessões, para que o valor dos IRIs pudesse, de fato, atingir um
valor mais próximo entre os componentes.
A Figura 3 mostra as taxas médias dos pontos obtidos em cada componente do
programa múltiplo para cada participante nas quatro últimas sessões da Fase 3 (mult
FR-DRL) e nas primeiras (Bloco Inicial) e quatro últimas (Bloco Final) sessões da Fase
4 (mult FI-FI).
Figura 3: Taxas médias de pontos obtidos em cada componente do programa múltiplo
FR-DRL para cada participante nas quatro últimas sessões da Fase 3 (Bloco Final), em
cada componente do programa múltiplo FI-FI nas quatro primeiras sessões da Fase 4
(Bloco Inicial) e nas quatro últimas sessões da Fase 4 (Bloco Final).
A Fase 2 foi encerrada apenas quando os IRIs do componente FR fossem
aproximadamente iguais aos do componente DRL ( 20 segundos) e a diferença de
45
pontos obtidos no componente FR fosse menor do que dez pontos em relação aos
pontos obtidos no componente DRL. A maior diferença entre os pontos obtidos nos
programas de FR e DRL encontrada nesta fase foi de 0,5 pontos/min (P2) o que, no
presente estudo, corresponde a 7 pontos por sessão. Observa-se que, de maneira geral, a
taxa de reforços não variou muito quando o programa foi mudado de um mult FR-DRL
para um mult FI-FI. A diferença entre as taxas médias de pontos nos dois componentes
para P1 durante as quatro últimas sessões da Fase 3 foi de 0,2 pontos/min. Quando a
contingência mudou para mult FI-FI, esta diferença deixou de ser observada. No caso de
P2, a diferença que era de 0,5 pontos/min durante a linha de base, manteve-se durante as
primeiras sessões da Fase 4, mas diminuiu: 0.2 pontos/min. Porém, nas quatro sessões
finais da Fase 4, a diferença não era mais observada. Para P3, não havia diferença na
taxa de pontos nas últimas sessões da linha de base. Durante as sessões da Fase 4, houve
uma pequena queda em relação à taxa de pontos em ambos os componentes, porém a
diferença na taxa de pontos entre os dois componentes continuou inexistente. No caso
de P4, havia uma diferença de 0,4 pontos/min entre os componentes durante as quatro
últimas sessões da Fase 4. Esta diferença continuou durante as quatro primeiras sessões
da Fase 4: 0,4 pontos/min. Nas últimas sessões da Fase 4, a diferença ainda podia ser
observada: 0,2 pontos/min. O valor da razão do componente FR utilizado na Fase 3
(linha de base) foi obtido pela aproximação dos IRIs do FR com os IRIs do DRL (i.e.,
aproximadamente 20 segundos). Dessa forma, na Fase 3, P1 foi exposto a um FR 220 e
P2, P3 e P4 a um FR 100.
Voltando à Figura 2, observa-se que todos os participantes apresentaram, ao
final da Fase 3 (linha de base), altas taxas de respostas no componente FR (botão verde)
em relação ao componente DRL (botão vermelho). Aplicando-se novamente a fórmula
para o lculo da diferenciação proposto por Hayes et al. (1986), o participante que
46
apresentou o menor índice de diferenciação (responder entre componentes mais
diferenciado) foi P1 (0,005), seguido de P4 (0,009), P2 (0,008) e P3 (0,01).
Durante as primeiras sessões da Fase 4 em que um programa mult FI-FI estava
em vigor podem ser observados efeitos da exposição prévia a um mult FR-DRL, para
todos os participantes. Eles continuaram a emitir altas taxas de resposta no componente
com botão verde [FR] e baixas taxas de resposta no componente com botão vermelho
[DRL]
23
. Entretanto, após uma exposição continuada ao mult FI-FI, as taxas de resposta
de P1, P2 e P3 tenderam a se igualar.
No caso de P4, o padrão comportamental selecionado pela história de exposição
ao mult FR-DRL persistiu durante toda a Fase 4 (mult FI-FI), ou seja, o participante
continuou emitindo altas taxas de respostas no componente com botão vermelho [DRL]
em relação ao componente com botão verde [FR]. Após as 15 sessões programadas para
o encerramento da Fase 4, P4 foi exposto a mais quatro sessões do mult FI-FI (verde-
vermelho). Estas quatro sessões tiveram um intervalo de 38 dias em relação à 15ª sessão
da Fase 4. A seta preta na Figura 2 indica a primeira dessas quatro sessões. Mesmo após
este período, o comportamento de P4 permaneceu inalterado: altas taxas de resposta no
componente com botão verde [FR] e baixas taxas de respostas no componente com
botão vermelho [DRL]. Após a realização dessas quatro sessões, P4 foi exposto à Fase
5, na qual o mesmo mult FI-FI da fase anterior estava em vigor, mas as cores do botão
de respostas mudaram para preto no primeiro componente e branco no segundo. Após a
mudança no controle de estímulos observou-se uma mudança abrupta no
comportamento de P4, no mesmo sentido dos outros participantes: as taxas de respostas
23
Quando as cores do botão de respostas estiverem referindo-se à Fase 4, será utilizada
a notação verde [FR] e vermelho [DRL] para destacar que, durante as fases anteriores,
estas cores foram correlacionadas, respectivamente, aos programas de FR e DRL.
47
nos dois componentes tenderam a se igualar, o que sugere um controle maior da
contingência presente.
É interessante notar que, para três dos quatro participantes (P1 e P3 na Fase 4 e
P4 na Fase 5), as taxas de respostas no componente FI com botão verde [FR] (ou preto,
no caso de P4) tenderam a diminuir mais do que as taxas de respostas no componente
com botão vermelho [DRL] (ou branco, no caso de P4) tenderam a aumentar. Este não
foi o caso de P3, em que as taxas de respostas no componente FI com botão verde [FR]
tenderam a baixar, de maneira geral, na mesma proporção que as taxas de respostas no
componente FI com botão vermelho [DRL] tenderam a aumentar.
Entretanto, uma análise da proporção da mudança da taxa de respostas em
relação à linha de base (cf. Nevin, 1974; 1988) nos dois componentes do programa
múltiplo, mostra um quadro diferente. A Figura 4 a seguir exibe a proporção da
mudança nas taxas de respostas nos componentes do mult FI-FI da Fase 4 (P1, P2 e P3)
ou da Fase 5 (P4) em relação às quatro últimas sessões da linha de base (mult FR-DRL).
A proporção foi calculada dividindo-se a taxa de respostas de cada componente em cada
sessão pela média da taxa de respostas nas quatro últimas sessões da Fase 3. Esta
diferença foi, então, dividida por 100 (100% era o valor da média da taxa de respostas
nas quatro últimas sessões da linha de base). Observa-se na Figura 4 que, no caso de P1,
P2 e P3, a proporção da mudança da taxa de respostas em relação à linha de base foi
maior no componente de FI com botão vermelho [DRL] do que no componente de FI
com botão verde [FR], indicando que uma história de FR pode produzir um responder
mais resistente à mudança.
No caso de P4, quando o comportamento na Fase 5 é analisado, observa-se que a
mudança nas taxas de respostas em relação à linha de base foi maior no componente FI
com botão branco em relação ao componente FI com botão preto.
48
Figura 4: Proporção da mudança das taxas de respostas em relação à linha de base nos
componentes do mult FI-FI na Fase 4 (para P1, P2 e P3). Os pontos cheios indicam a
mudança na taxa de respostas nos componentes FI com botão verde (que na linha de
base correspondiam ao FR) e os pontos vazios indicam a mudaa na taxa de respostas
nos componentes FI com botão vermelho (que na linha de base correspondiam ao DRL).
Para P4 (Fase 5) os pontos cheios indicam a mudança na taxa de respostas nos
componentes FI com botão preto e os pontos vazios indicam a mudança na taxa de
respostas nos componentes FI com botão branco. Os primeiros pontos em cada gráfico
indicam o log da média da taxa de respostas em cada componente nas quatro últimas
sessões da Fase 3.
A Figura 5 exibe os registros cumulativos de todos os participantes na última
sessão da Fase 3 (mult FR-DRL, coluna da esquerda), na primeira sessão da Fase 4
(mult FI-FI, coluna central) e na última sessão da Fase 4 (mult FI-FI, coluna da direita).
Todos os participantes terminaram a Fase 3 respondendo de forma diferenciada nos
componentes do mult FR-DRL (ver também Figura 2). Observa-se que os participantes
emitiam taxas de respostas altas e constantes no FR, sem pausas pós-reforço. No
componente DRL, o comportamento foi de taxas de respostas baixas e constantes
(geralmente, uma resposta por intervalo).
49
Figura 5: Registros cumulativos da última sessão da Fase 3 (mult FR-DRL, coluna da
esquerda), primeira sessão da Fase 4 (mult FI-FI, coluna central) e última sessão da Fase
4 (mult FI-FI, coluna da direita) para todos os participantes. Os números nos registros
indicam cada componente (1 para FR ou FI com botão verde e 2 para DRL ou FI com
botão vermelho) e as linhas pontilhadas indicam mudança de componente. Os registros
voltam a zero a cada 250 respostas. Cada sessão teve duração de 30 minutos.
50
Durante a primeira sessão da Fase 4 (quando o programa foi mudando para um
mult FI-FI), algumas mudanças podem ser identificadas no comportamento de P1 e P3.
No caso de P1, podem ser observadas altas taxas de respostas nos componentes FI com
botão vermelho [DRL], principalmente no quarto e sexto componentes do múltiplo. No
início do segundo componente do múltiplo também podem ser observadas altas taxas de
respostas no registro cumulativo de P1 (como indicado pela seta na Figura 5). Uma
análise dos registros cumulativos de sessões 22 e 24 (não reproduzidas no presente
trabalho) indica que, em alguns casos, P1 emitia altas taxas de respostas no componente
DRL (botão vermelho). No caso de P3, também pode ser observado um pequeno
aumento na taxa de respostas no último componente do programa múltiplo (FI com
botão vermelho). Esta não foi o caso de P2 e P4, que continuaram emitindo taxas de
respostas diferenciadas durante toda a sessão.
O que se observa ao final da Fase 4, porém, é que o comportamento de P1, P2 e
P3 ficou relativamente igual nos dois componentes do mult FI-FI (foram observadas
taxas de respostas relativamente iguais nos dois componentes). Os índices de
diferenciação de acordo com a fórmula de Hayes et al. (1986) foram 0,38 para P1, 0,49
para P2 e 0,46 para P3. O participante P4, porém, continuou apresentando um padrão
diferenciado de respostas nos componentes do múltiplo (índice de diferenciação igual a
0,02).
A Figura 6 a seguir mostra a sessão onde o comportamento dos participantes
começou a mudar quando da exposição ao mult FI-FI. Observa-se que, no caso de P1, o
comportamento começa a mudar logo na primeira sessão da Fase 4 (Sessão 29). A
mudança é marcante principalmente no quarto componente do múltiplo (segundo
componente FI com botão vermelho [DRL]).
51
Figura 6: Registros cumulativos das sessões do mult FI-FI nas quais o comportamento
dos participantes começa a mudar (sessões da Fase 4 para P1, P2 e P3 e da Fase 5 para
P4). Os números nos registros indicam cada componente (1 para FI com botão verde
[FR] e 2 para FI com botão vermelho [DRL]). Os registros cumulativos voltam a zero
após 250 respostas e as linhas pontilhadas marcam o final do componente. Cada
componente tinha duração de cinco minutos.
Nos casos de P2 e P3, a mudança pode ser observada na terceira sessão da Fase
4 (sessão 15 para P2 e sessão 16 para P3). Uma análise visual do registro cumulativo de
P2 permite identificar a mudança no quarto componente do mult FI-FI (segunda
apresentação do FI com botão vermelho [DRL]). Uma análise molecular do
comportamento de P2 indicou ainda uma diferença nas médias dos IRTs dos três
componentes FI com botão vermelho [DRL] (Componente 2): 26,9 segundos para a
primeira apresentação do Componente 2; 9,3 segundos para a segunda apresentação e
0,6 segundos para a terceira apresentação. Para P3, a mudança pode ser observada no
segundo componente do mult FI-FI (primeira apresentação do FI com botão vermelho
[DRL]). A diferença entre as médias dos IRTs nos três componentes FI com botão
vermelho nesta sessão foi: 13,4 segundos para a primeira apresentação; 11,8 segundos
52
para a segunda apresentação; 3,1 segundos na terceira apresentação. Em ambos os casos
(P2 e P3), o desempenho final na sessão de mudança assemelha-se ao padrão final
observado na última sessão da Fase 4 (como pode ser visto na Figura 2).
Como foi visto na Figura 5, o comportamento de P4 continuou diferenciado
durante toda a Fase 4. Quando as cores dos botões de resposta foram modificados na
Fase 5 (preto e branco), o comportamento de P4 mudou logo na primeira sessão (sessão
37). O comportamento de P4 durante a primeira sessão da Fase 5 foi semelhante ao
comportamento deste participante durante as outras sessões.
A Figura 7 a seguir mostra a ampliação do terceiro e quarto componentes dos
registros cumulativos da última sessão da Fase 4 (mult FI-FI). Esta ampliação permite
observar alguns detalhes que não podem ser vistos na Figura 4 (na última sessão,
supostamente, o desempenho do participante estaria mais estável; a escolha pela porção
central da sessão foi arbitrária).
Figura 7: Ampliações do terceiro e quarto componentes do mult FI-FI (verde-vermelho)
da última sessão da Fase 4 para todos os participantes. Os números nos registros
indicam cada componente (1 para FI com botão verde [FR] e 2 para FI com botão
vermelho [DRL]). Os registros cumulativos voltam a zero após 250 respostas e as linhas
pontilhadas marcam o final do componente. Cada componente tinha duração de cinco
minutos.
53
O comportamento de P1 e P3, em ambos os componentes, era de taxas baixas de
respostas, inclusive apresentando alguns padrões de scallop e break-and-run, conforme
indicado pelas setas na Figura 7. Durante a última sessão da Fase 4, o comportamento
de P2 era de taxas de respostas altas e constantes, sem pausa pós-reforço. Como foi
observado anteriormente na Figura 5, o comportamento de P4 continuou a apresentar
diferenciação nos dois componentes do múltiplo. Porém, a taxa de respostas no
componente FI com botão vermelho [DRL] aumentou em relação ao componente DRL
da Fase 3.
Durante as últimas quatro sessões da Fase 3, a taxa média de respostas no
componente DRL era de 2,7 R/min. Durante a Fase 4, as taxa média de respostas
durante o componente FI com botão vermelho [DRL] era de 3,3 R/min. A taxa média de
respostas no componente FI com botão verde [FR], que era de 305,1 R/min, também
aumentou em relação à taxa média de respostas no componente FR das últimas quatro
sessões da Fase 3, que era de 276,5 R/min.
54
Discussão
O objetivo do presente trabalho foi avaliar o efeito de uma exposição
pvia a um programa mult FR-DRL sobre o comportamento subseqüente de
humanos em um programa mult FI-FI (mantendo-se o mesmo controle de
estímulos i.e., mesma cor do botão de respostas nos dois programas
múltiplos). Três dos quatro participantes (P1, P2 e P3) apresentaram efeitos de curta
duração da exposição anterior a um programa mult FR-DRL quando as contingências
mudaram para um mult FI-FI. Com a exposição continuada ao mult FI-FI as taxas de
respostas pareceram se ajustar ao parâmetro temporal da contingência de reforço
presente (a diferença na taxa de respostas entre os dois componentes não foi
substancial), sugerindo que as cores do botão de respostas talvez tenham controlado
menos ou mesmo deixaram de controlar a taxa de respostas. Os resultados destes
três participantes vão ao encontro daqueles obtidos por Freeman e Lattal (1992).
Os resultados de P4 durante a Fase 4, porém, foram diferentes dos outros
participantes. Até a 15ª sessão da Fase 4 (32
a
sessão do experimento), podem ser
observados efeitos da exposição prévia ao mult FR-DRL no comportamento de P4, ou
seja, altas taxas de resposta no componente FI quando o botão de resposta era verde (a
mesma usada durante o componente de FR na fase anterior) e baixas taxas no FI quando
o botão de respostas era vermelho (a mesma usada durante o componente de DRL na
fase anterior). Estes resultados vão ao encontro daqueles obtidos no estudo de Weiner
(1964; 1969), que sugerem efeitos de longa duração de uma história de responder em
FR ou DRL sobre o comportamento subseqüente em FI.
Após 38 dias de intervalo entre a 15ª e a 16ª sessão da Fase 4, a taxa de respostas
de P4 nos dois componentes do mult FI-FI continuou diferenciada por quatro sessões.
Estes resultados sugerem que a mera passagem do tempo não foi suficiente para
55
eliminar os efeitos da exposição anterior ao mult FR-DRL no comportamento de P4.
Resultados semelhantes foram encontrados por Ono e Iwabuchi (1997, Parte 2). Os
pombos utilizados neste experimento foram expostos, em uma primeira fase, a um mult
DRH-DRL. O disco que os pombos bicavam era verde para o componente DRH e
vermelho para o componente DRL. Após seis meses de intervalo, os pombos eram
expostos a um programa de VI simples, com disco branco. Em uma terceira fase, um
programa mult VI-VI entrou em vigor, com a cor do disco variando entre verde e
vermelha (algumas sessões de VI simples com disco branco também foram realizadas
nesta fase). Os autores observaram que, mesmo após a passagem de seis meses, foram
observados efeitos da história de exposição ao mult DRH-DRL sobre o comportamento
no mult VI-VI.
Resultados semelhantes foram relatados também por Skinner (1950). Pombos
foram condicionados a bicar um disco sobre o qual era projetado um estímulo visual
complexo. Em seguida os pássaros eram alojados em suas gaiolas-viveiro sem nenhuma
exposição a qualquer contingência de reforço por um período de tempo que variou entre
seis meses e quatro anos. Então, os pombos foram introduzidos novamente na caixa
experimental em um programa de extinção. No período inicial da extinção no qual o
disco estava presente, mas o iluminado com o estímulo complexo, os pombos o
responderam. Quando o padrão complexo foi projetado no disco os pombos emitiram
cerca de 700 respostas na hora subseqüente.
Por que as taxas de respostas de P4 permaneceram diferenciadas durante toda a
Fase 4 (sugerindo efeitos de história de longa duração)? A resposta, provavelmente, diz
respeito à questão do controle de estímulos. A pesquisa de Okouchi (2003a) sugere que
a taxa de reforços pode servir de controle de estímulos quando se muda o programa de
reforço em vigor. Como na presente pesquisa a taxa de reforços em ambos os
56
componentes foi aproximada (durante a Fase 3 e 4 ver Figura 3), o comportamento de
P4 parece ter ficado, preponderantemente, sob controle dos estímulos correntes que
também estavam presentes nas fases anteriores do estudo, ou seja, as cores do botão de
resposta. Apesar da taxa de respostas de P4, durante a Fase 4, ter sido algo diferente da
taxa de respostas da Fase 3 (Figura 7), ela permaneceu mais alta no componente FI com
botão verde do que no componente FI com botão vermelho. Como o comportamento
diferenciado nos dois componentes do programa mult FI-FI continuou produzindo
pontos, não foi observada mudança comportamental substancial. Esse resultado parece
indicar que o comportamento de P4 continuou sob controle das cores dos botões, uma
vez que comportar-se daquela forma na presença daqueles estímulos continuou a
produzir pontos
24
.
Com o objetivo de verificar se a manutenção do padrão comportamental estava
sob controle principalmente das cores do botão de respostas, elas foram modificadas na
Fase 5 para P4. Quando as cores dos botões de resposta foram modificadas (preto para
um dos componentes de FI e branco para o outro) o comportamento de P4 mudou,
ficando semelhante ao dos outros participantes na Fase 4. Este resultado parece indicar
que o comportamento de P4 estava, durante a Fase 4, preponderantemente sob controle
das cores do botão de resposta (verde e vermelho). Os resultados de uma pesquisa
apresentada por Ferster e Skinner (1957) sugerem que a mudança abrupta do estímulo
durante um programa múltiplo produz alterações no comportamento corrente. Pombos
eram submetidos a um mult FI-FR e, subseqüentemente, o estímulo correlacionado ao
FI era apresentado durante o componente em que o FR estava em vigor. Os resultados
24
Essas considerações levariam à pergunta: por que então o comportamento dos outros
participantes não apresentou a persistência comportamental vista nos resultados de P4?
Essa questão será retomada e discutida mais adiante.
57
indicaram um comportamento típico de programas de FI quando o estímulo
correlacionado a este programa de reforço aparecia durante o FR.
Em relação aos estudos de Weiner (1964; 1969) que também sugerem efeitos
de longa duração da história luzes de cores diferentes estavam presentes durante cada
programa de reforço (FR ou DRL na fase de construção da história, ou FI durante a fase
de teste). Se nos estudos de Weiner havia luzes de diferentes cores durante a
apresentação de cada programa de reforço e ainda assim foram observados efeitos de
longa duração, por que o comportamento de P4 no presente estudo mudou quando as
cores do botão de respostas foram alteradas na Fase 5? A resposta para esta questão
parece estar na própria configuração das contingências de reforço. Nos estudos de
Weiner os participantes eram expostos a programas de reforço simples FR ou DRL,
dependendo do grupo e, posteriormente, a um FI. No presente estudo, os participantes
eram expostos a programas de reforço múltiplo. No caso de programas múltiplos, o
comportamento do organismo é, mais provavelmente, colocado sob controle dos
estímulos presentes uma vez que a melhor relação resposta-reforçador depende de qual
estímulo está presente e os estímulos alternam-se a todo o momento durante uma sessão
experimental. Esse não era o caso nos arranjos experimentais dos estudos de Weiner.
Se o controle de estímulos (cores dos botões) foi um fator importante para a
manutenção do comportamento de P4 durante a Fase 4 e posterior mudança durante a
Fase 5, uma pergunta que precisa ser abordada é: quais foram as variáveis relevantes
que contribuíram para a mudança no padrão comportamental de P1, P2 e P3 quando as
contingências de reforço mudaram durante a Fase 4?
Poder-se-ia esperar que uma mudança na taxa de reforço entre a Fase 3 e 4
aumentasse a probabilidade de que o comportamento dos participantes se alterasse na
Fase 4 (cf. Okouchi, 2003a). Entretanto, em relação ao controle da taxa de reforços, a
58
Figura 3 indica que no caso de P1 havia uma pequena diferença na taxa de reforços nos
dois componentes do mult FR-DRL durante as últimas sessões da Fase 3. Esta diferença
desapareceu quando da exposição ao mult FI-FI durante a Fase 4. No caso de P3, não foi
observada variação na taxa de reforços nos dois componentes durante as quatro últimas
sessões da Fase 3 (mult FR-DRL) nem durante a Fase 4 (mult FI-FI). Os resultados de
P2 e P4, no entanto, foram mais semelhantes. Tanto P2 quanto P4 tinham uma pequena
variação na taxa de reforços nos dois componentes do mult FR-DRL nas quatro últimas
sessões da Fase 3. Nas quatro primeiras sessões da Fase 4, essa variação continuou
sendo observada para ambos os participantes. Porém, na Figura 6 verifica-se que o
comportamento de P2 começa a mudar na terceira sessão da Fase 4 (Sessão 15 do
experimento), enquanto que a taxa de respostas de P4, nos dois componentes do
programa múltiplo, permaneceu diferenciada durante toda a Fase 4. Tais resultados
sugerem que não uma correlação clara entre a diferença na taxa de reforços durante
as quatro últimas sessões da Fase 3 e início da Fase 4 com a probabilidade da mudança
comportamental subseqüente.
Uma vez que a diferença na taxa de reforços, aparentemente, não foi o fator
relevante para explicar a mudança ou manutenção das taxas de respostas após a
alteração das contingências de reforço, uma análise da taxa local de respostas, via
inspeção visual dos registros cumulativos e análises dos IRTs de porções de algumas
sessões, foi implementada.
Observando-se o comportamento de P1, foram identificados padrões de altas
taxas de respostas no segundo componente FI (botão vermelho) da primeira sessão da
Fase 4 (ver Figuras 5 e 6). Altas taxas de respostas no início do componente DRL foram
observadas nos registros cumulativos de outras sessões das fases anteriores para este
participante (não apresentados no presente trabalho). Entretanto, quando isso ocorreu, o
59
IRI aumentou (i.e., um período de tempo maior foi necessário para a obtenção do
ponto), que uma diminuição nos IRTs abaixo de 20 segundos fazia zerar o
cronômetro, reiniciando o intervalo. Quando este aumento na taxa local de respostas
ocorreu durante a Fase 4 – em que um programa de FI estava em vigor nos dois
componentes do múltiplo (conforme visto na Figura 5) a diminuição dos IRTs não
produziu mudança no IRI. Esta variação pode ter contribuído para que o comportamento
de P1 mudasse bruscamente ainda na primeira sessão da Fase 4 no componente FI com
botão vermelho.
No caso de P2 e P3, não houve uma variação o evidente na taxa local de
respostas como aquela observada nos registros cumulativos de P1. Isso pode ter
contribuído para que os efeitos da história durassem por praticamente toda a primeira
sessão da Fase 4. A seleção de outro padrão comportamental depende da variação no
comportamento (Skinner, 1981). Todavia, uma análise preliminar dos IRTs sugeriu que
a freqüência de IRTs curtos aumentou a partir da terceira sessão da Fase 4 para P2 e P3,
durante o componente FI com botão vermelho (cor do botão correlacionado ao DRL na
fase anterior). Este aumento na freqüência dos IRTs curtos pode ter sido responsável
pela seleção de um novo padrão comportamental, sob controle do parâmetro temporal
dos programas de FI. Quanto ao P4, houve alguns IRTs curtos durante o FI com o botão
de respostas vermelho (correlacionado anteriormente ao DRL), entretanto, a freqüência
desses IRTs curtos, aparentemente, não foi tão alta quanto aquelas observadas nos
registros de P2 e P3. Uma análise mais refinada da distribuição dos IRTs poderia lançar
luz sobre a diferença no desempenho de P4 em relação aos demais participantes.
Um aspecto polêmico nos estudos de história comportamental diz respeito à sua
duração. Alguns autores (e.g., Tatham & Wanchisen, 1998; Wanchisen & Tatham,
1991) sugeriram que, em alguns casos, os efeitos da história comportamental poderiam
60
ser permanentes. Quando se analisa o comportamento de P1, P2 e P3 observa-se que,
com a exposição continuada ao mult FI-FI as taxas de respostas tendem a se tornar
iguais nos dois componentes do programa múltiplo. Estes resultados, de acordo com
Freeman e Lattal (1992), sugerem que o comportamento dos participantes ficou sob
controle do programa corrente, o mult FI-FI. Nesse sentido, os resultados destes
participantes corroboram a afirmação de Cole (2001) de que histórias de FR e DRL
parecem não afetar permanentemente o desempenho em um programa de FI. Assim,
pode-se afirmar que, no caso do presente estudo, os efeitos da história não foram
permanentes. Mesmo no caso de P4, que apresentou maior persistência comportamental,
quando as cores do botão de respostas foram alteradas na Fase 5 observou-se que o
comportamento do participante pareceu ficar sob controle da contingência presente.
Outro aspecto que precisa ser destacado com relação à mudança no
comportamento durante o mult FI-FI (na Fase 4 para P1, P2 e P3 e na Fase 5 para P4)
diz respeito à proporção dessa mudança em relação à linha de base. A Figura 4 mostra
que houve uma maior tendência ao aumento na taxa de respostas no componente FI com
botão vermelho (previamente correlacionado ao DRL), em relação à diminuição na taxa
de respostas no componente FI com botão verde (previamente correlacionado ao FR).
Ou seja, o comportamento no componente FI com botão verde parece ter sido mais
resistente à mudaa. No caso de P4, durante a Fase 5, o componente que apresentou
maior resistência à mudança foi o componente FI com botão preto. Como na presente
pesquisa os componentes eram apresentados sempre começando pelo FR (Fases 1, 2 e
3) e pelo componente FI com botão verde (Fase 4), a ordem de apresentação dos
componentes durante a Fase 5 (botão preto antes do botão branco) pode ter servido
como um controle de estímulos adicional para o comportamento de P4. Estes resultados
são contrários ao dos estudos da área de momento comportamental. Alguns estudos
61
sugerem que, uma vez controlada a taxa de reforço nos dois componentes de um
programa múltiplo que selecionam alta e baixa taxa de respostas (e.g., DRH e DRL), a
resistência à mudança é maior no componente cuja taxa de respostas era menor (e.g.,
Lattal, 1989; Nevin, 1974; 1979).
Todavia, deve-se destacar que as pesquisas da área de momento comportamental
utilizam durante a fase de teste, programas de extinção, alimentação prévia ou liberação
de comida independente da resposta em FT
25
ou VT
26
(cf. Lattal, 1989; Nevin, 1974;
Nevin, Mandell, & Atak, 1983). Este tipo de manipulação geralmente produz
diminuição na taxa de respostas em ambos os componentes do programa múltiplo.
Assim, pode-se avaliar, por exemplo, qual componente produz maior resistência à
mudança observando-se as taxas de respostas em ambos durante a extinção: aquele
componente em que as taxas de respostas diminuírem menos é o mais resistente à
mudança. No presente estudo, a mudança nas taxas de respostas nos dois componentes
do mult FI-FI (em relação à exposição prévia ao mult FR-DRL) deu-se em direções
opostas: aumento nas taxas de respostas no componente FI com botão vermelho (ou
branco, no caso de P4) correlacionado ao DRL e diminuição das taxas de respostas
no componente FI com botão verde (ou preto no caso de P4) correlacionado ao FR.
Este é um fator que pode ter contribuído para os resultados discrepantes em relação às
pesquisas da área de momento comportamental. Pesquisas futuras poderiam utilizar o
mesmo procedimento do presente estudo na fase de construção da história e na fase de
teste utilizar um mult Extinção-Extinção.
25
FT, do inglês fixed time (tempo fixo). Em um programa de FT um reforçador é
liberado após um intervalo de tempo fixo. Assim, em um programa haveria 5 segundos
de intervalo entre a liberação de um reforçador e a liberação do próximo.
26
VT, do inglês variable time (tempo variável). Em um programa de VT um reforçador
é liberado após um intervalo de tempo que varia de reforçador para reforçador, de
acordo com uma série randômica de intervalos. Os valores dos intervalos variam entre
valores extremos arbitrários.
62
Os resultados do presente estudo sugerem que, quando condições experimentais
específicas são arranjadas, resultados semelhantes podem ser obtidos utilizando-se
diferentes espécies. Freeman e Lattal (1992) utilizaram pombos como sujeitos
experimentais e os resultados de seu estudo foram, de maneira geral, parecidos com os
resultados do presente estudo. Weiner (1983) apontou para a importância da realização
de pesquisas experimentais utilizando humanos como participantes. Ressalta ainda o
fato de ter conseguido, em suas pesquisas com humanos, dados de pesquisa o
regulares quanto aqueles obtidos com não-humanos. A este respeito, Skinner
(1957/1972) diz que “A reprodutibilidade de espécie para espécie é um produto do
método. Escolhendo os estímulos, respostas e reforçadores apropriados para a espécie
estudada, eliminamos as fontes de diferenças de muitas espécies.” (p. 156)
63
REFERÊNCIAS BIBLIOGRÁFICAS
Aldinucci, B. A. S. (2007). Efeitos de diferentes extensões de uma história de FR sobre
o responder subseqüente em FI com humanos. Dissertação de Mestrado apresentada
ao Programa de Mestrado em Análise do Comportamento da Universidade Estadual
de Londrina.
Aló, R. M. (2005). História de reforçamento. In Abreu-Rodrigues J., Ribeiro, M.R
(org.). Análise do Comportamento: pesquisa, teoria e aplicação (p.45-62). Porto
Alegre: Artmed.
Azrin, N. (1958). Some effects of noise on human behavior. Journal of the
Experimental Analysis of Behavior, 1(2), 183-200.
Baron, A., & Leinenweber, A. (1995). Effects of a variable-ratio conditioning history on
sensitivity to fixed-interval contingencies in rats. Journal of the Experimental
Analysis of Behavior, 63(1), 97-110.
Baum, W. M. (1999). Compreender o behaviorismo: ciência, comportamento e cultura.
(M. T. A. Silva, M. A. Matos, G. Y. Tomanari, & E. Z. Tourinho, Trads.). Porto
Alegre: Artmed. (Originalmente publicado em 1994).
Branch, M. C. (1987). Behavior Analysis: a conceptual and empirical base for behavior
therapy. Behavior Therapist, 4, 79-84.
Cançado, C. R. X., Soares, P. G., Cirino, S. D., & Dias, A. L. F. (2006). Behavioral
history: Terms associated with the word history in publications of JEAB and JABA.
Pôster apresentado durante o 32º Encontro anual da Association for Behavior
Analysis. Atlanta, Geórgia, Estados Unidos.
64
Catania, A. C. (1999). Aprendizagem: Comportamento, Linguagem e Cognição.
(Traduzido por D. G. Souza, org.) Porto Alegre: Artmed. (Trabalho original
publicado em 1998).
Chiesa, M. (1994) Radical Behaviorism: the Philosophy and the Science. Boston:
Authors Cooperative, Inc., Publishers.
Chung, S. H. (1965). Effects of effort on response rate. Journal of the Experimental
Analysis of Behavior, 8(1), 1-7.
Cirino, S. D. (1999). Efeitos de História de reforçamento sobre o comportamento atual
de pombos. Tese de doutorado defendida no Departamento de Psicologia
Experimental da Universidade de São Paulo.
Cirino, S (2001a). O que é história comportamental. In H. J. Guilhardi; M. B. B. P.
Madi; P. P. Queiroz e M. C. Scoz (Orgs.), Sobre Comportamento e Cognição:
Expondo a variabilidade (Vol 7, pp.153-158). Santo André: ESETec.
Cirino, S. (2001b). Detecção da história de reforçamento: problemas metodológicos
para lidar com a história passada. In H. J. Guilhardi; M. B. B. P. Madi; P. P. Queiroz
e M. C. Scoz (Orgs.), Sobre Comportamento e Cognição: Expondo a variabilidade
(Vol 8, pp.137-147). Santo André: ESETec.
Cirino, S. D., Cançado, C. R. X., Soares, P. G. & Dias, A. L. F. (2006). Behavioral
history: Reflections on a classification model. Trabalho apresentado no 32º Encontro
da Association for Behavior Analysis, Atlanta, Geórgia, Estados Unidos.
Cole, M. R. (2001). The long-term effect of high- and low-responding histories on
fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior,
75(1), 43-54.
Costa, C. E. (2004). A natureza do reforçador como uma variável moduladora dos
efeitos da história de reforço sobre o comportamento de seres humanos. Tese de
65
doutorado defendida no Departamento de Psicologia Experimental da Universidade
de São Paulo.
Costa, C. E., & Banaco, R. A. (2002). ProgRef v3: sistema computadorizado para a
coleta de dados sobre programas de reforço com humanos – recursos básicos. Revista
Brasileira de Terapia Comportamental e Cognitiva, 4(2), 171-172.
Costa, C. E., & Banaco, R. A. (2003). ProgRef v3: sistema computadorizado para a
coleta de dados sobre programas de reforço com humanos recursos adicionais.
Revista Brasileira de Terapia Comportamental e Cognitiva, 5(2), 219-229.
Costa, C. E., Banaco, R. A., & Becker, R. M. (2005). Desempenho em FI com
humanos: efeito do tipo de reforçador. Temas em psicologia, 13(1), 18-33.
Costa, C. E., Banaco, R. A., Longarezi, D. M., Martins, E. V., Maciel, E. M., & Sudo,
C. H. (no prelo). Tipo de reforçador como variável moduladora dos efeitos da
história em humanos. Psicologia: Teoria e Pesquisa.
Doughty, A. H., Cirino, S., Mayfield, K. H., Da Silva, S. P., Okouchi, H., & Lattal, K.
A. (2005). Effects of behavioral history on resistance to change. Psychological
Records, 55, 315-330.
Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York:
Appleton.
Freeman, T. J., & Lattal, K. A. (1992). Stimulus control of behavioral history. Journal
of the Experimental Analysis of Behavior, 57(1), 5-15.
Hayes, S. C., Brownstein, A. J., Haas, J. R. & Greenway, D. E. (1986). Instructions,
multiple schedules, and extinction: Distinguishing rule-governed from schedule-
controlled behavior. Journal of the Experimental Analysis of Behavior, 46, 137-147.
Lattal, K. A. (1989). Contingencies on response rate and resistance to change. Learning
and Motivation, 29, 191-203.
66
LeFrancois, J. R., & Metzger, B. (1993). Low-response-rates conditioning history and
fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior,
59(3), 543-549.
Matthews, B. A., Shimoff, E., Catania, A. C., & Sagvolden, T. (1977). Uninstructed
human responding: sensitivity to ratio and interval contingencies. Journal of the
Experimental Analysis of Behavior, 27(3), 453-467.
Metzger, B. (1992). Stimulus control of behavioral history and subsequent fixed-
interval performance. Doctoral dissertation presented in the Departament of
Experimental Psychology of West Virginia University.
Nevin, J. A. (1974). Response strength in multiple schedules. Journal of the
Experimental Analysis of Behavior, 21(3), 389- 408.
Nevin, J. A. (1979). Reinforcement schedules and response strength. Reinforcement and
the organization of behavior. New York: John Wiley & Sons.
Nevin, J. A. (1988). Behavioral momentum and the partial reinforcement effect.
Psychological Bulletin, 103, 44-56.
Nevin, J. A., Mandell, C., & Atak, J. R. (1983). The analysis of behavioral momentum.
Journal of the Experimental Analysis of Behavior, 39(1), 49-59.
Okouchi, H. (2002). Individual differences in human fixed-interval performance.
Psychological Record, 52, 173-186.
Okouchi, H. (2003a). Effects of differences in interreinforcer intervals between past and
current schedules on fixed-interval responding. Journal of the Experimental Analysis of
Behavior, 79(1), 49-64.
Okouchi, H. (2003b). Stimulus generalization of behavioral history. Journal of the
Experimental Analysis of Behavior, 80(2), 173-186.
67
Ono, K., & Iwabuchi, K. (1997). Effects of histories of differential reinforcement of
response rate on variable-interval responding. Journal of the Experimental Analysis
of Behavior, 67(3), 311-322.
Patsko, C., Becker, R. M., & Costa, C. E., (no prelo). Desempenho em FI com
humanos: efeito da interação da resposta de consumação e do tipo de instrução.
Interação em Psicologia.
Perone, M., Galizio, M., & Baron, A. (1988). The relevance of animal-based principles
in the laboratory study of human operant conditioning. In G. Davey & C. Cullen
(eds). Human operant conditioning and behavior modification (pp. 59-84).
Chichester, England: John Wiley & Sons Ltd.
Salgado, R. C. (2007) Efeitos da história recente e remota sobre o responder
subseqüente em FI com humanos: o papel do tipo de reforçador empregado.
Dissertação apresentada ao Programa de Mestrado em Análise do Comportamento da
Universidade Estadual de Londrina.
Shoenfeld, W. N., Cumming, W. W., & Hearst, E. (1968). On the classification of
reinforcement schedules. In A. C. Catania. Contemporary research in operant
behavior (pp. 113-117). New York, Scott, Foresman and Company. (Originalmente
publicado em 1956).
Sidman, M. (1960). Tactics of Scientific Research. New York: Basic Books.
Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57(4),
193-216.
Skinner, B. F. (1972). The experimental analysis of behavior. In Cumulative record (p.
125-157). New York, Appleton Century Crofts. (Originalmente publicado em 1957).
Skinner, B. F. (1974). About behaviorism. New York: Vintage Books.
Skinner, B. F. (1981). Selection by Consequences. Science, 213, 501-504.
68
Skinner, B. F. (1989). The origins of cognitive thought. In Recent issues in the Analysis
of Behavior (pp. 13-25). Ohio: Merril Publishing.
Tatham, T. A., & Wanchisen, B. (1998). Behavioral history: a definition and some
common findings from two areas of research. Behavior Analyst, 21, 241-251.
Urbain, C., Poling, A., Millan, J., & Thompson, T. (1978). d-Amphetamine and
fixed-interval performance: effects of operant history. Journal of the
Experimental Analysis of Behavior, 29(3), 385-392.
Wanchisen, B. A. (1990). Forgetting the lessons of history. Behavior Analyst, 13, 31-37.
Wanchisen, B. A., Tatham, T. A., & Mooney, S. E. (1989). Variable-ratio conditioning
history produces high- and low-rate performances in rats. Journal of the
Experimental Analysis of Behavior, 52(2), 167-179.
Wanchisen, B.A., & Tatham, T. A. (1991). Behavioral history: a promising challenge in
explaining and controlling human operant behavior. The Behavior Analyst, 14, (2),
139-144.
Weiner, H. (1964). Conditioning story and human fixed-interval performance. Journal
of The Experimental Analysis of Behavior, 7(5), 383-385.
Weiner, H. (1965). Conditioning history and maladaptative human operant behavior.
Psychological Records, 17, 659-662.
Weiner, H. (1969). Controling human fixed-interval performance. Journal of The
Experimental Analysis of Behavior, 12(3), 349-373.
Weiner, H. (1983). Some thoughts on discrepant human-animal performance under
schedules of reinforcement. Psychological Record, 33, 521-532.
69
APÊNDICES
70
Apêndice A. Informações sobre o estudo a serem apresentadas aos participantes.
INFORMAÇÕES SOBRE O ESTUDO
Caros convidados:
Estamos desenvolvendo uma pesquisa com o intuito de sabermos um pouco mais
sobre as variáveis ambientais que contribuem para a variabilidade comportamental entre
os indivíduos. Sendo assim, gostaríamos de convidá-los a participar do experimento. Os
itens abaixo trazem esclarecimentos sobre o trabalho que será realizado.
Objetivo: Estudar algumas variáveis que possam afetar o modo como as pessoas se
comportam em determinadas situações.
Procedimento: Serão realizadas no mínimo 20 sessões experimentais em uma sala do
CCB (Centro de Ciências Biológicas) na UEL (Universidade Estadual de Londrina). As
sessões serão diárias (exceto finais de semana e feriados), realizadas individualmente e
terão a duração aproximada de 30 minutos cada. Será utilizado um fone de ouvido para
emissão de ruído branco (“chiado”), em volume adequado, durante toda a sessão. Antes
do início da sessão os participantes receberão uma folha com a instrução acerca da
tarefa experimental a ser executada: os participantes realizarão uma tarefa no
computador. Em linhas gerais, o objetivo será ganhar o maior número de pontos
possíveis (que aparecerão na tela do monitor).
Justificativa e Possíveis Benefícios: Estudos nessa linha de pesquisa podem ajudar a
compreender melhor as variáveis ambientais que levam a variabilidade comportamental
71
entre os indivíduos. O presente estudo pretende lançar mais luz sobre esta área do
conhecimento.
Riscos: O procedimento experimental empregado não oferece qualquer risco à
integridade física ou moral dos participantes. Não é recomendável, porém que
participantes com suspeita ou diagnóstico de Lesão por Esforço Repetitivo (LER)
participem do estudo, pois podem agravar sua lesão. O ruído branco também será
mantido em um volume confortável, regulado pelo próprio participante. Gostaríamos de
deixar claro que os participantes poderão abandonar a pesquisa a qualquer momento
sem que haja qualquer tipo de pena.
Sigilo: A identidade dos participantes será preservada, embora os resultados da pesquisa
possam ser divulgados em publicações e eventos científicos.
Maiores esclarecimentos sobre a pesquisa serão fornecidos ao final da coleta de
dados. Estamos à disposição para maiores esclarecimentos sobre o estudo que não
venham a influenciar o desempenho dos participantes na pesquisa.
Antecipadamente agradecemos,
____________________________________
Coordenador do Projeto
72
Apêndice B. Termo de Consentimento Livre e Esclarecido a ser apresentado aos
participantes
TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO
Eu,____________________________________________________
__RG:_____________________, após ter lido e entendido todas as
informações contidas nas “Informações sobre o estudo” na página
anterior e esclarecido todas as minhas dúvidas com o responsável pela
coleta de dados, concordo voluntariamente em participar da presente
pesquisa. Atesto também o recebimento das “Informações sobre o
estudo”, necessário para a minha compreensão da pesquisa.
______________________________________ Data: __/__/__.
Assinatura do entrevistado
Eu, ________________________________ RG:__________________, declaro que
forneci todas as informações referentes ao estudo ao entrevistado.
_______________________________________ Data: __/__/__.
Assinatura do responsável pela entrevista
73
Apêndice C. Instruções a serem fornecidas aos participantes.
INSTRUÇÃO
Obrigado por sua participação!
O experimentador não está autorizado a dar qualquer
informação adicional. Caso houver dúvidas, releia o texto a seguir
e prossiga o experimento.
Sua tarefa será manusear o mouse de algum modo específico
com o objetivo de conseguir pontos. Os pontos aparecerão em
uma janela (contador) que se localizará na parte superior da tela
do computador na posição central.
Boa Sorte!
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo