( PDF ) Controle de estímulos e história comportamental em humanos COMPORTAMENTAL EM HUMANOS

Download PDF

ads:

Universidade Estadual de Londrina

PAULO GUERRA SOARES

CONTROLE DE ESTÍMULOS E HISTÓRIA

COMPORTAMENTAL EM HUMANOS

Londrina

2008

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

PAULO GUERRA SOARES

CONTROLE DE ESTÍMULOS E HISTÓRIA

COMPORTAMENTAL EM HUMANOS

Dissertação apresentada ao programa de

Mestrado em Análise do Comportamento da

Universidade Estadual de Londrina como

parte dos requisitos para obtenção do grau

de Mestre em Análise do Comportamento.

Orientador: Prof. Dr. Carlos Eduardo Costa

* Projeto parcialmente financiado pela FUNDAÇÃO ARAUCÁRIA

Londrina

2008

ads:

iii

PAULO GUERRA SOARES

CONTROLE DE ESTÍMULOS E HISTÓRIA COMPORTAMENTAL

EM HUMANOS

Dissertação apresentada para cumprimento dos

requisitos para obtenção do título de Mestre em

Análise do Comportamento.

COMISSÃO EXAMINADORA

_______________________________________

Prof. Dr. Carlos Eduardo Costa

Universidade Estadual de Londrina

_______________________________________

Prof. Dr. Sérgio Dias Cirino

Universidade Federal de Minas Gerais

_______________________________________

Prof

. Dr

. Silvia Regina de Souza Arrabal Gil

Universidade Estadual de Londrina

Londrina, junho de 2008.

“O hoje é apenas um furo no futuro

Por onde o passado começa a jorrar...”

Raul Seixas

Marcelo Nova

DEDICATÓRIA

Para meus pais pois, no princípio, eram eles.

AGRADECIMENTOS

O ano era 2005 e estávamos, eu e alguns amigos psicólogos, comendo

sanduíches enormes no “Tosco Burguer”, em Belo Horizonte. Lembro-me que, ao tocar

no assunto “mestrado”, um dos meus amigos exclamou: “mestrado sem sofrimento não

existe! Nunca conheci alguém que tenha feito mestrado e não tenha chorado”! Confesso

que aquilo me assustou um pouco. Afinal, eu estava prestes a fazer a minha prova de

mestrado! Porém, agora, em 2008, ao final do processo, posso afirmar: se a regra era

chorar sempre, fui uma exceção. O que tenho para dizer sobre meu mestrado é que foi

uma das experiências mais enriquecedoras da minha vida! Aproveito a ocasião para

agradecer muito às pessoas que foram importantes durante este processo:

Primeiramente aos meus pais, seu Lau e dona Beth, e meus irmãos, Lipe e Zá.

Acreditem, sem vocês, nada do que está acontecendo hoje seria possível. Estar longe de

vocês ainda é o único fator que pode ter me feito querer chorar durante o mestrado.

Aos meus amigos de Belo Horizonte que, assim como minha família, não me

deixaram desistir. Muito obrigado, Gustavão, Tiagão, Filho, Lêta, Claret e Alysson,

mais uma vez, pela força, ainda que de longe.

Aos meus amigos da Análise do Comportamento, pessoas tão especiais pra mim

hoje, que foram importantíssimas na minha formação e tornaram o aprendizado tão

reforçador: Sônia, André, Ana Maria, Adélia, Renata Horta, Ernani e Gustavo Teixeira.

Fico feliz em saber que existem pessoas como vocês caminhando ao meu lado.

Não posso deixar de agradecer também a duas das pessoas mais importantes na

minha vida: Sérgio Cirino e Carlos Cançado, ou simplesmente “Serjão” e “Carlão”.

Seria necessário escrever um livro para narrar a importância que vocês têm em minha

vida e em minha formação. Eu nunca seria nada do que sou hoje se não tivesse

vii

trabalhado com vocês. Vocês me ensinaram a ser reforçador e crítico, obsessivo e

histérico. É muito importante saber que temos um ao outro para nos apoiar nos

momentos difíceis e celebrar nos momentos de alegria. E serão, ainda, muitos

momentos de alegria!

Meu mestrado também não seria possível sem as minhas colegas de turma:

Camila, Carol, Elissa, Fernanda, Ju, Lígia, Olivia e Renata. Muito obrigado, meninas,

por tudo! Um beijo especial para a Marina, que fez com que Londrina se tornasse um

lugar quentinho, mesmo quando o inverno bateu forte.

Agradeço também aos professores que conheci em Londrina e que me

acompanharam durante o mestrado: Verônica, Maura, Sílvia e Maria Luíza. O que

aprendi com vocês vai pra vida toda! Um forte abraço também para a Inês, sempre

prestativa, e para o Nelsinho e Zé Carlos, pelas nossas conversas pelos corredores do

PGAC. Falando em PGAC, não posso deixar de agradecer aos companheiros de

laboratório: Rodrigo Salgado, Luiz de Freitas, Tatiany Porto, Murilo Ramos, Rodrigo

Becker e Raquel Lacerda. Com essa turma toda, não dava pra se sentir sozinho no

laboratório! Agradeço também à Fundação Araucária, por financiar parte deste projeto,

e aos meus participantes, pela várias e várias sessões experimentais!

Muito importante na minha caminhada foi o apoio da Prof.ª Elisabete Coelho,

coordenadora do curso de Psicologia da Faculdade Pitágoras – Campus Metropolitana.

Obrigado pela oportunidade, pela confiança e por “segurar a barra” nos momentos em

que a dissertação tomava muito do meu tempo.

Queria também mandar um grande beijo para uma das pessoas mais importantes

desta trajetória: Íria, você sabe o quanto eu amo você. Se não fosse por você, nada disso

teria sido possível. Pelos beijos, abraços e carinhos. Que ainda durarão muito, muito

viii

tempo! Um grande abraço também para sua família, que sempre que me recebeu de

braços abertos.

Finalmente, mas não menos importante, gostaria de deixar um agradecimento

para meu orientador, Prof. Carlos Eduardo Costa. Caê, você foi um orientador perfeito

quando precisou ser e, principalmente, foi um amigo em todos os momentos. Obrigado

por fazer de mim o profissional e a pessoa que sou hoje. Fechamos este ciclo, meu

amigo. Mas se precisar de mim, sabe onde me achar. Um grande abraço!

SUMÁRIO

Dedicatória........................................................................................................................... v

Agradecimentos................................................................................................................... vi

Sumário ...............................................................................................................................ix

Resumo................................................................................................................................. x

Abstract............................................................................................................................... xi

Introdução............................................................................................................................ 1

Definições de história comportamental............................................................................... 3

O que é um estudo de história comportamental? ............................................................... 5

Estudos experimentais sobre história comportamental...................................................... 7

Diferenças entre humanos e não-humanos em programas de reforço...................... 8

História recente e remota..................................................................................... 21

Controle de estímulos e história comportamental................................................. 25

Delimitação do problema................................................................................................... 32

Método................................................................................................................................ 36

Participantes............................................................................................................ 36

Equipamentos e Instrumento ................................................................................... 36

Local....................................................................................................................... 37

Procedimento.......................................................................................................... 38

Resultados .......................................................................................................................... 42

Discussão ............................................................................................................................ 54

Referências bibliográficas.................................................................................................. 63

Apêndices ........................................................................................................................... 69

Soares, P. G. (2008) Controle de estímulos e história comportamental em humanos.

Dissertação apresentada ao Programa de Mestrado em Análise do Comportamento da

Universidade Estadual de Londrina. 84 p.

Resumo

O objetivo foi observar o efeito de uma exposição a um mult FR-DRL sobre o

comportamento subseqüente em um mult FI-FI, quando os mesmos controles de

estímulo foram mantidos. Participaram quatro universitários, cuja tarefa experimental

consistia em pressionar o botão esquerdo do mouse com o cursor sobre um botão (botão

de resposta) que aparecia no monitor do computador. Ao ser cumprida a contingência de

reforço programada, um smile aparecia no canto superior direito do monitor e, para que

um ponto fosse creditado em um visor acima do botão de respostas, o participante

deveria clicar em um botão localizado acima do smile (botão de resposta de

consumação). Os participantes foram expostos a um programa mult FR-DRL até que

fosse obtida estabilidade na taxa de respostas em ambos os componentes. A cor do

botão de resposta era diferente para cada componente do programa múltiplo (verde para

FR e vermelha para DRL). Em uma fase seguinte, os participantes foram expostos a um

programa mult FI-FI. Cada componente deste múltiplo era correlacionado a uma das

cores do botão de resposta apresentadas anteriormente. Nas duas fases, um timeout de 5

segundos ocorria entre os componentes do programa múltiplo. De maneira geral, os

resultados replicaram aqueles obtidos por Freeman e Lattal. Observou-se que três dos

quatro participantes apresentaram efeitos da história de exposição ao mult FR-DRL

somente por algumas sessões. Com a exposição continuada ao mult FI-FI, o

comportamento destes participantes tendeu a ficar sob controle da contingência

presente. O comportamento de um dos participantes apresentou efeitos da história de

exposição ao mult FR-DRL durante toda a fase de teste (mult FI-FI). Este participante

foi exposto, então, a mais dez sessões de um mult FI-FI, mas as cores dos botões de

resposta foram trocadas para preto e branco. Observou-se que o comportamento deste

participante mudou, ficando semelhante ao dos outros três quando foram expostos ao

mult FI-FI. Os resultados do presente estudo sugerem que o comportamento de humanos

tende a ficar sob controle da nova contingência de reforço com a exposição continuada a

esta contingência e, portanto, os efeitos da história são transitórios. Quando a resistência

à mudança pareceu maior, a substituição dos estímulos – cuja função havia sido

selecionada durante a fase de construção da história (i.e., a mudança na cor do botão de

respostas) – foi suficiente para produzir uma mudança comportamental e produzir um

padrão que parecia sob controle da contingência presente.

Palavras-chave: história comportamental; controle de estímulos; programas de reforço;

humanos

Soares, P. G. (2008) Stimulus control and behavioral history in humans. Dissertation

presented to the Masters Program in Behavior Analysis at Universidade Estadual de

Londrina. 84 p.

Abstract

The goal of the present study was to analyze the effects of a previous exposure to a mult

FR-DRL over subsequent behavior under a mult FI-FI, when similar stimuli were

maintained across conditions. Four undergraduate students served as participants. The

experimental task was pressing a mouse’s left button with the cursor over the response

button, displayed on the computer’s screen. When the reinforcement contingency in

effect was satisfied, a smile was displayed on the screen’s upper right corner and, after

the participant clicked on a button located above the smile (the consummatory response

button), a point was displayed on a counter located above the response button.

Participants were exposed to a mult FR-DRL until stable response rates were obtained

under both components. The color of the response button was different during each

component of the multiple schedule (green, during the FR and red during the DRL). On

a subsequent phase, participants were exposed to a mult FI-FI. Each component of this

schedule was correlated with one of the colors of the response button previously

presented. On both phases, a 5-s timeout occurred between components of the multiple

schedule. In general, the results replicated those obtained by Freeman and Lattal. Three

out of four participants presented effects of a history of exposure to the mult FR-DRL

for only a few sessions. With extended exposure to the mult FI-FI, the behavior of these

participants came under the control of the current contingency. The behavior of one

participant showed effects of the history of exposure to the mult FR-DRL during all the

test phase (mult FI-FI). This participant was exposed, then, to ten additional sessions

under the mult FI-FI, but the colors of the response button were changed to black and

white. The behavior of this participant changed, becoming similar to that of the other

three participants when exposed to the mult FI-FI. The results of the present study

suggest that human behavior may come under the control of a new contingency of

reinforcement with extended exposure to this contingency and, consequently, that

history effects are transitory. When resistance to change seemed higher, changing the

stimuli – whose function was previously established during the history building

condition (i.e., changing the color of the response button) – was sufficient to produce

behavioral change and a response pattern that seemed under the control of the current

contingency.

Key-words: behavioral history; stimulus control; schedules of reinforcement; humans

Introdução

Quando se examina a afirmação de Chiesa (1994) de que a “história pessoal

(experiência) é uma parte necessária das explicações do comportamento presente no

modelo causal de variação e seleção” (p. 122), percebe-se claramente a importância da

consideração e do estudo de variáveis históricas na Análise do Comportamento. O

modelo causal de variação e seleção é uma das bases do modelo skinneriano de

comportamento operante (Skinner, 1981). Para que se entenda como se dão os processos

de variação e seleção, deve-se recorrer a eventos históricos, ou seja, a explicação de tais

processos não está somente nos fatos atuais, muito menos em entidades internas. A

explicação última está na história. Os processos históricos que devem ser pesquisados,

para que se expliquem determinados padrões de comportamento, diferem para cada um

dos três tipos de variação e seleção: para o tipo filogenético, deve-se investigar a

seleção natural, ou seja, a história de evolução de uma determinada espécie; no tipo

ontogenético, a história comportamental de cada indivíduo é o foco de análise; já no

tipo cultural, o interesse está na história de um determinado grupo, sociedade ou

civilização e suas práticas culturais. O comportamento de seres humanos seria, dessa

forma, função de um conjunto de contingências

filogenéticas, ontogenéticas e culturais

(Baum, 1994/1999; Skinner 1981). Em relação à Análise do Comportamento, Skinner

(1974) afirma que “(...) uma análise do comportamento é (...) necessariamente

‘histórica’ (...)” (p. 236), ressaltando a importância da consideração e do estudo da

história ontogenética no entendimento do comportamento. Para isso, é importante que

se entenda como a noção e, posteriormente, as tentativas de definição de história

comportamental foram sendo propostas ao longo do tempo nas produções analítico-

comportamentais.

Contingências descrevem as condições sob as quais uma resposta produz determinada

conseqüência (Catania, 1998/1999).

À luz dos argumentos apresentados, observa-se que a noção de que as ações dos

organismos são determinadas pelo contato com contingências presentes em função de

uma exposição às contingências passadas (Branch, 1987; Ferster & Skinner, 1957;

Sidman 1960; Weiner, 1969) é considerada um consenso pela comunidade de analistas

do comportamento.

O que se constata, porém, é que os pesquisadores analistas do comportamento,

em geral, enfatizam o estudo do controle das variáveis presentes em detrimento dos

efeitos da história comportamental (Aló, 2005; Wanchisen, 1990). O esforço em se

estudar os efeitos de contingências passadas sobre o comportamento atual é tão pequeno

e assistemático, quando comparado com a literatura sobre efeitos de contingências

presentes (Tatham & Wanchisen, 1998), que se observa a existência de pouca clareza

até mesmo em torno do que os autores definem como "história comportamental". Isso

pode ser verificado quando se constata a alta profusão de termos utilizados para se

referir aos efeitos de contingências passadas sobre o comportamento atual - seja em

estudos que tenham por objetivo a verificação desses efeitos ou em estudos que

enfocam outros aspectos do desempenho de um organismo - como apontado por Cirino

(2001b): “história comportamental, história de condicionamento, história

operante, história passada, história de reforçamento, história de esquema, história

latente, história de desempenho, dentre outros” (p. 2). Cançado, Soares, Cirino e

Dias (2006) verificaram a existência de 126 diferentes termos vinculados à

palavra “história” (history) em artigos do Journal of the Experimental Analysis of

Behavior (JEAB) e do Journal of the Applied Behavior Analysis (JABA). Destes,

20 termos eram utilizados para se referir à história comportamental propriamente

dita.

É necessário que se entenda, dessa forma, o que os autores chamam de

história comportamental

, como ela é definida e, ainda, como as tentativas de

definição surgiram, levando em consideração o desenvolvimento da própria

Análise do Comportamento e a importância do estudo da história comportamental

nesta ciência. Deve-se, concomitantemente, entender como a pesquisa básica tem

buscado dados que elucidem tanto questões experimentais quanto questões

práticas. Dessa forma, o presente trabalho buscará identificar (a) propostas de

definição de história comportamental, (b) o que pode ser considerado um estudo

de história comportamental e (c) descrições de estudos de história

comportamental. Após este esforço será proposto um delineamento experimental

que permita avaliar os efeitos de uma exposição anterior a contingências sobre o

comportamento atual.

1. Definições de história comportamental

Apesar de haver um consenso na Análise do Comportamento em relação à noção

de que o comportamento dos organismos é determinado pelas contingências atuais por

meio da exposição a contingências passadas (Sidman, 1960; Wanchisen, 1990; Weiner,

1969), o que se observa é que tal consenso não existe quando da definição de história

comportamental. Isso pode ser observado pela existência de diversas propostas de

definição encontradas na literatura. Cirino (2001a) identificou três destas propostas. A

primeira delas foi elaborada por Wanchisen (1990). Para ela, história comportamental

diz respeito à “exposição a contingências respondentes e operantes cuidadosamente

controladas em laboratório, antes da fase de ‘teste’ desejada” (Wanchisen, p. 32). Nesta

definição são enfatizadas apenas as contingências arranjadas no setting experimental às

Segundo Cançado et al. (2006), o termo “comportamental” foi aquele mais

frequentemente vinculado à palavra história (“história de reforço” e “história de

condicionamento” são exemplos de outros termos frequentemente encontrados pelos

pesquisadores). Por essa razão, a expressão “história comportamental” será utilizada no

presente trabalho.

quais o organismo fora exposto, antes de uma fase de teste específica. A proposta de

Wanchisen enfatiza, dessa forma, as manipulações realizadas pelo experimentador,

anteriores à fase de teste. Esta definição identifica as variáveis independentes que serão

manipuladas e cujos efeitos serão observados no comportamento subseqüente.

E quais efeitos seriam estes? Para Freeman e Lattal (1992) “‘efeitos de história’

implicam fontes de controle sobre o comportamento presente que não foram eliminadas

pelo refinamento das contingências atuais e, conseqüentemente, obscurecem as relações

funcionais estabelecidas entre o comportamento e as contingências presentes” (p. 5).

Esta definição enfatiza o controle exercido pelas contingências presentes sobre o

comportamento atual. Para esses autores, os efeitos da história comportamental seriam

aqueles observados no comportamento atual do organismo na fase de teste de um

experimento.

Ou seja, enquanto a proposta de Wanchisen (1990) parece enfatizar o

procedimento nos estudos de história (i.e., ênfase nas variáveis independentes), a

proposta de Freeman e Lattal (1992) parece enfatizar o processo (i.e., os efeitos sobre o

comportamento presente – a variável dependente). Parece, portanto, que, isoladamente,

as propostas de Wanchisen e de Freeman e Lattal não esgotam uma definição do que

seria história comportamental.

Segundo Metzger (1992), história comportamental deve ser definida “em termos

de exposições prévias a contingências tanto dentro quanto fora do laboratório” (p. 15).

A definição desta autora é mais ampla do que a de Wanchisen (1990), pois engloba os

eventos extra-experimentais como parte da definição de história comportamental. Não

enfatiza, contudo, quais seriam os efeitos destas exposições prévias sobre o desempenho

atual.

Nesse sentido, as propostas de Wanchisen (1990) e de Freeman e Lattal (1992)

parecem, em conjunto, mais úteis do que a de Metzger (1992), para o estudo

experimental da história comportamental, já que não é possível o acesso a todas as

contingências extra-experimentais as quais um organismo foi exposto. O pesquisador

enfatizaria a análise das experiências prévias do organismo, cuidadosamente construídas

no laboratório e cujos efeitos podem ser observados pelo menos por algum tempo sobre

o comportamento atual do mesmo.

Portanto, sintetizando as propostas analisadas, pode-se melhor definir história

comportamental como experiências prévias cujos efeitos podem ser observados no

comportamento atual do organismo. Colocada dessa maneira a definição aponta para

dois aspectos importantes da história comportamental: sua operação (i.e., seu

procedimento) e seu processo (i.e., o efeito sobre o comportamento atual). Todavia,

deve-se ressaltar que, para que a definição seja experimentalmente útil, é necessário que

as “experiências prévias” sejam consideradas como os eventos arranjados no contexto

experimental e cujos efeitos possam ser observados no comportamento subseqüente.

2. O que é um estudo de história comportamental?

Após a adoção do termo história comportamental para se referir a esta área de

estudos e de uma definição útil na construção de um delineamento experimental, outro

ponto deve ser discutido: a identificação de um estudo como sendo um estudo de

história comportamental e não de outro tema qualquer. De maneira geral, qualquer

estudo da Análise Experimental do Comportamento pode ser considerado como tendo

uma dimensão histórica: “estudos de extinção, estados de transição, efeitos cumulativos

de certas variáveis, etc., todos podem ser classificados nessa categoria” (Sidman, 1960,

p. 384). Os estudos de programas de reforço mostram claramente esta noção. Em um

experimento básico de extinção, por exemplo, quando o reforçador que vinha mantendo

um determinado comportamento é suspenso, o indivíduo não deixa de se comportar

imediatamente. O período inicial de exposição à extinção indica claramente um efeito

da exposição prévia ao programa de reforço. Mesmo experimentos simples, como os de

programa de razão fixa (utilizados nas práticas de laboratório das aulas de graduação em

muitas faculdades de Psicologia) poderiam ser facilmente enquadrados como um estudo

de história. Um organismo dificilmente é exposto a uma contingência de FR 100, por

exemplo, sem antes passar por um treino que envolve responder em razões menores,

que vão aumentando segundo algum critério previamente definido pelo experimentador.

No entanto, como bem apontou Wanchisen (1990), dizer que todo estudo em

Análise Experimental do Comportamento é um estudo sobre história comportamental

comprometeria a utilidade do conceito, uma vez que se tornaria amplo em demasia.

Tatham e Wanchisen (1998) propuseram um modelo de classificação de estudos

de história comportamental baseado em três critérios: (a) que um estudo permita a

avaliação dos efeitos de uma manipulação anterior sobre uma condição subseqüente; (b)

demonstrar efeitos de história duradouros ou transitórios; (c) produzir efeitos de história

observáveis no comportamento atual, ou inobserváveis até que manipulações

experimentais específicas sejam arranjadas (como administração de drogas, por

exemplo). Segundo estes autores, um estudo deve satisfazer estes três critérios para que

possa ser considerado um estudo de história comportamental.

Cirino, Cançado, Soares e Dias (2006) apontaram para alguns problemas

relativos aos critérios propostos por Tatham e Wanchisen (1998). Segundo os autores, o

primeiro critério especifica não apenas estudos de história comportamental, mas

qualquer estudo experimental em Análise do Comportamento. O segundo critério seria

dependente do terceiro, visto que os efeitos só poderiam ser classificados como

duradouros ou transitórios se eles pudessem ser observados. Além disso, especificar se

um efeito é transitório ou duradouro seria apenas uma informação adicional e não um

critério de classificação de um estudo como um estudo de história comportamental. Em

relação ao terceiro critério, Cirino et al. chamaram a atenção para um aspecto

aparentemente importante na identificação de um estudo de história: a ênfase do

experimentador em relação ao estudo, ou seja, as variáveis que controlam o

comportamento do cientista (por exemplo, a literatura consultada, arranjo experimental

proposto etc.). Se a ênfase do experimentador for a verificação dos efeitos de

manipulações anteriores sobre o comportamento atual de um organismo, mesmo que

estes efeitos não sejam encontrados, o estudo deve ser considerado um estudo de

história comportamental. Dessa forma, o fato de um efeito de história ser observado ou

não deveria ser considerada uma informação adicional e não um critério de identificação

de um estudo de história.

Após a identificação da principal característica que poderia identificar um estudo

analítico-comportamental como um estudo de história comportamental (critério da

ênfase), serão descritas pesquisas experimentais em que este critério pode ser

observado. Pesquisas de outras áreas da Análise Experimental do Comportamento

também serão descritas, de acordo com a manipulação de determinadas variáveis, que

serão importantes para o delineamento experimental proposto no presente estudo.

3 Estudos experimentais sobre história comportamental

Como a história comportamental e seus efeitos têm sido estudados por

pesquisadores analistas do comportamento? Uma revisão da literatura sugere que, de

uma maneira geral, estudos em história comportamental configuram-se como: (a)

estudos do comportamento mantidos por programas de reforço com delineamento

experimental inter-sujeitos (delineamento de grupos) – no quais grupos de sujeitos são

submetidos a programas que produzem altas taxas de respostas ou baixas taxas de

respostas e, numa condição subseqüente, ambos são expostos a programas que

permitem alta variação na taxa de respostas, sem alteração substancial na taxa de

reforços (ver, por exemplo, Cole, 2001; Costa, 2004; Costa, Banaco & Becker, 2005;

Costa, Banaco, Longarezi, Martins, Maciel & Sudo (no prelo); LeFrancois & Metzger,

1993; Salgado (2007); Urbain, Polling, Millan & Thompson, 1978; Wanchisen, Tatham

& Mooney, 1989; Weiner, 1964; 1965; 1969); (b) estudos do comportamento mantidos

por programas de reforço com delineamento experimental intra-sujeitos (delineamento

de caso único) – nos quais o sujeito é exposto a diferentes programas de reforço (com

ou sem controle de estímulos). Em uma condição subseqüente, o mesmo sujeito é

exposto a um programa que permite alta variação na taxa de respostas sem que a taxa de

reforços seja alterada substancialmente e, se houver controle de estímulos, eles são

apresentados novamente (e.g. Cirino, 1999; Doughty, Cirino, Mayfield, da Silva,

Okouchi & Lattal, 2005; Freeman & Lattal, 1992; Okouchi, 2003a; 2003b).

A seguir serão relatadas pesquisas experimentais sobre a história

comportamental cujos temas tratados são relevantes para o presente trabalho. Será

abordada a importância da história comportamental no entendimento das diferenças

entre humanos e não-humanos se comportando sob programas de reforço; os efeitos da

história recente e remota sobre o comportamento atual dos organismos e, por fim, o

papel do controle de estímulos nos efeitos da história comportamental.

3.1 Diferenças entre humanos e não-humanos em programas de reforço

Um dos tópicos que gera grande controvérsia entre pesquisadores analistas do

comportamento diz respeito às diferenças no comportamento de humanos e não-

humanos em programas de reforço. Entre as décadas de 1950 e 1960, havia um

interesse, por parte dos analistas do comportamento, em observar padrões de scallop e

break-and-run

em estudos de programas de FI

, encontrados nos estudos que

utilizavam sujeitos não-humanos. Alguns pesquisadores, como Azrin (1958),

observaram que os padrões encontrados em organismos não-humanos raramente

apareciam em humanos.

O estudo de Weiner (1969, Experimento 1), permite avaliar as diferenças no

padrão comportamental de humanos em FI. Participantes humanos foram distribuídos

em três grupos. Os participantes dos grupos foram expostos a contingências de FI 10 s,

FI 600 s ou FI 10 s com custo

. O aparato experimental era constituído por uma tela

com um marcador de pontos e luzes com cores diferentes eram acesas para cada

programa de reforço. Um botão foi instalado em uma mesa que ficava em frente à tela.

A resposta selecionada para este experimento foi a de pressão ao botão

. A instrução

fornecida aos participantes dizia que eles deveriam ganhar o maior número de pontos

possível, pressionando o botão “de alguma forma”. Cada conseqüência reforçadora era

constituída por 100 pontos creditados no marcador. Os participantes recebiam uma

quantia fixa de dinheiro por hora de participação, pagos ao final de cada sessão. Não

eram revelados ao participante os objetivos do experimento, nem aspectos do programa

de reforço vigente durante a sessão.

“O padrão scallop se caracteriza por uma pausa no responder logo após o reforço e

uma retomada no responder, com aceleração positiva, até o próximo reforço. O nome

scallop foi dado a esse padrão em função de sua semelhança a uma concha do mar

(Argopecten irradians) quando visualizado a partir de um registro cumulativo. (...) O

padrão break-and-run se caracteriza por uma grande pausa e um jorro de respostas no

final do intervalo” (Cirino, 1999, p. 17-18).

FI, do inglês fixed interval (intervalo fixo). Em um programa de FI reforça-se a

primeira resposta que ocorrer após o intervalo determinado pelo programa (Ferster &

Skinner, 1957). Por exemplo, em um programa de FI 5 segundos, reforça-se a primeira

resposta que ocorrer após a passagem de cinco segundos.

Em uma contingência de FI com custo as respostas emitidas no intervalo do FI são

consequenciadas com a perda de um ponto (Weiner, 1964).

Este equipamento foi também utilizado nos outros estudos de Weiner que serão

descritos posteriormente (Weiner, 1965; Weiner, 1969)

Os resultados obtidos por Weiner (1969, Experimento 1) indicaram dois padrões

típicos de comportamento: alta taxa de respostas sem pausa pós-reforço

ou baixa taxa

de respostas (duas a três respostas no final do intervalo) com pausa pós-reforço, mas

sem o padrão de scallop. Nos grupos FI 10 s e FI 600 s, a maioria dos participantes

apresentou altas taxas de respostas, enquanto que no grupo FI 10 s com custo a maioria

dos participantes apresentou baixas taxas de respostas.

Outra pesquisa com objetivo de avaliar as diferenças comportamentais de

humanos em FI foi realizada por Okouchi (2002). O autor expôs 32 universitários a uma

contingência de FI 60 s. O equipamento era composto por um computador com tela

sensível ao toque. Os participantes deveriam tocar um círculo que aparecia no centro da

tela e ganhavam pontos durante as sessões e, ao final do experimento, eram pagos em

dinheiro pela participação, pelos pontos obtidos e recebiam, ainda, créditos na disciplina

que cursavam. O autor obteve resultados parecidos com aqueles de Weiner (1969,

Experimento 1), ou seja, padrões de altas e baixas taxas de respostas. Além disso, os

resultados de Okouchi indicaram também dois padrões de taxas intermediárias de

respostas (um padrão de responder constante, sem pausas pós-reforço e outro mais

parecido com padrões de scallop ou break-and-run, com pausas pós-reforço), sugerindo

que o desempenho de humanos respondendo em FI pode variar de alta para baixa taxa

de respostas, passando por valores intermediários.

Alguns autores (e.g. Wanchisen, 1990; Wanchisen et al., 1989; Weiner, 1983)

sustentaram que a diferença comportamental de humanos e não-humanos em FI pode

ser devida à história comportamental. O estudo de Weiner (1964) teve como objetivo

investigar experimentalmente o efeito de duas diferentes histórias sobre o

Pausa pós-reforço consiste no intervalo entre a resposta que produziu o reforço e a

próxima resposta emitida pelo organismo (Catania, 1998/1999).

comportamento subseqüente em FI, com seres humanos. Os participantes do

experimento foram seis enfermeiros de um hospital psiquiátrico, de ambos os sexos, que

foram distribuídos em dois grupos. Os participantes de cada grupo foram submetidos a

duas fases, compostas por 10 sessões de uma hora cada (a Fase 2 ainda contou com

mais 10 sessões de meia hora). Durante a Fase 1 (Fase de construção da história), os

participantes do Grupo 1 foram submetidos à contingência de FR 40

(contingência que

seleciona altas taxas de respostas), enquanto os participantes do Grupo 2 foram expostos

à contingência de DRL 20 s

(contingência que seleciona baixas taxas de respostas).

Posteriormente, na Fase 2 (Fase de teste), os participantes de ambos os grupos foram

expostos à contingência de FI 10 s. Luzes de cores diferentes estavam presentes quando

cada programa de reforço estava em vigor. Weiner observou que os participantes do

Grupo 1 apresentaram taxas altas de respostas quando expostos ao programa de FI, em

relação aos participantes do Grupo 2, que apresentaram baixas taxas de respostas

quando expostos ao mesmo programa.

Estes resultados sugerem que uma exposição prévia de humanos a uma

contingência de reforço pode influenciar o comportamento posterior em FI. As taxas de

respostas dos participantes do Grupo 1, no programa de FI, foram relativamente altas e

constantes, porém, demonstraram uma leve diminuição após o início da exposição ao

programa vigente. Da mesma forma, os participantes do Grupo 2, de forma geral,

tenderam a aumentar a taxa de respostas quando expostos à contingência de FI. Tais

resultados, apesar de não serem discutidos por Weiner (1964), podem apontar para um

FR, do inglês fixed ratio, (razão fixa). Em um programa de FR o reforço ocorre após

um número específico de respostas emitidas pelo organismo, independente do tempo

gasto para emiti-las (Ferster & Skinner, 1957; Cirino, 1999).

DRL, do inglês differential reinforcement of low rate (reforço diferencial de baixas

taxas [de respostas]). Em programa de DRL, a primeira resposta que ocorrer depois de

passado o um determinado intervalo é reforçada, desde que não tenha havido nenhuma

resposta durante o intervalo. Se ocorrer alguma resposta durante o intervalo, o mesmo é

reiniciado (Cirino, 1999).

gradual controle do comportamento pelo parâmetro temporal da contingência atual de

FI.

Buscando estudar o papel da história comportamental nas diferenças

comportamentais entre humanos e não-humanos em FI, Wanchisen et al. (1989),

realizaram um estudo utilizando ratos, cujas respostas de pressão à barra eram

reforçadas com alimento. Os ratos foram distribuídos em dois grupos: os ratos do grupo

controle foram expostos a 120 sessões de um programa de FI 30 s. Os ratos do grupo

experimental foram expostos a 30 sessões de um programa de VR 20

e a 30 sessões de

FI 30 s. Em uma fase seguinte, os ratos do grupo experimental foram novamente

expostos a 30 sessões de um programa de VR 20 e a 30 sessões de FI 30 s. A hipótese

dos autores era que ratos expostos a um programa de VR apresentariam, durante a

exposição ao FI, um padrão comportamental diferente daqueles do grupo controle e

semelhante ao padrão comumente encontrado em humanos (cf. Okouchi, 2002; Weiner,

1969, Experimento 1).

Os autores observaram que, ao serem expostos ao programa de FI, os ratos que

haviam passado por uma história de VR respondiam em altas taxas de respostas, quando

comparados ao grupo controle. Após algum tempo, as taxas de respostas dos ratos do

grupo experimental apresentaram uma queda, indicando um controle cada vez maior

pelo parâmetro temporal da contingência de FI presente. Em uma exposição posterior ao

VR e ao FI, o comportamento dos ratos do grupo experimental demorou menos tempo

para ficar sob controle da contingência presente. Os ratos deste grupo, porém,

apresentaram taxas mais altas no início da exposição ao programa de FI, quando

VR, do inglês variable ratio (razão variável). Em um programa de VR o reforço

ocorre após um número médio de respostas emitidas pelo organismo (Ferster & Skinner,

1957). Por exemplo, em um programa de VR 5 são reforçadas, em média, cada cinco

respostas emitidas. A distribuição é calculada arbitrariamente a partir de valores

extremos. Um programa de VR, em geral, produz altas taxas de respostas, sem pausa

pós-reforço.

comparados aos ratos do grupo controle. Os autores discutiram que o desempenho de

ratos em FI, após uma história de VR, apresentou padrões que se assemelhavam ao de

humanos se comportando em FI (i.e., um responder constante entre reforços sucessivos)

e argumentam que a história comportamental pode explicar a diferença comportamental

entre humanos e não-humanos em FI (cf. Weiner, 1983).

Entretanto, Baron e Leinenweber (1995) criticaram as análises realizadas por

Wanchisen et al. (1989). Segundo eles, as “conclusões sobre a natureza das variações

nas taxas dentro dos intervalos (‘scallop’) basearam-se demasiadamente nos registros

cumulativos” (p. 98). Dessa forma, propuseram uma replicação do estudo de Wanchisen

et al., realizando análises moleculares dos resultados (i.e., taxa local de respostas, o

quarter-life

e a distribuição das pausas pós-reforço).

Assim como esperado, os ratos que passaram por uma história de VR emitiram

altas taxas de respostas no programa de FI. Porém, com a exposição continuada ao FI,

as taxas tenderam a diminuir (cf. Weiner, 1964). As análises destes resultados estão em

concordância com aquelas realizadas por Wanchisen et al. (1989). Todavia, segundo

Baron e Leinenweber (1995), as análises moleculares não encontraram os padrões

comportamentais em FI semelhantes aos de humanos. As análises da taxa local de

respostas e do quarter-life sugeriram a formação de possíveis padrões de scallop. Os

autores chamaram a atenção que as interpretações baseadas apenas na observação dos

registros cumulativos podem levar a conclusões equivocadas.

O quarter-life refere-se ao tempo gasto para que os primeiros 25% das respostas de

um dado intervalo sejam emitidas (Freeman & Lattal, 1992). Pode ser expresso tanto em

unidades absolutas (i.e. o tempo gasto para emissão dos 25% das respostas) ou em

termos de porcentagem (i.e. porcentagem das respostas emitidas que correspondem aos

25% do total de respostas do FI).

Tomando-se estes resultados em conjunto, percebe-se que a história

comportamental pode ser uma, mas não o único evento que contribui para a diferença

no padrão comportamental entre humanos e não-humanos em programas de reforço.

3.1.1 Variações de procedimento

Outro fator que pode contribuir para as diferenças comportamentais entre

humanos e não-humanos em programas de reforço diz respeito às variações de

procedimento. Resultados aparentemente mais regulares obtidos em estudos com

organismos não-humanos provêm de um conjunto de procedimentos-padrão de

laboratório que não encontra, até o momento, contrapartida nos estudos com humanos

(Perone, Galizio & Baron, 1988).

Uma variável de procedimento é o custo da resposta operante estudada. Um dos

autores que estudou tal variável foi Chung (1965, Experimento 1). O autor expôs quatro

pombos a um programa de VI 1 min. A resposta requerida era a de bicar um disco e,

como conseqüência, os pombos recebiam alimento. O equipamento utilizado por Chung

permitia que a força necessária para que o disco funcionasse fosse ajustada.

Inicialmente, a força exigida era de, no mínimo, 25 gramas. Quando a taxa de respostas

estava estável, a força exigida para que o disco funcionasse foi aumentada para 100

gramas. Após duas semanas, a exigência foi novamente alterada. A ordem dos valores

de força manipulados pelo autor foi a seguinte: 25-100-150-50-200-250-75-100-300-25-

150 gramas.

Os resultados de Chung (1965) indicaram que existe uma relação direta entre o

custo e a taxa de respostas. De forma geral, quanto maior foi a força requerida para que

o disco funcionasse, menores foram as taxas de respostas. Foram observados ainda, de

forma sistemática, que quando os pombos passaram de uma condição de maior força

requerida para uma condição de menor força, apresentaram um aumento na taxa de

respostas, nas primeiras sessões, que se estabilizaram em taxas intermediárias com a

exposição continuada à nova condição. Da mesma forma, a mudança de uma condição

de menor força para uma de maior força produziu uma supressão na taxa de respostas,

nas primeiras sessões, que se estabilizaram em taxas intermediárias com a exposição

continuada

Estudos experimentais sobre o custo da resposta também foram realizados com

humanos. O estudo de Weiner (1965, Experimento 1), por exemplo, possibilitou a

avaliação dos efeitos da história em uma contingência subseqüente que apresentasse

custo para cada resposta emitida no intervalo do FI. Neste Experimento, seis

participantes foram distribuídos em três grupos de dois participantes cada. Os Grupos 1,

2 e 3 foram expostos a contingências de FR 40, DRL 20 s e FI 10 s, respectivamente,

durante a fase de construção da história. Cada conseqüência reforçadora era constituída

por 100 pontos. Os participantes recebiam uma quantia fixa de dinheiro por sessão,

independente da quantidade de pontos ganhos. Na fase seguinte, todos os participantes

foram expostos a uma contingência de FI 10 s com custo. Assim, o responder entre

reforços sucessivos no programa de FI era punido com a perda de um ponto por

resposta. Os participantes que passaram por uma história de responder em DRL 20 s e

FI 10 s emitiam padrões de baixa taxa quando expostos subseqüentemente ao programa

de FI com custo. Porém, os sujeitos que passaram por uma história de responder em FR

40 continuavam a emitir altas taxas de respostas no FI com custo, mesmo embora esse

padrão comportamental implicasse na perda de pontos. Esses resultados corroboram e

ampliam aqueles obtidos por Weiner (1964) uma vez que demonstraram que o efeito da

exposição prévia ao FR persiste durante a exposição a um FI subseqüente, mesmo

Estes resultados podem ser identificados enquanto efeitos de história, apesar de

Chung (1965) não realizar esta análise.

quando persistir no padrão de altas taxas implica em perda de parte dos pontos na

contingência atual.

Comparando-se os resultados de Chung (1965, Experimento 1) com os do

Grupo 3 de Weiner (1965, Experimento 1), percebe-se que quando contingências de

custo são introduzidas ou quando há aumento no custo da resposta, a taxa de respostas

cai, tanto no programa de VI quanto no FI. Tais resultados sugerem que procedimentos

análogos podem demonstrar dados regulares entre diferentes espécies.

Outra variável de procedimento manipulada em estudos de história

comportamental foi a conseqüência programada para o comportamento. Normalmente,

o que se observa é que os experimentos com organismos não-humanos utilizam

reforçadores primários como conseqüências. Costa, Banaco e Becker (2005)

investigaram o efeito do tipo de reforçador sobre o comportamento atual em FI de

humanos. A partir de um delineamento experimental semelhante ao de Weiner (1964) e

tendo como participantes estudantes universitários, Costa et al. variaram a conseqüência

programada para cada grupo de participantes: pontos, dinheiro e créditos em fotocópias.

Participaram da pesquisa 11 estudantes universitários. O instrumento utilizado para

coleta dos dados foi o software ProgRef v 3.1 (Costa & Banaco, 2002; 2003). A

resposta exigida dos participantes era um clique no botão esquerdo do mouse. Os

participantes foram distribuídos em três grupos: Grupo 1 – (Fotocópias, n=3) os

participantes ganhavam pontos que podiam ser trocados por créditos em fotocópias

(uma fotocópia por ponto que, à época da realização do experimento custavam R$

0,05); Grupo 2 – (Dinheiro, n=3) os participantes ganhavam pontos que podiam ser

trocados por dinheiro ao final da sessão (R$ 0,05 por ponto); e Grupo 3 – (Apenas

pontos, n=5) os participantes ganhavam pontos, mas estes eram trocados por nada. Na

segunda fase, a variação do tipo de reforçador continuou, mas o parâmetro da

contingência de FI foi alterado e os participantes foram expostos a uma das três

condições: FI 5, 20 ou 30 segundos.

Os resultados deste estudo indicam que a conseqüência programada para o

comportamento parece ter aumentado a probabilidade de que os participantes expostos

inicialmente a um programa de reforço em FI 10 s exibissem taxas de respostas altas e

constantes, sem pausa pós-reforço (participantes do Grupo 2 – Dinheiro). Em relação ao

comportamento dos participantes dos Grupos 1 e 3 (Fotocópias e Pontos), houve maior

variação inter-participantes (responder em taxas altas e constantes e em taxas

intermediárias e baixas de respostas). A conseqüência programada parece ter afetado

também o comportamento dos participantes quando o parâmetro do FI mudou de 10

para 5, 20 ou 30 segundos. O comportamento da maioria dos participantes das

Condições Fotocópia e Pontos mudou quando o parâmetro do FI foi alterado (as taxas

de respostas tenderam a diminuir), enquanto que o comportamento dos participantes da

Condição Dinheiro permaneceu o mesmo.

Outro estudo que buscou investigar o efeito de diferentes conseqüências

programadas sobre o comportamento atual em FI de humanos, após diferentes histórias

de reforço, foi realizado por Costa, Banaco, Longarezi, Martins, Maciel e Sudo (no

prelo). Participaram da pesquisa 20 estudantes universitários. O instrumento utilizado

para coleta dos dados foi o software ProgRef v 3.1. A resposta exigida dos participantes

era um clique no botão esquerdo do mouse. Os participantes foram distribuídos por dois

grupos (Grupo FR e Grupo DRL). Durante a primeira fase, os participantes foram

expostos a programas de FR 40 ou DRL 20s, dependendo do grupo a que pertenciam,

durante três sessões. Os participantes de cada um dos grupos eram distribuídos por três

condições de programação de conseqüência: (1) Condição Dinheiro – os participantes

ganhavam pontos que podiam ser trocados por dinheiro ao final da sessão (R$ 0,05 por

ponto); (2) Condição Fotocópia – os participantes ganhavam pontos que podiam ser

trocados por créditos em fotocópias (uma fotocópia por ponto que, à época da realização

do experimento custavam R$ 0,05); (3) Condição Pontos – os participantes ganhavam

pontos, mas estes não eram trocados por nada. Na segunda fase, a variação da

conseqüência programada continuou, mas todos os participantes foram expostos a três

sessões de uma contingência de FI 10s.

Como resultado, foi observado que os participantes expostos ao FR

apresentaram um padrão de responder em taxa alta e constante independentemente do

tipo de reforçador utilizado. Quando a contingência mudou de FR para FI a taxa de

respostas permaneceu alta para os participantes da Condição Fotocópia e Condição

Dinheiro, mas diminuiu para a maioria dos participantes da Condição Pontos. Os

participantes expostos inicialmente ao DRL apresentaram um responder em taxa baixa

tanto sob a contingência de DRL quanto sob a de FI subseqüente, independentemente da

condição de reforço. Apesar desse efeito de persistência comportamental, houve uma

diminuição no intervalo entre respostas (IRT)

quando a contingência mudou, o que

sugere que o responder era controlado também pela contingência de FI presente.

Tomados em conjunto os resultados sugerem que: (a) o comportamento dos

participantes foi controlado tanto pela história de reforço quanto pelas contingências

presentes; (b) a conseqüência programada pode favorecer o responder em taxa alta e

constante sob FI. Os resultados sugerem que o tipo de reforçador pode ser uma variável

importante para modular os efeitos da história experimental sobre o comportamento de

seres humanos (cf. Costa, 2004).

IRT, do inglês inter-response time (intervalo entre respostas). O IRT mede o tempo

entre a emissão de uma resposta e a emissão da próxima resposta (Ferster & Skinner,

1957).

Outra variável aparentemente importante quando se avaliam as diferenças entre

humanos e não-humanos se comportando em programas de reforço é a resposta de

consumação. Quando se realizam estudos com não-humanos, a emissão das respostas

selecionadas comumente precisa ser interrompida para que o sujeito possa consumir o

reforço (e. g., quando ratos deixam de pressionar a barra, abaixam-se para lamber a gota

de água e logo após voltam a emitir as respostas de pressão à barra). A utilização da

resposta de consumação pode tornar os estudos com humanos mais próximos dos

estudos com não-humanos, visto que os participantes devem deixar de emitir as

respostas de pressão ao botão para emitir a resposta de consumação e, só então, voltar a

pressionar o botão.

Matthews, Shimmof, Catania e Sagvolden (1977, Experimento 2) realizaram um

estudo no qual testaram o papel da resposta de consumação e do modo de aquisição da

resposta (instrução vs. modelagem) sobre o comportamento de humanos em FI. Quatro

universitários foram expostos a um programa de FI 60 s após passarem por uma história

de VR e outros seis foram expostos a um FI cujo parâmetro foi gradualmente

aumentado até um FI 50 s. A resposta requerida era a de pressão a um botão e os

participantes tinham que emitir uma resposta de consumação (pressionar outro botão)

antes de receberem os pontos. A resposta de pressionar um botão em FI foi modelada,

ao invés de instruída. Os resultados indicaram baixas taxas de respostas no FI, com a

presença de alguns scallops, para os participantes cuja resposta operante foi modelada e

cuja resposta de consumação estava presente. Estes são padrões comportamentais que se

assemelham àqueles tipicamente encontrados em não-humanos.

De acordo com os resultados de Matthews et al. (1977), parece plausível supor

que a utilização de uma resposta de consumação é uma variável interessante quando da

tentativa de aproximação do comportamento de humanos daqueles padrões obtidos

tipicamente com não-humanos. A pesquisa realizada por Patsko, Becker e Costa (no

prelo, Experimento 2), aponta para uma direção semelhante. Oito universitários foram

igualmente distribuídos em dois grupos: Grupo 1, com exigência de resposta de

consumação (CR) e o Grupo 2, sem exigência de resposta de consumação (SR). Os

participantes de ambos os grupos foram expostos a três sessões de FI 30 s. O

instrumento utilizado foi o ProgRef v 3.1 e o comportamento de pressionar o botão do

mouse recebia, como conseqüência, pontos. Cada ponto era trocado, ao final de cada

sessão, por R$ 0,05.

Patsko et al. (no prelo, Experimento 2) observaram que os participantes do

Grupo 1 (CR) tenderam a exibir taxas de respostas menores do que os participantes do

Grupo 2 (SR). Foram encontrados, para os participantes do Grupo 1, inclusive alguns

padrões de scallop e break-and-run. Estes resultados vão ao encontro daqueles obtidos

por Matthews et al. (1977). Em ambas as pesquisas a resposta de consumação parece ter

tornado o comportamento de humanos semelhante ao comportamento de não-humanos

em programas de FI.

No entanto, no estudo de Costa et al. (2005) apresentado anteriormente, no qual

a conseqüência programada foi manipulada, os autores também utilizaram resposta de

consumação durante o procedimento. Nesta pesquisa, todos os participantes do Grupo 2

(Dinheiro) apresentaram um padrão comportamental de altas taxas de respostas, mesmo

com a presença da resposta de consumação. Como explicar esta discrepância? Algumas

diferenças no procedimento das três pesquisas podem ser responsáveis por estes

resultados divergentes. Por exemplo, Matthews et al. (1977) modelaram a resposta de

pressão ao botão, enquanto Costa et al. (2005) e Patsko et al. (no prelo, Experimento 2)

forneceram instruções aos participantes.

A questão da duração e quantidade de sessões também pode ser importante: os

participantes da pesquisa de Matthews et al. (1977) foram expostos a apenas uma sessão

experimental, enquanto nas pesquisa de Costa et al. (2005) e Patsko et al. (no prelo,

Experimento 2) os participantes foram expostos a, pelo menos, três sessões

experimentais. Os resultados da pesquisa de Aldinucci (2007), todavia, sugerem que

quantidades de treino diferentes em FR (três, seis ou nove sessões) tiveram pouca

influencia sobre o comportamento de humanos em um FI subseqüente.

Assim, pode-se concluir que a resposta de consumação é uma, mas não a única

variável que pode influenciar o comportamento humano em FI, pois quando a

conseqüência programada foi manipulada, os participantes que tiveram pontos trocados

por dinheiro se comportaram de maneira diferente em relação aos não-humanos.

Após a análise dos experimentos descritos nesta seção, percebe-se que o estudo

das variações de procedimento é um campo importante quando se considera as

diferenças comportamentais de humanos e não-humanos em programas de reforço. As

diferenças de procedimento, como será visto posteriormente, podem influenciar também

os resultados das pesquisas de história comportamental.

3.2 História recente e remota

Outro tema que vem sendo sistematicamente investigado por pesquisadores da

área de história comportamental e que também reflete divergências de resultados nas

pesquisas com humanos e não-humanos, diz respeito à comparação dos efeitos de

arranjos imediatamente precedentes (história recente) e dos efeitos de programas

arranjados em condições remotas (história remota).

Este tipo de manipulação foi empregado, por exemplo, no estudo de Weiner

(1969, Experimento 5). Neste experimento

, o autor investigou alguns efeitos de

história construída de forma seqüencial no comportamento subseqüente em FI. Seis

participantes foram expostos a uma das seguintes seqüências na fase de construção de

história: DRL 20 s e FR 40 ou FR 40 e DRL 20 s (três participantes expostos a cada

uma das seqüências). Em uma fase subseqüente, os participantes dos dois grupos foram

expostos a uma seqüência de FI 10 s e FI 10 s com custo, nessa ordem. Os resultados

indicaram que, independentemente da seqüência da história comportamental os

participantes, de modo geral, tenderam a apresentar baixas taxas de respostas no

programa de FI (com ou sem custo). Esses resultados sugerem que uma história de

exposição ao DRL, quer essa exposição seja remota ou recente, aumenta a probabilidade

de baixas taxas de respostas quando os participantes são expostos ao FI com ou sem

custo.

Utilizando um delineamento semelhante ao de Weiner (1969, Experimento 5),

LeFrancois e Metzger (1993) realizaram uma pesquisa cujo objetivo foi avaliar o efeito

de uma história imediata e de uma história remota sobre o comportamento atual de

ratos. Os ratos eram distribuídos em dois grupos e cada grupo era exposto a uma fase de

construção de história diferente. Os ratos do Grupo 1 eram expostos a um programa de

DRL, enquanto que os ratos do Grupo 2 eram expostos a um programa de DRL e FR.

Na última fase do experimento todos os ratos eram expostos a um programa de FI. Uma

preocupação interessante dos autores foi utilizar parâmetros diferentes nos programas

para cada rato nos grupos. Assim, após atingirem a estabilidade no programa de DRL,

os valores de FR (para o Grupo 2) e do FI (para ambos os grupos) foram calculados de

Weiner (1969) realizou outras manipulações no Experimento 5. Serão relatadas

apenas aquelas manipulações do subgrupo que se mostraram úteis para a discussão

desse tópico do presente trabalho.

modo a manter a taxa de reforços estável para cada rato. O comportamento em FI foi de

baixa taxa de respostas para os ratos do Grupo 1 e de alta taxa de respostas para os do

Grupo 2. Diferentemente dos resultados de Weiner (1969), os resultados deste estudo

indicaram que a história recente exerceu maior influência sobre o comportamento atual.

Outro estudo com ratos que sugere que o desempenho atual é mais afetado por

uma história recente, independentemente de qual contingência de reforço está envolvida

nesta história, é o de Cole (2001). Foram utilizados 10 ratos experimentalmente

ingênuos, que foram distribuídos em cinco grupos: FI (controle); FR-FI; DRL-FI; DRL-

FR-FI e FR-DRL-FI. Após a exposição à história de reforço todos os ratos foram

expostos a uma mesma contingência de FI Esta exposição ao FI se deu por um período

de 80 a 100 sessões. Cole observou que, em todos os grupos (excluindo o controle), o

efeito da história recente foi maior do que o da história remota, independentemente

dessa história recente ser de FR ou DRL. Os ratos dos grupos FR-FI e DRL-FI

apresentaram, respectivamente, altas e baixas taxas de respostas no FI subseqüente.

Resultados parecidos foram observados para os ratos dos grupos DRL-FR-FI e FR-

DRL-FI. Nesses casos, o programa imediatamente precedente (história recente) pareceu

ter maior influência sobre o comportamento subseqüente em FI.

Como apontado anteriormente, os resultados obtidos por LeFrancois e Metzger

(1993), e Cole (2001) estão em contradição com aqueles obtidos por Weiner (1969,

Experimento 5). Segundo este último, a influência do programa de DRL não seria

eliminada mesmo que uma história recente de FR fosse fornecida ao participante. Os

resultados obtidos por LeFrancois e Metzger e Cole, porém, indicam que a história

recente exerceu maior influência sobre o responder atual, quer esta história tenha sido

de FR quer ela tenha sido de DRL. Os resultados discrepantes podem ser atribuídos a

algumas diferenças nos procedimentos destes experimentos: o fato de a taxa de reforços

entre as diferentes fases experimentais ter sido controlada no experimento de

LeFrancois e Metzger, e não no de Weiner

; no estudo de Weiner, luzes de cores

diferentes eram correlacionadas a cada um dos programas de reforço, enquanto

LeFrancois e Metzger não utilizam qualquer estímulo específico correlacionado com os

programas em vigor.

Outra explicação possível para as diferenças nos resultados de Weiner (1969,

Experimento 5) em relação aos de LeFrancois e Metzger (1993) e Cole (2001) diria

respeito às diferenças entre espécies: o comportamento atual de humanos e não-

humanos seria influenciado de maneira distinta pela história recente ou remota. Antes

que se possa recorrer a este tipo de explicação, uma análise da pesquisa de Salgado

(2007) sugere que diferenças no procedimento e não uma diferença entre espécies per se

podem ter contribuído para a discrepância nos dados das pesquisas citadas. O objetivo

do estudo de Salgado foi investigar o papel da conseqüência programada sobre o

comportamento de humanos em FI, após diferentes histórias comportamentais.

Participaram do estudo 12 estudantes universitários que foram distribuídos em quatro

grupos. Os participantes dos Grupos 1 e 3 foram expostos à seguinte seqüência de

programas de reforço: FR-DRL-FI. Para os participantes dos Grupos 2 e 4, a seqüência

dos programas de reforço foi: DRL-FR-FI. O instrumento utilizado para análise dos

dados foi o ProgRef v 3.1. Os participantes dos Grupos 1 e 2 tinham suas respostas de

pressão ao botão do mouse consequenciadas por pontos que, ao final das sessões eram

trocados por dinheiro (R$ 0,05 por ponto). Os participantes dos Grupos 3 e 4 tinham

como conseqüências para as respostas de pressionar o botão do mouse apenas os pontos.

Os resultados da pesquisa de Salgado (2007) indicaram que, quando os pontos

foram trocados por dinheiro, o comportamento dos participantes pareceu ser mais

A importância do controle da taxa de reforços será retomada mais adiante, na

descrição do experimento de Okouchi (2003a).

influenciado pela história recente, quer ela tenha sido de FR ou DRL (assim como nas

pesquisas de Cole, 2001 e LeFrancois e Metzger, 1997, com ratos). Quando a

conseqüência programada foram apenas os pontos, a história de DRL parece ter

exercido maior influencia sobre o comportamento em FI, quer tenha sido remota ou

recente (assim como a pesquisa de Weiner, 1969, Experimento 5).

Tomados em conjunto os dados das pesquisas de Cole (2001), LeFrancois e

Metzger (1993) e Weiner (1969, Experimento 5), em relação aos de Salgado (2007),

pode-se concluir que diferenças no procedimento podem ter sido responsáveis pela

discrepância nos resultados destas pesquisas. Quando condições específicas foram

arranjadas (neste caso, a conseqüência programada) o comportamento de humanos e

não-humanos variou em direções semelhantes.

Foi indicado anteriormente que a mudança de estímulo correlacionada com a

mudança nas contingências de reforço adotado em experimentos com humanos (Weiner,

1964; 1969), mas não com não-humanos (Cole, 2001; LeFrancois e Metzger, 1993)

pode ser uma das fontes de discrepância entre os resultados desses experimentos

relatados. Para se avaliar se esta hipótese tem sustentação é preciso analisar os estudos

de história comportamental que se propuseram a avaliar o papel do controle de

estímulos nos efeitos da história.

3.3 Controle de estímulos e história comportamental

Os estudos de história comportamental apresentados até então utilizaram

delineamento de grupos. A utilização de delineamentos de sujeito único, em estudos de

história comportamental, com sujeitos não-humanos, foi proposta por Freeman e Lattal

(1992). Para tanto, os autores realizaram manipulação dos estímulos correlacionados a

cada programa em vigor. Nos Experimentos 1 e 2, os pombos foram expostos a um

programa de FR e a um programa de DRL na Fase 1 (fase de construção da

história), sob diferentes controles de estímulo (a cor do fundo da caixa era preta

para FR e branca para DRL). Foram conduzidas duas sessões diárias, com seis

horas de diferença entre elas. Os pombos eram expostos a um dos dois programas

em cada sessão, ou seja, eram expostos aos dois programas no mesmo dia. A

ordem de apresentação dos programas era sorteada, com a ressalva de que a

mesma ordem não acontecesse por mais de três vezes seguidas. Preocupados em

manter a taxa de reforços constante nos dois programas, os valores do FR foram

calculados a partir do desempenho dos pombos no programa DRL. Dessa forma,

os autores tentaram igualar o número de reforços obtidos pelos pombos nos dois

componentes de um programa múltiplo de reforço. Foram obtidas taxas de

respostas sistematicamente mais altas no programa de FR do que no programa de

DRL.

Em uma segunda fase, os pombos foram submetidos a sessões de FI

(Experimento 1) ou VI

(Experimento 2), na presença dos estímulos que haviam

sido anteriormente correlacionados ao FR e ao DRL. Da mesma forma, os valores

do intervalo do FI e do VI foram calculados a partir do desempenho dos pombos

na Fase 1, com o objetivo de igualar a taxa de reforços na Fase 2 com aquelas da

Fase 1. Na Fase 2 foram obtidas, sistematicamente, taxas de respostas mais altas

nas sessões nas quais o estímulo presente era o mesmo utilizado durante o FR na

fase anterior e taxas mais baixas nas sessões nas quais o estímulo presente era o

mesmo utilizado durante o DRL na fase anterior. Todavia, as taxas de respostas

dos pombos na presença do estímulo anteriormente correlacionado ao programa

VI, do inglês variable interval (intervalo variável). Em um programa de VI o

reforçador segue uma resposta após um intervalo de tempo que varia de reforçador para

reforçador de acordo com uma série randômica de intervalos. A média dos intervalos

entre reforços é que determina o VI. Os valores dos intervalos variam entre valores

extremos arbitrários. Programas de VI geralmente produzem taxas de respostas

constantes, i.e., sem pausa pós-reforço (Ferster & Skinner, 1957).

FR tenderam a diminuir com a exposição continuada às contingências de FI ou

VI, assim como as taxas de respostas na presença do estímulo anteriormente

correlacionado ao DRL tenderam a aumentar. Tal fato, segundo os autores,

sugere um aumento do controle pelas contingências presentes, tanto no programa

de FI quanto no programa de VI (Freeman & Lattal, 1992).

Os autores realizaram ainda um terceiro experimento no qual, na Fase 1,

os pombos foram submetidos a programa múltiplo

com componentes tandem

mult (tand VI-FR)-(tand VI-DRL). Dessa forma, neste experimento, os pombos

eram expostos a ambos os programas (FR e DRL) na mesma sessão. Durante a

apresentação de cada um dos componentes do programa múltiplo, uma luz de cor

diferente também era apresentada (verde para o componente tand VI-FR e

vermelha para o componente tand VI-DRL). Os componentes foram apresentados

de maneira alternada, com um período de blackout (15 segundos) entre eles. As

taxas de respostas obtidas no componente tand VI-FR foram sistematicamente

mais altas em relação àquelas obtidas no componente tand VI-DRL.

Na Fase 2 deste experimento, os pombos foram expostos a um programa

mult VI-VI, cada componente do VI sendo apresentado juntamente a uma das

cores de luz que foi anteriormente correlacionada aos programas tand VI-FR e

tand VI-DRL. Os resultados encontrados por Freeman e Lattal (1992) foram

semelhantes àqueles dos Experimentos 1 e 2, ou seja, altas taxas de respostas no

Em um programa de reforço múltiplo, dois ou mais programas de reforço são

alternados, tendo um diferente estímulo presente durante cada um deles (Ferster &

Skinner, 1957).

Segundo Cirino (1999), “Tandem é uma palavra da língua inglesa que pode ser

traduzida pela expressão 'um atrás do outro'” (p. 18). Em um programa tandem, um

único reforço está programado para dois programas de reforço em vigor. Para que o

segundo componente do programa tandem entre em vigor é necessário que se complete

a exigência do primeiro. Não existem estímulos discriminativos correlacionados aos

componentes de um tandem (Ferster & Skinner, 1957).

componente VI no qual o estímulo presente era aquele que, na Fase 1, aparecia

juntamente ao componente de tand VI-FR. Da mesma forma, baixas taxas de

respostas foram obtidas no componente VI no qual o estímulo presente era o

mesmo que aparecia, na Fase 1, juntamente ao componente tand VI-DRL.

Os resultados de Freeman e Lattal (1992) sugerem que os efeitos da

história podem ficar sob controle de estímulos específicos (no caso, cores). O

delineamento utilizado pelos autores também serviu de base para a realização de

diversos outros estudos de história comportamental.

Uma das pesquisas de história comportamental que utilizaram o delineamento

proposto por Freeman e Lattal (1992) foi a de Doughty, et al. (2005, Experimento 1). O

objetivo dos autores foi a avaliação dos efeitos da introdução de alimentação prévia

sobre o desempenho atual de pombos expostos a uma história comportamental

específica. Foram utilizados três pombos, cuja resposta de bicar um disco era reforçada

com alimento. Os pombos foram treinados a responder em um programa mult VR 45 –

DRL 8 s, cada componente sinalizado por uma luz de cor diferente. Após a obtenção de

estabilidade na taxa de respostas em ambos os componentes e atingirem um critério de

diferenciação entre a taxa de respostas dos dois componentes (taxas de respostas cinco

vezes maiores no componente VR em relação ao componente DRL), os pombos eram

expostos a um programa mult VI 90 s – VI 90 s. As mesmas luzes apresentadas nos

programas de VR e DRL do componente múltiplo anterior foram apresentadas também

nessa fase, cada uma com um dos componentes do mult VI-VI. Os autores, então,

manipularam o estado de privação dos pombos pela introdução de alimentação prévia

(anteriormente, os pombos participavam das sessões experimentais privados de comida

a 80% do seu peso). Dois dos pombos, após algumas sessões, passaram a responder sob

Os sujeitos eram privados de alimento antes da fase de teste, mas poucos minutos

antes da sessão experimental o organismo tem acesso alimento e água livremente.

controle do programa VI-VI. Quando a alimentação prévia foi introduzida, o responder

desses dois pombos sofreu uma sensível alteração. As taxas de respostas no componente

VI, sinalizado pela luz anteriormente apresentada junto ao componente VR, foram

maiores que no componente VI sinalizado pela luz anteriormente apresentada junto ao

componente DRL. Doughty et al. sugerem, dessa forma, que tal desempenho poderia ser

atribuído à história comportamental à qual os pombos foram expostos (mult VR-DRL).

Em relação à introdução da alimentação prévia, os autores observaram uma sensível

alteração do responder dos sujeitos sob programa do mult VI-VI. Tais alterações,

porém, foram mais acentuadas no componente VI cujo estímulo foi anteriormente

correlacionado ao VR. O que se observou, todavia, é que tais efeitos tenderam a

diminuir com a exposição continuada ao mult VI-VI.

O delineamento proposto por Freeman e Lattal (1992) também foi utilizado com

participantes humanos. Okouchi (2003b) realizou uma pesquisa com o objetivo de

avaliar se os efeitos da história comportamental podem se generalizar para outras

dimensões dos estímulos. O autor dividiu sua pesquisa em dois experimentos. A

resposta exigida para cada participante (estudantes universitários) foi pressionar um

disco na tela do computador, o operandum (o monitor utilizado no estudo era sensível

ao toque) e um disco na parte inferior do monitor, a resposta de consumação. A

conseqüência programada eram pontos que apareciam na tela do monitor. Os

participantes eram pagos em dinheiro por seu desempenho na sessão e ao final do

experimento. No Experimento 1, os participantes foram submetidos a um programa

mult VR-DRL. Os valores de cada componente foram ajustados durante uma fase de

treino até os valores finais, ou seja, VR 30 e DRL 6 s. Durante a fase de treino, os

estímulos apresentados com cada componente foram linhas de diferentes comprimentos

que apareciam dentro do círculo de respostas (operandum) na tela do computador. Para

o programa de DRL foi apresentada uma linha de 13 mm de comprimento, enquanto

que para o VR foi apresentada uma linha de 25 mm de comprimento. Como esperado,

os participantes responderam em taxas mais altas no componente VR em relação ao

componente DRL. O autor passou, então, para a fase seguinte, na qual realizou um teste

de generalização utilizando as larguras das linhas anteriormente apresentadas como

parâmetro. Nessa fase, os participantes foram expostos à contingência de FI 6s. Foram

apresentadas 11 diferentes comprimentos de linhas, variando de 10 mm a 40 mm.

Okouchi observou que, de maneira geral, quando a linha variava de 22 a 28 mm de

comprimento, ou seja, valores próximos a 25 mm (comprimento apresentado junto ao

programa VR), os participantes respondiam em taxas mais altas do que quando o

comprimento da linha estava entre 10 e 16 mm, ou seja, valores próximos a 13 mm

(comprimento apresentado junto ao programa DRL). Dessa forma, o autor sugere que o

“comportamento foi generalizado para estímulos semelhantes fisicamente aos estímulos

da fase de treino” (p. 178).

No Experimento 2, Okouchi (2003b) propôs a utilização de extinção na fase de

teste. O método empregado foi praticamente o mesmo do Experimento 1, exceto que, na

fase de teste, o autor utilizou extinção em vez do programa de FI. Os resultados obtidos

também foram similares aos do Experimento 1, ou seja, houve generalização do

responder para os estímulos mais próximos fisicamente aos estímulos apresentados na

fase de treino (apesar de que, como ressaltado pelo próprio autor, os resultados tenham

sido menos sistemáticos e mais transitórios do que em relação ao Experimento 1).

Desse modo os resultados obtidos por este estudo de Okouchi estão de acordo com

aqueles obtidos por Freeman e Lattal (1992) e vão além deles, pois demonstram que os

efeitos da história podem se generalizar para dimensões semelhantes do estímulo.

Okouchi (2003a) conduziu uma pesquisa com objetivo de avaliar se o intervalo

entre reforços (IRI)

poderia ser utilizado como controle de estímulos. O equipamento,

tarefa experimental e as conseqüências reforçadoras eram as mesmas utilizadas em

Okouchi (2003b). No Experimento 1, oito estudantes universitários foram expostos a

programas mistos (mix)

, distribuídos em dois grupos: Grupo 1, “mix FR curto - DRL

longo”; Grupo 2, “mix FR longo – DRL curto”. Para os participantes do Grupo 1, os

valores do IRI para o “FR curto” foram ajustados de modo a serem menores que os do

“DRL longo”. Para os participantes do Grupo 2 aconteceu o inverso: os valores do IRI

para o “FR longo” foram ajustados de maneira a serem maiores do que os do “DRL

curto”. Dessa forma, os valores do FR e do DRL foram diferentes para cada um dos

participantes, dependendo do ajuste do IRI. Na fase de teste, todos os participantes

foram expostos a um mix FI 5s-FI 20 s. O autor observou que os participantes do Grupo

1 tenderam a apresentar altas taxas de respostas no componente FI 5s (menor IRI,

correlacionado ao programa de FR-curto) e baixas taxas de respostas no componente FI

20 s (maior IRI, correlacionado ao programa de DRL-longo). Já os participantes do

Grupo 2 tenderam a apresentar altas taxas de respostas no componente FI 20 s (maior

IRI, correlacionado ao programa de FR-longo) e baixas taxas de respostas no

componente FI 5s (menor IRI, correlacionado ao programa de DRL-curto).

Os resultados de Okouchi (2003a) sugerem que o IRI também pode funcionar

como controle de estímulos, afetando o comportamento subseqüente. Dessa forma, um

IRI, do inglês inter-reinforcement interval (intervalo entre reforços). O IRI consiste

no tempo entre a apresentação de um reforço e a apresentação do próximo reforço

(Catania, 1998/1999).

“Os programas mistos são iguais aos múltiplos com a exceção de que não existem

estímulos correlacionados a cada componente do programa” (Ferster & Skinner, 1957,

p. 580)

experimento que proponha controle da taxa de reforços pode diminuir as influências

deste tipo de controle de estímulos sobre o desempenho dos organismos na fase de teste.

As pesquisas apresentadas anteriormente são estudos cujas características serão

importantes na construção do delineamento do presente projeto com, por exemplo,

trabalhos que utilizaram participantes humanos (e. g., Okouchi, 2003a; 2003b; Weiner,

1964; 1969), metodologia de sujeito único (e. g., Doughty et al., 2005; Freeman &

Lattal, 1992; Okouchi, 2003a; 2003b) e controle de estímulos (Freeman & Lattal, 1992;

Okouchi, 2003a; 2003b).

4 Delimitação do problema

O estudo realizado por Freeman e Lattal (1992) é um trabalho considerado

referência para os recentes estudos de história comportamental. Este estudo

agrega algumas características de experimentos de história anteriormente

relatados. Os sujeitos experimentais, pombos, eram expostos a uma fase de

construção de história, respondendo a programas de baixa taxa (DRL) e alta taxa

de respostas (FR) e, posteriormente, eram expostos a um programa que permitia

alta variação na taxa de respostas sem alteração na taxa de reforços (FI ou VI),

assim como em muitos outros estudos de história comportamental (por exemplo,

Cole, 2001; Costa, 2004; Costa, et al., 2005; Costa, et al., (no prelo); Salgado (2007);

Weiner, 1964; 1965; 1969, em estudos com humanos; Baron & Leinenweber,

1995; Cole, 2001; LeFrancois & Metzger, 1993; Urbain et al., 1978; Wanchisen et al.

1989, em estudos com não-humanos).

Porém, diferentemente dos delineamentos até então propostos, Freeman e

Lattal (1992) utilizaram metodologia de sujeito único: cada sujeito foi exposto,

na fase de construção da história, tanto ao programa de FR quanto ao programa

de DRL de forma mais ou menos paralela, sendo cada programa correlacionado

sistematicamente com um estímulo (ou cor do fundo da caixa ou cor da luz da

chave de respostas). Após esta construção “concomitante” de diferentes histórias

de reforço sob controle de estímulos, os sujeitos eram expostos à fase teste em

programas de FI (Experimento 1) ou de VI (Experimentos 2 e 3), mantendo-se os

estímulos utilizados na fase anterior. De acordo com Freeman e Lattal, o

“procedimento de histórias paralelas permitiu uma avaliação (...) do desempenho

nos programas de FI e VI na presença de um estímulo historicamente

correlacionado com diferentes programas de reforço positivo” (p. 6-7). A partir

do delineamento de caso único em estudos de história comportamental proposto

por Freeman e Lattal, foram realizadas outras pesquisas como, por exemplo,

Doughty et al. (2005) com pombos e Okouchi (2003a; 2003b) com humanos.

Observando-se os dados das pesquisas citadas anteriormente, é importante

que novas pesquisas sejam realizadas, principalmente no que tange à questão da

generalidade entre as espécies (Sidman, 1960). Freeman e Lattal (1992) já

apontavam para esta questão ao justificar a utilização de pombos como sujeitos

experimentais pela constatação de que “a maioria dos estudos [sobre história

comportamental] conduzidos com não-humanos utilizou ratos como sujeitos

experimentais” (p. 6). Weiner (1964; 1965; 1969) e Okouchi (2003a; 2003b) utilizaram

humanos como participantes de pesquisa. Okouchi, inclusive, utilizou a metodologia de

sujeito único proposta por Freeman e Lattal. Os resultados encontrados sugerem

algumas similaridades entre o comportamento humano e o não-humano. Entretanto, a

realização de novas pesquisas pode auxiliar o desenvolvimento da história

comportamental enquanto área de pesquisa em Análise Experimental do

Comportamento.

O presente trabalho procurou realizar uma replicação sistemática do

estudo de Freeman e Lattal (1992 - Experimento 3). A diferença mais marcante

entre aquele estudo e o proposto aqui é a utilização de humanos como

participantes de pesquisa e outras diferenças originadas dessa mudança tais

como, tipo de reforçador, duração das sessões, instrumento de coleta de dados

utilizado etc.

Apesar de Okouchi (2003b) ter obtido resultados semelhantes aos de

Freeman e Lattal (1992), no que se refere ao papel do controle de estímulos nos

efeitos da história comportamental e tê-los ampliado, na medida em que

demonstrou que o controle de estímulos pode se generalizar para outros estímulos

com a mesma dimensão, algumas questões ainda precisam ser respondidas. Por

exemplo, no estudo de Okouchi não é possível avaliar com precisão o quanto o

comportamento estava sob controle da contingência atual (e.g., não há análises da

taxa de respostas entre reforços sucessivos). Além disso, Okouchi não se

preocupou em controlar a taxa de reforços entre as diferentes contingências

envolvidas no procedimento e o critério de mudança da fase de construção da

história para a fase de teste foi um número fixo de sessão (nenhum critério de

estabilidade foi utilizado). Por fim, mas não menos importante, uma replicação

sistemática do estudo de Freeman e Lattal poderia fornecer resultados mais claros

sobre a questão da discrepância entre o comportamento de humanos e não-

humanos em programas de reforço semelhantes.

O objetivo do presente trabalho foi contribuir, juntamente com os estudos

experimentais já realizados, para a compreensão do papel do controle de

estímulos nos efeitos da história com humanos. Mais especificamente foi

avaliado se cores diferentes do botão de respostas em cada componente de um

programa mult FR-DRL com controle da taxas de reforços, apresentado durante a

fase de construção da história, controlam, de alguma forma, o comportamento

subseqüente de humanos em um programa mult FI-FI.

Método

Participantes

Participaram do presente estudo 4 (quatro) universitários de cursos de graduação

(um do sexo masculino e três do sexo feminino). Os participantes não eram estudantes

do curso de Psicologia, visto que experiências anteriores com exercícios utilizando

programas de reforço nas aulas da graduação poderiam influenciar os resultados do

presente experimento. Também foram excluídos participantes com suspeita ou

diagnóstico de Lesão por Esforço Repetitivo (L.E.R.), porque a tarefa experimental

exigida (pressões no botão do mouse) poderia agravar tais lesões.

Equipamentos e Instrumento

Foram utilizados dois computadores do tipo PC, ambos com monitor em cores

de 14 polegadas, mouse e teclado padrões e um gravador Panasonic® Slim Line, modelo

RQ-2103 com fones de ouvido Grove, modelo HD-3030, para emissão de um ruído

branco

Para coleta de dados, foi utilizado o software ProgRef v3.1 (Costa & Banaco,

2002; 2003). O software exibia no monitor uma tela cinza, contendo um retângulo no

centro inferior da tela (ver Figura 1). Sobre tal retângulo (botão de respostas) eram

emitidas as respostas que consistiam de pressões no botão esquerdo do mouse com o

cursor sobre o botão de respostas. Quando a exigência de um determinado programa de

reforço era cumprida, aparecia no canto superior direito da tela um ícone comumente

identificado como “smile”. O participante deveria, então, “clicar” sobre outra barra,

situada também no canto superior direito (botão de resposta de consumação), para que o

Ruído branco é um som constante, presente durante toda a sessão, utilizado para

aumentar o controle experimental, evitando que o participante se distraia com outros

ruídos que possam ocorrer no momento da coleta de dados.

smile desaparecesse e um ponto fosse registrado no visor de pontuação localizado acima

do botão de respostas. Em um programa de reforço em FI ou DRL o intervalo tinha

início após o aparecimento do smile e não após a emissão da resposta de consumação.

Portanto, o tempo gasto pelo participante para deslocar o cursor do mouse do botão de

respostas até o botão de respostas de consumação e voltar novamente para o botão de

respostas é computado como parte dos intervalos do FI ou do DRL. A Figura 1 mostra o

layout da tela do ProgRef v3.1, com a qual os participantes interagiam. No programa de

reforço múltiplo o botão de respostas mudava de cor em cada um de dois componentes.

Figura 1. Layout da tela do computador com a qual os participantes interagiam.

Local

Os dados foram coletados no Laboratório de Análise Experimental do

Comportamento Humano (LAECH), localizado no Departamento de Psicologia Geral e

Análise do Comportamento, da Universidade Estadual de Londrina. A coleta foi

realizada em dois cubículos de aproximadamente 1,5 por 2,0 metros cada um, contendo,

além dos equipamentos, uma mesa, uma cadeira, e um ventilador.

Visor de pontuação

Botão de resposta de consumação

smile

Botão de respostas – Operandum

Procedimento

As sessões experimentais tiveram duração aproximada de 30 minutos e eram

diárias (exceto sábados, domingos e feriados). Os participantes receberam, ao final de

cada sessão, R$ 0,05 para cada ponto.

Para que o ruído de pessoas conversando ou de outras coletas de dados (outros

participantes emitindo respostas de clicar o botão do mouse) não influenciasse os

resultados do experimento, optou-se pela utilização do ruído branco. Os participantes

utilizaram um fone de ouvido, com volume regulável, em uma altura confortável

(definida pelo próprio participante).

Antes de começar o experimento, os participantes leram as informações sobre o

estudo (Apêndice A) e assinaram o “Termo de Consentimento Livre e Esclarecido”

(Apêndice B). Foi solicitado ao participante que deixasse seu material fora do cubículo

em que os dados foram coletados, e que retirasse o relógio e desligasse o celular. Ao

adentrar a sala de coleta, cada participante lia as instruções (Apêndice C), colocava o

fone de ouvido (com o ruído branco) e era, então, autorizado pelo experimentador a

começar a sessão. Para tanto, deveria clicar com o cursor do mouse sobre o botão de

início que estava presente na tela do computador. As fases do experimento estão

resumidas na Tabela 1.

Tabela 1. Seqüência das fases do experimento.

Componentes dos

programas de reforço

múltiplos

Fase

Verde Vermelho

Duração de

cada

componente

Duração de cada

sessão

Fase 1, Sessão 1

FR 10 DRL 2, 4, 6,

8, 10 s

10 pontos Aproximadamente

35 minutos

Fase 1, Sessão 2

FR 10 DRL 12, 14,

16, 18, 20 s

10 pontos Aproximadamente

35 minutos

Fase 1, Sessão 3

FR 10, 15,

20, 30, 40

DRL 20 s 10 pontos Aproximadamente

35 minutos

Fase 2 FR 40 DRL 20 s 5 minutos 30 minutos

Fase 3 FR n DRL 20 s 5 minutos 30 minutos

Fase 4 FI t s FI t s 5 minutos 30 minutos

Fase 1 – Aquisição: Nesta fase, os participantes eram expostos a um programa mult

FR-DRL por três sessões. Na primeira sessão, os participantes eram expostos ao mult

FR 10 – DRL ts, no qual o valor de t era ajustado gradativamente, ou seja, 2, 4, 6, 8 e 10

segundos. Os componentes eram apresentados de forma alternada, sendo que o critério

de mudança de um componente para o outro era a obtenção de 10 pontos (critério

arbitrário). Portanto, a sessão teve início com um FR 10 e, quando o participante

ganhasse 10 pontos a cor do botão mudava e uma contingência de DRL 2 s entrava em

vigor; quando o participante ganhasse 10 pontos em DRL 2 s a contingência mudava

para FR 10. Após ganhar 10 pontos em FR 10, a contingência mudava para DRL 4s e

assim por diante. A primeira sessão terminava, dessa forma, quando o participante

obtivesse o vigésimo ponto no programa DRL 12 s. Na segunda sessão desta fase, o

valor do FR continuou fixo (10), enquanto que o valor do intervalo do DRL foi

novamente ajustado, agora começando em 12 segundos e aumentando para 14, 16, 18 e

20 segundos. Na terceira sessão, o valor do intervalo do DRL era sempre de 20

segundos e o valor do FR foi ajustado a cada 10 pontos ganhos, ou seja, 10, 15, 20, 30 e

40 respostas. O critério para alternação dos componentes, em todas as sessões desta

fase, foi a obtenção de 10 pontos em cada componente. A cor do botão de respostas era

verde no componente FR e vermelha no componente DRL. Um timeout de 5 s era

apresentado entre um componente e outro.

Fase 2 – Aproximação do intervalo entre reforços (IRI): Nesta Fase, os participantes

foram expostos, inicialmente, a um programa mult FR 40 – DRL 20 s. A cor do botão

de respostas era verde para FR e vermelha para o DRL. Cada componente foi

apresentado alternadamente a cada 5 minutos. Toda sessão começava pelo componente

FR. Cada sessão tinha duração de 30 minutos. Ao final da primeira sessão da Fase 2, foi

verificado o IRI médio do componente de FR naquela sessão. Nas sessões subseqüentes,

o valor do FR era ajustado com base no IRI médio da sessão anterior para cada

participante, de tal modo que o IRI no componente de FR fosse aproximadamente o

mesmo que no componente de DRL (aproximadamente, 20 segundos). Tal

procedimento teve a função de igualar o máximo possível a taxa de reforços nos dois

componentes. Este procedimento foi adotado para que o IRI não se tornasse um controle

de estímulo adicional do mult FR-DRL (cf. Okouchi, 2003a). Um timeout de 5s era

apresentado entre um componente e outro.

Fase 3 – Construção da linha de base: Os participantes foram expostos a um

programa mult FR n – DRL 20 s, na presença de um botão verde no componente FR e

vermelho no componente DRL. Cada programa era apresentado alternadamente por 5

minutos cada e as sessões tiveram duração de 30 minutos. A Fase 3 foi mantida até que

a média da freqüência total da respostas de pressão ao botão nos dois componentes em

quatro sessões consecutivas fosse menor do que 10% da diferença entre a média das três

primeiras e três últimas destas quatro sessões (Schoenfeld, Cumming e Hearst,

1956/1968). Um timeout de 5s era apresentado entre um componente e outro.

Fase 4 – Teste: Os participantes foram expostos a um programa de reforço mult FI ts –

FI ts. O valor do intervalo dos componentes de FI (t) foi calculado com base na média

dos IRIs de ambos os componentes das quatro últimas sessões da Fase 3. Um timeout de

5s era apresentado entre um componente e outro. O botão de resposta era verde para o

primeiro componente de FI e vermelho durante o segundo componente de FI. Assim, os

estímulos presentes durante a apresentação de cada componente do programa múltiplo

foram mantidos constantes entre as Fases 1, 2, 3 e 4, porém as contingências de reforço

foram alteradas nesta Fase. Foram realizadas 15 sessões na Fase 4. No caso de P4,

foram realizadas mais quatro sessões nesta fase. A primeira destas quatro sessões teve

um intervalo de 38 dias em relação à última sessão anterior.

Fase 5 – Mudança no controle de estímulos: Somente P4 foi exposto a esta fase. O

participante foi exposto a um programa mult FI ts – FI ts, no qual o valor de t era o

mesmo da Fase 4. O botão de resposta era preto para o primeiro componente de FI e

branco durante o segundo componente de FI. Um timeout de 5 segundos era apresentado

entre um componente e outro. Esta fase foi realizada somente com P4 porque as taxas

de respostas permaneceram diferenciadas durante toda a Fase 4, isto é, o efeito da

história de exposição ao mult FR-DRL ainda era observado após 18 sessões da Fase 4.

Resultados

A Figura 2 a seguir indica as taxas de respostas (R/min) dos participantes em

todas as fases do experimento.

Figura 2: Taxas de respostas de P1, P2, P3 e P4 durante todas as fases do experimento.

As linhas pontilhadas indicam as mudanças de fase. Os círculos cheios indicam as taxas

de respostas nos componentes em que o botão de resposta era verde – componente FR

(Fases 1, 2 e 3) e FI (Fase 4). Os círculos vazios indicam as taxas de resposta nos

componentes em que o botão de resposta era vermelho – componente DRL (Fases 1, 2 e

3) e FI (Fase 4). Na Fase 5 (P4), um programa mult FI-FI idêntico ao da Fase 4 foi

mantido, exceto que as cores do botão em cada componente mudou de verde

(Componente 1) e vermelho (Componente 2) para preto (Componente 1) e branco

(Componente 2).

Em relação à Fase 1 (aquisição), para todos os participantes, as taxas de

respostas na terceira sessão já eram diferenciadas, ou seja, os participantes emitiam

taxas de respostas mais altas no componente FR do que no componente DRL. Hayes,

Brownstein, Haas e Greenway (1986) propuseram um critério para avaliar a

diferenciação do comportamento em dois componentes de um programa múltiplo de

reforço. Segundo este critério, considera-se que há diferenciação na freqüência de

respostas entre dois componentes de um programa múltiplo se o número total de

respostas no componente com menor freqüência, dividido pela freqüência total de

respostas em ambos os componentes, for menor que 0,25.

Aplicando esta fórmula da diferenciação após a coleta de dados foi possível

avaliar se havia diferenciação na taxa de respostas ao término da Fase 1 (aquisição). O

índice de diferenciação foi de 0,06 para P1, de 0,05 para P2, de 0,11 para P3 e de 0,08

para P4. Portanto, de acordo com o índice de diferenciação proposto por Hayes et al.

(1986) foi observada diferenciação na taxa de respostas de todos os participantes da

presente pesquisa nos componentes do programa múltiplo (altas taxas de respostas no

componente FR e baixas taxas no componente DRL).

Esse padrão se manteve durante a Fase 2 (aproximação do IRI), na qual os

valores do FR foram aumentados na tentativa de igualar a taxa de pontos ganhos em

ambos os componentes. Nesta fase cada participante foi exposto a um número diferente

de sessões, até que o critério para mudança de fase fosse atingido (IRI do componente

FR aproximadamente igual ao IRI do componente DRL e diferença de pontos ganhos

em cada componente menor do que dez). No caso de P1, o asterisco na Figura 1 indica

que entre a sessão 6 e a sessão 7 houve uma diferença menor do que dez pontos entre os

dois componentes do múltiplo (os IRIs médios da sessão 6 eram 25,5 para o

componente FR e 24,6 segundos para o componente DRL, enquanto que na sessão 7 os

IRIs médios eram 25,2 segundos para o componente FR e 25,1 para o componente

DRL), o que indicaria mudança da Fase 2 para a Fase 3. Porém, o IRI volta a ficar

diferenciado entre a sessão 7 e a sessão 8 (os IRIs médios da sessão 8 foram 22,2

segundos para o componente FR e 29,2 segundos para o componente DRL). Essa

diferenciação causou uma diferença no ganho de pontos no componente FR em relação

ao componente DRL maior do que dez nessa sessão. Dessa maneira, optou-se por

manter a Fase 2 por mais sessões, para que o valor dos IRIs pudesse, de fato, atingir um

valor mais próximo entre os componentes.

A Figura 3 mostra as taxas médias dos pontos obtidos em cada componente do

programa múltiplo para cada participante nas quatro últimas sessões da Fase 3 (mult

FR-DRL) e nas primeiras (Bloco Inicial) e quatro últimas (Bloco Final) sessões da Fase

4 (mult FI-FI).

Figura 3: Taxas médias de pontos obtidos em cada componente do programa múltiplo

FR-DRL para cada participante nas quatro últimas sessões da Fase 3 (Bloco Final), em

cada componente do programa múltiplo FI-FI nas quatro primeiras sessões da Fase 4

(Bloco Inicial) e nas quatro últimas sessões da Fase 4 (Bloco Final).

A Fase 2 foi encerrada apenas quando os IRIs do componente FR fossem

aproximadamente iguais aos do componente DRL (≅ 20 segundos) e a diferença de

pontos obtidos no componente FR fosse menor do que dez pontos em relação aos

pontos obtidos no componente DRL. A maior diferença entre os pontos obtidos nos

programas de FR e DRL encontrada nesta fase foi de 0,5 pontos/min (P2) – o que, no

presente estudo, corresponde a 7 pontos por sessão. Observa-se que, de maneira geral, a

taxa de reforços não variou muito quando o programa foi mudado de um mult FR-DRL

para um mult FI-FI. A diferença entre as taxas médias de pontos nos dois componentes

para P1 durante as quatro últimas sessões da Fase 3 foi de 0,2 pontos/min. Quando a

contingência mudou para mult FI-FI, esta diferença deixou de ser observada. No caso de

P2, a diferença que era de 0,5 pontos/min durante a linha de base, manteve-se durante as

primeiras sessões da Fase 4, mas diminuiu: 0.2 pontos/min. Porém, nas quatro sessões

finais da Fase 4, a diferença não era mais observada. Para P3, não havia diferença na

taxa de pontos nas últimas sessões da linha de base. Durante as sessões da Fase 4, houve

uma pequena queda em relação à taxa de pontos em ambos os componentes, porém a

diferença na taxa de pontos entre os dois componentes continuou inexistente. No caso

de P4, havia uma diferença de 0,4 pontos/min entre os componentes durante as quatro

últimas sessões da Fase 4. Esta diferença continuou durante as quatro primeiras sessões

da Fase 4: 0,4 pontos/min. Nas últimas sessões da Fase 4, a diferença ainda podia ser

observada: 0,2 pontos/min. O valor da razão do componente FR utilizado na Fase 3

(linha de base) foi obtido pela aproximação dos IRIs do FR com os IRIs do DRL (i.e.,

aproximadamente 20 segundos). Dessa forma, na Fase 3, P1 foi exposto a um FR 220 e

P2, P3 e P4 a um FR 100.

Voltando à Figura 2, observa-se que todos os participantes apresentaram, ao

final da Fase 3 (linha de base), altas taxas de respostas no componente FR (botão verde)

em relação ao componente DRL (botão vermelho). Aplicando-se novamente a fórmula

para o cálculo da diferenciação proposto por Hayes et al. (1986), o participante que

apresentou o menor índice de diferenciação (responder entre componentes mais

diferenciado) foi P1 (0,005), seguido de P4 (0,009), P2 (0,008) e P3 (0,01).

Durante as primeiras sessões da Fase 4 em que um programa mult FI-FI estava

em vigor podem ser observados efeitos da exposição prévia a um mult FR-DRL, para

todos os participantes. Eles continuaram a emitir altas taxas de resposta no componente

com botão verde [FR] e baixas taxas de resposta no componente com botão vermelho

[DRL]

. Entretanto, após uma exposição continuada ao mult FI-FI, as taxas de resposta

de P1, P2 e P3 tenderam a se igualar.

No caso de P4, o padrão comportamental selecionado pela história de exposição

ao mult FR-DRL persistiu durante toda a Fase 4 (mult FI-FI), ou seja, o participante

continuou emitindo altas taxas de respostas no componente com botão vermelho [DRL]

em relação ao componente com botão verde [FR]. Após as 15 sessões programadas para

o encerramento da Fase 4, P4 foi exposto a mais quatro sessões do mult FI-FI (verde-

vermelho). Estas quatro sessões tiveram um intervalo de 38 dias em relação à 15ª sessão

da Fase 4. A seta preta na Figura 2 indica a primeira dessas quatro sessões. Mesmo após

este período, o comportamento de P4 permaneceu inalterado: altas taxas de resposta no

componente com botão verde [FR] e baixas taxas de respostas no componente com

botão vermelho [DRL]. Após a realização dessas quatro sessões, P4 foi exposto à Fase

5, na qual o mesmo mult FI-FI da fase anterior estava em vigor, mas as cores do botão

de respostas mudaram para preto no primeiro componente e branco no segundo. Após a

mudança no controle de estímulos observou-se uma mudança abrupta no

comportamento de P4, no mesmo sentido dos outros participantes: as taxas de respostas

Quando as cores do botão de respostas estiverem referindo-se à Fase 4, será utilizada

a notação verde [FR] e vermelho [DRL] para destacar que, durante as fases anteriores,

estas cores foram correlacionadas, respectivamente, aos programas de FR e DRL.

nos dois componentes tenderam a se igualar, o que sugere um controle maior da

contingência presente.

É interessante notar que, para três dos quatro participantes (P1 e P3 na Fase 4 e

P4 na Fase 5), as taxas de respostas no componente FI com botão verde [FR] (ou preto,

no caso de P4) tenderam a diminuir mais do que as taxas de respostas no componente

com botão vermelho [DRL] (ou branco, no caso de P4) tenderam a aumentar. Este não

foi o caso de P3, em que as taxas de respostas no componente FI com botão verde [FR]

tenderam a baixar, de maneira geral, na mesma proporção que as taxas de respostas no

componente FI com botão vermelho [DRL] tenderam a aumentar.

Entretanto, uma análise da proporção da mudança da taxa de respostas em

relação à linha de base (cf. Nevin, 1974; 1988) nos dois componentes do programa

múltiplo, mostra um quadro diferente. A Figura 4 a seguir exibe a proporção da

mudança nas taxas de respostas nos componentes do mult FI-FI da Fase 4 (P1, P2 e P3)

ou da Fase 5 (P4) em relação às quatro últimas sessões da linha de base (mult FR-DRL).

A proporção foi calculada dividindo-se a taxa de respostas de cada componente em cada

sessão pela média da taxa de respostas nas quatro últimas sessões da Fase 3. Esta

diferença foi, então, dividida por 100 (100% era o valor da média da taxa de respostas

nas quatro últimas sessões da linha de base). Observa-se na Figura 4 que, no caso de P1,

P2 e P3, a proporção da mudança da taxa de respostas em relação à linha de base foi

maior no componente de FI com botão vermelho [DRL] do que no componente de FI

com botão verde [FR], indicando que uma história de FR pode produzir um responder

mais resistente à mudança.

No caso de P4, quando o comportamento na Fase 5 é analisado, observa-se que a

mudança nas taxas de respostas em relação à linha de base foi maior no componente FI

com botão branco em relação ao componente FI com botão preto.

Figura 4: Proporção da mudança das taxas de respostas em relação à linha de base nos

componentes do mult FI-FI na Fase 4 (para P1, P2 e P3). Os pontos cheios indicam a

mudança na taxa de respostas nos componentes FI com botão verde (que na linha de

base correspondiam ao FR) e os pontos vazios indicam a mudança na taxa de respostas

nos componentes FI com botão vermelho (que na linha de base correspondiam ao DRL).

Para P4 (Fase 5) os pontos cheios indicam a mudança na taxa de respostas nos

componentes FI com botão preto e os pontos vazios indicam a mudança na taxa de

respostas nos componentes FI com botão branco. Os primeiros pontos em cada gráfico

indicam o log da média da taxa de respostas em cada componente nas quatro últimas

sessões da Fase 3.

A Figura 5 exibe os registros cumulativos de todos os participantes na última

sessão da Fase 3 (mult FR-DRL, coluna da esquerda), na primeira sessão da Fase 4

(mult FI-FI, coluna central) e na última sessão da Fase 4 (mult FI-FI, coluna da direita).

Todos os participantes terminaram a Fase 3 respondendo de forma diferenciada nos

componentes do mult FR-DRL (ver também Figura 2). Observa-se que os participantes

emitiam taxas de respostas altas e constantes no FR, sem pausas pós-reforço. No

componente DRL, o comportamento foi de taxas de respostas baixas e constantes

(geralmente, uma resposta por intervalo).

Figura 5: Registros cumulativos da última sessão da Fase 3 (mult FR-DRL, coluna da

esquerda), primeira sessão da Fase 4 (mult FI-FI, coluna central) e última sessão da Fase

4 (mult FI-FI, coluna da direita) para todos os participantes. Os números nos registros

indicam cada componente (1 para FR ou FI com botão verde e 2 para DRL ou FI com

botão vermelho) e as linhas pontilhadas indicam mudança de componente. Os registros

voltam a zero a cada 250 respostas. Cada sessão teve duração de 30 minutos.

Durante a primeira sessão da Fase 4 (quando o programa foi mudando para um

mult FI-FI), algumas mudanças podem ser identificadas no comportamento de P1 e P3.

No caso de P1, podem ser observadas altas taxas de respostas nos componentes FI com

botão vermelho [DRL], principalmente no quarto e sexto componentes do múltiplo. No

início do segundo componente do múltiplo também podem ser observadas altas taxas de

respostas no registro cumulativo de P1 (como indicado pela seta na Figura 5). Uma

análise dos registros cumulativos de sessões 22 e 24 (não reproduzidas no presente

trabalho) indica que, em alguns casos, P1 emitia altas taxas de respostas no componente

DRL (botão vermelho). No caso de P3, também pode ser observado um pequeno

aumento na taxa de respostas no último componente do programa múltiplo (FI com

botão vermelho). Esta não foi o caso de P2 e P4, que continuaram emitindo taxas de

respostas diferenciadas durante toda a sessão.

O que se observa ao final da Fase 4, porém, é que o comportamento de P1, P2 e

P3 ficou relativamente igual nos dois componentes do mult FI-FI (foram observadas

taxas de respostas relativamente iguais nos dois componentes). Os índices de

diferenciação de acordo com a fórmula de Hayes et al. (1986) foram 0,38 para P1, 0,49

para P2 e 0,46 para P3. O participante P4, porém, continuou apresentando um padrão

diferenciado de respostas nos componentes do múltiplo (índice de diferenciação igual a

0,02).

A Figura 6 a seguir mostra a sessão onde o comportamento dos participantes

começou a mudar quando da exposição ao mult FI-FI. Observa-se que, no caso de P1, o

comportamento começa a mudar logo na primeira sessão da Fase 4 (Sessão 29). A

mudança é marcante principalmente no quarto componente do múltiplo (segundo

componente FI com botão vermelho [DRL]).

Figura 6: Registros cumulativos das sessões do mult FI-FI nas quais o comportamento

dos participantes começa a mudar (sessões da Fase 4 para P1, P2 e P3 e da Fase 5 para

P4). Os números nos registros indicam cada componente (1 para FI com botão verde

[FR] e 2 para FI com botão vermelho [DRL]). Os registros cumulativos voltam a zero

após 250 respostas e as linhas pontilhadas marcam o final do componente. Cada

componente tinha duração de cinco minutos.

Nos casos de P2 e P3, a mudança pode ser observada na terceira sessão da Fase

4 (sessão 15 para P2 e sessão 16 para P3). Uma análise visual do registro cumulativo de

P2 permite identificar a mudança no quarto componente do mult FI-FI (segunda

apresentação do FI com botão vermelho [DRL]). Uma análise molecular do

comportamento de P2 indicou ainda uma diferença nas médias dos IRTs dos três

componentes FI com botão vermelho [DRL] (Componente 2): 26,9 segundos para a

primeira apresentação do Componente 2; 9,3 segundos para a segunda apresentação e

0,6 segundos para a terceira apresentação. Para P3, a mudança pode ser observada no

segundo componente do mult FI-FI (primeira apresentação do FI com botão vermelho

[DRL]). A diferença entre as médias dos IRTs nos três componentes FI com botão

vermelho nesta sessão foi: 13,4 segundos para a primeira apresentação; 11,8 segundos

para a segunda apresentação; 3,1 segundos na terceira apresentação. Em ambos os casos

(P2 e P3), o desempenho final na sessão de mudança assemelha-se ao padrão final

observado na última sessão da Fase 4 (como pode ser visto na Figura 2).

Como foi visto na Figura 5, o comportamento de P4 continuou diferenciado

durante toda a Fase 4. Quando as cores dos botões de resposta foram modificados na

Fase 5 (preto e branco), o comportamento de P4 mudou logo na primeira sessão (sessão

37). O comportamento de P4 durante a primeira sessão da Fase 5 foi semelhante ao

comportamento deste participante durante as outras sessões.

A Figura 7 a seguir mostra a ampliação do terceiro e quarto componentes dos

registros cumulativos da última sessão da Fase 4 (mult FI-FI). Esta ampliação permite

observar alguns detalhes que não podem ser vistos na Figura 4 (na última sessão,

supostamente, o desempenho do participante estaria mais estável; a escolha pela porção

central da sessão foi arbitrária).

Figura 7: Ampliações do terceiro e quarto componentes do mult FI-FI (verde-vermelho)

da última sessão da Fase 4 para todos os participantes. Os números nos registros

indicam cada componente (1 para FI com botão verde [FR] e 2 para FI com botão

vermelho [DRL]). Os registros cumulativos voltam a zero após 250 respostas e as linhas

pontilhadas marcam o final do componente. Cada componente tinha duração de cinco

minutos.

O comportamento de P1 e P3, em ambos os componentes, era de taxas baixas de

respostas, inclusive apresentando alguns padrões de scallop e break-and-run, conforme

indicado pelas setas na Figura 7. Durante a última sessão da Fase 4, o comportamento

de P2 era de taxas de respostas altas e constantes, sem pausa pós-reforço. Como já foi

observado anteriormente na Figura 5, o comportamento de P4 continuou a apresentar

diferenciação nos dois componentes do múltiplo. Porém, a taxa de respostas no

componente FI com botão vermelho [DRL] aumentou em relação ao componente DRL

da Fase 3.

Durante as últimas quatro sessões da Fase 3, a taxa média de respostas no

componente DRL era de 2,7 R/min. Durante a Fase 4, as taxa média de respostas

durante o componente FI com botão vermelho [DRL] era de 3,3 R/min. A taxa média de

respostas no componente FI com botão verde [FR], que era de 305,1 R/min, também

aumentou em relação à taxa média de respostas no componente FR das últimas quatro

sessões da Fase 3, que era de 276,5 R/min.

Discussão

O objetivo do presente trabalho foi avaliar o efeito de uma exposição

prévia a um programa mult FR-DRL sobre o comportamento subseqüente de

humanos em um programa mult FI-FI (mantendo-se o mesmo controle de

estímulos – i.e., mesma cor do botão de respostas – nos dois programas

múltiplos). Três dos quatro participantes (P1, P2 e P3) apresentaram efeitos de curta

duração da exposição anterior a um programa mult FR-DRL quando as contingências

mudaram para um mult FI-FI. Com a exposição continuada ao mult FI-FI as taxas de

respostas pareceram se ajustar ao parâmetro temporal da contingência de reforço

presente (a diferença na taxa de respostas entre os dois componentes não foi

substancial), sugerindo que as cores do botão de respostas talvez tenham controlado

menos – ou mesmo deixaram de controlar – a taxa de respostas. Os resultados destes

três participantes vão ao encontro daqueles obtidos por Freeman e Lattal (1992).

Os resultados de P4 durante a Fase 4, porém, foram diferentes dos outros

participantes. Até a 15ª sessão da Fase 4 (32

sessão do experimento), podem ser

observados efeitos da exposição prévia ao mult FR-DRL no comportamento de P4, ou

seja, altas taxas de resposta no componente FI quando o botão de resposta era verde (a

mesma usada durante o componente de FR na fase anterior) e baixas taxas no FI quando

o botão de respostas era vermelho (a mesma usada durante o componente de DRL na

fase anterior). Estes resultados vão ao encontro daqueles obtidos no estudo de Weiner

(1964; 1969), que sugerem efeitos de longa duração de uma história de responder em

FR ou DRL sobre o comportamento subseqüente em FI.

Após 38 dias de intervalo entre a 15ª e a 16ª sessão da Fase 4, a taxa de respostas

de P4 nos dois componentes do mult FI-FI continuou diferenciada por quatro sessões.

Estes resultados sugerem que a mera passagem do tempo não foi suficiente para

eliminar os efeitos da exposição anterior ao mult FR-DRL no comportamento de P4.

Resultados semelhantes foram encontrados por Ono e Iwabuchi (1997, Parte 2). Os

pombos utilizados neste experimento foram expostos, em uma primeira fase, a um mult

DRH-DRL. O disco que os pombos bicavam era verde para o componente DRH e

vermelho para o componente DRL. Após seis meses de intervalo, os pombos eram

expostos a um programa de VI simples, com disco branco. Em uma terceira fase, um

programa mult VI-VI entrou em vigor, com a cor do disco variando entre verde e

vermelha (algumas sessões de VI simples com disco branco também foram realizadas

nesta fase). Os autores observaram que, mesmo após a passagem de seis meses, foram

observados efeitos da história de exposição ao mult DRH-DRL sobre o comportamento

no mult VI-VI.

Resultados semelhantes foram relatados também por Skinner (1950). Pombos

foram condicionados a bicar um disco sobre o qual era projetado um estímulo visual

complexo. Em seguida os pássaros eram alojados em suas gaiolas-viveiro sem nenhuma

exposição a qualquer contingência de reforço por um período de tempo que variou entre

seis meses e quatro anos. Então, os pombos foram introduzidos novamente na caixa

experimental em um programa de extinção. No período inicial da extinção no qual o

disco estava presente, mas não iluminado com o estímulo complexo, os pombos não

responderam. Quando o padrão complexo foi projetado no disco os pombos emitiram

cerca de 700 respostas na hora subseqüente.

Por que as taxas de respostas de P4 permaneceram diferenciadas durante toda a

Fase 4 (sugerindo efeitos de história de longa duração)? A resposta, provavelmente, diz

respeito à questão do controle de estímulos. A pesquisa de Okouchi (2003a) sugere que

a taxa de reforços pode servir de controle de estímulos quando se muda o programa de

reforço em vigor. Como na presente pesquisa a taxa de reforços em ambos os

componentes foi aproximada (durante a Fase 3 e 4 – ver Figura 3), o comportamento de

P4 parece ter ficado, preponderantemente, sob controle dos estímulos correntes que

também estavam presentes nas fases anteriores do estudo, ou seja, as cores do botão de

resposta. Apesar da taxa de respostas de P4, durante a Fase 4, ter sido algo diferente da

taxa de respostas da Fase 3 (Figura 7), ela permaneceu mais alta no componente FI com

botão verde do que no componente FI com botão vermelho. Como o comportamento

diferenciado nos dois componentes do programa mult FI-FI continuou produzindo

pontos, não foi observada mudança comportamental substancial. Esse resultado parece

indicar que o comportamento de P4 continuou sob controle das cores dos botões, uma

vez que comportar-se daquela forma na presença daqueles estímulos continuou a

produzir pontos

Com o objetivo de verificar se a manutenção do padrão comportamental estava

sob controle principalmente das cores do botão de respostas, elas foram modificadas na

Fase 5 para P4. Quando as cores dos botões de resposta foram modificadas (preto para

um dos componentes de FI e branco para o outro) o comportamento de P4 mudou,

ficando semelhante ao dos outros participantes na Fase 4. Este resultado parece indicar

que o comportamento de P4 estava, durante a Fase 4, preponderantemente sob controle

das cores do botão de resposta (verde e vermelho). Os resultados de uma pesquisa

apresentada por Ferster e Skinner (1957) sugerem que a mudança abrupta do estímulo

durante um programa múltiplo produz alterações no comportamento corrente. Pombos

eram submetidos a um mult FI-FR e, subseqüentemente, o estímulo correlacionado ao

FI era apresentado durante o componente em que o FR estava em vigor. Os resultados

Essas considerações levariam à pergunta: por que então o comportamento dos outros

participantes não apresentou a persistência comportamental vista nos resultados de P4?

Essa questão será retomada e discutida mais adiante.

indicaram um comportamento típico de programas de FI quando o estímulo

correlacionado a este programa de reforço aparecia durante o FR.

Em relação aos estudos de Weiner (1964; 1969) – que também sugerem efeitos

de longa duração da história – luzes de cores diferentes estavam presentes durante cada

programa de reforço (FR ou DRL na fase de construção da história, ou FI durante a fase

de teste). Se nos estudos de Weiner havia luzes de diferentes cores durante a

apresentação de cada programa de reforço e ainda assim foram observados efeitos de

longa duração, por que o comportamento de P4 no presente estudo mudou quando as

cores do botão de respostas foram alteradas na Fase 5? A resposta para esta questão

parece estar na própria configuração das contingências de reforço. Nos estudos de

Weiner os participantes eram expostos a programas de reforço simples – FR ou DRL,

dependendo do grupo e, posteriormente, a um FI. No presente estudo, os participantes

eram expostos a programas de reforço múltiplo. No caso de programas múltiplos, o

comportamento do organismo é, mais provavelmente, colocado sob controle dos

estímulos presentes uma vez que a melhor relação resposta-reforçador depende de qual

estímulo está presente e os estímulos alternam-se a todo o momento durante uma sessão

experimental. Esse não era o caso nos arranjos experimentais dos estudos de Weiner.

Se o controle de estímulos (cores dos botões) foi um fator importante para a

manutenção do comportamento de P4 durante a Fase 4 e posterior mudança durante a

Fase 5, uma pergunta que precisa ser abordada é: quais foram as variáveis relevantes

que contribuíram para a mudança no padrão comportamental de P1, P2 e P3 quando as

contingências de reforço mudaram durante a Fase 4?

Poder-se-ia esperar que uma mudança na taxa de reforço entre a Fase 3 e 4

aumentasse a probabilidade de que o comportamento dos participantes se alterasse na

Fase 4 (cf. Okouchi, 2003a). Entretanto, em relação ao controle da taxa de reforços, a

Figura 3 indica que no caso de P1 havia uma pequena diferença na taxa de reforços nos

dois componentes do mult FR-DRL durante as últimas sessões da Fase 3. Esta diferença

desapareceu quando da exposição ao mult FI-FI durante a Fase 4. No caso de P3, não foi

observada variação na taxa de reforços nos dois componentes durante as quatro últimas

sessões da Fase 3 (mult FR-DRL) nem durante a Fase 4 (mult FI-FI). Os resultados de

P2 e P4, no entanto, foram mais semelhantes. Tanto P2 quanto P4 tinham uma pequena

variação na taxa de reforços nos dois componentes do mult FR-DRL nas quatro últimas

sessões da Fase 3. Nas quatro primeiras sessões da Fase 4, essa variação continuou

sendo observada para ambos os participantes. Porém, na Figura 6 verifica-se que o

comportamento de P2 começa a mudar na terceira sessão da Fase 4 (Sessão 15 do

experimento), enquanto que a taxa de respostas de P4, nos dois componentes do

programa múltiplo, permaneceu diferenciada durante toda a Fase 4. Tais resultados

sugerem que não há uma correlação clara entre a diferença na taxa de reforços durante

as quatro últimas sessões da Fase 3 e início da Fase 4 com a probabilidade da mudança

comportamental subseqüente.

Uma vez que a diferença na taxa de reforços, aparentemente, não foi o fator

relevante para explicar a mudança ou manutenção das taxas de respostas após a

alteração das contingências de reforço, uma análise da taxa local de respostas, via

inspeção visual dos registros cumulativos e análises dos IRTs de porções de algumas

sessões, foi implementada.

Observando-se o comportamento de P1, foram identificados padrões de altas

taxas de respostas no segundo componente FI (botão vermelho) da primeira sessão da

Fase 4 (ver Figuras 5 e 6). Altas taxas de respostas no início do componente DRL foram

observadas nos registros cumulativos de outras sessões das fases anteriores para este

participante (não apresentados no presente trabalho). Entretanto, quando isso ocorreu, o

IRI aumentou (i.e., um período de tempo maior foi necessário para a obtenção do

ponto), já que uma diminuição nos IRTs abaixo de 20 segundos fazia zerar o

cronômetro, reiniciando o intervalo. Quando este aumento na taxa local de respostas

ocorreu durante a Fase 4 – em que um programa de FI estava em vigor nos dois

componentes do múltiplo (conforme visto na Figura 5) – a diminuição dos IRTs não

produziu mudança no IRI. Esta variação pode ter contribuído para que o comportamento

de P1 mudasse bruscamente ainda na primeira sessão da Fase 4 no componente FI com

botão vermelho.

No caso de P2 e P3, não houve uma variação tão evidente na taxa local de

respostas como aquela observada nos registros cumulativos de P1. Isso pode ter

contribuído para que os efeitos da história durassem por praticamente toda a primeira

sessão da Fase 4. A seleção de outro padrão comportamental depende da variação no

comportamento (Skinner, 1981). Todavia, uma análise preliminar dos IRTs sugeriu que

a freqüência de IRTs curtos aumentou a partir da terceira sessão da Fase 4 para P2 e P3,

durante o componente FI com botão vermelho (cor do botão correlacionado ao DRL na

fase anterior). Este aumento na freqüência dos IRTs curtos pode ter sido responsável

pela seleção de um novo padrão comportamental, sob controle do parâmetro temporal

dos programas de FI. Quanto ao P4, houve alguns IRTs curtos durante o FI com o botão

de respostas vermelho (correlacionado anteriormente ao DRL), entretanto, a freqüência

desses IRTs curtos, aparentemente, não foi tão alta quanto aquelas observadas nos

registros de P2 e P3. Uma análise mais refinada da distribuição dos IRTs poderia lançar

luz sobre a diferença no desempenho de P4 em relação aos demais participantes.

Um aspecto polêmico nos estudos de história comportamental diz respeito à sua

duração. Alguns autores (e.g., Tatham & Wanchisen, 1998; Wanchisen & Tatham,

1991) sugeriram que, em alguns casos, os efeitos da história comportamental poderiam

ser permanentes. Quando se analisa o comportamento de P1, P2 e P3 observa-se que,

com a exposição continuada ao mult FI-FI as taxas de respostas tendem a se tornar

iguais nos dois componentes do programa múltiplo. Estes resultados, de acordo com

Freeman e Lattal (1992), sugerem que o comportamento dos participantes ficou sob

controle do programa corrente, o mult FI-FI. Nesse sentido, os resultados destes

participantes corroboram a afirmação de Cole (2001) de que histórias de FR e DRL

parecem não afetar permanentemente o desempenho em um programa de FI. Assim,

pode-se afirmar que, no caso do presente estudo, os efeitos da história não foram

permanentes. Mesmo no caso de P4, que apresentou maior persistência comportamental,

quando as cores do botão de respostas foram alteradas na Fase 5 observou-se que o

comportamento do participante pareceu ficar sob controle da contingência presente.

Outro aspecto que precisa ser destacado com relação à mudança no

comportamento durante o mult FI-FI (na Fase 4 para P1, P2 e P3 e na Fase 5 para P4)

diz respeito à proporção dessa mudança em relação à linha de base. A Figura 4 mostra

que houve uma maior tendência ao aumento na taxa de respostas no componente FI com

botão vermelho (previamente correlacionado ao DRL), em relação à diminuição na taxa

de respostas no componente FI com botão verde (previamente correlacionado ao FR).

Ou seja, o comportamento no componente FI com botão verde parece ter sido mais

resistente à mudança. No caso de P4, durante a Fase 5, o componente que apresentou

maior resistência à mudança foi o componente FI com botão preto. Como na presente

pesquisa os componentes eram apresentados sempre começando pelo FR (Fases 1, 2 e

3) e pelo componente FI com botão verde (Fase 4), a ordem de apresentação dos

componentes durante a Fase 5 (botão preto antes do botão branco) pode ter servido

como um controle de estímulos adicional para o comportamento de P4. Estes resultados

são contrários ao dos estudos da área de momento comportamental. Alguns estudos

sugerem que, uma vez controlada a taxa de reforço nos dois componentes de um

programa múltiplo que selecionam alta e baixa taxa de respostas (e.g., DRH e DRL), a

resistência à mudança é maior no componente cuja taxa de respostas era menor (e.g.,

Lattal, 1989; Nevin, 1974; 1979).

Todavia, deve-se destacar que as pesquisas da área de momento comportamental

utilizam durante a fase de teste, programas de extinção, alimentação prévia ou liberação

de comida independente da resposta em FT

ou VT

(cf. Lattal, 1989; Nevin, 1974;

Nevin, Mandell, & Atak, 1983). Este tipo de manipulação geralmente produz

diminuição na taxa de respostas em ambos os componentes do programa múltiplo.

Assim, pode-se avaliar, por exemplo, qual componente produz maior resistência à

mudança observando-se as taxas de respostas em ambos durante a extinção: aquele

componente em que as taxas de respostas diminuírem menos é o mais resistente à

mudança. No presente estudo, a mudança nas taxas de respostas nos dois componentes

do mult FI-FI (em relação à exposição prévia ao mult FR-DRL) deu-se em direções

opostas: aumento nas taxas de respostas no componente FI com botão vermelho (ou

branco, no caso de P4) – correlacionado ao DRL – e diminuição das taxas de respostas

no componente FI com botão verde (ou preto no caso de P4) – correlacionado ao FR.

Este é um fator que pode ter contribuído para os resultados discrepantes em relação às

pesquisas da área de momento comportamental. Pesquisas futuras poderiam utilizar o

mesmo procedimento do presente estudo na fase de construção da história e na fase de

teste utilizar um mult Extinção-Extinção.

FT, do inglês fixed time (tempo fixo). Em um programa de FT um reforçador é

liberado após um intervalo de tempo fixo. Assim, em um programa haveria 5 segundos

de intervalo entre a liberação de um reforçador e a liberação do próximo.

VT, do inglês variable time (tempo variável). Em um programa de VT um reforçador

é liberado após um intervalo de tempo que varia de reforçador para reforçador, de

acordo com uma série randômica de intervalos. Os valores dos intervalos variam entre

valores extremos arbitrários.

Os resultados do presente estudo sugerem que, quando condições experimentais

específicas são arranjadas, resultados semelhantes podem ser obtidos utilizando-se

diferentes espécies. Freeman e Lattal (1992) utilizaram pombos como sujeitos

experimentais e os resultados de seu estudo foram, de maneira geral, parecidos com os

resultados do presente estudo. Weiner (1983) apontou para a importância da realização

de pesquisas experimentais utilizando humanos como participantes. Ressalta ainda o

fato de ter conseguido, em suas pesquisas com humanos, dados de pesquisa tão

regulares quanto aqueles obtidos com não-humanos. A este respeito, Skinner

(1957/1972) diz que “A reprodutibilidade de espécie para espécie é um produto do

método. Escolhendo os estímulos, respostas e reforçadores apropriados para a espécie

estudada, eliminamos as fontes de diferenças de muitas espécies.” (p. 156)

REFERÊNCIAS BIBLIOGRÁFICAS

Aldinucci, B. A. S. (2007). Efeitos de diferentes extensões de uma história de FR sobre

o responder subseqüente em FI com humanos. Dissertação de Mestrado apresentada

ao Programa de Mestrado em Análise do Comportamento da Universidade Estadual

de Londrina.

Aló, R. M. (2005). História de reforçamento. In Abreu-Rodrigues J., Ribeiro, M.R

(org.). Análise do Comportamento: pesquisa, teoria e aplicação (p.45-62). Porto

Alegre: Artmed.

Azrin, N. (1958). Some effects of noise on human behavior. Journal of the

Experimental Analysis of Behavior, 1(2), 183-200.

Baron, A., & Leinenweber, A. (1995). Effects of a variable-ratio conditioning history on

sensitivity to fixed-interval contingencies in rats. Journal of the Experimental

Analysis of Behavior, 63(1), 97-110.

Baum, W. M. (1999). Compreender o behaviorismo: ciência, comportamento e cultura.

(M. T. A. Silva, M. A. Matos, G. Y. Tomanari, & E. Z. Tourinho, Trads.). Porto

Alegre: Artmed. (Originalmente publicado em 1994).

Branch, M. C. (1987). Behavior Analysis: a conceptual and empirical base for behavior

therapy. Behavior Therapist, 4, 79-84.

Cançado, C. R. X., Soares, P. G., Cirino, S. D., & Dias, A. L. F. (2006). Behavioral

history: Terms associated with the word history in publications of JEAB and JABA.

Pôster apresentado durante o 32º Encontro anual da Association for Behavior

Analysis. Atlanta, Geórgia, Estados Unidos.

Catania, A. C. (1999). Aprendizagem: Comportamento, Linguagem e Cognição.

(Traduzido por D. G. Souza, org.) Porto Alegre: Artmed. (Trabalho original

publicado em 1998).

Chiesa, M. (1994) Radical Behaviorism: the Philosophy and the Science. Boston:

Authors Cooperative, Inc., Publishers.

Chung, S. H. (1965). Effects of effort on response rate. Journal of the Experimental

Analysis of Behavior, 8(1), 1-7.

Cirino, S. D. (1999). Efeitos de História de reforçamento sobre o comportamento atual

de pombos. Tese de doutorado defendida no Departamento de Psicologia

Experimental da Universidade de São Paulo.

Cirino, S (2001a). O que é história comportamental. In H. J. Guilhardi; M. B. B. P.

Madi; P. P. Queiroz e M. C. Scoz (Orgs.), Sobre Comportamento e Cognição:

Expondo a variabilidade (Vol 7, pp.153-158). Santo André: ESETec.

Cirino, S. (2001b). Detecção da história de reforçamento: problemas metodológicos

para lidar com a história passada. In H. J. Guilhardi; M. B. B. P. Madi; P. P. Queiroz

e M. C. Scoz (Orgs.), Sobre Comportamento e Cognição: Expondo a variabilidade

(Vol 8, pp.137-147). Santo André: ESETec.

Cirino, S. D., Cançado, C. R. X., Soares, P. G. & Dias, A. L. F. (2006). Behavioral

history: Reflections on a classification model. Trabalho apresentado no 32º Encontro

da Association for Behavior Analysis, Atlanta, Geórgia, Estados Unidos.

Cole, M. R. (2001). The long-term effect of high- and low-responding histories on

fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior,

75(1), 43-54.

Costa, C. E. (2004). A natureza do reforçador como uma variável moduladora dos

efeitos da história de reforço sobre o comportamento de seres humanos. Tese de

doutorado defendida no Departamento de Psicologia Experimental da Universidade

de São Paulo.

Costa, C. E., & Banaco, R. A. (2002). ProgRef v3: sistema computadorizado para a

coleta de dados sobre programas de reforço com humanos – recursos básicos. Revista

Brasileira de Terapia Comportamental e Cognitiva, 4(2), 171-172.

Costa, C. E., & Banaco, R. A. (2003). ProgRef v3: sistema computadorizado para a

coleta de dados sobre programas de reforço com humanos – recursos adicionais.

Revista Brasileira de Terapia Comportamental e Cognitiva, 5(2), 219-229.

Costa, C. E., Banaco, R. A., & Becker, R. M. (2005). Desempenho em FI com

humanos: efeito do tipo de reforçador. Temas em psicologia, 13(1), 18-33.

Costa, C. E., Banaco, R. A., Longarezi, D. M., Martins, E. V., Maciel, E. M., & Sudo,

C. H. (no prelo). Tipo de reforçador como variável moduladora dos efeitos da

história em humanos. Psicologia: Teoria e Pesquisa.

Doughty, A. H., Cirino, S., Mayfield, K. H., Da Silva, S. P., Okouchi, H., & Lattal, K.

A. (2005). Effects of behavioral history on resistance to change. Psychological

Records, 55, 315-330.

Ferster, C. B., & Skinner, B. F. (1957). Schedules of reinforcement. New York:

Appleton.

Freeman, T. J., & Lattal, K. A. (1992). Stimulus control of behavioral history. Journal

of the Experimental Analysis of Behavior, 57(1), 5-15.

Hayes, S. C., Brownstein, A. J., Haas, J. R. & Greenway, D. E. (1986). Instructions,

multiple schedules, and extinction: Distinguishing rule-governed from schedule-

controlled behavior. Journal of the Experimental Analysis of Behavior, 46, 137-147.

Lattal, K. A. (1989). Contingencies on response rate and resistance to change. Learning

and Motivation, 29, 191-203.

LeFrancois, J. R., & Metzger, B. (1993). Low-response-rates conditioning history and

fixed-interval responding in rats. Journal of the Experimental Analysis of Behavior,

59(3), 543-549.

Matthews, B. A., Shimoff, E., Catania, A. C., & Sagvolden, T. (1977). Uninstructed

human responding: sensitivity to ratio and interval contingencies. Journal of the

Experimental Analysis of Behavior, 27(3), 453-467.

Metzger, B. (1992). Stimulus control of behavioral history and subsequent fixed-

interval performance. Doctoral dissertation presented in the Departament of

Experimental Psychology of West Virginia University.

Nevin, J. A. (1974). Response strength in multiple schedules. Journal of the

Experimental Analysis of Behavior, 21(3), 389- 408.

Nevin, J. A. (1979). Reinforcement schedules and response strength. Reinforcement and

the organization of behavior. New York: John Wiley & Sons.

Nevin, J. A. (1988). Behavioral momentum and the partial reinforcement effect.

Psychological Bulletin, 103, 44-56.

Nevin, J. A., Mandell, C., & Atak, J. R. (1983). The analysis of behavioral momentum.

Journal of the Experimental Analysis of Behavior, 39(1), 49-59.

Okouchi, H. (2002). Individual differences in human fixed-interval performance.

Psychological Record, 52, 173-186.

Okouchi, H. (2003a). Effects of differences in interreinforcer intervals between past and

current schedules on fixed-interval responding. Journal of the Experimental Analysis of

Behavior, 79(1), 49-64.

Okouchi, H. (2003b). Stimulus generalization of behavioral history. Journal of the

Experimental Analysis of Behavior, 80(2), 173-186.

Ono, K., & Iwabuchi, K. (1997). Effects of histories of differential reinforcement of

response rate on variable-interval responding. Journal of the Experimental Analysis

of Behavior, 67(3), 311-322.

Patsko, C., Becker, R. M., & Costa, C. E., (no prelo). Desempenho em FI com

humanos: efeito da interação da resposta de consumação e do tipo de instrução.

Interação em Psicologia.

Perone, M., Galizio, M., & Baron, A. (1988). The relevance of animal-based principles

in the laboratory study of human operant conditioning. In G. Davey & C. Cullen

(eds). Human operant conditioning and behavior modification (pp. 59-84).

Chichester, England: John Wiley & Sons Ltd.

Salgado, R. C. (2007) Efeitos da história recente e remota sobre o responder

subseqüente em FI com humanos: o papel do tipo de reforçador empregado.

Dissertação apresentada ao Programa de Mestrado em Análise do Comportamento da

Universidade Estadual de Londrina.

Shoenfeld, W. N., Cumming, W. W., & Hearst, E. (1968). On the classification of

reinforcement schedules. In A. C. Catania. Contemporary research in operant

behavior (pp. 113-117). New York, Scott, Foresman and Company. (Originalmente

publicado em 1956).

Sidman, M. (1960). Tactics of Scientific Research. New York: Basic Books.

Skinner, B. F. (1950). Are theories of learning necessary? Psychological Review, 57(4),

193-216.

Skinner, B. F. (1972). The experimental analysis of behavior. In Cumulative record (p.

125-157). New York, Appleton Century Crofts. (Originalmente publicado em 1957).

Skinner, B. F. (1974). About behaviorism. New York: Vintage Books.

Skinner, B. F. (1981). Selection by Consequences. Science, 213, 501-504.

Skinner, B. F. (1989). The origins of cognitive thought. In Recent issues in the Analysis

of Behavior (pp. 13-25). Ohio: Merril Publishing.

Tatham, T. A., & Wanchisen, B. (1998). Behavioral history: a definition and some

common findings from two areas of research. Behavior Analyst, 21, 241-251.

Urbain, C., Poling, A., Millan, J., & Thompson, T. (1978). d-Amphetamine and

fixed-interval performance: effects of operant history. Journal of the

Experimental Analysis of Behavior, 29(3), 385-392.

Wanchisen, B. A. (1990). Forgetting the lessons of history. Behavior Analyst, 13, 31-37.

Wanchisen, B. A., Tatham, T. A., & Mooney, S. E. (1989). Variable-ratio conditioning

history produces high- and low-rate performances in rats. Journal of the

Experimental Analysis of Behavior, 52(2), 167-179.

Wanchisen, B.A., & Tatham, T. A. (1991). Behavioral history: a promising challenge in

explaining and controlling human operant behavior. The Behavior Analyst, 14, (2),

139-144.

Weiner, H. (1964). Conditioning story and human fixed-interval performance. Journal

of The Experimental Analysis of Behavior, 7(5), 383-385.

Weiner, H. (1965). Conditioning history and maladaptative human operant behavior.

Psychological Records, 17, 659-662.

Weiner, H. (1969). Controling human fixed-interval performance. Journal of The

Experimental Analysis of Behavior, 12(3), 349-373.

Weiner, H. (1983). Some thoughts on discrepant human-animal performance under

schedules of reinforcement. Psychological Record, 33, 521-532.

APÊNDICES

Apêndice A. Informações sobre o estudo a serem apresentadas aos participantes.

INFORMAÇÕES SOBRE O ESTUDO

Caros convidados:

Estamos desenvolvendo uma pesquisa com o intuito de sabermos um pouco mais

sobre as variáveis ambientais que contribuem para a variabilidade comportamental entre

os indivíduos. Sendo assim, gostaríamos de convidá-los a participar do experimento. Os

itens abaixo trazem esclarecimentos sobre o trabalho que será realizado.

Objetivo: Estudar algumas variáveis que possam afetar o modo como as pessoas se

comportam em determinadas situações.

Procedimento: Serão realizadas no mínimo 20 sessões experimentais em uma sala do

CCB (Centro de Ciências Biológicas) na UEL (Universidade Estadual de Londrina). As

sessões serão diárias (exceto finais de semana e feriados), realizadas individualmente e

terão a duração aproximada de 30 minutos cada. Será utilizado um fone de ouvido para

emissão de ruído branco (“chiado”), em volume adequado, durante toda a sessão. Antes

do início da sessão os participantes receberão uma folha com a instrução acerca da

tarefa experimental a ser executada: os participantes realizarão uma tarefa no

computador. Em linhas gerais, o objetivo será ganhar o maior número de pontos

possíveis (que aparecerão na tela do monitor).

Justificativa e Possíveis Benefícios: Estudos nessa linha de pesquisa podem ajudar a

compreender melhor as variáveis ambientais que levam a variabilidade comportamental

entre os indivíduos. O presente estudo pretende lançar mais luz sobre esta área do

conhecimento.

Riscos: O procedimento experimental empregado não oferece qualquer risco à

integridade física ou moral dos participantes. Não é recomendável, porém que

participantes com suspeita ou diagnóstico de Lesão por Esforço Repetitivo (LER)

participem do estudo, pois podem agravar sua lesão. O ruído branco também será

mantido em um volume confortável, regulado pelo próprio participante. Gostaríamos de

deixar claro que os participantes poderão abandonar a pesquisa a qualquer momento

sem que haja qualquer tipo de pena.

Sigilo: A identidade dos participantes será preservada, embora os resultados da pesquisa

possam ser divulgados em publicações e eventos científicos.

Maiores esclarecimentos sobre a pesquisa serão fornecidos ao final da coleta de

dados. Estamos à disposição para maiores esclarecimentos sobre o estudo que não

venham a influenciar o desempenho dos participantes na pesquisa.

Antecipadamente agradecemos,

____________________________________

Coordenador do Projeto

Apêndice B. Termo de Consentimento Livre e Esclarecido a ser apresentado aos

participantes

TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO

Eu,____________________________________________________

__RG:_____________________, após ter lido e entendido todas as

informações contidas nas “Informações sobre o estudo” na página

anterior e esclarecido todas as minhas dúvidas com o responsável pela

coleta de dados, concordo voluntariamente em participar da presente

pesquisa. Atesto também o recebimento das “Informações sobre o

estudo”, necessário para a minha compreensão da pesquisa.

______________________________________ Data: __/__/__.

Assinatura do entrevistado

Eu, ________________________________ RG:__________________, declaro que

forneci todas as informações referentes ao estudo ao entrevistado.

_______________________________________ Data: __/__/__.

Assinatura do responsável pela entrevista

Apêndice C. Instruções a serem fornecidas aos participantes.

INSTRUÇÃO

Obrigado por sua participação!

O experimentador não está autorizado a dar qualquer

informação adicional. Caso houver dúvidas, releia o texto a seguir

e prossiga o experimento.

Sua tarefa será manusear o mouse de algum modo específico

com o objetivo de conseguir pontos. Os pontos aparecerão em

uma janela (contador) que se localizará na parte superior da tela

do computador na posição central.

Boa Sorte!

Livros Grátis
( http://www.livrosgratis.com.br )
 
Milhares de Livros para Download:
 
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas

Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo