Download PDF
ads:
SUELEN MAPA
MODELAGEM DE ORGANISMOS ARTIFICIAIS
COGNITIVO-EMOCIONAIS DOTADOS DE
MEMÓRIA EXPERIENCIAL DE LONGO PRAZO
Belo Horizonte MG
Março de 2009
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
SUELEN MAPA
MODELAGEM DE ORGANISMOS ARTIFICIAIS
COGNITIVO-EMOCIONAIS DOTADOS DE
MEMÓRIA EXPERIENCIAL DE LONGO PRAZO
Dissertação apresentada ao Curso de
Mestrado em Modelagem Matemática
e Computacional do Centro Federal de
Educação Tecnológica de Minas Gerais,
como requisito parcial à obtenção do título
de Mestre em Modelagem Matemática e
Computacional.
Linha de pesquisa:
Sistemas Inteligentes
Orientador:
Prof. Dr. Henrique Elias Borges
Centro Federal de Educação Tecnológica de Minas Gerais
MESTRADO EM MODELAGEM MATEMÁTICA E COMPUTACIONAL
CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS
DIRETORIA DE PESQUISA E PÓS-GRADUAÇÃO
Belo Horizonte MG
Março de 2009
ads:
Dedico este trabalho ao meu pai, que Deus levou antes que eu o finalizasse,
na esperança de retribuir todo carinho e orgulho que ele sempre
teve por mim. Saudades eternas, Pai querido.
À minha mãe que sempre foi e será
meu exemplo de vida.
Ao Rafael, meu noivo,
pela motivação,
apoio e carinho.
Agradecimentos
A Deus pelo dom da vida e por mais essa etapa concluída.
Ao meu orientador, Prof. Dr. Henrique Elias Borges, que com seu profissionalismo me
ensinou o que é fazer pesquisa com disciplina e rigor acadêmico. Agradeço também
pela confiança, orientação e sugestões que foram essenciais para o desenvolvimento
deste trabalho de pesquisa.
À minha família pelo apoio, carinho e orações.
Aos meus amigos do LSI e do programa de mestrado pela amizade e as palavras
de conforto nos momentos dificíeis. Em especial gostaria de agradecer aos amigos
Alexandre Vieira e Luciana Campos, que não mediram esforços para me ajudar nos
momentos que eu mais precisei.
À FAPEMIG pelo apoio financeiro individual recebido.
Ao CNPq pelo apoio financeiro ao projeto ARTÍFICE.
Ao Laboratór io de Sistemas Inteligentes (LSI) pelos recursos disponibilizados para re-
alização deste trabalho.
Ao Centro Federal de Educação Tecnológica de Minas Gerais (CEFET-MG).
"Nada somos além daquilo que recordamos... e também aquilo que resolvemos
esquecer."
Iván Izquierdo, 2002.
Resumo
Um dos grandes desafios na inteligência artificial é o desenvolvimento de agentes
cognitivos que sejam capazes de executar suas tarefas com o mais elevado grau de
autonomia. Para tanto, eles devem ser capazes de aprender com suas próprias expe-
riências vivenciadas e valoradas emocionalmente. É a partir de tais experiências que
um organismo biológico constrói sua memória episódica, um dos mais importantes
mecanismos para favorecer sua adaptabilidade ao ambiente. Assim, inspirado na psi-
cobiologia e neurobiologia do processo de formação de memórias autobiográficas, foi
modelado e implementado no presente trabalho um mecanismo de formação de me-
mórias episódicas que possibilita a uma criatura artificial consolidar, relembrar e recon-
solidar suas exper iências de vida, aqui denominadas ECQ - experiências completas
com qualia. Cada ECQ é compreendida como uma seqüência ordenada de ações da
criatura em seu ambiente, denominadas MEE - micro experiências emocionais. O mo-
delo proposto contempla ainda a formação de memórias cintilantes. Este tipo de me-
mória surge sempre que a criatura se encontra sob forte arousal emocional e realiza
uma tarefa complexa envolvendo dois ou mais objetos em seu campo sensorial. Uma
aplicação de vida artificial em 2D foi desenvolvida para servir de plataforma de avali-
ação do modelo proposto. Nesta aplicação, uma criatura artificial habita um mundo
artificial no qual foram dispostos aleatoriamente um conjunto de objetos (maçãs verde
e vermelha, pedras, bolas) e outras criaturas inanimadas (abelhas). A criatura deve
então aprender por si só, e a partir de suas próprias experiências de vida, a encontrar
e comer as maçãs - mas não pedras - quando tem fome, a dormir quando tem sono,
a encontrar e br incar com uma bola quando está entediado, a evitar as abelhas que
podem lhe picar, causando dor. Este repertório de comportamentos para lidar com
cada situação específica que a criatura irá construir ao longo de sua ontogenia deve
ser tal que a mantenha sob regulação homeostática e emocional, i.e., que mantenha
regulados os níveis de arousal de seus afetos biológicos simples (fome, sono, tédio
e dor) e complexos (apatia e estresse). Para forjar suas memórias a criatura dispõe
de mecanismos de aprendizagem associativa via condicionamento clássico e condi-
cionamento operante. Foi realizado um conjunto de experimentos computacionais
comprovando que a criatura artificial foi capaz de: consolidar e evocar suas memó-
rias autobiográficas regulares, além das memórias cintilantes; utilizar suas memórias
como guia no processo de seleção da ação mais adequada a ser realizada numa certa
situação. Tal seleção se por meio da avaliação das expectativas quanto a eventu-
ais recompensas ou punições decorrentes de cada ação possível (affordances). Além
disso, foram realizados experimentos computacionais visan-do avaliar a influência do
mecanismo de memória proposto na capacidade de sobrevivência da criatura num
ambiente gerado aleatoriamente. Os resultados demonstram que a criatura dotada
de memória episódica não apenas se adapta mais rapidamente ao seu ambiente, em
relação à criatura sem memória, como também consegue sobreviver por mais tempo
no ambiente. Em alguns casos o tempo de sobrevivência da criatura com memória é
mais que o dobro daquele de uma criatura sem memória, o que corrobora a noção de
que a formação de memórias autobiográficas favorece a adaptabilidade da criatura.
Por fim, mas não menos importante, cabe destacar que o modelo proposto foi conce-
bido de maneira coerente com o fenômeno biológico e, sobretudo, com o referencial
teórico-conceitual que compreende a cognição como um fenômeno incorporado e in-
dissociável da emoção, e embebido em um ambiente.
PALAVRAS-CHAVE: Memória Autobiográfica; Memória Cintilante; Memória Episódica;
Episódio Emocional; Agente Cognitivo-Emocional; Criaturas Artificiais.
Abstract
One of the challenges in the artificial intelligence is the development of cognitive agents
that are capable to perform their actions with the highest autonomy degree. To achieve
this goal they should be able to learn from their own lived, and emotionally appraised,
experiences. It is from these experiences that a biological organism constructs its
episodic memory, one of the most important mechanisms favouring its adaptability.
Thus, inspired by psychobiology and neurobiology of the autobiographical memory for-
mation process, it was modelled and implemented in the present work a mechanism for
the formation of episodic memory which enables an artificial creature to consolidate, to
remember and to reconsolidate its life exper iences, here denoted as CEQ - complete
experiences with qualia. Each CEQ is understood as an ordered sequence of actions
carried out by the creature in its environment, named EME - emotional micro experi-
ences. Furthermore, the proposed model accounts for flashbulb memories. This kind
of memory is formed whenever the creature is subject to a strong enough emotional
arousal and performing a complex task involving two or more objects in its sensorial
field. A 2D artificial life application was developed to provide a test bed for the proposed
model. In such application one artificial creature inhabits an artificial world in which a
set of objects (green and red apples, stones, balls) and other artificial innate creatures
(bees) were randomly distributed. Hence, the creature should learn, from its own liv-
ing experiences, how to find and eat some apples - but not the stones - whenever it
is hungry, to get some sleep when it is sleepy, to find and play with a ball, when in a
boring state, to avoid the bees, since they can sting it causing great pain. The reper-
tory of possible behaviours the creature will eventually construct in its ontogeny to deal
with any given situation, must be such that keep it under homeostatic and emotional
regulation,i.e., keep the arousal level of its biological simple affects (hunger, sleep, te-
dious and pain) as well as its complex affects (apathy and stress) in a certain range.
To forge its memories the creature has mechanisms for associative learning via clas-
sical and operant conditioning. A set of computational experiments was accomplished
showing that the creature was able to: consolidate and to evoke its regular autobio-
graphical memories as well as its flashbulb memories; make use of its memories as
guides for the selection of the most adequate action to be performed in a situation. This
selection is based on an evaluation of the expectations regarding eventual rewards or
punishments resulting from each possible action (affordances). Moreover, another set
of computational experiments was carried out aiming to examine the effects due to
the memory formation mechanism on the survival capability of the artificial creature
in a randomly generated world. The results have shown that creatures with the pro-
posed memory mechanism not only adapt themselves to its environment faster than
those creatures without memory, but also survive them. In some cases, the survival
time of the creatures with memory was more than twice that for the creatures with-
out memories. Finally, it is worth mentioning that the proposed model was conceived
in full agreement with the biological phenomenon and, more important, in coherence
with the conceptual and theoretical framework that assumes cognition as embodied,
inextricably attached to emotion and embedded in an environment.
KEYWORDS: Autobiographical Memory; Flashbulb Memory; Episodic Memory; Emo-
tional Episode; Cognitive-Emotional Agent; Artificial Creatures.
Lista de Figuras
1 Modelo conceitual inicial da arquitetura ARTÍFICE. . . . . . . . . . . . p. 23
2 Diagrama em blocos do modelo conceitual proposto por Campos (2006). p. 25
3 Curva da aquisição e extinção do condicionamento clássico. . . . . . p. 26
4 Ajuste das probabilidade das ações no condicionamento instrumental. p. 28
5 Ser-em-seu-ambiente e os domínios fenomênicos dinamicamente acopla-
dos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 38
6 Esquema de classificação da Memória. . . . . . . . . . . . . . . . . . p. 48
7 Memórias Cintilantes × Memórias Regulares . . . . . . . . . . . . . . p. 52
8 O tempo de aprendizagem em função da intensidade do choque elétrico
para tarefas com diferentes níveis de complexidade. . . . . . . . . . . p. 55
9 A hipótese equivocada de Hebb para a relação entre eficiência com-
portamental e arousal emocional. . . . . . . . . . . . . . . . . . . . . p. 56
10 A interpretação de Diamond et al. (2006) para a Lei de Yerkes-Dodson. p. 56
11 A divisão do córtex cerebral. . . . . . . . . . . . . . . . . . . . . . . . p. 58
12 O córtex cerebral e o lobo temporal médio. . . . . . . . . . . . . . . . p. 60
13 A estimulação tetânica na região hipocampal . . . . . . . . . . . . . . p. 64
14 A transmissão sináptica normal (de baixa freqüência) x a transmissão
sináptica de alta freqüência (que induz a LTP) . . . . . . . . . . . . . . p. 65
15 Dinâmica temporal de como o arousal emocional afeta a formação da
memória no hipocampo, amígdala e córtex pré-frontal . . . . . . . . . p. 69
16 Cenário e Episódio da arquitetura ARS. . . . . . . . . . . . . . . . . . p. 74
17 Saliência emocional de um evento em função do tempo. . . . . . . . . p. 75
18 Sistema de memória da arquitetura SOAR. . . . . . . . . . . . . . . . p. 79
19 A árvore de elementos da memória de trabalho e da memória episódica. p. 80
20 A arquitetura ISAC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 83
21 Formação da memória episódica. . . . . . . . . . . . . . . . . . . . . . p. 84
22 Decaimento exponencial da saliência emocional, como função do número
de interações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 86
23 A correlação entre memória, aprendizagem e emoção modelada. . . . p. 94
24 Diagrama em blocos da arquitetura ARTÍFICE. . . . . . . . . . . . . . p. 94
25 Composição de uma experiência com qualia a partir de micro-experiências
emocionais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 96
26 Correlação entre micro-experiências emocionais e exper iências com-
pletas com qualia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 98
27 Eficiência comportamental x nível de arousal emocional para uma
emoção específica. Modelo elaborado sob inspiração de Diamond
et al. (2006) p.3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 100
28 Grau de complexidade de uma tarefa em função do número de estí-
mulos distintos recebidos pelo ASCS num certo instante. . . . . . . . p. 102
29 Intensidade Emocional da Memória Regular (IMR) durante o processo
de aquisição da memória, sob condições distintas de arousal e de
estímulos recebidos em função do número de interações do ASCS no
ambiente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 106
30 Intensidade Emocional da Memória Regular (IMR) durante o processo
de extinção da memória, sob condições distintas de arousal e de es-
tímulos recebidos em função do número de interações do ASCS no
ambiente. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 107
31 Seqüência de MEE que compõe uma ECQ e seus respectivos níveis
de arousal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 110
32 Consolidação da ECQ da Figura 31 em uma memória regular que
apresenta falhas e três memórias cintilantes. . . . . . . . . . . . . . . p. 111
33 A circularidade da relação entre o processo cognitivo-emocional e a
formação de memórias experienciais. . . . . . . . . . . . . . . . . . . p. 112
34 O modelo conceitual do sistema de memória da arquitetura ARTÍFICE. p. 117
35 Regulação entre MEE, ECQ e memória de longo prazo e respectivos
atributos utilizados durante sua valoração emocional. . . . . . . . . . p. 119
36 Esquema simplificado da troca de estímulos interoceptivos e ambien-
tais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 122
37 Memórias regulares consolidadas na LTM conforme a Tabela 3 e seus
respectivos parâmetros. . . . . . . . . . . . . . . . . . . . . . . . . . . p. 124
38 Formação de memórias cintilantes a partir das micro-experïências
vivenciadas sob forte impacto emocional. . . . . . . . . . . . . . . . . p. 126
39 A interface da aplicação de vida artificial ALifeWorld 0.9.5 e seus ele-
mentos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 133
40 O ASCS se aproximando de uma abelha. Até este momento seu
arousal de dor (barra lateral esquerda) é nulo. Compare este resul-
tado com o da Figura 41 após o ASCS tocar na abelha. . . . . . . . . p. 135
41 O arousal das emoções dor e estresse aumentam, enquanto o arousal
da emoção apatia diminui, após o ASCS ter tocado a abelha e, assim,
ter sido “picado” por ela. Compare este resultado com a o anterior,
Figura 40 antes do ASCS tocar a abelha. . . . . . . . . . . . . . . . . p. 136
42 Conteúdo de LongTermMemory do ASCS após pouquíssimas inte-
rações, ilustrando uma memória regular constituída de duas MME. . . p. 137
43 Dinâmica da intensidade emocional das memórias formadas em condições
naturais. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 141
44 Tempo médio para o ASCS (com e sem memória experiencial) inter-
agir com os objetos - Condicionamento Operante Inicial: Baixo. . . . . p. 145
45 Tempo médio para o ASCS (com e sem memória experiencial) inter-
agir com os objetos - Condicionamento Operante Inicial: Médio. . . . p. 145
46 Tempo médio para o ASCS (com e sem memória experiencial) inter-
agir com os objetos - Condicionamento Operante Inicial: Alto. . . . . . p. 146
47 Intervalo de tempo médio (em 20 sessões) para o ASCS (com e sem
memória experiencial) encontrar um objeto no mundo e interagir com
ele para cada nível inicial de condicionamento operante. . . . . . . . . p. 148
48 Intervalo de tempo médio gasto para encontrar e comer maçãs para
os três níveis iniciais de condicionamento. . . . . . . . . . . . . . . . . p. 149
49 Intervalo de tempo para o ASCS com memória encontrar um objeto
no mundo e interagir com ele - Condicionamento Operante Inicial Médio.p. 150
50 Tempo médio de sobrevivência do ASCS (com e sem memória expe-
riencial) no mundo, para cada nível de condicionamento operante. . . p. 153
Lista de Tabelas
1 Composição das emoções complexas modeladas e sua composição. p. 95
2 Parâmetros constantes de ajuste do modelo. Cujos valores foram
definidos a partir de simulações computacionais. . . . . . . . . . . . . p. 104
3 Evolução do arousal emocional das emoções estresse e apatia a
cada MEE vivenciada, as células destacadas dão origem às quatro
ECQ que serão registradas na memória de longo prazo. . . . . . . . . p. 124
4 Evolução do arousal emocional do estresse e da apatia a cada micro-
experiência vivenciada. . . . . . . . . . . . . . . . . . . . . . . . . . . p. 127
5 As affordances, possibilidade de ação com cada objeto, consideradas
na aplicação ALifeWorld 0.9.5. . . . . . . . . . . . . . . . . . . . . . . p. 137
6 Nível do condicionamento operante para os experimentos. . . . . . . p. 144
7 Tempo (ms) de sobrevivência do ASCS (com memória) sujeito inicial-
mente ao Condicionamento Operante Baixo. . . . . . . . . . . . . . . p. 154
Lista de Abreviaturas e Siglas
ASCS Agente de Software Cognitivo e Situado
GPSI Grupo de Pesquisa em Sistemas Inteligentes
LSI Laboratório de Sistemas Inteligentes
NS
Neutral Stimulus
UR Unconditioned Response
US Unconditioned Stimulus
CS Conditioned Stimulus
NMDA N-Methyl-D-Aspartate
LTP Long Term Potentiation
LTD Long Term Depression
ARS Artificial Recognition System
SOAR States, Operators, Reasoning
ISAC Intelligent Soft Arm Control
MEE Micro Experiência Emocional
ECQ Experiência Completa com Qualia
IE Intensidade Emocional
BE Behavioural Efficiency
LTM Long Term Memory
STM Short Term Memory
WM Working Memory
Sumário
1 Introdução p. 19
1.1 Histórico do Projeto ARTÍFICE . . . . . . . . . . . . . . . . . . . . . . p. 21
1.2 Relevância do trabalho para a área de Sistemas Inteligentes . . . . . p. 29
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 30
1.4 Escopo do trabalho de pesquisa . . . . . . . . . . . . . . . . . . . . . p. 31
1.5 Estrutura da dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . p. 32
2 Sobre o processo de formação das memórias p. 34
2.1 Memória sob a perspectiva da cognição situada . . . . . . . . . . . . p. 36
2.2 O Processo de formação da memória: a visão da neurociência . . . . p. 39
2.2.1 As fases do processo de formação das memórias . . . . . . . p. 39
2.2.2 Classificação das Memórias . . . . . . . . . . . . . . . . . . . p. 45
2.2.3 Memórias Autobiográficas × Memórias Cintilantes × Memó-
rias Traumáticas . . . . . . . . . . . . . . . . . . . . . . . . . . p. 49
2.2.4 A lei de Yerkes-Dodson . . . . . . . . . . . . . . . . . . . . . . p. 53
2.2.5 Principais áreas cerebrais envolvidas na formação das memó-
rias e suas correlações com a complexidade da tarefa . . . . . p. 57
2.3 O processo de formação da memória: a visão da biologia molecular . p. 61
2.3.1 O fenômeno da plasticidade sináptica . . . . . . . . . . . . . . p. 62
2.3.2 Dinâmica Temporal da Formação das Memórias . . . . . . . . p. 67
2.4 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 70
3 Algumas arquiteturas computacionais que envolvem o processo de
formação de memórias experienciais p. 73
3.1 A memória experiencial da arquitetura ARS . . . . . . . . . . . . . . . p. 73
3.1.1 Algumas considerações sobre o modelo proposto . . . . . . . p. 76
3.2 A memória experiencial da arquitetura SOAR . . . . . . . . . . . . . . p. 78
3.2.1 Algumas considerações sobre o modelo proposto . . . . . . . p. 82
3.3 A memória experiencial da arquitetura ISAC . . . . . . . . . . . . . . . p. 83
3.3.1 Algumas considerações sobre o modelo proposto . . . . . . . p. 87
3.4 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 88
4 Modelagem conceitual do processo de formação de memórias experi-
enciais p. 91
4.1 Abstrações utilizadas na modelagem . . . . . . . . . . . . . . . . . . . p. 91
4.1.1 As unidades elementares da memória e sua relação com o
equilíbrio corpóreo do ASCS . . . . . . . . . . . . . . . . . . . p. 92
4.1.2 Algumas adaptações na arquitetura . . . . . . . . . . . . . . . p. 93
4.1.3 O processo de auto-regulação das emoções básicas e com-
plexas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 96
4.1.4 A modulação do comportamento do ASCS e a lei de Yerkes-
Dodson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 98
4.1.5 Intensidade das memórias e sua relação com a valoração emo-
cional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 101
4.1.6 Sobre a formação das memórias cintilantes . . . . . . . . . . . p. 109
4.1.7 Unidades funcionais da memória e sua relação com processo
cognitivo-emocional . . . . . . . . . . . . . . . . . . . . . . . . p. 111
4.2 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 114
5 Aspectos de implementação do modelo proposto p. 116
5.1 Sobre a modelagem do sistema de memória . . . . . . . . . . . . . . p. 117
5.2 O mecanismo de valoração das micro-experiências e experiências . . p. 118
5.3 A dinâmica de funcionamento do processo de formação de memórias p. 120
5.3.1 A dinâmica da fase de consolidação da memória . . . . . . . . p. 123
5.3.2 A dinâmica da fase de evocação da memória . . . . . . . . . . p. 128
5.3.3 A dinâmica da fase de reconsolidação da memória . . . . . . . p. 130
5.4 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 131
6 Experimentos Computacionais, Análise e Discussão dos Resultados p. 132
6.1 Aplicação de vida artificial ALIFEWORLD - 0.9.5 . . . . . . . . . . . . p. 132
6.2 Comportamentos emergentes . . . . . . . . . . . . . . . . . . . . . . . p. 134
6.3 Experimentos envolvendo a formação das memórias . . . . . . . . . . p. 139
6.3.1 Análise e discussão dos resultados . . . . . . . . . . . . . . . p. 141
6.4 Experimentos envolvendo o nível de condicionamento, seleção de
ações e memória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 143
6.5 Experimentos envolvendo condicionamento, memória e sobrevivência p. 151
6.6 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 155
7 Conclusão p. 157
7.1 Principais contribuições deste trabalho . . . . . . . . . . . . . . . . . . p. 158
7.2 Perspectivas de trabalhos futuros . . . . . . . . . . . . . . . . . . . . . p. 159
7.3 Considerações finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . p. 160
Referências p. 161
Anexo A -- Modelo de projeto da arquitetura ARTÍFICE p. 166
Anexo B -- Pool de estímulos internos - InteroceptiveStimuliPool p. 167
Anexo C -- Conteúdo da memória de longo prazo - Arquivo de “log1” (For-
mação de memórias regulares) p. 168
Anexo D -- Conteúdo da memória de longo prazo - Arquivo de “log2” (For-
mação de memórias regulares e cintilantes) p. 169
19
1 Introdução
Talvez foco principal da pesquisa na área de sistemas inteligentes seja entender o
que é compor tamento inteligente e, mais especificamente, como ocorre o processo de
aprendizagem. É durante a aprendizagem que surge a memória, e ela torna-se im-
prescindível para esse processo, a ponto de não existir memória sem aprendizagem,
nem tampouco aprendizado sem algum tipo de memória. Sem memória seria impos-
sível estabelecer qualquer tipo de relação com o mundo e com os objetos que nele
existam. Assim, antes de discutir a relação existente entre esses dois processos e a
importância deles para a vida de todo os indivíduos (neste caso específico, indivíduos
artificiais), torna-se crucial deixar claras as idéias e perspectivas que norteiam este
trabalho de pesquisa.
As ciências cognitivas constituem um campo de trabalho interdisciplinarque abrange
várias disciplinas, dentre elas: a psicologia, filosofia, biologia, neurociência, lingüistica
e outras, cada uma das quais contribui, dentro do seu âmbito, para compreender o
conhecimento humano (DUPUY, 1996). Essas disciplinas abordam o tema de maneira
distinta, conforme seu estatuto ontológico, e podem ser divididas em dois grandes gru-
pos: o da objetividade, no qual é feita a separação sujeito/mundo, onde o saber e o
conhecer humanos são vistos como representações internas de um mundo externo
realizadas pelo sujeito; e o da não-objetividade, no qual se concebe que o sujeito é
parte inseparável do mundo em que vive, e o saber e o conhecer humanos são vistos
como adaptações sofridas pelo sujeito decorrentes de suas interações com o mundo.
Devido a essas diferenças de perspectiva filosófica, cada disciplina compreende o
fenômeno da cognição de forma bastante diferenciada.
Neste contexto, e em conformidade com os princípios de cada grupo, é possível iden-
tificar algumas abordagens cognitivas. No grupo dos objetivistas encontram-se, entre
outras, as abordagens cognitivistas e conexionistas. Na primeira o conhecimento é
representado por um conjunto de símbolos e regras que têm uma correspondência
direta e explícita com os objetos do mundo real. Segundo Clancey, Smoliar, Stefik
1 Introdução 20
apud Clancey (1997)
1
o comportamento inteligente é obtido através de processos que
manipulam estes símbolos e regras. Ao modelar sistemas inteligentes, a abordagem
cognitivista parte de uma vasta combinação de símbolos e regras manipuláveis que
constituem o sistema especialista ou sistema baseados em regras. Quanto mais sím-
bolos e regras o agente de software possuir em sua base de conhecimento, mais
inteligente ele será.
na abordagem conexionista o conhecimento é registrado em estruturas distribuídas
denominadas redes neurais artificiais. O aprendizado, nesse caso, é compreendido
como um processo de ajuste manual ou automatizado nos pesos das conexões sináp-
ticas entre os neurônios que compõem a rede neural. Daí, frequentemente se diz que
o conhecimento é representado de forma sub-simbólica
2
. Ambas abordagens, cogni-
tivista e conexionista, têm alcançado bons resultados, notadamente em aplicações de
engenharia, e seus conceitos são amplamente difundidos na literatura de inteligência
artificial. A semelhança entre estas duas abordagens reside no fato de que ambas são
objetivistas e, sendo assim, são representacionistas, i.e., elas requerem que os obje-
tos e entidades do mundo exterior, bem como suas relações, sejam representados na
“mente” ou no “cérebro” do organismo artificial de modo concentrado ou distribuído.
Quanto às abordagens não-objetivistas tem-se, entre outras, a Biologia do Conhecer
(MATURANA; VARELA, 2001), a Cognição Situada (CLANCEY, 1997) e a Enação (VARELA;
EVAN; ROSCH, 2003). Todas elas partem do princípio de que é o próprio ser vivente que
constrói o seu mundo no processo de seu viver. Assim, o mundo não é pré-dado e,
portanto, não representações internas de uma realidade externa. Nelas, para que o
ser vivo seja considerado inteligente ele não precisa apresentar raciocínio abstrato, ele
precisa apenas apresentar uma conduta adequada em um certo domínio consensual.
Além disso, a cognição é compreendida como mudanças estruturais que mantêm o ser
vivo em congruência com seu meio, o quê ocorre a todo instante (MATURANA, 1997).
Quanto ao desenvolvimento de sistemas inteligentes que estejam baseados nas abor-
dagens não-objetivistas, até o início da década de 90 não havia uma fundamentação
teórica consistente e bem difundida na literatura que possibilitasse a criação desses
agentes. Foi a partir dessa lacuna que o GPSI - Grupo de Pesquisas em Sistemas
Inteligentes do CEFET/MG iniciou o desenvolvimento da arquitetura ARTÍFICE - uma
1
CLANCEY, W.J.; SMOLIAR, S.W.; STEFIK, M.J. Contemplating minds: A form for artificial intelli-
gence. Cambridge, MA:MIT Press, 1994.
2
A questão de uma rede neural artificial ser ou não representacionista é bastante controversa.
Ocorre que certas classes de redes neurais que são auto-organizáveis e, portanto, não requerem a
figura de um “supervisor” para seu aprendizado. No entanto, está fora do escopo desse trabalho discutir
aprofundadamente essa questão que, de resto, é amplamente discutido na literatura. (CLANCEY, 1997)
1.1 Histórico do Projeto ARTÍFICE 21
arquitetura flexível para criação de linhagens de agentes de softwares cognitivos e
situados - com o objetivo de criar uma metodologia de pesquisa diferenciada para a
criação de agentes de software baseada numa visão não-objetivista do mundo. E é
sob essa perspectiva, a não-objetivista, que o presente trabalho pretende se estabele-
cer, contribuindo também para o desenvolvimento do referencial teórico proposto pela
aquitetura ARTÍFICE.
Para uma discussão mais detalhada acerca da metodologia de criação de sistemas
inteligentes da arquitetura ARTÍFICE e as implicações de alguns trabalhos desen-
volvidos nessa nova perspectiva de pesquisa, vide Santos (2003), Campos (2006),
Silva (2008) e outros.
Na seção seguinte será apresentado um breve resumo dos trabalhos desenvolvidos
no âmbito desse projeto de pesquisa.
1.1 Histórico do Projeto ARTÍFICE
O projeto ARTÍFICE foi concebido por Borges (2000) com o objetivo de criar uma ar-
quitetura flexível para a criação de agentes de softwares cognitivos e situados. Como
dito, este projeto se assenta sobre uma filosofia não-objetivista do mundo e, por esse
motivo, integra c onceitos da cognição situada, da psicologia e da biologia para modelar
o processo cognitivo de seus agentes inteligentes. Neste sentido, o projeto ARTÍFICE
busca contribuir para o estabelecimento de novas abordagens para o desenvolvimento
de sistemas inteligentes, que tenham maior plausibilidade biológica.
Desde a proposta de criação da arquitetura, vários trabalhos foram desenvolvidos para
compor sua estr utura. Alguns deles merecem ser destacados aqui por possuírem
forte relevância para o entendimento e desenvolvimento deste trabalho de pesquisa.
Um deles é o trabalho realizado por Santos (2003) que descreve toda a base teórico-
conceitual para construção de agentes de softwares inteligentes dentro da perspectiva
adotada. Outro trabalho importante foi o desenvolvido por Campos (2006), que mode-
lou o processo cognitivo-emocional de animais mais evoluídos na escala filogenética,
e.g., mamíferos superiores, primatas e seres humanos, e justificou a importância da
memória neste processo. Outro trabalho desenvolvido foi o de Silva (2008), que apri-
morou o processo de aprendizagem da arquitetura incluindo nele os mecanismos de
condicionamento clássico e instr umental, vitais para processos mais sofisticados de
aprendizagem. Para melhor contextualização, nos parágrafos seguintes, os três traba-
1.1 Histórico do Projeto ARTÍFICE 22
lhos serão brevemente apresentados, para uma discussão mais extensa refira-se aos
trabalhos originais.
No trabalho de Santos (2003) são enfatizadas as restrições que a abordagem situada
impõe ao desenvolvimento de sistemas inteligentes, principalmente no que concerne
à sua caracter ização como uma unidade simples no domínio fenomênico de suas in-
terações com o meio, e como uma unidade composta no domínio fenomênico de sua
estrutura interna.
Santos (2003) propôs o modelo conceitual inicial da arquitetura ARTÍFICE (Figura 1) e,
buscando manter a plausibilidade biológica, modelou, ainda que de forma preliminar,
os principais aspectos da cognição humana, embutindo no agente dois subsistemas,
um cognitivo e outro não-cognitivo. Pelo modo como foram concebidos e propostos,
esses subsistemas deram ao agente a característica de agente de software cognitivo
e situado (ASCS). O sistema cognitivo seria o análogo artificial do sistema nervoso do
agente e o não-cognitivo seria análogo aos demais órgãos que compõe o organismo,
e que não têm qualquer função cognitiva. A interação entre esses dois subsistemas
do agente ocorre através de componentes sensores e efetores e é mediada pela troca
de estímulos.
Enquanto o trabalho de Santos (2003) teve como foco a organização funcional, ou
estrutural, da arquitetura, discutindo quais componentes deveriam existir e como se
daria a interação entre eles, o trabalho de Campos (2006), por sua vez, concentrou-se
na questão da modelagem dos processos homeostáticos, emocionais e cognitivos de
um organismo artificial dotado de um sistema nervoso primitivo, bem como na dinâ-
mica de suas interações. O traço marcante desta modelagem foi o interacionismo.
Isso significa que a troca de estímulos, internos e externos ao organismo, ocorre de
forma assíncrona e não-determinística, definida apenas pela estrutura interna do com-
ponente que está recebendo e não do estímulo ou da interação propriamente ditos.
Campos (2006) caracterizou a relação circular que prevalece entre homeostase
3
e a
emoção. Cabe destacar que as emoções modulavam o comportamento do ASCS por
meio de suas tendências para ações, considerando as possibilidades para ação em
um determinado momento e em certa situação (denominadas affordances). Nesse
trabalho foram tratadas apenas as emoções que referem-se à manutenção do equi-
líbrio homeostático do ASCS. Isto significa que cada emoção terá seu respectivo nível
de arousal
4
, e a variação desses níveis afetam o comportamento do ASCS via meca-
3
Entende-se por homeostase a manutenção do equilíbrio corpóreo.
4
Segundo Buck (1976), o arousal é uma medida do grau de excitação fisiológica da emoção que se
reflete nas atividades autônoma, somática e do sistema nervoso central.
1.1 Histórico do Projeto ARTÍFICE 23
Figura 1: Modelo conceitual inicial da arquitetura ARTÍFICE.
FONTE - Santos (2003), p. 113.
1.1 Histórico do Projeto ARTÍFICE 24
nismo de coordenação sensório-motora responsável pela adequação de sua eficiência
comportamental, de modo a favorecer a restauração de seu equilíbrio homeostático.
De forma geral o modelo proposto por Campos (2006) realiza uma avaliação das expe-
riências do ASCS, tanto na função emocional, quanto na função cognitiva. Em decor-
rência das avaliações feitas, o modelo contempla três níveis de resposta ao longo do
eixo-neural para cada interação ocorrida no domínio do comportamento. O primeiro
nível de resposta é a chamada resposta não-elaborada ou reflexa. o segundo nível
de resposta é a chamada resposta semi-elaborada ou inconsciente e ocorre, em hu-
manos, no nível do sistema sub-cortical. O terceiro e último nível de resposta constituí
a chamada resposta elaborada ou consciente, pois é voluntária e envolve raciocínio e
escolhas de ação. As respostas elaboradas são a base do aprendizado mais sofisti-
cado, bem como da consciência do sujeito epistêmico.
De vez que a troca de estímulos neste modelo é assíncrona e não-determinística, é
necessário um mecanismo, ou melhor, um processo de sincronização das atividades
internas ao sistema nervoso artificial para resultar numa gestalt
5
que produz um com-
portamento coerente. Tal sincronia ocorre da seguinte maneira: após o ASCS emitir
uma resposta automática, o componente que realiza a avaliação parcial - que está
inserida na função emocional e, por isso, pode também ser chamada de appraisal
6
emocional - é responsável por gerar uma resposta parcial (meramente emocional)
num primeiro momento. Num segundo momento, o componente que realiza a avali-
ação completa, também chamada de appraisal cognitivo, gera uma resposta completa,
mais elaborada (resposta cognitiva), capaz de corrigir ou coordenar a resposta ante-
rior (emocional) e assim possibilitar uma característica essencial do comportamento:
a auto-regulação emocional. Na Figura 2 pode ser visto um diagrama em blocos do
modelo conceitual proposto por Campos (2006).
A interação entre a avaliação (appraisal) parcial e completa, além de ocorrer mediante
troca de estímulos entre estes dois subsistemas, faz uso das memórias de longo prazo
e de curto prazo (memória de trabalho). Estes dois tipos de memória foram modelados
de forma simplificada, e é justamente nesse ponto que o presente trabalho pretente
dar sua contribuição ao modelar o processo de formação das memórias da arquitetura
ARTÍFICE e discutir as principais fases que norteiam sua operação.
Após Campos (2006) mostrar como se poderia sincronizar a atividade interna (ao
corpo do ASCS) entre os componentes do processo cognitivo-emocional, o trabalho
5
O gestalt é uma teoria da psicologia que considera os fenômenos psicológicos como uma totalidade
organizada e indivisível, i.e., uma configuração global.
6
Termo também conhecido como avaliação, consagrado no estudo das emoções na ótica da Psi-
cologia.
1.1 Histórico do Projeto ARTÍFICE 25
desenvolvido por Silva (2008) o complementou aprimorando o processo de aprendiza-
gem.
O foco principal de Silva (2008) foi conceber um mecanismo que permitisse ao ASCS
construir um repertório básico de comportamentos visando sua melhor adaptação ao
ambiente e ajustar esse repertório frente às mudanças que porventura viessem a ocor-
rer. Para tanto, o modelo desenvolvido contemplou dois aspectos principais referentes
à modelagem do condicionamento clássico e condicionamento operante.
O mecanismo do condicionamento clássico atua no primeiro nível de resposta do sis-
tema nervoso artificial proposto na arquitetura, a resposta reflexa. Para cada com-
ponente implementado na arquitetura, que é responsável por um reflexo, existe um
estímulo não-condicionado (US - do inglês, unconditioned stimulus) que elicitará a
resposta reflexa (UR - do inglês, unconditioned response) que lhe está associada. O
par US-UR é definido durante a construção do agente, pois esse é entendido com
algo inato. A aprendizagem promovida pelo mecanismo de condicionamento clássico
consiste em forjar uma associação entre estímulos neutros (NS - do inglês, neutral
stimulus), captados pelo agente durante sua exploração do ambiente, e os US que
disparam as respostas reflexas. A cada experiência em que US e NS são percebidos
concomitantemente, a associação entre eles é reforçada e ajustada com base numa
expressão matemática definida no modelo de Rescorla e Wagner (1972). Depois de
forjada a associação entre eles, o estímulo NS deixa de ser um estímulo neutro e
passa a ser considerado um estímulo condicionado, daí sua nova designação de CS
(do inglês, conditioned stimulus), e ele sozinho é capaz de elicitar a UR. Quanto mais
Sistema valoracional
Tendências para ação
ASCS
Estrutura
Ação
Affordance
Sistema
auxiliar
Sistema de
persistência
Sistema
sensório-
motor
Sistema
periférico
Sistema Nervoso
Memória
de trabalho
Memória de
longo prazo
Córtex efetor
Córtex sensório
Função emocional
Eficiência comportamental
Arousal
Avaliação parcial
Avaliação reflexo/instinto
Função cognitiva
Avaliação completa
Mundo artificial
Componentes
de software
Figura 2: Diagrama em blocos do modelo conceitual proposto por Campos (2006).
FONTE - Campos (2006), p. 78.
1.1 Histórico do Projeto ARTÍFICE 26
o emparelhamento for repetido, mais fortemente o CS ficará associado a US e con-
seguirá elicitar UR com mais eficácia.
Tal como ocorre nos organismos vivos, a associação entre CS e US, forjada durante
o processo de condicionamento clássico, não é persistente. Caso somente o estímulo
CS seja percebido pelo agente (sem que o US seja apresentado junto) a associação
entre eles vai se tornando cada vez mais fraca, até se desfazer, e assim o CS perde a
capacidade de elicitar o UR, tornando-se novamente um estímulo neutro.
Na literatura, é denominada de aquisição (ou consolidação) a fase na qual o CS se
associa ao US e de extinção, a fase onde o CS é percebido sozinho repetidas vezes
e a associação estabelecida entre ele e US vai se desfazendo. A Figura 3, adaptada
de Silva (2008), ilustra a curva de aquisição e extinção do condicionamento clássico
modelada na arquitetura ARTÍFICE
7
. Como pode-se perceber, ao longo das 10 expe-
riências vivenciadas pelo agente, os estímulos CS e US foram associados (indicado
pela curva de aquisição). a curva de extinção é formada ao longo das outras 10
experiências, durante as quais US foi omitido.
Limiar
Experiências
Curva da Aquisição
Curva da Extinção
Limiar
Experiências
Curva da Aquisição
Curva da Extinção
Figura 3: Curva da aquisição e extinção do condicionamento clássico.
FONTE - Adaptado de Silva (2008), p. 85.
Esse mecanismo de condicionamento clássico não envolve nenhum tipo de valoração
emocional ou cognitiva. Trata-se de uma maneira mais elementar de aprendizagem
associativa. Não obstante, o condicionamento clássico é essencial para que outras
7
Ressalte-se que o modelo de condicionamento clássico utilizado na arquitetura ARTÍFICE foi o
modelo de Rescola e Wagner (1972)
1.1 Histórico do Projeto ARTÍFICE 27
formas de aprendizagem possam se desenvolver.
Enquanto o mecanismo de condicionamento clássico lida com ações reflexas inatas,
o mecanismo de condicionamento operante ou instrumental irá lidar com ações volun-
tárias. Neste tipo de aprendizado a conseqüência da ação escolhida tem participação
no condicionamento. Se uma ação é seguida por uma experiência “agradável”, a pro-
babilidade dela vir a ser executada novamente aumenta. Caso contrário, se a ação
for seguida de uma experiência “desagradável”, a probabilidade dela ser executada
novamente diminui. Sendo assim, o mecanismo de condicionamento instrumental mo-
delado na arquitetura ARTÍFICE permite ao agente forjar padrões de comportamento
decorrentes das conseqüências advindas da execução de suas ações no ambiente,
aumentando a probabilidade de ocorrência futura das ações que tenham levado a
conseqüências positivas e diminuindo a probabilidade de ocorrência das ações que
tenham levado a conseqüências negativas.
Para facilitar o entendimento do mecanismo de condicionamento instrumental imple-
mentado, ele será explicado numa seqüência que faça sentido lógico. O processo
inicia quando o agente recebe através de seus componentes sensores estímulos ex-
ternos emitidos pelos objetos do mundo. Para cada estímulo recebido, o agente evoca
os episódios vivenciados, e portanto, emocionalmente valorados e armazenados na
memória de longo prazo, para verificar qual é a sua expectativa de interação com o
objeto emissor. Em seguida é verificada qual é a emoção mais desregulada a ser aten-
dida naquele episódio. De posse destas informações, o agente verifica qual estímulo
apresenta a maior expectativa de interação para regular o arousal da emoção e, com
base nas probabilidades da coleção de ações, referentes ao estímulo selecionado,
é realizado um sorteio para eleger a ação a ser executada por seus componentes
efetores. Após a execução da ação, caso haja interação com o objeto emissor do es-
tímulo, o sistema de valoração compara a recompensa esperada com a recompensa
recebida e realiza um ajuste da expectativa caso a recompensa esperada tenha sido
maior ou menor que a recompensa recebida. Esse processo se mediante uma
avaliação completa da situação que, após ser concluída, resulta num reforço/inibição
da associação entre o par estímulo-ação, bem como reforço/inibição da valência emo-
cional associada àquela ação.
Cabe registrar que a dinâmica do exemplo anter ior não ocorre, de fato, como na se-
qüência precisa recém-explicada, que tem fins meramente pedagógicos. A dinâmica
da arquitetura ARTÍFICE é não-deter minística, sendo imprevisível determinar quando
e qual componente irá atuar em determinado momento. A valoração executada pelo
1.1 Histórico do Projeto ARTÍFICE 28
modelo proposto é determinada pelo agente, e não pelo estímulo recebido do ambi-
ente. Portanto, caso o agente interaja com um determinado objeto do ambiente para
contribuir com a regulação de uma emoção, mas, porém a mesma esteja regulada,
a ação será valorada como negativa.
Caso a valoração atribuída à ação seja positiva, a probabilidade de ocorrência da
ação aumenta. Caso contrário (experiência aversiva), a probabilidade de ocorrência
da ação diminui. Um exemplo apresentado por Silva (2008) ilustra essa idéia (vide
Figura 4).
Figura 4: Ajuste das probabilidade das ações no condicionamento instrumental.
FONTE - Silva (2008), p. 92.
Antes de interagir com um dado objeto do mundo, a probabilidade de seleção das
ações é a mesma para todas elas, como está ilustrado na coluna A. À medida que o
agente for interagindo com os objetos do mundo em que esteja inserido, a freqüência
das ações vão sendo ajustadas pelo componente. Como pode ser observado nas co-
lunas B, C e D, a “Ação 4” foi selecionada repetidas vezes sendo avaliada como uma
experiência positiva, a cada vez implicando numa maior probabilidade dela ser sele-
cionada novamente. Entretanto, e a despeito de ser menos provável de ocorrer, em E
a “Ação 2” foi selecionada (e seu resultado foi positivo), implicando num aumento da
probabilidade de seleção da “Ação 2” e diminuição das demais. Sintetizando, alguns
aspectos do modelo proposto para o mecanismo de condicionamento instrumental
são:
uma das ações é sempre selecionada;
o somatório das probabilidades de seleção das interações para um dado objeto
1.2 Relevância do trabalho para a área de Sistemas Inteligentes 29
é sempre 100%;
a seleção da ação é um evento probabilístico. Assim sendo, nem sempre a ação
com maior probabilidade será selecionada;
inicialmente, antes do condicionamento operante entrar em ação, todas as ações
são igualmente prováveis de serem escolhidas. Assim, no início o compor-
tamento do agente poderá ser um tanto “esquizofrênico“, mas após um certo
número de episódios emocionais vivenciados ele tende a seguir um certo padrão
de comportamento que o leva à regulação emocional.
A modelagem proposta por Silva (2008) pode ser visualizada no anexo A deste tra-
balho. Para maiores detalhes sobre esse trabalho ver (SILVA, 2008).
1.2 Relevância do trabalho para a área de Sistemas In-
teligentes
Muitos trabalhos desenvolvidos na área de sistemas inteligentes buscam desenvolver
organismos artificiais que sejam capazes de aprender a partir de suas experiências
passadas resultantes de sua interação com os objetos do mundo. No caso do projeto
ARTÍFICE, essa idéia não é diferente. Porém, ao desenvolver agentes de softwares
capazes de aprender com tamanha autonomia, é impossível que este processo se
torne efetivo sem que ele tenha um mecanismo de formação de memórias.
Como será visto ao longo do desenvolvimento desse trabalho de pesquisa, a memória
exerce uma função cerebral importante porque ela é a base do processo de apren-
dizagem. Todo conhecimento e habilidades que um indivíduo adquiriu ao longo de
sua existência são consolidados na memória permitindo sua orientação no tempo e no
espaço, conectando seu passado com seu presente e oferecendo melhores condições
de adaptação no futuro. Muito apropriadamente Iván Izquierdo, um estudioso da área
de neurobiologia da memória, ressalta a importância dessa função cerebral para todos
os seres vivos:
...somos aquilo que recordamos, literalmente. Não podemos fazer aquilo
que não sabemos como fazer, nem comunicar nada que desconheça-
mos, isto é, nada que não esteja na nossa memória. Não podemos
1.3 Objetivos 30
usar como base para projetar nosso futuro aquilo que esquecemos ou
que nunca aprendemos. [...] Eu sou quem sou, cada um é quem é,
porque todos lembramo-nos de coisas que nos são próprias e exclu-
sivas, e não pertencem a mais ninguém. As nossas memórias fazem
com que cada ser humano ou animal seja um ser único, um indivíduo.
(IZQUIERDO, 2002)
Por apresentar essas características, a memória torna-se imprescindível para o pro-
cesso de aprendizagem dos ASCS no contexto da arquitetura ARTÍFICE. Porém, a
memória a ser formada não pode ser considerada simplesmente como um lugar de
registro de experiências passadas. É preciso que essa atividade cerebral, assim como
nos seres vivos, seja um processo que envolve várias fases (consolidação, evocação
e reconsolidação) que interagem entre si de maneira recíproca.
A partir dessa necessidade, este trabalho busca acoplar ao processo cognitivo-emocional
da arquitetura ARTÍFICE um mecanismo de formação de memória que continuamente
consolida, evoca e reconsolida as experiências que de fato contribuem para a adap-
tação do ASCS ao ambiente. Espera-se que com esse processo, o organismo artificial
possa utilizar suas memórias de experiências vivenciadas para selecionar melhor suas
próprias ações de modo a mantê-lo adaptado ao seu ambiente.
Além disso, o enfoque interdisciplinar deste trabalho, ao utilizar aspectos da biologia e
psicologia (ou melhor dizendo, da neuropsicobiologia) como fonte de inspiração, pre-
tende estabelecer novas estratégias de implementação dos mecanismos envolvidos
no processo de formação de memórias em artefatos de software. Pode-se destacar
também como uma contribuição relevante deste estudo, a influência das emoções nas
memórias que serão eventualmente formadas. Com essas características buscou-se
dar maior plausibilidade biológica aos ASCS de modo que eles apresentem memórias
mais próximas àquelas que ocorrem, em particular, aos humanos.
1.3 Objetivos
O objetivo geral deste trabalho é desenvolver um mecanismo de formação de memó-
ria, principalmente daquela de longo prazo, que possibilite aos agentes de softwares
criados a partir da arquitetura ARTÍFICE a capacidade de adquirir, consolidar, evocar e
reconsolidar (reforçar/esquecer) memórias de experiências vivenciadas via valoração
cognitivo-emocional.
1.4 Escopo do trabalho de pesquisa 31
Para tanto, este trabalho propõe atender aos seguintes objetivos específicos:
1. elaborar um referencial teórico consistente sobre o processo de formação de
memória na perspectiva da neuropsicobiologia, que sirva de inspiração para mo-
delagem do processo proposto;
2. identificar, no referencial utilizado, a influência das emoções no processo de
formação das memórias, inclusive nas memórias formadas sob forte nível de
arousal emocional (memór ias cintilantes);
3. modelar e implementar o mecanismo de formação de memórias de modo coe-
rente com a inspiração da neuropsicobiologia, contemplando todas as fases que
compõe este processo, bem como a influência que a emoção exerce nele e nas
memórias a serem formadas;
4. modelar o processo de formação das memórias cintilantes (flashbulb memories);
5. acoplar tal mecanismo à arquitetura ARTÍFICE, permitindo sua integração e ao
processo cognitivo-emocional e aos mecanismos de condicionamento clássico e
operante;
6. desenvolver uma aplicação de vida artificial, com intuito de verificar se o ASCS
tem capacidade de formar memórias - consolidar, evocar e reconsolidar expe-
riências que de fato contribuem para sua adaptação. E verificar as diferenças
quando essas ocorrem sob forte (ou fraco/médio) impacto emocional;
7. ampliar a capacidade do agente selecionar as ações mais adequadas em um
dado contexto;
8. comprovar a hipótese de que ampliar a capacidade da memória
8
do agente sig-
nifica dar-lhe mais condições de adaptação ao seu ambiente (o que quer dizer
que ele viverá mais).
1.4 Escopo do trabalho de pesquisa
O escopo deste trabalho de pesquisa é elucidar, por meio da revisão bibliográfica da
biologia e da psicologia (ou melhor dizendo, da neuropsicobiologia), as pr incipais ca-
racterísticas do processo de formação das memórias episódicas dos seres vivos, de
8
Lembrando que o condicionamento clássico e o condicionamento operante podem ser considerados
como exemplos de memórias das mais elementares possíveis.
1.5 Estrutura da dissertação 32
modo a servir de inspiração para a modelagem do processo de formação de memó-
rias experienciais no âmbito da arquitetura ARTÍFICE. Também busca demonstrar a
importância e a imbricação da aprendizagem neste processo. Por fim, busca deixar
claro como a memória e a aprendizagem favorecem a adaptação do indivíduo no am-
biente no qual ele está inserido.
O processo de formação de memór ia a ser modelado será composto das seguintes
fases: consolidação, evocação e reconsolidação. Todas as experiências que o ASCS
estabelecer com os objetos do ambiente, durante uma situação, serão armazenadas
na sua memória de longo prazo durante a fase de consolidação. Na fase da evocação
serão trazidas à tona as memórias que possuem alguma correlação com a situação
atual e que irão guiar o ASCS no momento da escolha de sua interação com os ob-
jetos encontrados. na fase de reconsolidação, a memória que foi evocada terá sua
intensidade emocional fortalecida e as que não foram evocadas terão sua intensidade
emocional enfraquecida.
Este processo também contemplará a formação de memória cintilante. Por ser for-
mada sob forte impacto emocional, este tipo de memória possui alta intensidade emo-
cional, permanece na memória de longo prazo do ASCS por um intervalo de tempo
muito grande e se extingue muito lentamente.
Como prova de conceito, propõe-se acoplar o mecanismo de formação de memórias
experienciais na versão da arquitetura produzida no trabalho desenvolvido por Silva
(2008), com intuito de verificar se a associação das memórias formadas, juntamente
com o mecanismo de condicionamento operante, favorece a adaptabilidade e a sobre-
vivência do ASCS no meio em que ele vive.
1.5 Estrutura da dissertação
Este trabalho está organizado em seis capítulos, sendo que no segundo capítulo é
discutida a visão da neuropsicobiologia para o processo de formação de memórias e
a influência da emoção neste processo. Este capítulo é de vital importância, pois as
questões discutidas nortearão o desenvolvimento do trabalho.
No terceiro capítulo será feita uma análise de trabalhos correlatos no âmbito da área
de Inteligência Artificial, visando contextualizar o presente trabalho.
no quarto capítulo, o modelo conceitual proposto para o processo de formação
de memória será discutido em detalhes, destacando as opções de modelagem e os
1.5 Estrutura da dissertação 33
aspectos relevantes para a implementação.
O quinto capítulo é dedicado à análise e discussão dos resultados dos experimentos
computacionais realizados, enquanto o sexto capítulo apresenta a conclusão deste
trabalho de pesquisa.
34
2 Sobre o processo de formação
das memórias
Memória é um processo central que somente os seres vivos, principalmente os mais
evoluídos, são capazes de executar. Esse processo é caracterizado pela capaci-
dade de consolidar informações aprendidas durante uma experiência e recordá-las
quando necessário. Dessa maneira, formar memória quer dizer aprender algo novo,
mantendo-o para que seja possível evocá-lo quando se vive situações similares.
A memória está intimamente associada à aprendizagem, e ambos são fundamen-
tais para a experiência humana. Somos capazes de adquirir novos conhecimentos
acerca do mundo porque as experiências que vivenciamos modificam nossa estrutura
cerebral. E, uma vez que aprendemos, é possível manter o conhecimento adquirido
na memória por um tempo bastante longo, pois essas modificações estruturais que
sofremos persistem em nosso cérebro. Posteriormente, pode-se atuar sobre o conhe-
cimento consolidado, agindo e modificando-o de novas (e várias) maneiras (KANDEL;
SQUIRE, 2003).
O aprendizado compreendido como um processo contínuo de transformação do com-
portamento a partir de experiências que foram vivenciadas e que estão consolida-
das na memória. Em síntese, não memória sem aprendizado e não aprendizado
sem memória.
A análise de como ocorre o aprendizado e de como as memórias são formadas tem
sido um ponto central de quatro disciplinas: inicialmente a filosofia, depois a psicolo-
gia, a biologia e a neurociência (KANDEL; SQUIRE, 2003).
Até perto do século XIX, os estudos envolvendo a memória restringiam-se aos domínios
da filosofia. Para estudar a memória e outros processos mentais, os filosófos uti-
lizavam essencialmente dois métodos de pesquisa: a introspecção consciente e a
análise lógica e argumentativa. Esse métodos falharam pois levavam a resultados dis-
tintos que não permitiam chegar a um ponto de vista comum (KANDEL; SQUIRE, 2003).
Sendo assim, os estudos filosóficos dos processos mentais foram substituídos por es-
2 Sobre o processo de formação das memórias 35
tudos de outra natureza e a psicologia emergiu como uma disciplina independente,
distinta da filosofia.
No início os psicólogos focavam suas pesquisas na percepção dos sentidos e mais
tarde aventuraram-se no estudo mais complexo sobre o funcionamento da estrutura
cerebral. Como resultado dos estudos feitos pelos pr incipais pesquisadores dessa
época (Ebbinghaus, Georg Muller, Alfons Pilzeker e Willian James), descobriu-se uma
característica fundamental acerca da consolidação da memória. Foi demonstrado em-
piricamente que a memória possui diferentes tempos de duração, fazendo uma dis-
tinção clara e qualitativa entre a memória que dura de segundos a alguns minutos que
é essencialmente uma extensão do momento presente conhecida como memória de
curto prazo. Ao contrário, a memória de longa duração pode persistir por dias, se-
manas ou até meses e resiste a interferências (IZQUIERDO, 2002). no século XX,
durante um movimento que ficou conhecido como Revolução Behaviorista, e na es-
teira do sucesso dos estudos da época, o russo Ivan Pavlov e o americano Edward
Thorndike, desenvolveram modelos para o estudo do aprendizado em animais. Tra-
balhando independentemente, cada um deles descobriu um método experimental di-
ferente para a modificação do comportamento. Pavlov desvendou o condicionamento
clássico, enquanto Thorndike, o condicionamento operante (ou instrumental). Esses
dois métodos experimentais, elaborados a partir de estímulos e respostas comporta-
mentais, constituíram a base para o estudo científico do aprendizado e da memória
em animais (KANDEL; SQUIRE, 2003), (GAZZANIGA; IVRY; MANGNUN, 2006).
Apesar do rigor científico, o behaviorismo mostrou-se restritivo em seus objetivos. Ao
estudar apenas estímulos e respostas observáveis, seus pesquisadores deixaram de
lado muitas questões intrigantes sobre os processos mentais. Paralelo a esse movi-
mento surgia um segundo movimento que ficou conhecido como Revolução Cognitiva.
Dentro dessa nova perspectiva, os psicólogos cognitivos tinham como objetivo ana-
lisar não apenas os estímulos e as respostas comportamentais produzidas por um
indivíduo, mas também os processos mentais que ocorrem entre um estímulo e uma
resposta. Para tanto, eles tentaram seguir o fluxo do estímulo a partir dos orgãos
sensoriais até sua “representação” interna na estrutura cerebral, para então ser, even-
tualmente, utilizada na memória e na seleção da ação. Ainda assim, esse novo movi-
mento também tinha suas próprias dificuldades. Os psicólogos cognitivos tiveram que
enfrentar a realidade de que ainda eles não possuiam aparato tecnológico nem teórico
suficientes para estudar os processos mentais internos.
Para obter êxito a psicologia cognitiva precisava juntar forças com a biologia para
2.1 Memória sob a perspectiva da cognição situada 36
abrir a “caixa preta” que é o processo de formação da memória e explorar suas es-
truturas cerebrais. Sendo assim, durante a década de 60, um modelo mais acurado
de como as células funcionam e de como elas transmitem sinais uma para as outras
foi desvendado. Com o passar do tempo esse achado, juntamente com a desco-
bertas das modernas técnicas de imageamento cerebral (tomografia por emissão de
pósitrons e ressonância magnética funcional) forneceu aos cientistas uma maneira de
estudar os processos cognitivos inerentes à estrutura cerebral. Agora, a biologia da
memória pode ser estudada em dois níveis, um microscópico, envolvendo as células
nervosas e as moléculas dentro dessas células e outro macroscópico, abrangendo
as estruturas cerebrais, a circuitaria e o comportamento (KANDEL, 2001), (BEAR; CON-
NORS; PARADISO, 2002), (IZQUIERDO, 2002), (KANDEL; SQUIRE, 2003), (GAZZANIGA; IVRY;
MANGNUN, 2006).
Neste capítulo, serão discutidos alguns aspectos relevantes para o estudo das memó-
rias a fim de responder questões cruciais para a modelagem a ser proposta. Ao se
propor modelar o processo de formação das memórias, buscou-se entender o que é
a memória, sua relação com a aprendizagem e emoção. Além de identificar os tipos
de memór ias existentes, assim com as principais áreas cerebrais envolvidas nesse
processo, buscou-se compreender esse processo como um todo, a partir da visão
macroscópica da neurociência cognitiva até a visão microscópica da biologia molecu-
lar. Antes de prosseguir, porém, faz-se necessário estabelecer o pano de fundo sobre
o qual se realiza este trabalho, qual seja, o arcabouço teórico conceitual situacionista
para o fenômeno de formação das memórias, discutido na próxima seção, que reco-
nhece a relação imbricada entre aprendizagem e memória.
2.1 Memória sob a perspectiva da cognição situada
Apenas para estabelecer um nítido contraste, do ponto de vista das ciências cogniti-
vas tradicionais, a memória funciona como um dispositivo para armazenar informações
sobre os objetos do mundo e regras de manipulação dos mesmos. Frequentemente,
também se diz que a memória é um “locus” onde são armazenadas as infor mações.
O aprendizado, portanto, seria a capacidade do indivíduo captar informações acerca
desses objetos e criar representações destes em sua memória e, ainda, criar ou forjar
associações entre tais representações, modificando-as mediante a aplicação de um
conjunto de regras lógicas, sejam elas tácitas ou explícitas.
2.1 Memória sob a perspectiva da cognição situada 37
numa perspectiva situacionista e interacionista da cognição, a memória dos seres
vivos, em geral, é compreendida, não como um “locus“ onde são armazenadas refe-
rências a objetos do mundo, mas sim como um processo de construção contínua de
experiências emocionalmente valoradas pelo organismo-em-seu-ambiente, que são
reforçadas/inibidas levando-se em consideração sua dinâmica interna e externa (CLANCEY,
1997), (IZQUIERDO, 2002).
A memória é vista como um processo que envolve vários estágios, que inclui a aqui-
sição, consolidação, evocação e reconsolidação de experiências ou episódios emo-
cionais. Nesta frase o termo chave é “experiências emocionais”, que indica que a me-
mória é fruto de uma experiência vivenciada sob o domínio de uma, ou mais, emoções.
Juntas, essas fases fazem com que a memória forneça as bases para a construção
de todo conhecimento e habilidade de uma pessoa, fazendo com que ela considere
seu passado, para se situar no presente e prever seu futuro. Neste sentido, as ex-
periências relevantes que uma pessoa estabelece com os objetos do meio no qual
ela está inserida são consolidadas na memória e evocadas quando necessário. E é
nesse contexto que surge o aprendizado
1
e, por conseguinte, a memória, bem como
a relação imbricada entre ambos.
Segundo Maturana e Varela, como citado no trabalho de Campos (2006, p. 35), que
se perceber que a aprendizagem coincide com o ser e com o fazer deste ser e, assim,
não se pode tomar o fenômeno do aprender como se os fatos e objetos estivessem
fora, indissociados do ser, e que este fosse capaz de captá-lo e armazená-lo em seu
cérebro.
As ciências cognitivas situacionistas entendem o processo cognitivo
2
como um todo,
que surge da geração mútua de dois domínios fenomênicos, ortogonais entre si,
porém mutuamente gerativos e que coexistem acoplados: o domínio da estr utura in-
terna do ser e o domínio de suas relações e interações com seu meio, como apre-
sentado na Figura 5. É a partir das interações estabelecidas nesses dois domínios
fenomênicos que o ser constroi seu conhecimento e, por conseguinte, forma sua me-
mória, e esta opera como um dos mecanismos internos que favorece sua adaptabili-
dade ao ambiente.
Segundo Izquierdo (2002), a memória surge como resultado de modificações estrutu-
rais das sinapses envolvendo neurônios de uma ampla gama de circuitos neuronais
1
Aqui entendido como a capacidade de selecionar as ações mais adequadas numa certa situação
com base em experiências passadas, que estão consolidadas na memória, e que mais tarde passarão
a compor uma nova memória.
2
Também denominado de processo cognitivo-emocional devido a forte e indissociável influência da
emoção neste processo.
2.1 Memória sob a perspectiva da cognição situada 38
Figura 5: Ser-em-seu-ambiente e os domínios fenomênicos dinamicamente acopla-
dos.
FONTE - Campos (2006) p. 33.
que a compõem. Essas alterações justificam porque os indivíduos, depois de ex-
perienciar uma situação, passam a responder de maneira diferente a determinados
estímulos, que inicialmente eram neutros ou causavam outras respostas. Isso é o que
acontece, por exemplo, com uma criança que após levar um choque elétrico não colo-
cará o dedo na tomada novamente, pelo menos durante algum tempo.
Na mesma linha, Edelman afirma que a “memória não é uma representação, ela é
um reflexo de como o cérebro está mudando sua dinâmica de forma a possibilitar
a repetição de um comportamento” (EDELMAN; TONONI, 2001, p.35). A partir do ex-
posto, pode-se perceber que o processo de formação de memória está longe de ser
algo trivial como gerenciar informações ar mazenadas em um banco de dados, como
é grosseiramente suposto pelas ciências cognitivas mais tradicionais. Ela envolve in-
úmeros processos moleculares e celulares que, operando sobre um número incontável
de células neurais dão à memória um papel importante na função cognitiva-emocional
de um organismo. Ela forma o suporte para sua auto-aprendizagem, permitindo que
ele tenha capacidade de adaptar seu comportamento frente às mudanças que ocor-
rem em seu meio sem que isso lhe seja informado previamente.
Sem esse complexo mecanismo, um ser vivo não conseguiria desempenhar tudo o
que ele é capaz. É por esse motivo que um dos grandes desafios no desenvolvimento
de sistemas inteligentes é justamente compreender como funciona esse poderoso me-
canismo, a fim de possibilitar sua mimetização em organismos artificiais, na esperança
que esses possam, um dia, serem considerados verdadeiramente inteligentes sob um
ponto vista antropomórfico.
2.2 O Processo de formação da memória: a visão da neurociência 39
2.2 O Processo de formação da memória: a visão da
neurociência
Nos anos recentes, grande avanço foi feito pelos pesquisadores da área da neuro-
ciência na compreenssão do processo de formação das memórias. A primeira grande
descoberta veio com a concepção de que a memória não é uma faculdade unitária da
mente, mas que se apresenta sob várias formas. Paralelo às descobertas das baases
moleculares dos mecanismos de armazenamento das memórias e às recentes téc-
nicas de imageamento funcional do cérebro, foi possível compreender que cada tipo
de memór ia possui seus próprios sistemas encefálicos. Em seguida, o estudo das
emoções ganha enfoque e os pesquisadores começam a reconhecer sua influência
na cognição e, por conseqüência, na formação dos sistemas da memória. Alguns as-
pectos dessa perspectiva de estudo, tais como: as fases do processo de formação da
memória, os tipos de memórias, os sistemas encefálicos envolvidos nesse processo,
assim como a influência da emoção, são descritos a seguir.
2.2.1 As fases do processo de formação das memórias
Para os estudiosos do processo de formação da memória, essa fantástica capacidade
do cérebro humano é muito mais do que simplesmente identificar um objeto ou uma
situação. A memória é um processo flexível, que decorre de sua capacidade de deter-
minar quando e em qual contexto uma experiência ocorreu. Durante a aprendizagem,
ela permite que características dos estímulos recebidos e características contextuais
do momento presente sejam unidas de alguma forma, de modo que à percepção de
um objeto ou situação vivenciada no passado permita a antecipação da melhor ação
a ser realizada. (POLYN; KAHANA, 2007).
O processo de identificaçao e “inferência” realizado pela memória envolve algumas
etapas ou fases conhecidas como: consolidação, evocação e reconsolidação da me-
mória. Na consolidação, verifica-se como as experiências recém vivenciadas são ar-
mazenadas na memória. na evocação, é possível observar como as experiências
(ou memórias) antigas, e consolidadas, influenciam na formação da memória atual.
E na reconsolidação, o contrário da evocação, é possível observar como a experiência
2.2 O Processo de formação da memória: a visão da neurociência 40
atual influência exper iências antigas. Mais alguns detalhes sobre cada uma dessas
fases serão discutidos nas seções seguintes.
Consolidação da Memória
Segundo Schafe et al. (2001), a consolidação da memória é um processo pelo qual
a memória de curto prazo é transformada, com o passar do tempo, em memória de
longo prazo. Essa constatação havia sido feita a mais de um século atrás por Müller
e Pilzcker, propositores da hipótese da consolidação da memória, que estabelece que
essa fase é o processo pelo qual a memória, recém adquirida, passa de um estado
débil para um estado duradouro (MCGAUGH, 2000).
Segundo Müller e Pilzcker apud McGaugh (2000)
3
, as memórias não são forjadas na
sua forma final. Até o fim da fase de consolidação, elas são suscetíveis à interferência
de qualquer evento, e.g., drogas, tratamentos, traumas ou até mesmo a formação de
outras memórias. Sendo assim, essa fase envolve uma série de eventos bioquímicos
no hipocampo (e em outras estruturas cerebrais) que compreende diversos processos
e que dura entre 3 a 8 horas. Enquanto esses processos não estiverem concluídos,
as memórias são instáveis.
Mais especificamente, pode-se entender a consolidação da memória como uma com-
posição de 3 subfases: a aquisição, codificação e armazenamento das experiências. A
aquisição se atém à maneira pela qual um indivíduo percebe os estímulos do mundo
no qual ele está inserido e como ele os correlaciona com o contexto atual. A par-
tir desse processo de correlação, surgirá uma experiência de vida, que poderá fazer
parte de sua memória. A codificação é o processo pelo qual a memória é preparada
para ser armazenada, onde o indivíduo atribui a ela um grau de significância.
o armazenamento é onde, de fato, ocorre a persistência da memória nas estruturas
cerebrais (KANDEL; SQUIRE, 2003).
É na fase de aquisição que as experiências de vida de um indivíduo são adquiridas a
partir da correlação dos estímulos do ambiente, do contexto no qual ele está inserido
e de suas experiências passadas. Esse processo está fortemente vinculado à apren-
dizagem, na qual se destaca o aprendizado associativo (incluindo os mecanismos de
condicionamento), que é um dos tipos de aprendizado mais simples para se forjar
comportamentos (IZQUIERDO, 2002).
No condicionamento clássico, um animal aprende associar dois estímulos. No exem-
3
MÜLLER, G. E.; PILZECKER, A. Experimented Beitrage zur Lehre vom Gedächtniss.
Zeitschr.
Psychol., n. 1, pp. 1-288, 1900
2.2 O Processo de formação da memória: a visão da neurociência 41
plo clássico utilizado por Pavlov, o animal aprende a associar o som da campainha
com a comida. Após repetir esse pareamento várias vezes o animal torna-se condi-
cionado, e um simples toque da campainha é capaz de fazer com que ele salive e se
prepare para receber algo de comer.
no condicionamento operante, um animal aprende a estabelecer uma associação
entre um estímulo e a consequência de sua ação. No exemplo clássico, utilizado por
Thornike, um gato faminto era colocado em uma caixa fechada e do lado de fora era
colocada a comida. Para sair da caixa o gato tinha que pressionar uma alavanca exis-
tente no interior da caixa. A cada vez que saía da caixa, o animal associava o ato
de pressionar a alavanca com a sua libertação e posterior alimentação (experiência
apetitiva). Assim, cada vez que o experimento era repetido o animal gastava menos
tempo para se libertar da caixa e receber algo para comer, repetindo uma experiência
anterior que lhe foi prazerosa. Neste caso o condicionamento se deu em conseqüên-
cia do seu ato.
De forma bem resumida pode-se concluir que no condicionamento clássico o animal
aprende apenas, e tão somente, a se preparar para o inevitável mediante a associ-
ação de um estímulo anteriormente neutro a um outro estímulo, não-condicionado,
que antecipa no tempo a resposta reflexa (absolutamente involuntária) correspon-
dente.(GLASSMAN, 2006), (MOREN, 2002). no condicionamento operante, o animal
aprende a relação entre uma ação escolhida, em resposta a um determinado estímulo,
e a recompensa ou punição que essas ações lhe trouxe. Dessa maneira, ele consegue
“manipular” uma situação a partir de suas possíveis ações e respectivas conseqüên-
cias, de modo a evitar/ganhar algo (MOREN, 2002). Para uma discussão mais ampla
sobre os mecanismos de condicionamento refira-se ao trabalho de Silva (2008).
Assim que uma memória (ou experiência) é adquirida mediante os mecanismos de
aprendizagem associativa (condicionamento clássico e instrumental) ela é submetida
ao processo de codificação. É nessa fase que uma experiência adquire significância
para o animal, e o que define se essa passará a compor sua memória e com qual grau
de detalhes ela será armazenada (KANDEL; SQUIRE, 2003). Quando a codificação é
elaborada e profunda a memória é muito mais fiel à realidade do que quando a codifi-
cação é limitada e superficial, como afirma Kandel e Squire:
Lembramos melhor de um material quanto mais completamente o pro-
cessamos. Isto é, quanto mais razões tivermos para estudá-lo, quanto
mais gostamos daquilo que estamos estudando e quando mais pu-
dermos trazer nossa personalidade por completo para o momento do
2.2 O Processo de formação da memória: a visão da neurociência 42
aprendizado, melhor será a memória. (KANDEL; SQUIRE, 2003)
Pode-se concluir que os interesses e preferências de uma pessoa influenciam a na-
tureza e a intensidade da memória que está se formando. Então, quando nenhum
esforço está sendo utilizado para registrar uma experiência, mais difícil será sua evo-
cação. Porém, quanto mais interesse, melhor a qualidade da memória que está se
formando e mais fidedigna será sua evocação posterior.
Assim que uma experiência é codificada essa será registrada (armazenada) na me-
mória, podendo durar minutos, horas, dias, semanas ou até a vida toda. Estudar o
processo de armazenamento da memória leva a refletir sobre sua aparente ilimitada
capacidade em reter informações e debater com o seguinte questionamento: como
uma memória codificada persiste na forma de uma memória?
Segundo Izquierdo (2002), o armazenamento da memória consiste de modificações
duradouras de determinadas sinapses, que incluem o hipocampo e suas conexões.
Essas modificações sinápticas são sustentadas pela capacidade plástica de suas célu-
las nervosas, por meio de uma série de passos moleculares que causariam, primeira-
mente, alterações funcionais e, em seguida, alterações morfológicas nas sinapses que
as sustentam.
hipóteses que estabelecem a LTP - Long Term Potentiation
4
como o mecanismo
responsável por tal capacidade plástica. Desde que tal idéia foi proposta, se esta-
beleceu na literatura certa confusão e a LTP passou a ser referida por uma parcela
significativa da literatura como um “modelo de memória“, o que tem sido fortemente
questionado nos últimos anos.
Fica claro que não existe um lugar físico para armazenamento da memória. Existe a
co-participação de células nervosas das diversas regiões celebrais, que contribuem
de forma diferente para a “representação“ da experiência com um todo. De um ponto
de vista operacional, o armazenamento da memória nada mais é do que alterações
estruturais de sinapses, distintas para cada memória ou tipos de memórias.
Evocação da Memória
Como visto na seção anterior, as memórias são armazenadas por meio de alterações
ou modificações duradouras (ou permanentes) nas sinapses das redes neuronais de
cada memória. Essas modificações resultam na consolidação da memória, especifi-
camente das de longa duração. Segundo Izquierdo (2002), a única maneira de avaliar
4
Segundo Izquierdo (2002), a LTP é um processo eletrofisiológico que ocorre entre os neurônios de
modo a fortalecer suas ligações sinápticas. Para maiores detalhes refira-se à seção 2.3.1
2.2 O Processo de formação da memória: a visão da neurociência 43
a consolidação da memória é medindo sua evocação.
Durante muito tempo, foi consenso na literatura que a evocação das memórias era
um processo onde o cérebro agrupava diferentes tipos de informações, distribuídas
ao longo dos vários sítios corticais (KANDEL; SQUIRE, 2003). Entretanto, a evocação da
memória não é apenas isso.
Memórias não são recuperadas de um banco de dados, nem tampouco recriadas
como uma fotografia do passado. Memórias são memórias-de-experiências-de-vida.
E, assim sendo, evocar uma memória significa, mediante um ou mais estímulos es-
pecíficos e previamente associados a certos comportamentos, reviver um episódio
emocional da sua vida de maneira adaptada às suas circunstancias atuais. Esse
processo será mais completo e coerente quanto mais estímulos forem apresentados,
como exemplifica Izquierdo (2002): “A evocação da memória é como reconstruir uma
casa, quanto mais tijolos estiverem à disposição, melhor será a reconstrução”.
Segundo Kandel e Squire (2003), para que os estímulos (ou dicas) sejam capazes de
reviver uma memória, eles devem ser capazes de despertar os aspectos mais bem
codificados do evento que um indivíduo está tentando lembrar.
Outro aspecto que também influencia, e muito, na qualidade e na capacidade de evo-
car uma memória é o estado interno do indivíduo. O estado corpóreo de alguém, e
também, todo o contexto no momento da evocação facilitam a lembrança de eventos
que haviam sido aleatoriamente codificados em contextos semelhantes, como exem-
plifica Sara:
We walk into a room and have an immediate sensation of familiarity,
without being able to evoke a particular episodic memory associated
with the context. We experience an increase in arousal and attention,
and initiate a search for cues or relevant stimuli within the context to
facilitate retrieval of the target memory.
5
(SARA, 2000, p. 77)
Este exemplo nos leva a concluir que a evocação será melhor quando o contexto e as
peculiaridades que estavam presentes, durante a consolidação daquela memória, for
o mesmo contexto apresentado posteriormente. Dessa forma a evocação da memória
será tanto melhor quanto maior for o número de sinapses reativadas e que compõe
aquela memória, quanto maior for a presença de estímulos relevantes e sua integração
a fim de se compor um traço significativo que provoque no indivíduo um aumento ex-
5
Nós caminhamos em um sala e sentimos imediatamente uma sensação de familiaridade, sem ser-
mos capazes de evocar uma memória episódica particular associada com o contexto. Experienciamos
um aumento no arousal e atenção, e iniciamos uma busca por peculiaridades ou estímulos relevantes
para facilitar a recuperação da memória alvo. [Tradução livre da autora]
2.2 O Processo de formação da memória: a visão da neurociência 44
pressivo em seu nível de arousal e atenção.
Reconsolidação da Memória
A reconsolidação da memória é uma conseqüência da fase de evocação. Isto é, du-
rante a evocação da memória, experiências passadas são trazidas à tona para que
um indivíduo possa vivenciar novas experiências (que por sua vez, poderão também
vir a compor novas memórias). No final desse processo, as experiências evocadas
são novamente consolidadas. Assim, elas se tornam mais vívidas e com maiores
probabilidades de serem recordadas no futuro ou, de outro modo, se tornam mais
desvanecidas e, portanto, com menores probabilidades de serem recordadas.
É possível compreender melhor como ocorre esse processo estudando um tipo es-
pecífico de condicionamento clássico, a esquiva inibitória. Nesse tipo de condiciona-
mento, um indivíduo aprende a evitar determinado comportamento para não experi-
mentar uma resposta aversiva, por exemplo: toda vez que o rato desce da plataforma
ele recebe um choque elétrico em suas patas. Porém, quando o rato permanece na
plataforma ele não recebe o choque. Após sucessivas repetições desse experimento,
o animal aprende a não descer da plataforma e assim evitar receber o choque elétrico,
ou seja, ele aprende a se esquivar de receber um choque elétrico.
Reproduzindo esse teste em laboratório, Izquierdo e colaboradores descobriram que
durante algum tempo o rato não descia da plataforma (sinal de que ele se recordava
do seu aprendizado). Com o passar do tempo esse aprendizado foi se extinguindo
(pois, o rato voltou a descer a platafor ma). Como resultado ele recebeu novamente o
estímulo aversivo, e isso fez com que ele recuperasse sua memória e permanecesse
mais tempo na plataforma (IZQUIERDO, 2002).
Outro processo que se pode observar durante o experimento da esquiva inibitória é a
extinção da memória. Toda vez que o estimulo reforçador (ou também chamado de
estimulo não-condicionado - o choque elétrico no nosso exemplo) é omitido, é desen-
cadeado o processo de extinção daquela memória. A fase de evocação da memória
costuma ser feita sem a apresentação do estímulo reforçador. Essa ação, após vários
testes sucessivos, faz com que a memória, recém consolidada, seja extinta (SARA,
2000), (IZQUIERDO, 2002), (KANDEL; SQUIRE, 2003).
Abel e Lattal (2001), argumentam que experimentos como a esquiva inibitória apontam
a extinção como um processo de aprendizagem ativo, que “apaga“ a memória origi-
nal, fazendo com que novas memórias sejam formadas. E que o processo bioquímico
que sustenta este fenômeno é o mesmo envolvido no estabelecimento da aquisição
2.2 O Processo de formação da memória: a visão da neurociência 45
da memória. Dessa forma, Abel e Lattal (2001) concluem que a extinção constitui um
novo aprendizado. O sujeito que tinha aprendido: estímulo neutro junto com estímulo
condicionado deve emitir determinada resposta, repentinamente, tem que aprender o
contrário: estímulo condicionado sozinho fará a resposta se extinguir.
Segundo Izquierdo (2002), uma memória extinta não significa apenas numa memória
esquecida. Como visto, se o animal após algumas sessões do teste receber no-
vamente o choque, ele recuperará instantaneamente a memória da esquiva inibitória.
quem acredite que o esquecimento seja um fator negativo da atividade cerebral,
mas ao contrário do que se pensa, esse é um fator adaptativo. A conservação de de-
masiadas memórias e de seus incontáveis detalhes poderia causar dois problemas: o
primeiro inerente a um hipotético limite biológico do sistema nervoso em lidar com tan-
tas memórias, e o segundo relacionado com os estragos que tal fato poderia causar à
vida de alguém. Imagine se uma pessoa guardasse todos os detalhes dos episódios
de sua vida? Se assim fosse ela seria incapaz de generalizar e raciocinar ou talvez
vivesse um intratável quadro depressivo (IZQUIERDO, 2002).
2.2.2 Classificação das Memórias
Nos estudos atuais sobre a memória é consenso que a memória humana não é uma
entidade unitária, e sim uma composição de múltiplos sistemas independentes, mas
interativos (KANDEL; SQUIRE, 2003).
A partir da década de 50 é que essa idéia passou a ser defendida com a descrição
do paciente H.M.. Com cerca de 9 anos de idade, H.M. havia sofrido um acidente
de bicicleta que causara um traumatismo craniano, o qual, mais tarde, levou ao de-
senvolvimento de epilepsia. As crises de H.M. pioraram com o passar do tempo, e
aos 27 anos, ele estava gravemente incapacitado. Para controlar as crises epiléti-
cas, H.M. foi submetido a uma cir urgia, onde foi retirado parte do seu hipocampo, giro
para-hipocampal, córtex entorrinal e amígdala bilateral. Os responsáveis pelo pro-
cedimento, Brenda Milner e Scoville, constataram que esse tratamento foi efetivo com
relação à epilepsia, porém, H.M. passou a ter um déficit de memória, do qual nunca
mais se recuperou. Ele era incapaz de adquirir novos conhecimentos relativos a acon-
tecimentos posteriores à cirurgia, mas conservava lembranças de sua infância e de
fatos ocorridos dois anos antes da operação (KANDEL; SQUIRE, 2003).
Essa constatação empírica promoveu o desenvolvimento conceitual sobre as dissoci-
2.2 O Processo de formação da memória: a visão da neurociência 46
ações entre dois tipos de memória, uma temporária e outra mais duradoura, que hoje
em dia são comumente conhecidas como memór ia de curta e longa duração, respec-
tivamente.
Os psicólogos cognitivos subdividem a memória de curta duração em dois compo-
nentes principais: memória imediata e memória de trabalho. A memória de curta de
duração, doravante MCD, como seu próprio nome afirma, refere-se aos processos que
consolidam o aprendizado temporariamente, até que este seja extinto ou se torne uma
memória de longa duração.
A memória imediata refere-se àquilo que pode ser mantido ativo na mente, começando
no momento em que a informação é recebida. É essa informação que representa o
foco da atenção no momento e que ocupa o fluxo de pensamento nesse instante.
Segundo Gazzaniga, Ivry e Mangnun (2006), a capacidade da memória imediata é
bastante limitada, normalmente persiste por menos de 30 segundos. a memória de
trabalho pode persistir por muitos minutos, talvez uma hora ou mais. Segundo Kandel
e Squire (2003), é a memória de trabalho que nos proporciona a capacidade de man-
ter na mente um número de telefone enquanto se prepara para discá-lo, por exemplo.
Complementando a idéia do parágrafo anterior, Izquierdo (2002) afirma que a memó-
ria imediata é breve e fugaz, servindo para gerenciar a realidade e determinar em qual
contexto fatos e informações ocorreram. Por outro lado, a memória de trabalho man-
tém ativo, por um tempo maior, esses fatos e informações, avaliando se é viável criar
ou não uma nova memória desses ou se existe uma memória similar. Assim, esses
dois subtipos de memórias, em conjunto caracterizam a MCD.
memória de longa duração, doravante MLD, pode durar algumas horas, dias, meses,
décadas ou a vida toda, o que a caracteriza é o fato de ser mais estável e poten-
cialmente permanente (GAZZANIGA; IVRY; MANGNUN, 2006), (KANDEL; SQUIRE, 2003),
(IZQUIERDO, 2002), (SA; MEDALHA, 2001). Para que a MLD se forme e alcance tal esta-
bilidade, ela passa por alguns estágios e por vários processos bioquímicos. Como foi
visto na seção 2.2.1, um desses estágios é a consolidação, processo pelo qual todo
traço de memória passa até alcançar sua forma estável. Segundo Müller e Pilzcker
apud McGaugh (2000)
6
, durante esse período de consolidação, as memórias ainda
são instáveis e suscetíveis à interferência de numerosos fatores como, traumatismo
craniano, eletro-choques convulsivos e outros, como exemplificado no caso do pa-
ciente H.M..
Usualmente se acredita que a MCD dura poucas horas, justamente o tempo necessá-
6
MÜLLER, G. E.; PILZECKER, A. Experimented Beitrage zur Lehre vom Gedächtniss. Zeitschr.
Psychol., n. 1, pp. 1-288, 1900.
2.2 O Processo de formação da memória: a visão da neurociência 47
rio para que a MLD se consolide. Discutiu-se durante muito tempo que a MCD fosse
um processo inicial da MLD, porém foi descoberto que ambas memórias envolvem
processos paralelos e até certo ponto distintos (IZQUIERDO, 2002). A MCD possui três
características básicas que ajudam a esclarecer seu curto processo de consolidação:
é transitória, não necessita de alterações anatômicas para ser mantida e por isso não
requer a síntese de proteínas. Por outro lado a MLD, pode-se tornar mais estável pelo
fato de envolver a síntese de proteínas em seus processos bioquímicos, fator que, por
sua vez, promove e sustenta as alterações anatômicas nas sinapses resultantes de
sua estabilização. Mais detalhes sobre esse processo são apresentados nas seções
seguintes.
A MLD ainda pode ser classificada com relação à possibilidade do acesso consciente
ao seu conteúdo, distinguindo-se a memória implícita e explícita.
Segundo afirma Kandel e Squire (2003), a memória implícita é formada vagarosa-
mente pela repetição de uma ação e é expressa no comportamento sem evocação da
consciência ou, dito de outra forma, sem o reconhecimento por parte do sujeito de que
a memória de um episódio vivenciado no passado está sendo utilizada. Ao contrário,
a memória explícita é caracterizada pelo fato de que sua evocação é um processo
consciente para o sujeito.
As memórias explícitas e implícitas são também referidas na literatura como memór ias
declarativas e não-declarativas, respectivamente. A memória declarativa é a memória
para fatos, idéias e eventos, isto é, para informações que podem ser evocadas cons-
cientemente por meio de uma proposição verbal ou imagem visual. É esse o tipo de
memória à qual coloquialmente as pessoas se referem quando empregam o termo
“memória” (KANDEL; SQUIRE, 2003).
Segundo Gazzaniga, Ivry e Mangnun (2006), a memória explícita pode ser subdividida
em coisas que uma pessoa vivenciou ou se lembra (tipo de memória conhecida como
memória episódica ou autobiográfica) e conhecimentos que adquiriu durante sua vida
porque alguém lhe contou (tipo de memória conhecida como memória semântica).
Foi Endel Tulving o responsável pela distinção entre memória episódica e memória
semântica. Recentemente Tulving (2002), definiu a memória episódica como uma
memória pessoal, autobiográfica, que confere a capacidade de resgatar experiên-
cias passadas, de for ma consciente. A memória semântica, em contraste, reflete o
conhecimento das coisas do mundo e que é lembrada mesmo na ausência de qual-
quer estímulo que tenha correlação com a circunstância específica na qual ocorreu
seu aprendizado. Por exemplo, ao contrário da memória episódica, para subtrair dois
2.2 O Processo de formação da memória: a visão da neurociência 48
números não é preciso receber nenhum estímulo para evocar a memória dessa ação.
Por sua vez, a memória implícita é revelada quando a experiência prévia facilita o
desempenho de tarefas que não requerem lembranças intencionais das experiências.
Gazzaniga, Ivry e Mangnun (2006) afirmam que esse tipo de memória abrange várias
formas de conhecimento que se pode observar no dia-a-dia e que pode também ser
observada em testes experimentais adequados, tais como: aprendizado procedural
(aprendizado de nossas habilidades motoras), aprendizagem perceptual (priming -
onde a forma e a estrutura de objetos/palavras podem ser facilitadas por experiências
anteriores), e o aprendizado associativo (mecanismos de condicionamento clássico e
operante, como discutido brevemente na seção 2.2.1).
A Figura 6 apresenta um possível esquema de classificação das memórias largamente
difundido na literatura.
Memória
Memória de Longa Duração
Memória de Curta Duração
Memória Explícita
Memória Implícita
Memória de Trabalho
Memória Imediata
Memória
Episódica
Memória
Semântica
Memória de
Procedimento
Memória
Perceptiva
Memória
Associativa
Figura 6: Esquema de classificação da Memória.
Adaptado de Gazzaniga, Ivry e Mangnun (2006) p.332.
Para além dos possíveis esquemas de classificação das memórias, qualquer que seja
ele, desde um ponto da biologia, toda memória - seja de curta ou de longa duração,
explícita ou implícita - nada mais é do que uma ampla rede de neurônios conectados,
trocando sinais uns com os outros e podendo alterar sua forma anatômica, se diferen-
ciando pela ausência e/ou presença de um processo bem específico, conhecido como
Potenciação de Longa Duração (LTP, do inglês Long Term Potentiation), o qual será
melhor discutido na seção 2.3.1.
2.2 O Processo de formação da memória: a visão da neurociência 49
2.2.3 Memórias Autobiográficas × Memórias Cintilantes × Memó-
rias Traumáticas
Quem não se recorda do primeiro dia da escola, a cerimônia de casamento, o nasci-
mento do filho, uma experiência afetiva marcante, a morte de uma pessoa querida?
Destas memórias, umas são mais nítidas e “brilhantes”, facilmente recordáveis e ca-
pazes de desencadear a lembrança de outras memórias associadas devido ao seu
caráter único, singular e exclusivo. Porém, outras experiências pessoais menos
elaboradas, de acesso mais demorado, e que resultam de acontecimentos repetidos,
como viagens, o dia-a-dia da escola, ou da casa onde se viveu na infância. Uma pes-
soa pode não ter uma recordação do primeiro dia de escola, mas é pouco provável
que não tenha uma memória de sua passagem pela escola.
Segundo Rubin apud Pinto (1998)
7
, as experiências pessoais associadas a pessoas,
acontecimentos, lugares, objetos e ações são componentes da memória autobiográ-
fica regular. São episódios e situações referentes à pessoa que os viveu e presenciou
e que, sobre eles, elaborou uma interpretação e atribuiu um significado. São experi-
ências e fragmentos da vida de cada um, em que o envolvimento pessoal é um sinal
e uma marca. São experiências que formam a personalidade e definem a identidade
de uma pessoa, como dizia Izquierdo (2002): Somos aquilo que recordamos”.
A memória cintilante (do inglês, flashbulb memory) é um tipo especial de memória
autobiográfica, proposta por Brown e Kulik (1977) para caracterizar recordações muito
vívidas, pormenorizadas e com forte carga emocionais que as pessoas relatam ao
descreverem o modo como tomaram conhecimento de um acontecimento único, sur-
preendente, dramático e fortemente emocional, como por exemplo, um acidente de
carro.
Segundo Brown e Kulik (1977) e Stratton (1919), quando uma pessoa recorda um
acontecimento deste tipo, normalmente ela é capaz de se lembrar com grande nitidez
de informações sobre o local exato onde estava quando recebeu a notícia, o que es-
tava fazendo e como se sentiu quando teve aquela experiência e o que aconteceu
imediatamente a seguir.
Brown e Kulik (1977) propuseram um mecanismo neuronal especial que seria ativado
quando uma pessoa se encontra face a acontecimentos dramáticos, importantes e
surpreendentes. A atuação deste mecanismo permitiria que o cenário do aconteci-
mento/evento ficasse “impresso”, por assim dizer, na memória, semelhante a uma
fotografia de uma cena, o que permite registrar e preservar tudo o que foi percebido
7
RUBIN, D.C. Autobiographical memory. Cambridge: Cambridge University Press,1986.
2.2 O Processo de formação da memória: a visão da neurociência 50
naquele instante. Assim, as recordações posteriores do acontecimento seriam no
entanto construções pessoais baseadas naquela impressão original e nas várias lem-
branças e repetições que eventualmente ocorreram.
Neisser apud Pinto (1998)
8
contestou a existência de um mecanismo fisiológico do
tipo proposto por Brown e Kulik e sugeriu que a preservação nítida do conteúdo das
memórias cintilantes resulta das lembranças e repetições frequentes que habitual-
mente ocorrem depois do acontecimento, contestando também, que essas memórias
não seriam uma “imagem precisa” da situação real e que elas se extinguiriam com o
passar do tempo.
Durante anos, Nisser tinha uma memória cintilante de estar assistindo a um jogo de
baseball no dia anterior do seu aniversário de 13 anos. Porém, o jogo foi interrompido
pelo anúncio do bombardeio Japones a Pearl Harbor e ele se apressou para dar a
notícia à sua mãe. Neisser afirmou:
“This memory has been so clear for so long that I never confronted its
inherent absurdity until last year: no one broadcasts baseball games in
December! (It can’t have been a football game either; professional foot-
ball barely existed in 1941, and the college season ended by Thanks-
giving.) Apparently flashbulbs can be just as wrong as other kinds
of memories; they are not produced by a special quasi-photographic
mechanism.
9
(NEISSER, 1982, p. 45)
Corroborando o que Neisser afirma, Schmidt (2004) diz que as memórias autobiográfi-
cas cintilantes apesar de possuírem um caráter único, também são passíveis de erros
reconstrutivos no momento de sua evocação e não são cópias da realidade.
Assim como Neisser e Schmidt, outros pesquisadores também têm argumentado que
o forte impacto emocional não leva um indivíduo à completa recordação do evento
vívido ou dos detalhes menos significativos, como Brown e Kulik haviam proposto.
O que leva a crer que a forte emoção pode criar uma memór ia relativamente deta-
lhada e precisa para aspectos centrais do evento (o acontecimento surpreendente),
porém pobre para aspectos periféricos (os acontecimentos menos importante), o que
justifica, entretanto, a característica inconsistente da memória cintilante para determi-
nados fatos do evento (SCHMIDT, 2004).
8
NEISSER, U. Memory observed: Remembering in natural contexts. São Francisco: Freeman, 1982.
9
“Esta memória tem sido tão evidente durante tanto tempo que eu nunca havia confrontado sua
inerente insensatez até o ano passado: não houve trasmissão de jogos de baseball em dezembro!
(Também, não pode ter sido um jogo de futebol, pois, o futebol profissional quase não existia em 1941,
e naquela época a temporada do colégio terminou por volta do dia de Ação de Graças). Aparente-
mente memórias cintilantes podem ser tão errôneas como outros tipos de memórias, pois elas não são
produzidos por um mecanismo fotográfico. [Tradução livre da autora]
2.2 O Processo de formação da memória: a visão da neurociência 51
Desde que tais características da memória autobiográfica cintilante foram descober-
tas muitos pesquisadores procuraram verificar quais são as principais diferenças entre
elas e as memórias autobiogáficas regulares.
Com esse intuito, Talarico e Rubin (2003) desenvolveram um trabalho onde os partici-
pantes do teste deveriam responder uma sér ie de questões sobre os ataques terroris-
tas aos Estados Unidos, no dia 11 de setembro de 2001. Para cada tipo de memória
era analisado características que os permitissem aferir algumas propriedades, tais
como: a taxa de recordação das memórias, sua vivacidade, a crença na precisão da
memória formada e o fortalecimento da memória pela repetição.
Os parágrafos seguintes relatam sobre os resultados encontrados. A princípio foi com-
provado que não existia nenhuma diferença entre as memórias autobiográfica cinti-
lantes e regulares em função da passagem do tempo, ou seja, todos os dois tipos
de memórias são suscetíveis ao esquecimento. Embora, ambas memórias sofressem
com a ação do tempo, elas diferiam em suas propriedades fenomenológicas. O que
Talarico e Rubin (2003) observaram foi que os participantes dos testes direcionados à
memória cintilante possuíam alta coerência em sua narrativas, que eram menos frag-
mentadas e tinham alta intensidade emocional.
Talarico e Rubin (2003) comprovaram também que as memórias autobiográficas cinti-
lantes são mais inconsistentes do que as memórias autobiográficas regulares, porém,
quanto mais a versão inconsistente da memória autobiográfica cintilante é recordada
mais consistente ela ficará, o que a torna mais duradoura. Para as taxas de recor-
dação, convicção e vivacidade, eles afirmam que essas características permanecem
altas para as memórias cintilantes autobiográficas, mas decrescem, com o passar do
tempo, para as memórias autobiográficas regulares. com relação ao fortalecimento
da memória pela repetição, ficou claro que as memórias autobiográficas regulares são
menos fortalecidas, pois as pessoas as recordam menos (quando comparado com a
taxa de recordação das memórias autobiográficas cintilantes). A Figura 7 demonstra
graficamente os resultados apurados por Talarico e Rubin, onde ambos tipos de me-
mórias foram correlacionadas.
Como se pode perceber, as memórias autobiográficas cintilantes e regulares são muito
parecidas e se distinguem em aspectos bem específicos, devido às características do
processo de consolidação de cada uma. As memórias cintilantes se destacam por
serem altamente duradouras e por proporcionarem recordações explicitas de detalhes
centrais dos eventos que ocorreram durante experiências emocionais (BROWN; KULIK,
1977), (SCHMIDT, 2004).
2.2 O Processo de formação da memória: a visão da neurociência 52
Figura 7: Memórias Cintilantes × Memórias Regulares
Fonte: Talarico e Rubin (2003) p.457.
2.2 O Processo de formação da memória: a visão da neurociência 53
Ainda com relação à memória autobiográfica cintilante é possível destacar outro tipo
específico de memória, a chamada memória traumática. Este tipo de memória é for-
mada em resposta a um trauma que uma pessoa tenha experienciado, causando o
que é chamado de “nó neurológico”, que se expressa de diferentes formas, como, so-
nhos repetitivos, pesadelos, flashbacks e pensamentos intrusivos - os assim chama-
dos sintomas positivos do TEPT - Transtorno do Estresse Pós-Traumático. Porém,
vale ressaltar que o trauma aqui referenciado não necessariamente é entendido como
algo ruim, como a literatura comumente costuma abordar ao estudar este tipo de me-
mória, mas sim como a dificuldade do cérebro em lidar com situações que ocorrem
mediante uma carga emocional muito forte, sejam elas positivas ou negativas (KOLK;
MCFARLANE; WEISAETH, 1996).
Segundo Kolk, McFarlane e Weisaeth (1996), durante a formação das memórias trau-
máticas supressão de algumas áreas cerebrais que origem à fragmentação da
memória e à formação de “pedaços” implícitos, o que levou muitos pesquisadores a
concluir que este tipo de memória possui um componente não-declarativo (incons-
ciente) que ocasiona nos pacientes uma amnésia parcial ou falhas dos eventos que
ocorreram durante o trauma. Segundo Ehlers et al. (2002) pessoas traumatizadas tam-
bém podem descrever com grande detalhe elementos sensórios de suas experiências
traumáticas, o que leva a crer que as memórias traumáticas não sejam totalmente
implícitas e fragmentadas. Sendo assim, pode-se concluir que as memórias traumáti-
cas não ocasionam perda total da memória regular, mas a combinação de fragmentos
explícitos ou conscientes (declarativos) com fragmentos implícitos ou inconscientes
(não-declarativos) do trauma numa única categoria de memória (DIAMOND et al., 2006).
2.2.4 A lei de Yerkes-Dodson
Vários anos após as hipóteses acerca da influência da emoção na memória, (como
visto na seção 2.2.3), dois psicólogos americanos, Yerkes e Dodson, estudaram o
efeito do arousal emocional na eficiência comportamental em ratos durante tarefas de
discriminação visual com variados graus de dificuldade (YERKES; DODSON, 1908).
Na versão original de seu trabalho, Yerkes e Dodson (1908), mediram a rapidez com
que ratos eram capazes de discriminar entre duas caixas - preta e branca (e em ou-
tras ocasiões cinza) - em função da intensidade do choque elétrico punitivo que era
administrado quando o animal fazia uma escolha errada.
2.2 O Processo de formação da memória: a visão da neurociência 54
Yerkes e Dodson (1908) mostraram que quando os ratos eram treinados em tarefas
simples, isto é, distinguir a caixa preta da caixa branca, a taxa de aprendizagem me-
lhorava com o aumento da intensidade do choque elétrico. Por outro lado, quando os
ratos eram treinados com tarefas complexas, isto é, distinguir a caixa preta da caixa
cinza, a taxa de aprendizagem diminuía com o aumento da intensidade do choque
elétrico. Porém, a taxa de aprendizagem, em tarefas complexas, era mais eficiente
quando a intensidade do choque elétrico tinha um valor intermediário.
A partir de então, o resultado apurado por Yerkes e Dodson, passou a ser reconhecido
na literatura como a Lei de Yerkes-Dodson, o qual essencialmente mostra que uma
forte estimação pode reforçar a aprendizagem em uma tarefa simples e prejudicar a
aprendizagem em uma tarefa difícil, como foi proposto por eles:
an easily acquired habit may be readily formed under strong stimu-
lation, whereas a difficult habit may be acquired only under relatively
weak stimulation.
10
(YERKES; DODSON, 1908, p. 481)
A Figura 8 ilustra o relacionamento entre a taxa de aprendizagem e a intensidade do
choque elétr ico para tarefas com diferentes graus de dificuldade. A tarefa simples en-
volvia a distinção entre a cor clara e escura, e a tarefa difícil a distinção entre cores
parecidas. Como esperado, a relação entre a intensidade do choque elétrico e taxa
de aprendizagem é monotonicamente decrescente quando a tarefa de discriminação
é simples, e em forma de “U” quando a tarefa é complexa.
Vários pesquisadores, tais como: Postman, Broadhurst, Harlon apud Diamond et al.
(2006)
11 12 13
realizaram experimentos similares aos de Yerkes e Dodson (1908), e
também comprovaram que altos níveis arousal emocional prejudicam a eficiência com-
portamental em tarefas difíceis, mas não em tarefas fáceis. Porém, em condições in-
termediárias de emoção, o desempenho comportamental é melhor para a execução
de tarefas complexas, corroborando, assim, os achados de Yerkes e Dodson.
Segundo Diamond et al. (2006), durante a década de 50 os maiores expoentes da área
da psicologia cognitiva pareciam ter ignorado os achados de Yerkes e Dodson quando
afirmavam, sem nenhum resquício de dúvida, que o relacionamento entre o arousal
emocional e a eficiência comportamental era exclusivamente curvilíneo (em forma de
10
“um hábito adquirido facilmente pode ser prontamente formado sob for te estimulação, enquanto um
hábito difícil pode ser adquirido apenas sob excitação relativamente fraca. [Tradução livre da autora]
11
POSTMAN, L. The history and present status of the law of effect, Psychological Bulletin, vol.17,
pp.279-301, 1934.
12
BROADHURST, P.L. Emotionality and the Yerkes-Dodson law, Journal of Experimental Psychology,
vol.54, n.5, pp.345-352, 1957.
13
HARLOW, H.F. Mice, monkeys, men and motives, Psychological Review, vol.60, n.1, pp.23-32,
1959.
2.2 O Processo de formação da memória: a visão da neurociência 55
Discriminação difícil
Discriminação fácil
Aprendizagem
rápida
Aprendizagem
lenta
Intensidade do choque
Critério do teste
Figura 8: O tempo de aprendizagem em função da intensidade do choque elétrico
para tarefas com diferentes níveis de complexidade.
Fonte: Diamond et al. (2006) p.2.
“U” invertido). Por exemplo, Hebb (1955), em seu trabalho, postulou tal hipótese sem
sequer citar o trabalho de Yerkes e Dodson. Buck (1976), referenciando Hebb (1955),
também afirma (sem fazer qualquer citação ao trabalho de Yerkes e Dodson) que a efi-
ciência comportamental é relacionada ao arousal emocional por uma função em forma
de “U” invertido, como mostra a Figura 9. O que indica que a eficiência compor tamen-
tal é baixa em níveis baixos e muito altos de arousal, e é alta em níveis moderados de
arousal emocional.
Dada a proeminência científica de Hebb à época, ficou até muito recentemente esta-
belecida na literatura, sua peculiar proposição para a relação entre eficiência compor-
tamental e arousal emocional. Isso acarretou inúmeras controvérsias na literatura du-
rante esse tempo. Pois, se o lado direito da curva eficiência comportamental x arousal
emocional sempre declina, prejudicando a eficiência comportamental, como foi postu-
lado por Hebb (1955), então todas as formas de aprendizagem que ocorrem sob forte
impacto emocional estariam prejudicadas e apenas os aprendizados que ocorrem sob
baixo ou médio impacto emocional não seriam prejudicados. Porém, como discutido
na seção 2.2.3 isso não acontece dessa maneira, muito pelo contrário.
Levou algum tempo, mas a lei de Yerkes-Dodson passou a ser reconhecida e aceita
como que mais corretamente descreve essa relação entre eficiência comportamental
2.2 O Processo de formação da memória: a visão da neurociência 56
Figura 9: A hipótese equivocada de Hebb para a relação entre eficiência comporta-
mental e arousal emocional.
Adaptado de Diamond et al. (2006) p.3.
e arousal emocional. Diamond et al. (2006) fizeram uma extensa revisão de litera-
tura acerca desta controvérsia e elaborou uma interpretação coerente para a Lei de
Yerkes-Dodson, que encontra amplo respaldo nos resultados experimentais recentes,
como mostra a Figura 10.
Tarefa Simples
Atenção focada, memória
cinƟlante, condicionamento do medo.
Tarefa Complexa
Deterioração da atenção dividida, memória
de trabalho, tomada de decisão e mulƟtarefa
Fraca
Forte
Baixo Alto
Eficiência comportamental
Arousal Emocional
Figura 10: A interpretação de Diamond et al. (2006) para a Lei de Yerkes-Dodson.
Adaptado de Diamond et al. (2006) p.3.
A Figura 10 apresenta graficamente a essência da Lei de Yerkes-Dodson, tal como ela
foi proposta originalmente. Ela deve ser comparada à Figura 9, que apresenta a ver-
2.2 O Processo de formação da memória: a visão da neurociência 57
são de Hebb. Enquanto esta última mostra que os altos níveis de estresse, ansiedade
e estimulação prejudicam a eficiência comportamental, a versão original (vide Figura
10) prevê que o forte impacto emocional pode reforçar a eficiência comportamental
para casos que envolvem a realização de uma tarefa simples, tal como aquela que
envolve distingüir entre a caixa preta e a caixa branca. Por outro lado, prejudica o de-
sempenho quando a tarefa a ser executada é complexa, tal como entre a caixa preta
e a caixa cinza nos experimentos relatados por Diamond et al. (2006).
Como demonstrado por Diamond et al. (2006), caso o processo de formação das me-
mórias fosse compreendido apenas à luz da proposta de Hebb (1955), os seres hu-
manos seriam capazes de formar apenas memórias regulares que surgem sob arousal
emocional baixo ou mediano. Isto porque as memórias cintilantes ou traumáticas, que
requerem forte impacto emocional estariam localizadas no lado direito da curva de
eficiência comportamental x arousal emocional e, assim, não poderiam ser formadas.
Mas, ao contrário do que Hebb expôs, as memórias cintilantes não apenas se formam,
como ademais, são mais vívidas e duráveis que as memór ias regulares . Sendo as-
sim, somente a versão original da lei de Yerkes- Dodson pode justificar, de maneira
coerente, a formação tanto de memórias regulares quanto de memórias cintilantes e
traumáticas.
Como será discutido nos capítulos seguintes, este é um aspecto crucial para a mode-
lagem do processo de formação das memórias de longo-prazo, tanto regulares quanto
cintilantes, na arquitetura ARTÍFICE.
2.2.5 Principais áreas cerebrais envolvidas na formação das me-
mórias e suas correlações com a complexidade da tarefa
O córtex cerebral tem dois hemisférios simétricos que consistem em amplas lâminas
de neurônios dispostos em camadas. Ele está localizado sobre estruturas centrais,
incluindo parte do sistema límbico e núcleos da base. Segundo Gazzaniga, Ivry e
Mangnun (2006), o córtex cerebral corresponde à camada mais externa que envolve
o cérebro dos vertebrados, daí a palavra córtex que se origina do latim, significando
“casca”. É nessa estrutura cerebral que ocorre o processamento neuronal mais sofisti-
cado, e que torna os humanos seres mais evoluídos.
O córtex cerebral têm quatro divisões principais (ou lobos) que possuem diferentes
propriedades funcionais, e são conhecidas como: lobo frontal, parietal, occipital e
temporal, como mostra a Figura 11.
2.2 O Processo de formação da memória: a visão da neurociência 58
Figura 11: A divisão do córtex cerebral.
Adaptado de Gazzaniga, Ivry e Mangnun (2006) p.89.
O lobo frontal tem um papel importante no planejamento e na execução dos movimen-
tos. Ele pode ser subdividido em duas regiões principais: o córtex motor e o córtex
pré-frontal. O lobo parietal recebe aferências das regiões somatossensoriais e, por
esse motivo, está envolvido com a percepção das sensações, tais como: dor, tato,
temperatura e posição dos membros. O lobo occipital é responsável pelo “proces-
samento” da infor mação visual advinda do mundo exterior. o lobo temporal está
envolvido com o “processamento” da informação auditiva e com a formação da memó-
ria. Para maiores detalhes sobre a divisão do córtex cerebral e o papel de cada lobo,
ver, por exemplo, Gazzaniga, Ivry e Mangnun (2006).
O primeiro pesquisador a suger ir que alguns aspectos da memória poderiam ser con-
solidados nos lobos do córtex cerebral, mais precisamente no lobo temporal, foi o
neurocirurgião Wilder Penfield em 1938. Ele foi o precursor no tratamento da epilep-
sia, desenvolvendo uma técnica para remover o tecido epilético e diminuir o dano às
funções mentais. Durante a cirurgia ele aplicava estímulos elétricos no córtex dos
pacientes, e como esses permaneciam conscientes durante a cirurgia, eles eram ca-
pazes de relatar experiências passadas de suas vidas, ao mesmo tempo que Penfield
identificava as áreas cerebrais estimuladas. Como resultado, o neurocirurgião verifi-
cou que toda vez que o paciente trazia à tona uma experiência vivida no passado, a
área estimulada era sempre o lobo temporal. Diante disso, ele concluiu que o lobo
temporal é uma das principais estruturas relacionadas com a formação da memória
humana (KANDEL; SQUIRE, 2003).
2.2 O Processo de formação da memória: a visão da neurociência 59
Scoville e Milner apud Kandel e Squire (2003)
14
, estimulados pelo trabalho de Pen-
field, submeteram o paciente H.M. à cirurgia de remoção dos lobos temporais para
tratamento da epilepsia (c.f., vide a discussão na seção 2.2.2). Com esse experimento,
eles também obtiveram evidências diretas de que os lobos temporais têm participação
na memória humana. Scoville e Milner sintetizou seus resultados apurados em quatro
pontos:
1. a capacidade de adquirir novas memórias é uma função distinta de outras capaci-
dades e está localizada na porção medial do lobo temporal, uma região grande
do cérebro humano composto pela amígdala, hipocampo e o córtex entorrinal
(Figura 12);
2. o lobo temporal não desempenha nenhum tipo de atividade na memória de curta
duração. Segundo Kandel e Squire (2003), uma região importante e que está
ativa durante a permanência temporária de uma dada informação na memória
é o córtex pré-frontal. Patrícia Goldman-Rakic apud Kandel e Squire (2003)
15
afirmou que o córtex pré-frontal mantém as informações na memória de trabalho
para orientar comportamentos e processos de aprendizagem em andamento.
Sendo assim, pode-se concluir que o córtex pré-frontal, e não o córtex temporal,
funciona como um sistema neuronal, para receber uma informação e mantê-la
na memória por um curto espaço de tempo a fim de que uma pessoa consiga
gerenciar a realidade e executar várias tarefas ao mesmo tempo;
3. o lobo temporal não é o destino final da memória de longa duração, visto que
H.M. podia se lembrar de eventos de sua infância. Kandel e Squire (2003) acre-
ditam que a memória de longa duração seja consolidada no mesmo conjunto
de estruturas distribuídas que percebem, processam e analisam aquilo que é
recordado. Assim, poder-se-ia esperar que a memória para um objeto recém
reconhecido estaria distribuída entre o córtex temporal médio, lobo parietal e
outras áreas;
4. existia um tipo de conhecimento que H.M. podia aprender e se lembrar perfeita-
mente após a cirurgia. Ela comprovou isso realizando um experimento que se
tornou clássico, que foi ensinar H.M. a traçar o contorno de uma estrela de cinco
pontas. Ao longo de vários experimentos, Milner percebeu que a habilidade de
14
SCOVILLE, W.B. MILNER, B. Loss of recent memory after bilateral hippocampal lesions. Journal of
Neurology, Neurosurgery and Psychiatry, n.20, pp.11-21, 1957
15
GOLDMAN-RAKIC, P.S. Working Memory and mind. Scientific American, n.267, pp. 110-117, 1992
2.2 O Processo de formação da memória: a visão da neurociência 60
H.M. para tal atividade melhorava a cada dia, mesmo ele declarando jamais ter
feito isso. Com esse experimento ela concluiu que a memória não-declarativa de
H.M. estava intacta.
Córtex pré-frontal
Amígdala
Córtex visual
Medula
espinhal
Hipocampo
Tronco encefálico
Hipocampo
Córtex
entorrinal
Figura 12: O córtex cerebral e o lobo temporal médio.
Fonte: Kandel e Squire (2003) p.107.
É importante deixar claro que a formação da memória é um processo longo e du-
radouro que envolve várias áreas cerebrais e não somente as citadas no parágrafo
anterior. Dentre todas as estruturas cerebrais, três ocupam papel de destaque na
contextualização do presente trabalho, e elas são: o córtex pré-frontal, o hipocampo e
a amígdala. Alguns autores têm argumentando que essas áreas se correlacionam de
diversas maneiras com a complexidade da tarefa no momento da formação da memó-
ria.
De acordo com os achados de Diamond et al. (2006) uma tarefa é dita complexa
quando o córtex pré-frontal (e suas áreas correlacionadas) está envolvido na sua exe-
cução. A ativação do córtex pré-frontal (que, como foi dito, é responsável pelas
funções executivas) irá favorecer o funcionamento da memória de trabalho, que por
2.3 O processo de formação da memória: a visão da biologia molecular 61
sua vez permitirá a um indivíduo tomar decisões e dividir sua atenção em vários pon-
tos da situação ((NEBEL et al., 2005), (GOLDMAN-RAKIC, 1996), (BECHARA, 2004)). Ou
seja, a atividade cognitiva de alta ordem de um organismo depende da integridade do
córtex pré-frontal.
Em condições de alto arousal emocional, a execução da tarefa complexa não será
possível, pois como pre a lei de Yerkes-Dodson, a eficiência comportamental de um
indivíduo fica prejudicada nessas condições (rever Figura 10). Neste caso, a curva da
eficiência comportamental vs arousal é a curva em formato de “U” invertido.
Em contra partida, para Diamond et al. (2006), uma tarefa é classificada como sim-
ples quando ela envolve a atividade apenas da amígdala e do hipocampo, mas não do
córtex pré-frontal (DIAMOND et al., 2006). Sendo assim, durante a execução deste tipo
de tarefa, a memória de trabalho não irá atuar e o foco da atenção do indivíduo estará
voltado para um aspecto específico da situação. E sob alto arousal emocional, o de-
sempenho comportamental para realizar a tarefa simples sempre é favorecido (rever
Figura 10). Neste caso, a curva da eficiência comportamental vs arousal emocional é
a curva monotonicamente crescente.
Ainda que de forma simplificada esta seção procurou deixar claro quais as principais
áreas cerebrais envolvidas na formação da memória e sua correlação com o tipo de
tarefa executada por um indivíduo.
Este tema tornou-se um ponto de destaque no presente trabalho e os achados dos
principais autores aqui citados irão nortear seu desenvolvimento. Para uma discussão
mais detalhada sobre este tema reveja o trabalho de Diamond et al. (2006), o capítulo
3 do livro de Gazzaniga, Ivry e Mangnun (2006), os capítulos 5 e 6 do livro de Kandel
e Squire (2003) e o capítulo 2 do livro de Izquierdo (2002).
2.3 O processo de formação da memória: a visão da
biologia molecular
Um dos aspectos mais notáveis da capacidade humana é modificar seu comporta-
mento a partir do que foi aprendido. Kandel (2001) acredita que aprendizagem e
memória são processos cerebrais fascinantes porque eles referem-se a uma das ca-
racterísticas fundamentais da atividade humana: nossa habilidade de adquirir novos
conhecimentos e consolidá-los a todo tempo na memória.
A partir do momento que foi possível analisar, em nível celular, a aprendizagem e a
2.3 O processo de formação da memória: a visão da biologia molecular 62
memória, muitos pesquisadores começaram a investigar quais mudanças acontecem
no cérebro quando aprendemos algo (e quando algo é aprendido, como é que esse
aprendizado é consolidado). Muito foi descoberto, mas tudo isso é apenas o começo
de uma vasta área de pesquisa.
Um dos percursores pela busca de como e onde ocorre a consolidação da memória
foi Cajal apud Lynch (2004)
16
, que afirmou que as memórias resultam das alterações
morfológicas nas sinapses que as sustentam, e que essas alterações podem estar am-
plamente distribuídas no cérebro. Estudos posteriores demonstram claramente que
Cajal estava certo (LYNCH, 2004), (KANDEL; SQUIRE, 2003), (IZQUIERDO, 2002), (KAN-
DEL, 2001), (GODA; STEVENS, 1996), (STEVENS, 1998), (BLISS; COLLINGRIDGE, 1993),
(SILVA, 1994).
Desde então, enorme esforço tem sido feito para entender o mecanismo pelo qual o
fortalecimento das conexões sinápticas pode ser alcançado. Um importante modelo
eletrofisiológico ficou conhecido e ocupou papel de destaque nas pesquisas da biolo-
gia molecular. Este modelo é a Potenciação de Longo Prazo (ou simplesmente, LTP).
Nas seções seguintes veremos mais detalhes sobre esse fenômeno e sua influência
na dinâmica da formação das memórias autobiográficas cintilantes e regulares.
2.3.1 O fenômeno da plasticidade sináptica
É amplamente aceito na literatura atual da área que a formação da memória depende
de mudanças na eficiência sináptica que permitem o fortalecimento/enfraquecimento
das associações entre neurônios, como também afirma Lynch:
“... activity-dependent synaptic plasticity at appropriate synapses dur-
ing memory formation is believed to be both necessary and sufficient
for storage of information.
17
(LYNCH, 2004) p.90.
Em 1973, Tim Bliss e Terje Lomo apud Lynch (2004)
18
, baseados nas idéias de
Hebb
19
, fizeram uma notável descoberta. Sabedores das observações de Brenda
16
CAJAL, Y.R. Histologie du Systeme Nerveux de l’Homme et des Vertebras. Paris:Maloine, 1913
17
“...acredita-se que a plasticidade sináptica dependente da atividade de sinapses apropriadas du-
rante a formação da memória é condição necessária e suficiente para o armazenamento da memó-
ria.”[Tradução livre do autor]
18
BLISS T. V.; LOMO T. Long-lasting potentiation of synaptic transmission in the dentate area of the
anaesthetized rabbit following stimulation of the perforant path. Journal Physiology n.232, pp.331-356,
1973.
19
Donald Hebb corroborou as idéias de Cajal, afir mando que se dois neurônios são ativados ao
mesmo tempo, a sinapse entre eles será fortalecida.
2.3 O processo de formação da memória: a visão da biologia molecular 63
Milner sobre o papel do hipocampo e do lobo temporal médio na consolidação da me-
mória, eles tentaram verificar se as sinapses entre os neurônios dessa região cerebral
eram capazes de consolidar informação. Para examinar essa possibilidade, eles de-
senvolveram um exper imento propositalmente artificial.
Eles descobriram que um período breve de alta atividade elétrica, aplicada artificial-
mente em uma via hipocampal, produzia um aumento na eficiência sináptica, que
durava por horas. E quando repetida, poderia durar dias ou semanas. Esse fenômeno
ficou conhecido com facilitação de longo prazo, ou mais comumente, potenciação de
longa duração (LTP, o inglês Long-Term Potentiation).
Desde que a LTP foi caracterizada como um processo fisiológico que ocorre entre
neurônios de modo a fortalecer sua ligação sináptica, esse tipo de plasticidade siná-
ptica tem recebido muita atenção por parte dos pesquisadores. Muitos deles acredi-
tam que as alterações sinápticas que sustentam certas formas de memória e apren-
dizado podem ser similares àquelas que sustentam a expressão da LTP (LYNCH, 2004),
(KANDEL; SQUIRE, 2003), (SCHAFE et al., 2001), (EICHENBAUM, 1996), (STEVENS, 1998),
(SILVA, 1994).
Antes de discutir se o fenômeno da LTP pode ser considerado como um modelo do
processo de formação da memória, é necessário entender como ele ocorre em nível
molecular.
Segundo Kandel e Squire (2003), esse processo inicia quando sinais de freqüência
relativamente alta (que a literatura chama de “estimulação tetânica”) levam a uma mo-
dificação persistente da transmissão sináptica, que se revela por um aumento das
respostas dos neurônios, como mostra a Figura 13.
A Figura 13 apresenta um gráfico que foi extraído de um experimento, comumente re-
alizado na literatura. Uma série de estímulos elétricos é aplicada à via das colaterais
de Schaffer (uma região hipocampal) durante um segundo, numa frequencia 100 Hz
(estimulação tetânica), enquanto um microeletrodo registra os potenciais excitatórios
pós-sinápticos (PEPS). Como pode ser observada, após a estimulação os PEPS au-
mentam sua intensidade das conexões sinápticas entre os neurônios dessa região
hipocampal, durante mais de uma hora. Esse fenômeno é conhecido como LTP.
Ao estudar os mecanismos básicos da LTP, é possível descrever, ainda que de forma
resumida, esse processo ao nível molecular.
A célula pré-sináptica, ao receber o sinal despolarizante, altera seu potencial de re-
pouso e gera um sinal forte, chamado de potencial de ação. Esse sinal é capaz de
liberar um tipo específico de neurotransmissor, denominado glutamato. O glutamato
2.3 O processo de formação da memória: a visão da biologia molecular 64
Microeletrodo
Via das colaterais
de Schaffer (LTP
associativa)
Via das fibras
Musgosas (LTP
não-associativa)
Via perforante
Uma série de estímulos
PEPS (% do controle)
min
Estímulo
tetanizante
Figura 13: A estimulação tetânica na região hipocampal
Fonte: Kandel e Squire (2003), p.126.
liberado na fenda sináptica (“canal de comunicação“ estabelecido entre a célula pré-
sináptica e pós-sináptica) ativa dois tipos de receptores na célula pós-sináptica: um
especial, capaz de causar o influxo de cálcio na célula pós-sináptica, denominado
NMDA (N-metil-D-aspartato) e um convencional que, para facilitar o entendimento,
usualmente é denominado não-NMDA.
Durante a transmissão sináptica normal, isto é, nos processos onde não ocorre LTP,
apenas os receptores não-NMDA são ativados pelo glutamato, pois os receptores
NMDA estão bloqueados pelos íons de magnésio (Mg
+2
). Porém, quando o potencial
de ação é estimulado em alta freqüência (tétano) a célula pós-sináptica é despolari-
zada, de tal forma que os íons de Mg
+2
são expelidos, desbloqueando os receptores
NMDA. Como resultado ocorre a entrada dos íons de cálcio (Ca
+2
) para dentro da
célula pós-sináptica que provoca uma cascata de eventos químicos que são essenci-
ais para o estabelecimento da LTP. Entre esses processos se deve distinguir a ativação
das proteínas cinases e fosfatases que condicionam o estado de fosforilação de diver-
sas proteínas. A Figura 14 ilustra esse processo (KANDEL; SQUIRE, 2003).
Até aqui foi considerado apenas a plasticidade sob forma de LTP. No entanto deve-se
notar que a plasticidade sináptica não é expressa apenas por potenciação. Nos anos
posteriores à descoberta do LTP, foi descrita outra for ma de plasticidade sináptica de
“sinal” oposto, a chamada depressão de longo prazo (LTD, do inglês Long-Term De-
2.3 O processo de formação da memória: a visão da biologia molecular 65
Figura 14: A transmissão sináptica normal (de baixa freqüência) x a transmissão siná-
ptica de alta freqüência (que induz a LTP)
Fonte: Kandel e Squire (2003) p.128.
pression). Segundo Izquierdo (2002), a LTD consiste do enfraquecimento (ou inibição)
persistente de uma determinada resposta sináptica como conseqüência da estimu-
lação de baixa freqüência de uma via aferente.
A LTD pode ser induzida no hipocampo por uma forma de estimulação prolongada
com uma série de pulsos a baixa freqüência. uma corrente de pesquisadores
que defendem que a diminuição da atividade de certas sinapses, pelo mecanismo de
LTD pode ser o processo pelo qual o fenômeno do esquecimento se realiza (KANDEL;
SQUIRE, 2003), (IZQUIERDO, 2002).
Os mecanismos celulares da LTD não estão bem esclarecidos, embora a hipótese cor-
rente seja que esta forma de plasticidade sináptica depende também de um aumento
de cálcio intracelular, porém a um nível mais baixo que no caso da LTP. De acordo com
a hipótese de Lisman, proposta em 1989, um aumento de cálcio intracelular abaixo de
certo limiar levaria à indução da LTD, e acima desse limiar à LTP. (LISMAN, 1989)
Embora os fenômenos da LTP e LTD sejam interessantes por si mesmos, como forma
de plasticidade sináptica, a pergunta que neste contexto se impõe é se existe evidên-
cia experimental para concluir que esses fenômenos se assemelham com as modi-
ficações que ocorrem na circuitaria neuronal durante a aprendizagem e a formação
2.3 O processo de formação da memória: a visão da biologia molecular 66
da memória. A resposta é sim, existem argumentos experimentais para corroborar tal
hipótese.
A LTP apresenta três propriedades que são bem conhecidas na literatura: a associa-
tividade, a cooperatividade e a especificidade. A associatividade diz que uma sinapse
ativa pode disparar a LTP à medida que recebe um sinal forte, capaz de despolarizar
suficientemente a célula pós-sináptica e, por conseqüência, a célula pré-sináptica,
de tal forma que a atividade de tais neurônios (pré e pós-sinápticos) seja associ-
ada. a cooperatividade significa que a LTP depende da ativação de um grupo
de terminais sinápticos. E, por último, a especificidade indica que a LTP é restrita
às sinapses que foram estimuladas adequadamente, isto é, àquelas sinapses que
foram ativadas quando pareadas com neurônios despolarizados fortemente. Essas
propriedades também são essenciais para qualquer modelo de formação de memória
(LYNCH, 2004), (SCHAFE et al., 2001). Para maiores detalhes sobre essas três caracte-
rísticas da LTP, veja o trabalho de Bliss e Collingridge (1993).
Outra característica que a LTP apresenta, e que a faz ser identificada como a possível
base biológica de algumas formas de memória, seria a durabilidade de suas fases.
A memória pode ser diferenciada em memór ia de curto prazo, que persiste por pou-
cas horas, e memória de longo prazo, que persiste por períodos muito longos. Numa
perspectiva celular, a consolidação da memória de longo prazo está associada com
a síntese de proteínas e a formação de novas conexões sinápticas. Por outro lado,
existe a memória de curo prazo que é independe desses processos. Sendo assim,
existe uma correlação entre memória e LTP. A LTP, assim como a memória, consiste
de fases temporais distintas envolvendo diferentes mecanismos moleculares. A fase
breve da LTP (E-LTP, do inglês Early Long Term Potentiation) dura cerca de alguns
minutos ou horas e não depende da síntese de proteínas como a memória de curto
prazo. fase duradoura da LTP (L-LTP, do inglês Lasting Long Term Potentiation)
dura várias horas ou semanas e requer a síntese de proteínas como a memória de
longo prazo (LYNCH, 2004), (SCHAFE et al., 2001), (STEVENS, 1998).
Na literatura são conhecidos dois tipos de LTP: a LTP não-associativa e a LTP associa-
tiva. A LTP não-associativa depende apenas da atividade do neurônio pós-sináptico.
a LTP associativa requer a atividade concomitante, tanto do neurônio pré quanto
do pós-sináptico, de forma que o receptor NMDA esteja ativo (LYNCH, 2004), (EICHEN-
BAUM, 1996), (BLISS; COLLINGRIDGE, 1993). Muitos pesquisadores, como Lynch (2004),
acreditam, que o processo de formação da memória seja similar à LTP associativa,
pois depende da ativação dos receptores glutaminérgicos do tipo NMDA e também
2.3 O processo de formação da memória: a visão da biologia molecular 67
requer a ativação dos neurônios pré e pós-sinápticos.
Após a descoberta e caracterização dos mecanismos bioquímicos da LTP, Izquierdo
(2002), buscou verificar se esse fenômeno era igual ao da memória. Utilizando as
modernas técnicas de processamento de imagens cerebrais e os antigos estudos so-
bre áreas cerebrais com lesões, muitas pesquisas foram feitas e foi possível mensurar
bioquimicamente os processos subjacentes à consolidação da memória.
Os resultados dos experimentos comportamentais levaram Izquierdo a verificar que
muitos processos recém enumerados na formação da LTP intervêm também nos pro-
cessos da formação da memória. Porém, várias e importantes distinções entre
ambos que o permitiu concluir que eles não são idênticos, apesar de compartilharem
dos mesmos eventos bioquímicos e, às vezes, em seqüência parecida.
Diante de inúmeras características similares entre a LTP e a memória, é comum se
supor, frequentemente de modo implícito ou tácito, que o processo que sustenta as
modificações estruturais de determinadas sinapses no processo de formação das me-
mórias seja a LTP. Apesar de ser um fenômeno promissor como o mecanismo que
constitui a base da formação da memória, a LTP é um fenômeno de laboratório, in-
duzido de forma completamente artificial. Sendo assim, não se pode presumir que
esse processo reflita necessariamente o que acontece durante a aprendizagem e na
formação da memória. A similaridade entre ambos ainda não foi estabelecida e é
fortemente questionada pelos pesquisadores da memória. (IZQUIERDO, 2002)
2.3.2 Dinâmica Temporal da Formação das Memórias
Na seção 2.3.1 foi visto que a LTP é um fenômeno de laboratório, induzido de forma
artificial, e que compartilha inúmeras características com a memória. No entanto, foi
visto também que não é possível tomá-lo como um modelo do processo de formação
das memórias. Neste contexto uma questão pode ser proposta: o processo de for-
mação das memórias episódicas (ou autobiográficas) utiliza a LTP?
O primeiro teste para verificar essa questão foi realizado por Richard Morris e seus
colaboradores (MORRIS, 1984). Seu teste consistia basicamente em colocar um rato
para nadar em uma piscina circular para encontrar uma plataforma submersa e oculta
sob um líquido opaco. Na primeira tentativa o rato encontrará a plataforma por mero
acaso. Nas tentativas seguintes, o animal deve utilizar referências espaciais colocadas
nas paredes. Para utilizar essas referências, o rato necessita de sua memória espacial
2.3 O processo de formação da memória: a visão da biologia molecular 68
(a qual é considerada como uma memória episódica) e do seu hipocampo.
Para testar se a LTP é necessária para a tarefa espacial, Morris (1984) injetou no
hipocampo do rato um inibidor que bloqueia os receptores NMDA. Com a LTP hipocam-
pal bloqueada, os animais falhavam nessa tarefa espacial, o que levou alguns pesqui-
sadores, como Kandel e Squire (2003), a concluir que o hipocampo e alguns mecanis-
mos de plasticidade sináptica, tal como LTP, estão envolvidos no aprendizado espacial
e na memória episódica.
Além da LTP, outros pesquisadores, como LeDoux (2004), têm enfatizado a importân-
cia da emoção na memória. A questão que portanto se levanta no presente trabalho
é como a emoção influencia a LTP, e como esta relação atua na dinâmica temporal da
formação da memória.
Seguindo esta linha de pesquisa, Diamond et al. (2006) desenvolveram um modelo
para demonstrar como a LTP do hipocampo, amígdala e córtex pré-frontal se cor-
relacionam com a emoção durante o processo de formação da memória. Os resul-
tados encontrados por Diamond et al. (2006) indicam que a ativação da plasticidade
sináptica dessas regiões cerebrais é diretamente proporcional à intensidade (arousal)
emocional da situação vivenciada.
Até um valor intermediário de arousal emocional
20
, a LTP no hipocampo, amígdala
e córtex pré-frontal são estimulados, aumentando a intensidade com que as memó-
rias autobiográficas são formadas, e assim evocadas e reconsolidadas. Sob essas
condições é importante destacar o aumento de desempenho do córtex pré-frontal que
organiza e melhora sua capacidade de realizar funções executivas. Tal fato se ma-
nifesta, num nível macroscópico, numa crescente facilidade para a aprendizagem e
aumento da eficiência comportamental (efeitos visíveis das memórias autobiográficas
formadas e consolidadas utilizadas para guiar a seleção das ações mais adequadas
para determinada situação).
Por outro lado, acima desse valor, a intensidade (arousal) emocional contribui crescen-
temente para desorganizar a operação do córtex pré-frontal, prejudicando-o na reali-
zação dos processos executivos, via redução de sua capacidade em fazer LTP. Tal fato
se manifesta como uma diminuição crescente da capacidade de aprendizagem, que
é devida à diminuição progressiva da intensidade da memória autobiográfica regular
que está sendo forjada. A manifestação macroscópica desse fenômeno é a redução
da eficiência comportamental do organismo.
À medida que o arousal emocional aumenta e a LTP no córtex pré-frontal diminui
20
Na nossa hipótese esse valor é igual a metade do valor máximo do arousal emocional (7,0).
2.3 O processo de formação da memória: a visão da biologia molecular 69
esperava-se que o mesmo acontecesse com a LTP do hipocampo e da amígdala.
Porém, o que Diamond et al. (2006) verificou foi o contrário. Caso o arousal se en-
contre acima de um limiar crítico
21
, ele provoca uma mudança no padrão de LTP do
hipocampo, passando a funcionar do modo “regular” para o modo “cintilante”. Neste
modo de operação a LTP do córtex pré-frontal fica totalmente inibida durante certo
intervalo de tempo, enquanto o hipocampo e a amígdala têm, por seu turno, sua LTP
estimulada ao extremo, passando a registrar memórias autobiográficas cintilantes e/ou
traumáticas. A Figura 15 mostra como se esta dinâmica.
Figura 15: Dinâmica temporal de como o arousal emocional afeta a formação da me-
mória no hipocampo, amígdala e córtex pré-frontal
Adaptado de Diamond et al. (2006) p.10.
Sendo assim, uma experiência de forte impacto emocional produz uma intensa, porém
breve, ativação da LTP no hipocampo. Este processo implica em uma mudança de
funcionamento do hipocampo. Minutos depois de ser ativado pelo do alto arousal, o
hipocampo passa para fase 2, onde sua LTP é totalmente inibida, prejudicando a con-
solidação de qualquer evento que ocorra durante esta fase. Ao final, ele retorna ao
modo de funcionamento “regular” para tentar reconstruir uma versão detalhada desta
21
Na nossa hipótese, esse valor é definido como 90% do valor máximo do arousal.
2.4 Considerações finais 70
experiência. Por este motivo, informações consolidadas em período de experiências
de forte impacto emocional podem ser uma “representação” corrompida da experiên-
cia original.
Pode-se concluir, portanto, que a memória autobiográfica regular utiliza o córex pré-
frontal para registrar temporariamente as micro-exper iências emocionais (seqüência
de ações) que compõe uma experiência emocional com qualia, formando uma “rep-
resentação” completa da situação na memória de trabalho. a memória cintilante,
por ser registrada no hipocampo e na amígdala, faz uso apenas da memória imediata,
e por este motivo ela é constituída pela i-ésima ação (Micro-Experiência Emocional -
MME
i
) e pela ação imediatamente antecedente (MEE
i1
). Pelo fato do córtex pré-
frontal ser completamente inibido por um breve, porém variável, intervalo de tempo,
ocorrem “buracos” ou “falhas” na memória autobiográfica cintilante ((DIAMOND et al.,
2006), (NEISSER, 1997)).
2.4 Considerações finais
Descobrir os mecanismos do processo de formação da memória pode ser considerado
como um dos maiores desafios científicos do século XXI. Felizmente, tanto biólogos
quanto psicólogos, seja atuando em conjunto ou de forma separada, têm logrado pro-
gressos que colocam os pesquisadores em uma posição mais favorável para enfrentar
este desafio.
Como visto, a memória não é um lugar onde características dos objetos e coisas do
mundo são armazenadas. Memória é um processo (longo, por sinal) que envolve
várias áreas cerebrais e requer mudanças estruturais, nas células neuronais.
Ficou claro que a memória se origina das experiências de vida de um indivíduo, resul-
tantes do processo de aprendizagem. Ao ponto que não existe memória sem apren-
dizagem e aprendizagem sem memória, sem deixar de ressaltar nesta co-relação o
papel modulador da emoção.
No nível microscópico veio a compreensão de que a LTP de alguma forma participa do
processo de formação das memórias. Muitos pesquisadores concluem que este me-
canismo de plasticidade é um bom modelo microscópico da formação das memórias.
Embora haja fortes indícios de que esta conclusão seja uma verdade, ainda é muito
cedo para tomá-la como um paradigma. Além disso pesquisadores que questionam
seriamente este modelo. (IZQUIERDO, 2002)
2.4 Considerações finais 71
Estudando o papel da LTP no processo de formação das memórias, Diamond et al.
(2006), propuseram uma dinâmica de funcionamento para o processo de formação
de memórias. A partir de seus estudos foi possível concluir que independentemente
do tipo da tarefa desempenhada por um indivíduo é possível formar tanto memórias
regulares quanto memórias sob forte impacto emocional (memórias cintilantes). No
caso das memórias cintilantes, o grau de complexidade da tarefa irá definir as par-
ticularidades deste processo, como é o caso das memórias cintilantes oriundas de
tarefas simples (neste caso, essas memórias são provenientes dos mecanismos de
condicionamento clássico ou instrumental).
Como foi discutido, memórias de experiências com baixo grau de complexidade são
distintas de memórias de experiências com alto grau de complexidade. Assim, uma
quetão importante refere-se ao conceito de complexidade de uma experiência. No
ponto de vista da psicologia, tal conceito é francamente definido, ficando muitas vezes
subentendido o seu significado. Porém, usualmente uma tarefa simples envolve uma
escolha discricionária entre duas (ou algumas poucas) opções bem distintas entre si
(no caso das experiências com os ratos, eles tinham que distinguir uma figura preta e
outra branca), enquanto uma tarefa é considerada complexa quando a distinção não
é tão clara (no caso dos ratos, distinguir entre figuras pretas e cinzas).
a neurociência consegue dar uma resposta precisa a esta questão. O grau de
complexidade de uma tarefa ou experiência está diretamente associado ao nível de
ativação do córtex pré-frontal durante a realização de experiência. Quanto mais se re-
quer do córtex pré-frontal, mais complexa é a tarefa. Tal “definição” operacional é mais
ou menos intuitiva, visto que compete ao córtex pré-frontal a realização das funções
executivas (foco multiatencional, organização, planejamento, etc) e, quanto mais com-
plexa for uma tarefa, mais ela irá demandar desta área cerebral. com relação a exe-
cução de tarefas simples, outras áreas cerebrais são envolvidas (tais como, amígdala
e hipocampo) que, por sua vez, permitirá a execução de funções menos elaboradas,
como o foco atencional em um ponto específico da situação.
Para desenvolvimento do trabalho em questão, a neuropsicobiologia ofereceu uma
conceitualização viável para a construção de sistemas artificiais biologicamente inspi-
rados que estejam em conformidade com os princípios do fenômeno cognitivo situ-
ado. Através desta perspectiva foi possível estabelecer um ponto de partida baseado
no processo de formação das memórias declarativas, especificamente as memórias
autobiográficas regulares e cintilantes. Ainda que desenvolver um mecanismo de for-
mação de memórias autobiográficas não seja algo trivial, partiremos de uma abor-
2.4 Considerações finais 72
dagem bem simplificada a fim de conferir menor complexidade para a modelagem e
implementação propostas. Os detalhes e as abstrações de modelagem propostos se-
rão discutidos no capítulo 4.
Para melhor explorar o processo de formação das memórias autobiográficas em or-
ganismos artificiais, no capítulo 3 serão discutidas algumas arquiteturas que também
tiveram este tema como objeto de pesquisa.
73
3 Algumas arquiteturas
computacionais que envolvem o
processo de formação de
memórias experienciais
O conhecimento adquirido ao longo de experiências passadas, quando utilizado nas
situações atuais, torna o processo de tomada de decisão eficaz, pois permite recordar
o resultado de eventos ou situações similares que foram experimentadas no passado.
Como visto no capítulo 2, esse tipo de conhecimento é denominado de conhecimento
episódico e é registrado na memória episódica. Vários pesquisadores, com o intuito
de construir organismos artificiais ditos inteligentes, tentam modelar e desenvolver
processos que permitem que eles sejam capazes de consolidar e utilizar experiências
passadas para se adaptar mais rapidamente às novas situações do ambiente. Ainda
que a criação de um mecanismo de formação de memória episódica não seja algo
trivial de se desenvolver, algumas arquiteturas tais como: ARS
1
, SOAR
2
e ISAC
3
,
voltadas para o desenvolvimento de aplicações de engenharia, mesmo que de forma
mais simples, vêem obtendo bons resultados com relação a esse objetivo. Nas seções
seguintes, estes e outros trabalhos relacionados serão discutidos criticamente.
3.1 A memória experiencial da arquitetura ARS
A arquitetura ARS foi proposta por Russ(2003) e Pratal e Palensky(2005) apud Deutsch
et al. (2008), com o objetivo de criar novas abordagens para a construção de sistemas
autônomos. Ela é formada por duas partes principais: o módulo de psicanálises (ARS-
1
do inglês, Artificial Recognition System
2
do inglês, States, Operators And Reasoning.
3
do inglês, Intelligent Soft Arm Control.
3.1 A memória experiencial da arquitetura ARS 74
PA) e o módulo de percepção (ARS-PC). O módulo ARS-PA é uma abordagem inter-
disciplinar para tomada de decisão, onde são utilizados conceitos da neuro-psicanálise,
neurologia e psicologia, como: drives, emoção, desejos, ego, superego, para guiar a
tomada de decisão da arquitetura. Para facilitar esse processo, Deutsch et al. (2008)
introduziram a formação de memórias episódicas. Dessa forma, utilizando o resul-
tado de situações passadas, esse módulo será capaz de adaptar suas estratégias e
alcançar seus objetivos mais rapidamente.
o módulo ARS-PC é composto de uma unidade sensora que recupera as ima-
gens percebidas pelo agente. Cada uma das imagens percebidas é comparada com
imagens-modelo que descrevem uma situação num processo de matching. O resul-
tado da comparação indica a probabilidade de uma imagem-modelo (situação) ser
percebida e usada durante a tomada de decisão. Esse módulo também é capaz de
detectar vários cenários, que, nesse caso, são considerados seqüências de estados
que descrevem o agente em um dado momento. A transição entre dois estados é
disparada quando uma imagem percebida pelo agente é muito parecida com uma
imagem-modelo. Quando essa combinação acontece, um episódio é iniciado.
Durante um episódio vários eventos podem ocorrer. O fim do episódio acontece
quando novamente a imagem percebida pelo agente é combinada com uma imagem-
modelo que, por sua vez, também indicará o início de outro episódio. A Figura 16
mostra a correlação entre um cenário e um episódio utilizado pelo módulo ARS-PC.
Cenário A
Episódio 1
Estado 1 Estado 2 Estado 3
Evento 1
Evento 2
Evento 3 Evento 4
Combinação
Combinação
Figura 16: Cenário e Episódio da arquitetura ARS.
Adaptado de Deutsch et al. (2008), p. 3.
O cenário A consiste de três estados e a combinação de duas imagens percebidas
com as imagens modelos. O episódio 1 inicia com a primeira combinação encontrada,
onde ocorre o evento 1. Esse evento, por sua vez, dispara a percepção do evento 2.
Logo em seguida, o evento 2 dispara o evento 3. Finalmente o evento 4 é percebido
3.1 A memória experiencial da arquitetura ARS 75
e o episódio é finalizado como resultado da segunda combinação encontrada, o que
marca também o início do estado 3. Nesse exemplo o episódio foi composto de 4
eventos consecutivos.
O sistema de memória episódica proposto por Deutsch et al. (2008) atuará nos even-
tos percebidos pelo agente durante um episódio, codificando, armazenando e os evo-
cando quando necessário. De acordo com a modelagem proposta, nem todo evento
percebido será codificado e armazenado, mas somente aqueles cuja saliência estiver
acima de um limiar.
A saliência de um evento representa a importância desse evento para o agente e é
composta por vários elementos, tais como: taxa de combinação das imagens (isto
é, a quantidade de objetos de uma imagem percebida que é semelhante aos objetos
da imagem-modelo), o estado emocional do agente (por exemplo, as necessidades
corpóreas do agente naquele momento), a ação executada, etc.. Para determinar a
saliência de um evento, todos esses elementos são agrupados e é selecionado o maior
valor de cada variável considerada. Em seguida, o valor encontrado é multiplicado por
um coeficiente, e é esse resultado final que determina o grau de saliência do evento.
Desde o momento que um evento é armazenado na memória episódica, sua saliência
declina com o tempo. Por esse motivo os eventos tendem a serem esquecidos, tor-
nando difíceis de serem recuperados. Com essa idéia, pretendeu-se implementar o
fenômeno do esquecimento, que foi modelado como uma função exponencial decres-
cente, como pode ser visto na Figura 17.
Figura 17: Saliência emocional de um evento em função do tempo.
FONTE - Deutsch et al. (2008), p. 4.
Como pode ser observado, o nível de saliência (A
e
(t)) do evento no início (t=0) é
1. Antes do evento ser recuperado, a curva decai sem ser interrompida. Caso esse
evento seja recordado ele recupera parte de sua saliência (observe a descontinuidade
em A
e
(0) ).
Durante a fase da evocação da memória o evento atual é comparado com os eventos
3.1 A memória experiencial da arquitetura ARS 76
armazenados. A qualidade da comparação é determinada pelo número de objetos
semelhantes entre os dois eventos. Os eventos candidatos são ordenados a partir da
quantidade de elementos semelhantes encontrados. O evento escolhido será aquele
cuja quantidade de elementos semelhantes estiver acima de um limiar de evocação.
Assim, a ação escolhida para o momento atual é determinada com base nesse evento
de sucesso. A antecipação do resultado pode ser obtida analisando os eventos suces-
sivos ao evento de sucesso, uma vez que um evento pode pertencer a nenhum, um
ou a vários episódios.
Para avaliar o desempenho da memória episódica proposta, um ambiente de simu-
lação para robôs autônomos foi construído no software “Bubble Family Game” (DEUTSCH
et al., 2008). Nesse jogo os agentes devem explorar o ambiente em busca de fontes
de energia para manter-se em homeostase. Para tanto, o ambiente é construído com
obstáculos que podem ser triângulos, círculos ou retângulos. Diferentes tipos de ter-
renos, tais como desertos e pântanos influenciam o comportamento do agente e dife-
rentes tipos de fontes de energias podem ser criadas para satisfazer suas necessida-
des corpóreas.
O resultado das simulações mostrou que os agentes dotados de memória episódica
são positivamente afetados em uma variedade de reações. Segundo Deutsch et al.
(2008), durante 30 evocações da memória episódica, os agentes foram capazes de
antecipar 83% das situações corretamente e foram capazes também de prever o im-
pacto de certos comportamentos, o que melhorou o processo de tomada de decisão.
Assim, os autores concluíram que agentes que possuem memória episódica vivem
mais (uma média de 20%) do que os agentes sem memória.
3.1.1 Algumas considerações sobre o modelo proposto
Como se pode observar, o modelo da memória episódica proposta por Deutsch et
al. (2008) faz uso dos conceitos advindos da neuropsicanálise e psicologia, e.g.,
emoções, desejos, drives, ego, superego e outros. Para o processo de formação das
memórias experienciais foram consideradas as fases de codificação, consolidação,
evocação e esquecimento. Como visto também, o estado emocional do agente exerce
influência na fase de consolidação da memória episódica, mais precisamente, no cál-
culo da saliência do evento a ser consolidado. Quanto maior o grau de saliência de um
evento, mais chances ele terá de ser consolidado, mais tempo ele per manecerá na me-
3.1 A memória experiencial da arquitetura ARS 77
mória e maior, também, será suas chances de ser evocado no futuro. A evanescência
da memória episódica foi implementada pela curva de esquecimento que decai expo-
nencialmente com o passar do tempo.
Esse modelo possui muitas características em comum com o modelo proposto pelo
presente trabalho, como por exemplo:
Durante a formação da memória, e na escolha da ação, é possível verificar que
a emoção exerce forte influência nesse processo;
Todas as fases modeladas (consolidação, evocação e esquecimento) foram as
mesmas consideradas nesse trabalho, embora Deutsch et al. (2008) dêem des-
taque à fase de esquecimento;
Um episódio é formado a partir de vários eventos consecutivos que ocorrem num
determinado período de tempo.
Ainda que o processo de formação de memórias episódicas proposto por Deutsch et
al. (2008) tenha muitas semelhanças com o modelo proposto, pode-se citar também
algumas limitações observadas:
Como visto as emoções influenciam a formação da memória, porém aquelas
experiências ou eventos que ocorrem sob forte impacto emocional não são di-
ferenciadas das exper iências normais. Essa constatação pode ser observada
analisando a fase de esquecimento. Todo evento, independente das condições
sob a qual ele foi consolidado, começa com o valor de ativação (ou saliência)
igual a 1 que decai igualmente com o tempo. Como discutido no capítulo 2,
as memórias que se formam sob forte impacto emocional (memórias cintilantes)
permanecem períodos longos na memória, podendo durar a vida toda. Isso quer
dizer que essas memórias possuem uma taxa de evanescência muito inferior se
comparada à taxa de evanescência das memórias normais, o que não foi con-
templado nesse trabalho;
Outra limitação percebida foi com relação ao processo de formação da memória
em si. Em nenhum momento de seu trabalho, Deutsch et al. (2008) citam que
esse processo é intermediado por outros tipos de memórias. Sendo assim, não é
possível verificar, por exemplo, o papel desempenhado pela memória de trabalho
nesse processo.
3.2 A memória experiencial da arquitetura SOAR 78
A memória tal como implementada parece ser formada apenas por estímulos vi-
suais (imagens de cenários). A arquitetura não parece adequada para incorporar
em sua memórias estímulos não-visuais;
Por fim, e certamente mais relevante e fundamental, para funcionar a contento,
o sistema de formação de memórias requer necessariamente um conjunto de
imagens-modelos que serão comparadas com uma cena capturada pelo módulo
de percepção (e este é modelado pelo método de reconhecimento de padrões).
3.2 A memória experiencial da arquitetura SOAR
Nessa seção será discutido o trabalho de Nuxoll e Laird (2007), que apresenta um mo-
delo computacional para a formação de memória episódica (ou autobiográfica). Como
será visto nos parágrafos seguintes, o modelo da memória proposto é baseado nos
estágios funcionais da memória episódica humana proposto por Tulving (2002), que
são: codificação, consolidação e evocação. Para testar sua funcionalidade, o modelo
foi acoplado ao processo cognitivo da arquitetura SOAR.
A arquitetura SOAR foi proposta por Newell em 1990, com o objetivo de ser um mo-
delo cognitivo de propósito geral. Desde a sua idealização ela tem sido bastante
utilizada para modelar uma variedade de fenômenos. No que diz respeito ao seu fun-
cionamento geral, ela compartilha muitas características de outras arquiteturas, tais
como: ACT-R (Anderson e Lebiere apud Nuxoll e Laird (2007)
4
) e EPIC (Kieras and
Meyer apud Nuxoll e Laird ()
5
). Possui uma memória declarativa de curto prazo e uma
memória procedural de longo prazo. A versão da SOAR que Nuxoll e Laird (2007)
estenderam inclui uma memória declarativa de longo prazo. Com essa nova estru-
tura cognitiva os agentes instanciados nessa arquitetura seriam capazes de recordar
o resultado de experiências passadas para predizer o resultado de situações similares
no momento presente. A Figura 18 mostra um esquema de alto nível da arquitetura
SOAR e seu respectivo sistema de memória.
A memória procedural de longo prazo codifica o conhecimento sobre as habilidades
motoras através de regras. A memória declarativa de curto prazo é localizada na
memória de trabalho, que inclui estruturas geradas internamente durante comandos
motores e estruturas geradas a partir da ação de percepção. Quando as condições
4
ANDERSON, J. R.; LEBIERE, C. The Atomic Components of Thought. Mahwah, NJ: Lawrence
Erlbaum Associates, 1998.
5
KIERAS,D.; MEYER, D.E. An overview of the EPIC architecture for cognition and performance with
application to human-computer interation. Human-Computer Interaction, N.12, pp.391-438, 1997.
3.2 A memória experiencial da arquitetura SOAR 79
da memória de trabalho são satisfeitas, são criados novos elementos da memória de
trabalho. A ativação desses elementos foi baseada nos conceitos da arquitetura ACT-
R. Se o nível de ativação dos elementos da memória de trabalho está alto, ele será
testado e poderá ser importante para a memória episódica. A memória episódica cap-
tura automaticamente esses elementos e os armazenam como regras. Tudo que está
na memória de trabalho compõe o episódio, exceto os elementos que possuem baixa
ativação. Durante a escolha da ação, a memória episódica é questionada por oper-
adores, que utilizando um conjunto de regras, cr iam uma sugestão da situação atual
numa área específica da memória de trabalho. O episódio que melhor combina com
esta sugestão é evocado e colocado na área de evocação da memór ia de trabalho.
De forma geral, a integração da memória episódica de longo prazo, proposta por Nuxoll
e Laird (2007), com as demais memórias do sistema de memória da arquitetura SOAR
funciona como descrito no parágrafo anterior. Porém, inspirados nas proposições do
psicólogo Tulving (2002), os autores deste modelo de memória dividiram sua funcional-
idade em fases: codificação, armazenamento e evocação.
Durante a fase de codificação um elemento da memória de trabalho é codificado toda
vez que o agente executa uma ação. Nesse caso, um episódio consiste do estado
corrente do agente, o qual inclui o que foi percebido naquele instante, os comandos
motores selecionados, os dados de sua estr utura interna e o grau de ativação do ele-
mento. Como todas as características dos elementos da memória de trabalho são
Memórias de Longa Duração
Procedural Episódica
Sugestão Recuperado
Percepção Ação
Corpo
Decisão
Procedimento
Memória de Trabalho
Figura 18: Sistema de memória da arquitetura SOAR.
Adaptado de Nuxoll e Laird (2007), p. 2.
3.2 A memória experiencial da arquitetura SOAR 80
utilizadas durante a evocação, a sugestão da memória pode ser formada pela união
de todos os elementos que formam o episódio.
A fase de armazenamento é baseada em instâncias, onde é utilizada uma estrutura de
dados para armazenar referências dos elementos da memória de trabalho que com-
põem os episódios. Sendo assim, cada episódio consiste de uma lista de ponteiros
para cada elemento, formando uma árvore de dados. Por sua vez, cada elemento
possui uma lista indicando os episódios dos quais ele pertence, como mostra Figura
19. serão consolidados aqueles elementos da memória de trabalho que foram ati-
vados.
Árvore de Memória de Trabalho
Memórias
Episódicas
Instancias da memória
de trabalho
Figura 19: A árvore de elementos da memória de trabalho e da memória episódica.
Adaptado de Nuxoll e Laird (2007), p. 3.
A fase de evocação inicia quando uma sugestão é criada, que fica numa porção reser-
vada da memória de trabalho e pode incluir não apenas elementos que existem no
episódio recuperado, como também elementos que não existem. Portanto, dada uma
sugestão, ela é comparada com todos episódios. É selecionado o episódio que me-
lhor combina com a sugestão. O episódio eleito é recuperado e mantido em outra área
da memória de trabalho, ficando disponível para o agente se basear no momento da
tomada de decisão.
Para validar a modelagem proposta, várias experimentos foram executados em di-
versos ambientes. Um deles foi o executado no ambiente chamado TankSoar
6
. No
6
maiores detalhes sobre esta aplicação está disponívies em: http://sitemaker.umich.edu/soar/home.
3.2 A memória experiencial da arquitetura SOAR 81
TankSoar, o agente controla um tanque de guerra que se move num labirinto de duas
dimensões. Ele possui três recursos: mísseis, energia e saúde, os quais são empre-
gados pelas ações do tanque no mundo. Sem energia um tanque não se protege ou
ataca o inimigo. Sem mísseis, o tanque não pode atacar outro tanque, e sem saúde,
um tanque é destruído. O agente tem um objetivo pré-definido que é destruir outros
tanques no labirinto pelo disparo de mísseis enquanto evita os mísseis do inimigo.
A funcionalidade da memória episódica, na arquitetura SOAR, foi testada avaliando
se ela suportava diferentes capacidades cognitivas. Por exemplo, com a capacidade
de modelagem da ação um agente pode predizer os efeitos imediatos de sua ação
examinando o resultado de ações similares executadas no passado. Para validar essa
hipótese o experimento com TankSoar focou no problema de gerenciamento de ener-
gia. Um tanque usa seu eixo para sentir o ambiente imediatamente a sua frente. A
energia é gasta quando o radar é bloqueado por um obstáculo (por exemplo, uma
parede ou outro tanque). Durante o experimento foi observado que ao agente usava
sua memória episódica para prever o que ele verá quando girar em torno do seu radar
e usa esta infor mação para definir o melhor caminho a seguir. Os autores sustentam
que o agente aprende rapidamente a extrair boas definições das informações do seu
radar (a partir da sua memória episódica) e assim navega no labirinto com facilidade,
sem desperdiçar energia.
Outra habilidade testada foi a aprendizagem a partir de experiências de fracasso e
sucesso. Como visto, a modelagem da ação permite o agente prever o resultado de
uma ação. Entretanto, o sucesso em uma tarefa exige uma estratégia coerente com
múltiplas ações tomada em conjunto. Para testar essa habilidade cognitiva, o conhe-
cimento tático do agente no domínio do TankSoar foi substituído pelo uso da memó-
ria episódica durantes as decisões. Ao considerar uma ação específica, a memória
episódica do tanque é investigada para encontrar episódios, nos quais esta ação foi
executada. Foi observado que, durante a evocação da memória, aquelas memórias
que não levam o agente a decisões de sucesso são evitadas no futuro. Dessa forma,
evocando memórias adequadas, o agente aprendeu a prever ações do inimigo e a
evitá-lo quando está enviando mísseis.
Assim, pode-se concluir que em ambos testes, a memória episódica contribuiu para
a adaptação do agente ao ambiente, ajudando-o a escolher o melhor comportamento
frente a situações de tomada de decisão.
3.2 A memória experiencial da arquitetura SOAR 82
3.2.1 Algumas considerações sobre o modelo proposto
O modelo da memória episódica idealizado por Nuxoll e Laird (2007) é baseado nos
estágios de formação da memória propostos pelo psicólogo Tulving. Os episódios
são consolidados como elementos instantâneos da memór ia de trabalho, unidos por
um nível de ativação. Na evocação, o episódio que melhor combina com uma certa
sugestão é selecionado. Além da memória episódica, outros tipos de memória são
utilizados pela arquitetura SOAR, tais como a memória de trabalho e a memória pro-
cedural.
Ainda que as fases implementadas por esse modelo sejam semelhantes com as fases
implementadas neste trabalho de pesquisa, algumas limitações foram encontradas.
Uma importante fase do processo de formação da memória não foi contemplada, o
esquecimento. Esse falta impõe uma grande dificuldade, pois as memórias conso-
lidadas não mudam com o passar do tempo e o comportamento do agente tende
ser “sistemático”, sempre evocando as mesmas memórias nas mesmas situações es-
pecíficas, o que acarretará que, num ambiente com grande diversificação de objetos,
o agente possívelmente terá um comportamento “esquizóide”, tomando sempre as
mesmas decisões e jamais experimentando algo novo introduzido no ambiente. Outra
questão tem relação com o tipo estrutura utilizada para o armazenamento da memó-
ria. Estruturas lineares podem tornar a fase de evocação muito lenta ao pesquisar
pelos episódios, quando uma quantidade relativamente grande de elementos foi ar-
mazenada.
Outra limitação encontrada é com relação à ausência da emoção. Segundo Maturana
(2001), não nada que um indivíduo faça que não esteja imerso em um estado emo-
cional. Além disso, o capítulo 2 deixou bem claro o papel fundamental desempenhado
pela emoção, tanto na formação da memória quanto no próprio processo cognitivo.
Porém, em nenhum momento de seu trabalho, Nuxoll e Laird (2007) citaram que o
comportamento do agente fosse movido por uma emoção. Além do mais, eles não
ressaltam a influência das emoções no processo de formação das memórias episódi-
cas.
Por fim, a crítica que nos parece ser a mais fundamental, pois tem a ver com con-
cepção filosófica e questões de primeiros princípios. Esta arquitetura foi desenvolvida
sob a perspectiva do cognitivismo, que compreende a mente (e tudo que a ela se
relaciona) como um processador simbólico de representações internas de objetos e
eventos externos ao agente. Isso fica evidente pela própria linguagem empregada pe-
los autores, e.g., regras e elementos armazenados, etc.
3.3 A memória experiencial da arquitetura ISAC 83
3.3 A memória experiencial da arquitetura ISAC
Nessa seção será descrito o trabalho desenvolvido por Dodd e Gutierrez (2005). Trata-
se de um sistema de memória, com emoções, para a arquitetura cognitiva ISAC. Esta
arquitetura compõe o framework Intelligent Machine Architecture (IMA), um sistema
multi-agentes desenvolvido para promover o reuso do projeto. Como ilustra a Figura
20, a arquitetura ISAC é composta por agentes que trabalham juntos para produzir
comportamentos complexos. Seu sistema cognitivo interage com o mundo através de
atuadores, sistemas de voz e sistemas de exibição computacional, e recebe informa-
ções do mundo através de seus componentes sensores.
Ambiente Externo (pessoas, objetos, comandos, etc.)
Atuadores
Sensores
braço cabeça
Mão
Reconhecimento
de voz
Agente
Humano
Localização
Percepção
Gerenciamento
ESE
AEC
Auto
Agente
Simulador
MT
ESE
MCD MLD
MLD-MT
MS
MP
ME
Comportamento 1 .... Comportamento N
Comportamentos
MCD-MT
MP= Memória Procedural
MS= Memória Semântica
ME = Memória Episódica
AEC= Agente Executivo Central
ESE= Esfera Sensorial do Ego
Ambiente Externo (pessoas, objetos, comandos, etc.)
Atuadores
Sensores
braço cabeça
Mão
Reconhecimento
de voz
Agente
Humano
Localização
Percepção
Gerenciamento
ESE
AEC
Auto
Agente
Simulador
MT
ESE
MCD MLD
MLD-MT
MS
MP
ME
Comportamento 1 .... Comportamento N
Comportamentos
MCD-MT
MP= Memória Procedural
MS= Memória Semântica
ME = Memória Episódica
AEC= Agente Executivo Central
ESE= Esfera Sensorial do Ego
Figura 20: A arquitetura ISAC.
Adaptado de Dodd e Gutierrez (2005), p. 692.
O sistema de memória do ISAC é dividido em três classes: memória de curta duração
(MCD), memória de longa duração (MLD) e memória de trabalho (MT). A memória
de curta duração possui informações sobre o estado atual do ambiente, enquanto a
memória de longa duração possui comportamentos aprendidos (memória procedural -
MP), conhecimentos semânticos (memória semântica - MS) e experiências passadas
(memória episódica - ME). a memória de trabalho possui informações de tarefas
específicas que a memória de curta duração está gerenciando, informações recupe-
3.3 A memória experiencial da arquitetura ISAC 84
radas da memória de longa duração e a informação corrente do processo cognitivo
durante uma tarefa.
O raciocínio da ISAC é realizado por um agente composto (um agente composto con-
siste de vários agentes simples) chamado de auto-agente. O auto-agente é a localiza-
ção do sistema de planejamento, controle executivo, auto-monitoramento, seleção de
tarefa e outras funções atribuídas à cognição humana.
Um componente auto-agente chamado executivo central recupera informações da me-
mória de trabalho. A memória de trabalho monitora as necessidades do agente execu-
tivo central (AEC), o conteúdo dos demais sistemas de memória e a saída do sistema
de percepção para popular a memória de trabalho com os dados mais relevantes.
Cada tipo de memória possui um método específico para recuperar os dados da me-
mória de trabalho, que possui uma região específica e limitada para armazenar cada
tipo de dado, como mostra a Figura 21. A estrutura chamada esfera sensorial do ego
(ESE) possui informações da memória de curta duração e atua como uma memória
de curta duração para o robô.
Figura 21: Formação da memória episódica.
Adaptado de Dodd e Gutierrez (2005), p. 693.
Como um cérebro humano, a memória de longa duração armazena informações tais
como, habilidades aprendidas e experiências adquiridas que podem ser recuperadas
no futuro. A parte da memória de longa duração, denominada de memória proce-
3.3 A memória experiencial da arquitetura ISAC 85
dural, possui movimentos primitivos e comportamentos necessários para o bom de-
sempenho do robô. A memória semântica é uma estrutura de dados que armazena
informações de objetos no ambiente. Esse tipo de informação é importante para que
o sistema cognitivo possa raciocinar e planejar sobre objetos, objetivos e movimen-
tos. A memória episódica e a esfera sensorial do ego mantêm ligação com a memória
semântica para representar informações relevantes.
O sistema de memória episódica possui informações de experiências passadas e foi
essa estrutura, o foco de trabalho de Dodd e Gutierrez (2005). O objetivo do sistema
de memória episódica proposto é permitir que o processo cognitivo da arquitetura
ISAC selecione e execute novas ações com base em suas experiências passadas.
Para tanto, a memória episódica armazena o conteúdo da memória de trabalho. To-
dos os episódios serão consolidados, principalmente aqueles aos quais o sistema de
emoção do agente atribuir saliência. A duração do episódio na memória é diretamente
proporcional à saliência e sua taxa de decaimento.
Um episódio simples é definido como um período de tempo no qual o robô executa
uma tarefa enquanto mantém seu objetivo invariante. Como mostra a Figura 21, um
episódio além de conter elementos da memória de trabalho contém, também, o resul-
tado que o sistema de emoção do agente atribuiu para a tarefa, a ação executada e
seu objetivo.
O sistema de evocação da memória episódica tem o objetivo de popular automatica-
mente a memória de trabalho (nesse caso, sua área específica) com episódios corre-
tos para uma dada situação e usa um algoritmo específico para fazer a seleção. Os
episódios recuperados são aqueles que:
contêm mais elementos em comum com a situação corrente (sugestão);
foram recentemente acessados;
possuem alta saliência. O robô pode recuperar facilmente situações de extrema
recompensa ou punição, e pode recordá-las por muito tempo.
Os episódios recuperados são utilizados para gerar ações futuras através do sistema
de planejamento. Como o tamanho da área da memór ia de trabalho destinada para
os episódios recuperados é relativamente pequena, os episódios podem ser unidos
para escolher as ações de uma maneira tratável. Isto per mite ao sistema gerar planos
quando novos problemas forem encontrados.
Uma fase contemplada no modelo de Dodd e Gutierrez (2005) foi o esquecimento. A
3.3 A memória experiencial da arquitetura ISAC 86
toda memória consolidada é atribuído um valor de alfa (que é a história do compo-
nente e representa sua saliência emocional). As memórias armazenadas com baixo
coeficiente de alfa não são esquecidas tão rapidamente como aquelas com alto alfa.
Portanto, o valor de alfa é inversamente proporcional à relevância de uma determinada
memória. A Figura 22, mostra a função exponencial decrescente de esquecimento da
memória episódica.
Figura 22: Decaimento exponencial da saliência emocional, como função do número
de interações
FONTE - Dodd e Gutierrez (2005), p. 695.
Um experimento foi proposto para verificar se o robô utiliza seu sistema de memória
episódica para recordar experiências de forte impacto emocional. Em determinada
situação, na qual o robô executa uma tarefa simples - tal como localizar com suas
câmeras objetos (e/ou pessoas) que se movimentam em um quarto - uma pessoa
entra no quarto e grita “fogo”. O robô deve recuperar o episódio relacionado com a
situação corrente e assim retirar as pessoas da sala.
No primeiro momento, o robô deve utilizar sua memória para recuperar episódios que
tenham esta sugestão, que nesse caso é o estímulo “fogo”. O estímulo “fogo” repre-
senta uma pequena fração da memória episódica formada e sua raridade a torna mais
saliente que os demais constituintes da memória, pois a significância de uma unidade
da memória episódica decai à medida que ela é utilizada. Então o estímulo “fogo” é
reconhecido como algo de forte impacto emocional.
O experimento mostrou que o robô é capaz de dar atenção para ambos os tipos de
3.3 A memória experiencial da arquitetura ISAC 87
informação, uma novidade ou algo saliente. Se a sugestão da memória episódica
foi formada com baixa intensidade emocional, ela decai rapidamente com mostra a
Figura 22 e poderá não ser evocada. A informação emocional, entretanto, pode aju-
dar o robô a se lembrar tanto de uma informação recente que não é saliente, mas foi
recentemente formada, quanto a informação que foi formada num passado distante,
mas é de forte impacto emocional. Esta característica pode ser utilizada para localizar
um objeto visto recentemente ou recuperar informações importantes. Sendo assim, o
robô pode utilizar o episódio para mudar de meta para retirar todos os humanos do
quarto.
Os autores sustentam que este experiemento demonstrou que a memória episódica
modelada atua como o esperado e poderia ser acoplada ao sistema de planejamento
da arquitetura ISAC.
3.3.1 Algumas considerações sobre o modelo proposto
A memória episódia proposta por Dodd e Gutierrez (2005) é composta de várias
unidades semânticas que são consolidadas na memória em um formato indexado.
Emoções são usadas para dar uma significância particular para o episódio vivenciado.
No experimento executado, o robô mostrou recordar muito bem os episódios com forte
saliência emocional. Entretanto, verificou-se que os episódios que foram formados re-
centemente também possuem alta relevância para o robô.
Esse modelo, assim como o desenvolvido por Deutsch et al. (2008), também pos-
sui muitas semelhanças com a modelagem proposta por este trabalho de pesquisa.
Como ponto principal, pode-se destacar o papel desempenhado pelas emoções. As
memórias que possuem alta relevância emocional persistem por mais tempo na me-
mória. Outra semelhança é com relação à implementação do esquecimento, que é
relacionada com sua saliência emocional.
Um aspecto interessante deste modelo é com relação aos episódios recuperados.
Não apenas os episódios com alta relevância emocional são recordados, mas também
aqueles que foram formados recentemente. Entendemos que esta é uma caracterís-
tica importante, pois aumenta o leque de opções para o sistema de planejamento se
basear no momento da escolha da ação. E seu comportamento não será tão restrito.
Uma restrição com relação ao modelo é com relação ao ajuste da função de esqueci-
mento das memórias episódicas. Não se sabe ao certo se o modelo pre o reajuste
3.4 Considerações finais 88
da saliência emocional da memória, quando essa é evocada. Essa característica não
foi explicitamente informada no trabalho, levando os leitores a suporem que esta va-
riável é decrementada e, portanto, o modelo não contempla o reforço dinâmico de
memórias.
Assim como no modelo desenvolvido por Nuxoll e Laird (2007), esta arquitetura foi de-
senvolvida sob a perspectiva do cognitivismo, que compreende o sistema nervoso do
agente como um processador simbólico de representações internas de episódios ex-
ternos ao agente. Os autores empregam constantemente o termo “raciocínio”, porém,
entende-se que para funcionamento de um sistema de raciocínio é fundamental a con-
sciência, e parece que neste trabalho ela não foi prevista.
Por fim, o modelo mantém pouca plausibilidade biológica. Ao analisar o nome dos
componentes empregados para determinar o comportamento do agente, verifica-se
que nenhum deles compõem o sistema nervoso humano. A emoção contemplada
nada mais é do que um parâmetro cujo valor determina a intensidade emocional de
um episódio e, não um processo adaptativo que exerce forte influência no processo
cognitivo. Além do mais, o agente ao navegar no mundo artificial sempre tem um ob-
jetivo pré-definido. Porém, isto não acontece com os organismos vivos. Um animal
não tem objetivo, ele come porque ele está com fome (ou foge de um predador porque
está com medo) e não porque isto lhe foi previamente dito para fazer.
3.4 Considerações finais
Como pode ser claramente observado, os pesquisadores da área de IA têm buscado
incorporar vários conceitos do processo de formação das memórias na modelagem
do sistema cognitivo de seus agentes, para que esses possam de fato serem consi-
derados inteligentes. Em essência, a maioria deles reconhece esse processo como
imprescindível para a aprendizagem e a adaptação do agente. Apesar de poucos
terem a preocupação de construir esse modelo com respaldo biológico ou psicológico,
como é o caso da ARS e ARTÍFICE. Ao que parece, não estamos longe de possuir
um referencial teórico coerente e sólido para a criação de agentes artificiais dotados
de memórias.
Ao analisar os três tipos de memória modelados, percebe-se que a memória experien-
cial, isto é, a memória episódica, ocupa papel de destaque nas pesquisas, sem deixar
de levar em consideração que para seu perfeito funcionamento é de vital importância
que ela se correlacione com os demais tipos de memórias citados pela literatura. Isso
3.4 Considerações finais 89
nos leva a crer que estamos no caminho certo com relação ao nosso objetivo.
Com o trabalho de Deutsch et al. (2008) e Dodd e Gutierrez (2005), foi possível veri-
ficar que a emoção ocupa um papel importante no processo de formação das memó-
rias, corroborando com o que foi estudado no capítulo 2. Especificamente no trabalho
de Deutsch et al. (2008), foi possível observar que nem todas as experiências viven-
ciadas irão fazer parte da memória, mas somente aquelas que possuem relevância
emocional para o sistema.
Ainda em relação a ambos os trabalhos, observou-se que o valor emocional de uma
experiência é diretamente relacionado à sua durabilidade na memória episódica. Sendo
assim, quanto maior for o teor emocional de uma experiência, mais tempo ela tende
a permanecer na memória. A partir desse conceito, os dois autores implementaram a
curva de esquecimento, como uma função exponencial. Deutsch et al. (2008) ressalta-
ram em seu modelo o reajuste do teor emocional da memória, quando ela é evocada,
o que significa dizer que ele trata o fenômeno da reconsolidação da memória. Entre-
tanto Dodd e Gutierrez (2005) não lidam com este fenômeno da reconsolidação da
memória.
O trabalho de Nuxoll e Laird (2007) modelou explicitamente as fases que compõem o
processo de formação da memória: codificação, consolidação e a evocação.
Em linhas gerais, pode-se afirmar que o trabalho de Nuxoll e Laird (2007) e Dodd e
Gutierrez (2005) possuem propostas de trabalho baseados na abordagem cognitivista,
com representações de objetos/eventos e processamento simbólico sobre essas re-
presentações. Sendo assim, nenhum deles empregam conceitos da cognição situ-
ada. O termo emoção, quando existe, é um mero de modelo que não possui nenhuma
semelhança com um processo evolucionário de adaptação e regulação, como ocorre
de fato com as emoções.
o modelo contemplado por Deutsch et al. (2008) trabalha com a abordagem um
pouco mais embasada na bioloia neurociência, embora lancem mão de conceitos cog-
nitivistas ou psicanalíticos (ego, superego, etc). Um ponto negativo deste modelo é
com relação à sua arquitetura, que não é genérica e trabalha exclusivamente com re-
conhecimento de estímulos visuais. O sistema de memória contemplado é restrito a
memória episódica de longo prazo. Assim como o modelo de Nuxoll e Laird (2007) e
Dodd e Gutierrez (2005), este modelo também não implementou a formação de me-
mórias cintilantes.
Outro comentário se faz necessário com relação à dinâmica de funcionamento dos
modelos. Em todos os três trabalhos citados a dinâmica de interação do agente é de-
3.4 Considerações finais 90
terminística (semelhante a uma máquina de estado), o que é um ponto negativo, pois
nenhum organismo biológico funciona dessa maneira. Em contraposição, a dinâmica
de funcionamento da arquitetura ARTÍFICE é assíncrona e não-deterministica, sendo
impossível determinar quando e como um dado componente da arquitetura ARTÍFICE
entrará em ação, semelhante ao que ocorre com os organismos vivo.
Para validar o funcionamento da modelagem proposta, cada autor estabeleceu a pri-
ori alguns objetivos pré-dados para o agente. Em ambos modelos, os objetivos foram
alcançados e a memória episódica facilitou o processo de tomada de decisão e adap-
tação do agente numa situação específica.
91
4 Modelagem conceitual do
processo de formação de
memórias experienciais
Após revisar, no Capítulo 1, a dinâmica interacionista do processo cognitvo-emocional
da arquitetura ARTÍFICE proposta por Campos (2006) e seus mecanismos de apren-
dizagem associativa propostos por Silva (2008), neste capítulo será discutido o modelo
proposto para o processo de formação de memórias experienciais de longo prazo do
organismo ar tificial. Como será visto, esse modelo compreende as principais fases do
processo de formação de memórias dos seres vivos, destacando sua imbricação com
a aprendizagem e a emoção. O modelo proposto compreende, também, a for mação
de memórias cintilantes que podem ocorrer em momentos de alto nível de arousal
emocional. Toda experiência que o ASCS estabelecer com o ambiente, desde que
possua relevância emocional para o mesmo, passará a compor sua memória de longo
prazo e poderá permanecer um longo intervalo de tempo. Ela poderá ser evocada
durante a aprendizagem, proporcionando ao agente melhores condições de selecionar
suas ações e, por conseguinte, favorecendo sua adaptação ao ambiente. Ao final
desse processo, experiências mais eficazes sempre irão se formar, e permanecerão
vívidas na memória (ao contrário das experiências menos eficazes) e farão com que a
adaptação do agente ocorra de forma mais eficaz, com menos chances de fracasso.
4.1 Abstrações utilizadas na modelagem
A modelagem proposta pretendeu abstrair os principais conceitos do referencial teórico
utilizado no Capítulo 2. Um desses conceitos, que se mostrou fundamental diz respeito
à imbricação entre memória, aprendizagem e emoção.
4.1 Abstrações utilizadas na modelagem 92
4.1.1 As unidades elementares da memória e sua relação com o
equilíbrio corpóreo do ASCS
Como visto, a memória envolve um complexo mecanismo que abrange a consoli-
dação, evocação e o reforço/extinção das experiências provenientes do processo de
aprendizagem. Este mecanismo é extremamente útil para a adaptação de um orga-
nismo, pois este poderá utilizar suas experiências passadas de modo a favorecer sua
adaptação à situação atual. Ainda sob este contexto, foi destacado também o papel
modulador das emoções. As emoções são disposições para a ação que preparam
o organismo para lidar com uma nova situação, a fim de que ele restaure seu equi-
líbrio corpóreo
1
. Entende-se que a imbricação desses elementos inicia-se quando um
evento desencadeante, seja ele interno ou externo ao organismo, desregula seu sis-
tema emocional. Como forma de restaurá-lo, o organismo deverá interagir com os
objetos do seu ambiente. Esta experiência (episódica ou autobiográfica) passará a
compor sua memória e poderá vir a servir como guia de como ele deverá agir (ou não
agir) caso venha a vivenciar situações similares no futuro.
Tomando esta imbricação como ponto de partida, foi assumido como unidade elemen-
tar formadora da memória do ASCS, as experiências (nesse caso particular deno-
minadas de micro-experiências emocionais) que ele vivenciar e que contribuem para
restaurar seu equilíbrio corpóreo. Uma micro-experiência emocional (doravante, MEE)
corresponde a uma única ação do ASCS no ambiente que contribui para regular uma
emoção básica e que comporá uma experiência completa com Qualia
2
(doravante
ECQ). Sendo assim, uma ECQ corresponde a um conjunto de MEE, ou uma seqüên-
cia de ações realizadas, que regulam uma emoção complexa
3
.
Ainda em consonância com a literatura adotada (c.f., Buck (1976)) e mantendo a carac-
terística interacionista da arquitetura ARTÍFICE por meio da troca de estímulos, uma
questão chave surgiu: o que acontece no corpo de um organismo artificial e que serve
como referência imediata (marcadores somáticos, no sentido de Damasio (2003)) do
início e fim de um episódio emocional, ou mais precisamente, de uma MEE? Mantendo
1
Um organismo está em equilíbrio quando ele está em homeostase - que é a capacidade dos seres
vivos de regular o seu estado interno de modo a manter uma condição estável.
2
Segundo Bateson (1972), diz-se que uma experiência tem qualia quando ela possui qualidade
como um todo, sendo esta qualidade avaliada subjetivamente face a uma situação (contexto e estado
do organismo) e não no contexto.
3
Segundo Pankseep (1992), entendemos as emoções complexas como um tipo de combinação das
emoções básicas (sob o ponto de vista dos sistemas neurobiológicos) que conferem ao organismo
níveis mais elaborados de disposição corpórea para a ação. Para maiores detalhes sobre a classi-
ficação de emoções básicas e complexas rever os trabalhos de Pankseep (1992), Ortony (1990) e
Campos (2006).
4.1 Abstrações utilizadas na modelagem 93
em vista a plausibilidade biológica da arquitetura, foram introduzidos dois tipos de es-
tímulos, o estímulo simpático e parassimpático. Assim como ocorre nos organismos
vivos, o estímulo simpático é emitido por um orgão do corpo e recebido pelo sistema
nervoso central. Este estímulo marca somaticamente o instante em que o organismo
perde seu equilíbrio homeostático. De outro lado, o estímulo parassimpático é emitido
pelo sistema nervoso central e é recebido por um orgão do corpo, assinalando o mo-
mento em que o equilíbrio homeostático é reestabelecido.
Quando o ASCS receber um estímulo desencadeante, que pode vir do ambiente ou
até mesmo do próprio corpo, este estímulo é transduzido em um estímulo simpático
que, eventualmente, desregula o nível de arousal de uma emoção, seja ela básica ou
complexa. Deste momento em diante, o processo de auto-regulação se inicia, e é mar-
cado pela aprendizagem (aqui entendido como a escolha da ação que pode aumentar
ou diminuir o nível do arousal da emoção desregulada). Esse processo irá perdurar
até o momento em que o ASCS retorne ao seu estado de equilíbrio homeostático
ou até sua eventual morte caso ele não consiga restaurar seu equilíbrio corpóreo em
tempo hábil. O envio do estímulo parassimpático marca o fim da micro-experiência ou
da experiência completa propriamente dita.
Antes de uma MEE passar a compor uma experiência ou uma ECQ passar a compor
a memória de longo prazo
4
, ambas passarão por uma avaliação emocional. O agente
se mantém vivo à medida que interage com os objetos de seu ambiente e mantém
o arousal de suas emoções dentro de certos limiares. O processo descrito ao longo
deste e dos parágrafos anteriores é ilustrado pela Figura 23.
4.1.2 Algumas adaptações na arquitetura
Para incorporar os dois novos (e fundamentais) estímulos - simpático e parassimpático
- de modo integrado à arquitetura ARTÍFICE, foram necessárias algumas modificações
na versão anterior da arquitetura de Silva (2008): a inclusão do sistema autônomo na
arquitetura e a divisão de seu sistema nervoso em central e periférico, como mostra
a Figura 24. Como pode ser observado, todas as estruturas que sofreram algum tipo
de modificação estão destacadas das demais com a linha pontilhada. O sistema ner-
voso, que na versão anterior da arquitetura, era uma unidade simples, agora passou a
ser composto pelo sistema ner voso central e periférico. Das estruturas que compõem
4
Mais adiante, a formação e disposição de uma MEE e uma ECQ ficará mais clara.
4.1 Abstrações utilizadas na modelagem 94
Consolidação
Evocação
Reconsolidação
(reforço/extinção)
Modelo proposto:
Sub processos que compõem o preocesso de formação
da memória:
Estímulo SimpáƟco
Avaliação Completa
Avaliação emocional da experiência
Avaliação Completa
Avaliação emocional da experiência
Inicia processo de consolidação da memóriaInicia processo de consolidação da memória
Afeto
Causa perturbação em um
Afeto
Causa perturbação em um
Auto-Regulação
Inicia processo de auto-regulação
Auto-Regulação
Inicia processo de auto-regulação
Estímulo ParassimpáƟco
Finaliza processo de auto-regulação
Estímulo ParassimpáƟco
Finaliza processo de auto-regulação
Evocação
da memória
Evocação
da memória
Reconsolidação
da memória
Reconsolidação
da memória
Estímulo
Externo
Estímulo
Externo
AçãoAção
Estímulo
Interno
Estímulo
Interno
MEMÓRIA
Memória
de
Trabalho
Memória de
Longa
Duração
Memória de
Longa
Duração
Memória de
Curta
Duração
Estímulo
Interno
Estímulo
Interno
Figura 23: A correlação entre memória, aprendizagem e emoção modelada.
Mundo ArƟficial
ASCS
Sistema Nervoso
Sistema SomáƟco
Sistema Auxiliar
Sistema de
Persistência
Estrutura
Sistema Nervoso Central
Função Emocional
Tendências para ação
Arousal
Eficiência
comportamental
Avaliação Reflexo/instinto
Avaliação Parcial
Sistema Valoracional
Função CogniƟva
Avaliação Completa
Sistema
Periférico
Sistema
SimpáƟco
Sistema Sensório Motor
Superfície Sensória
Superfície Efetora
Sistema
Parassimpático
Affordance
Ação
Componentes
De SoŌware
Nutrientes
Pedras
Bolas
Abelhas
Memória
de
Trabalho
Memória
de Longo
Prazo
Memória
de Curta
Duração
Memória
Mundo ArƟficial
ASCS
Sistema Nervoso
Sistema SomáƟco
Sistema Auxiliar
Sistema de
Persistência
Estrutura
Sistema Nervoso Central
Função Emocional
Tendências para ação
Arousal
Eficiência
comportamental
Avaliação Reflexo/instinto
Avaliação Parcial
Sistema Valoracional
Função Emocional
Tendências para ação
Arousal
Eficiência
comportamental
Avaliação Reflexo/instinto
Avaliação Parcial
Sistema Valoracional
Função CogniƟva
Avaliação Completa
Função CogniƟva
Avaliação Completa
Sistema
Periférico
Sistema
SimpáƟco
Sistema Sensório Motor
Superfície Sensória
Superfície Efetora
Sistema
Parassimpático
Affordance
Ação
Componentes
De SoŌware
Nutrientes
Pedras
Bolas
Abelhas
Memória
de
Trabalho
Memória
de Longo
Prazo
Memória
de Curta
Duração
Memória
Memória
de
Trabalho
Memória
de Longo
Prazo
Memória
de Curta
Duração
Memória
de
Trabalho
Memória
de Longo
Prazo
Memória
de Curta
Duração
Memória
Figura 24: Diagrama em blocos da arquitetura ARTÍFICE.
Adaptado de Campos (2006), p. 78.
4.1 Abstrações utilizadas na modelagem 95
o sistema nervoso central, apenas o sistema de valoração e o sistema de memória
é que foram fortemente alterados para suportar o sistema de formação de memórias
modelado. O sistema periférico, na versão anterior da arquitetura, não fazia parte
do sistema nervoso e era composto pelo sistema sensório-motor. A partir deste tra-
balho, ele agora faz parte do sistema nervoso e contém o sistema autônomo (sistema
simpático e parassimpático). Outra alteração contemplada foi a criação do sistema
somático para fazer a adaptação do sistema sensório-motor. Basicamente as demais
estruturas eram contempladas no modelo e não sofreram alterações significativas.
Outra alteração feita foi a introdução de outro tipo de emoção, denominado de emoção
complexa. Este tipo de emoção é formada pela combinação das emoções básicas que
a arquitetura contemplava. Essa alteração foi importante, pois permitiu estabelecer
critérios mais elaborados de avaliação da experiência formada (no caso uma ECQ).
As emoções e suas combinações consideradas podem ser visualizadas na Tabela
1. Como pode ser observado, as duas emoções contempladas foram o estresse e
a apatia. No caso da emoção estresse, ela é formada pelas emoção básicas: fome
(hungry), sono (sleep) e dor (pain). Sendo seu nível de arousal diretamente propor-
cional ao arousal dessas emoções. Ou seja, quanto mais fome, sono e dor o agente
sentir mais estressado ele estará. a emoção apatia é formada pela combinação
das emoções básicas: tédio (tedium), sono (sleep) e dor (pain). Sendo seu nível de
arousal diretamente proporcional ao arousal da emoção tédio e sono, e inversamente
proporcional ao arousal da emoção dor. Ou seja, quanto mais entediado e sonolento
o agente estiver, mais apático ele estará. Porém, quanto mais dor o agente sentir
menos apático ele estará.
Emoção Complexa Emoção Básica
Reguladas por experiências completas
com qualia
Reguladas por micro-experiências
emocionais
Fome
Sono
Dor
Tédio
Sono
Dor
Estresse
Apatia
Tabela 1: Composição das emoções complexas modeladas e sua composição.
4.1 Abstrações utilizadas na modelagem 96
4.1.3 O processo de auto-regulação das emoções básicas e com-
plexas
Inspirado nos trabalhos de Buck (1999), Pankseep (1992) e Ortony (1990), consider-
amos que o processo de auto-regulação de uma emoção básica e uma emoção com-
plexa são diferentes entre si. Assim como as emoções básicas se unem para formar
as emoções complexas, as MEE, que regulam uma emoção básica, se unem para re-
gular as emoções complexas e, assim, formar uma ECQ. Para melhor esclarecer essa
regulação, consideremos o conjunto de emoções básicas que definem a emoção com-
plexa estresse (vide Tabela 1). Quando esta emoção complexa estiver desregulada,
quer dizer também que, pelo menos uma, duas ou todas as emoções básicas que
a constitui, também estarão desreguladas. Assim sendo, as micro-experiências que
regulam as emoções básicas fome, sono e dor, juntas irão compor uma ECQ que re-
gulará a emoção complexa estresse. A Figura 25 ilustra esquematicamente o quadro
recém descrito.
MEE1
FOME
MEE2
FOME
MEE3
SONO
MEE4
DOR
Experiência completa com qualia
ESTRESSE
ES1
EP1
ES2 ES3 ES4
EP2 EP3 EP4
ES - Estímulo Simpático
EP - Estímulo Parassimpático
MEE – Micro-Experiência Emocional
MEE1
FOME
MEE2
FOME
MEE3
SONO
MEE4
DOR
Experiência completa com qualia
ESTRESSE
ES1
EP1
ES2 ES3 ES4
EP2 EP3 EP4
ES - Estímulo Simpático
EP - Estímulo Parassimpático
MEE – Micro-Experiência Emocional
Figura 25: Composição de uma experiência com qualia a partir de micro-experiências
emocionais.
Na Figura 25 o envio do estímulo símpático ES1 marca o início da MEE1 que ocorre
sob a emoção básica fome bem como o início da ECQ para a emoção complexa
stresse. A MEE1 é finalizada com o envio de um estímulo parassimpático EP1. Ao
mesmo tempo que EP1 é enviado, outro estímulo simpático também é recebido - ES1,
que marca o início da MEE2, que também ocorre sob a emoção básica fome. A MEE2
4.1 Abstrações utilizadas na modelagem 97
é finalizada pelo envio do estímulo parassimpático EP2. Nesse mesmo instante, o
estímulo ES3 é recebido, marcando o início da MEE3. Esta micro-experiência ocorre
sob a emoção básica sono e é finalizada pelo envio do estímulo parassimpático EP3.
Paralelo ao envio de EP3, o estímulo simpático ES4 é recebido, marcando o inicío da
MME4 que ocorreu sob a emoção básica dor. Ao finalizar a MEE4 com o envio do
estímulo parassimpático EP4, tem-se também a regulação homeostática da emoção
complexa estresse, onde a ECQ também é finalizada pelo estímulo parassimpático
EP4.
Cabe observar, entretanto, que uma certa MEE (uma ação isolada do agente), pode
ser parte de várias ECQ (seqüência de ações com qualia) do agente, que o levam à
regulação homeostática. Por exemplo, considerando que a emoção complexa apatia
seja formada pelas emoções básicas: tédio (tedium), dor (pain) e sono (sleep) (tabela
1), sua regulação emocional poderia ocorrer pela correlação adequada de um con-
junto de MEE correspondente a essas emoções básicas. Por outro lado, uma corre-
lação distinta das mesmas MEE poderia vir a regular a emoção estresse. Como ilustra
a Figura 26, as micro-experiências MEE3 e MEE4 são, ao mesmo tempo, parte das
experiências completas com qualia que regulam o estresse e a apatia, embora con-
tribuam para esta regulação de forma distinta. Como pode ser visto, o recebimento
do estímulo simpático ES3, além de marcar o início da MEE3, marcará também o in-
íco da ECQ para a emoção complexa apatia. Sendo assim, MEE3 também passará
a compor esta exper iência. A mesma coisa ocorre com a MEE4. O fim da MME4 e
da experiência completa estresse é marcado pelo envio do estímulo parassimpático
EP4. Porém, neste mesmo intervalo de tempo, o estímulo simpático ES5 é recebido,
dando continuidade à formação da experiência completa apatia e marcando o início da
MEE5. A MEE5 ocorre sob a emoção básica tédio é finalizada pelo envio do estímulo
parassimpático EP5. Consecutivamente ao envio de EP5, o estímulo ES6 é recebido,
o que marca o início da MEE6 que ocorre sob a emoção dor. Em seguida o estí-
mulo parassimpático EP6 é recebido e a MEE6 é finalizada. Neste mesmo intervalo, a
emoção apatia é regulada e sua experiência completa com qualia também é finalizada
pelo envio de EP6. Nesse caso, formaram-se duas ECQ, uma sob a emoção estresse
e outra sob a emoção apatia. A ECQ referente a emoção estresse é composta pelas
MEE1, MEE2, MEE3 e MEE4, enquanto a ECQ referente a emoção apatia é formada
pelas MEE3, MEE4, MEE5, e MEE6, como ilustra a Figura 26.
4.1 Abstrações utilizadas na modelagem 98
MEE1
FOME
MEE2
FOME
MEE3
SONO
MEE4
DOR
Experiência completa com qualia
ESTRESSE
ES1
EP1
ES2 ES3 ES4
EP2 EP3 EP4
ES - Estímulo Simpático
EP - Estímulo Parassimpático
MEE - Micro-Experiência Emocional
MEE5
TÉDIO
MEE6
DOR
ES5 ES6
EP5 EP6
Experiência completa com qualia
APATIA
MEE1
FOME
MEE2
FOME
MEE3
SONO
MEE4
DOR
Experiência completa com qualia
ESTRESSE
ES1
EP1
ES2 ES3 ES4
EP2 EP3 EP4
ES - Estímulo Simpático
EP - Estímulo Parassimpático
MEE - Micro-Experiência Emocional
MEE5
TÉDIO
MEE6
DOR
ES5 ES6
EP5 EP6
Experiência completa com qualia
APATIA
Figura 26: Correlação entre micro-experiências emocionais e experiências completas
com qualia.
4.1.4 A modulação do compor tamento do ASCS e a lei de Yerkes-
Dodson
A modulação do comportamento do ASCS será baseada no conceito de eficiência
comportamental
5
, a ser calculada em função do arousal das emoções básicas e com-
plexas citadas nos parágrafos anteriores. Até os trabalhos de Campos (2006) e Silva
(2008) a arquitetura ARTÍFICE utilizava a proposta de Hebb (1955) para modelar a re-
lação entre a eficiência comportamental e o nível de arousal emocional. No entanto, a
partir da discussão do Capítulo 2, ficou evidente que deveria ser utilizada, em lugar da
lei de Hebb, a lei de Yerkes-Dodson (1908), conforme interpretada por Diamond et al.
(2006). Neste sentido, dependendo das áreas cerebrais ativadas no momento em que
o ASCS está desempenhando uma tarefa será utilizada uma das duas funções imple-
mentadas para o ajuste da eficiência comportamental em função do nível de arousal
emocional (c.f., Equações 4.1 e 4.2).
que se saber que na arquitetura ARTÍFICE tem-se memórias provenientes de
vários processo internos do ASCS que ocorrem mediante sua correlação com o am-
biente. Existe um tipo específico de memória que envolve a atuação de áreas sub-
corticais (hipocampo e amígdala), como é o caso das memórias provenientes dos
mecanismos de condicionamento clássico e instrumental. Neste caso, a capacidade
5
Segundo Campos (2006), a eficiência comportamental é entendida como uma configuração global
corpórea em um dado momento para a execução de uma ação.
4.1 Abstrações utilizadas na modelagem 99
do ASCS lidar com vár ios estímulos simultâneamente é severamente limitada. Em
contrapartida, outros tipos de memórias, provenientes de processos mais elabora-
dos, que para se formarem é necessário a atuação do córtex cerebral, como é o caso
das memórias autobigráficas regulares. Este tipo de memória envolve um processo
longo que, na maioria das vezes, requer ações executivas do ASCS (e, portanto, re-
querem o envolvimento do córtex) para guiar seu comportamento. A exceção fica por
conta das memórias cintilantes que em sua formação envolvem apenas as áreas sub-
corticais.
No que se refere à eficiência comportamental, a atuação do córtex cerebral durante a
formação da memória se reflete na capacidade do ASCS lidar com um ou mais obje-
tos do mundo ao mesmo tempo. Quanto maior o número de objetos em seu campo
sensorial, mais será requerido do córtex para proporcionar a seleção do foco aten-
cional. Sendo assim, se o ASCS interagir com nenhum ou um único objeto, a tarefa
requer mínima atuação do córtex e será, portanto, considerado para fins de modela-
gem como não requerendo o envolvimento do córtex. O que significa dizer que sua
eficiência comportamental será ajustada pela curva monotonicamente crescente 4.1.
Por outro lado, no caso do ASCS interagir com mais de um objeto, a tarefa irá requerer
maior atuação do córtex . Neste caso, a eficiência comportamental será ajustada a
partir da curva em forma de “U” invertido da lei de Yerkes-Dodson 4.2. Vale ressaltar
que em ambas situações serão formadas memórias autobiográficas regulares, salvo
com exceção das memórias autobiográficas cintilantes (maiores detalhes sobre a for-
mação deste tipo de memória será visto a seguir).
As equações para a eficiência comportamental (EC) em função de nível de arousal
emocional (A) associado a cada emoção são dadas por:
Caso a tarefa não requeira o envolvimento do córtex pré-frontal:
EC = {
100
18
A ; 0 < A < 0, 18;
16(1 e
0,4A
) ; 0, 18 A 7, 0;
(4.1)
Caso a tarefa requeira o envolvimento do córtex pré-frontal:
EC = {
100
18
A ; 0 < A < 0, 18;
40
49
A
2
+
280
49
A ; 0, 18 A 7, 0;
(4.2)
4.1 Abstrações utilizadas na modelagem 100
e são ilustradas na Figura 27.
Figura 27: Eficiência comportamental x nível de arousal emocional para uma emoção
específica. Modelo elaborado sob inspiração de Diamond et al. (2006) p.3.
A correlação entre arousal e eficiência comportamental para a tarefa que não requer a
atuação do córtex é modelada pela função monotonicamente crescente descrita pela
equação 4.1, onde o intervalo de variação do arousal é de 0 a 7 e o intervalo de vari-
ação da eficiência comportamental de 0 a 16. no caso de uma tarefa que requer a
atuação do córtex, a correlação entre arousal e eficiência comportamental é modelada
pela função em formato de “U” invertido descrita pela equação 4.2, onde o intervalo
de variação do arousal também é de 0 a 7 e o intervalo de variação da eficiência com-
portamental de 0 a 10.
No arousal das duas funções, o intervalo de 0 a 0,18 foi considerado, para fins de
modelo, como correspondendo ao sono profundo e de 0,18 a 7 o intervalo de vari-
ação dos valores do nível de arousal na condição de acordado. O intervalo de arousal
emocional 0,18 a 2 foi considerado como significando que o agente está em equilíbrio
homeostático e portanto, não requer nenhuma ação de auto-regulação por parte do
agente.
A modelagem adotada neste trabalho (vide Figura 27) deve ser confrontada com a
proposta da Lei Yerkes-Dodson, como mostrado na Figura 10, Capítulo 2.
4.1 Abstrações utilizadas na modelagem 101
4.1.5 Intensidade das memórias e sua relação com a valoração
emocional
Antes de falar propriamente da intensidade emocional das memórias, será citado uma
importante variável que influenciará seu cálculo. Esta variável é o grau de complexi-
dade de uma tarefa ou de uma MEE (i.e, uma ação isolada do agente no ambiente).
A complexidade de uma tarefa refere-se ao grau de dificuldade que o agente irá en-
frentar durante uma situação, e é proporcional ao número de objetos que com os
quais o ASCS deverá lidar em seu campo sensorial. É, assim, a medida do grau de
envolvimento do córtex para atividades executivas de planejamento, seleção do foco
atencional, tomada de decisão, dentre outras. Portanto, esta variável guarda relação
direta com o número de objetos presentes no campo sensorial do ASCS, ou seja, é
dado em função do número de estímulos “simultâneos” com os quais ele tem que lidar
num certo instante.
Para manter o respaldo biológico da arquitetura ARTÍFICE, buscou-se na literatura re-
ferências para modelar de forma coerente esta relação. Entretanto, não foi possível
identificar qualquer modelo para expressar a complexidade de uma tarefa, mas parece
razoável supor que a complexidade tem um valor de saturação, i.e, que ela não cresce
indefinidamente com o número de estímulos. Nesse sentido, para fins de modelagem,
tal relação foi expressa como uma função sublinear monotonicamente crescente do
número de estímulos, como mostra a Equação 4.3.
C
MEE
= C
sat
(1 e
Q5N
estim
) ; (4.3)
onde:
C
M EE
é o grau da complexidade da ação (ou da MEE);
N
estim
é o número (inteiro) de estímulos distintos advindos de objetos percebidos pelo
agente;
C
sat
é o valor de saturação da complexidade da tarefa;
Q
5
é um parâmetro de ajuste do modelo.
Por simplicidade, será assumido, sem perda de generalidade, que C
sat
=1, que equi-
vale dizer que C
MM E
varia entre 0 e 1. Quanto maior o número de objetos com os
4.1 Abstrações utilizadas na modelagem 102
quais o agente interage, maior será a complexidade da tarefa, até que ela alcance seu
limite de saturação. A Figura 28 mostra o comportamento de C
MM E
em função do
número de estímulos ambientais recebidos pelo agente num certo instante. A linha
contínua unindo os pontos serve apenas como guia para os olhos.
Grau de complexidade de uma tarefa
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
N_
esƟm
C_
MEE
Figura 28: Grau de complexidade de uma tarefa em função do número de estímulos
distintos recebidos pelo ASCS num certo instante.
Agora que foi visto como é cálculado o grau de complexidade de uma tarefa, a
atenção será voltada para o cálculo da intensidade emocional das memórias.
Nas versões anteriores da arquitetura ARTÍFICE, cada ação executada pelo agente,
i.e, cada MEE, era valorada emocionalmente de modo que, numa dada situação, o
agente teria maior probabilidade de selecionar ações mais adequadas. Tal modelo foi
mantido na versão atual da arquitetura, entretanto, ele foi estendido para incluir a val-
oração emocional de uma seqüência de MEE, que são exatamente as ECQ que dão
origem às memórias regulares de longo prazo.
Como foi visto no Capítulo 2, as memórias têm forte relação com as emoções, de modo
que memórias de experiências vividas sob forte impacto emocional têm maior proba-
bilidade de serem evocadas e, sendo evocadas, têm maior probabilidade de servirem
de “guia” para a seleção da ação a ser desempenhada. Quanto mais uma memória
for evocada, mais reforçada ela será, e portanto, mais tempo ela permanecerá na me-
mória de longo prazo do ASCS. O contrário também é uma verdade. Quanto menos a
experiência for evocada, mais inibida ela será e, portanto, menor será o tempo que ela
permanecerá na memória de longo prazo do ASCS (origem do fenômeno do esque-
cimento). O processo de extinção de uma memória é um processo passivo e natural
que ocorre ao longo de toda vida do ASCS. Isso significa que todas as memórias se-
4.1 Abstrações utilizadas na modelagem 103
rão inexoravelmente extintas a menos que elas sejam evocadas e, assim sendo, elas
serão momentaneamente reforçadas (num processo ativo).
Neste trabalho, a valoração emocional da experiência, aqui denominada de Intensi-
dade da Memória Regular (IMR), foi modelada sob inspiração dos mecanismos mi-
croscópicos biológicos da LTP e LTD (vide seção 2.3.1). Nesta perspectiva, esta var i-
ável foi modelada de acordo com as expressões:
IMR
i
= IMR
i1
+ IMR ; (4.4)
Sendo:
IMR = P
mr
(IMR
sat
IMR
i1
) ; (4.5)
Ou escrito de outra forma:
IMR
i
= (1 P
mr
) IMR
i1
+ P
mr
IMR
sat
; (4.6)
onde:
IMR
i
é a intensidade da memória autobiográfica regular na i-ésima vez que a memória
é evocada (e não-evocada);
IMR
sat
é o valor de saturação, máximo ou mínimo, que a intensidade da memória
regular pode assumir para determinada experiência completa com qualia;
P
mr
é o potencial normalizado para a consolidação da memória regular associado a
um episódio emocional completo (i.e., uma ECQ) . Tem a ver com a capacidade
do sistema CAH
6
realizar LTP, a que é prejudicada (diminuída) quando se tem
valores baixos ou altos de arousal.
Tem-se ainda que:
P
mr
P
mr
(
¯
A) = Q
1
{1 e
Q
2
(
¯
A
¯
A
2
)
} 0 P
mr
1; (4.7)
IMR
sat
IMR
sat
(
¯
C
ECQ
) = Q
3
e
Q
4
(
¯
C
ECQ
)
; (4.8)
6
Sistema CAH é a denominação dada à região cerebral composta pelo córtex pré-frontal, amígdala
e hipocampo.
4.1 Abstrações utilizadas na modelagem 104
Sendo a Complexidade Média de uma ECQ é dada por:
¯
C
ECQ
=
N
k=1
C
MEE,j
N
0
¯
C
ECQ
1; (4.9)
e o Arousal Médio Normalizado durante uma ECQ:
¯
A =
M
k=1
A
k
/A
max
M
0
¯
A 1; (4.10)
As equações modeladas foram submetidas a diversas testes de laboratório para veri-
ficar se o comportamento modelado por cada uma delas está de acordo com o que foi
visto na literatura. A partir dos resultados apurados, pode-se afirmar que os valores
que melhor se ajustaram nas equações são os que se seguem na Tabela 2.
Aquisição da
memória
Extinção da
memória
Q1
1.5 1.5
Q2
4.0 4.0
Q3
3.0 3.0
Q4
13.2 10.0
Q5
0.1 0.1
Tabela 2: Parâmetros constantes de ajuste do modelo. Cujos valores foram definidos
a partir de simulações computacionais.
No presente trabalho, assim que uma memória for consolidada, ela estará disponível
para ser evocada e auxiliar no momento da escolha da ação. É a partir das memórias
evocadas que o ASCS irá calcular sua expectativa de interação com os objetos do
seu ambiente. De acordo com as equações modeladas, cada vez que uma memória
for evocada, ela deverá ser reconsolidada, independentemente de ter sido utilizada ou
não na escolha da ação. Assim, a reconsolidação envolve o recálculo da IMR, o que
poderá reforçar ou inibir uma memória.
As equações que definem a IMR foram modeladas para refletir o trabalho de Diamond
et al. (2006), que correlacionou a capacidade de ocorrência de LTP em três impor-
tantes áreas cerebrais (área CAH) com o arousal emocional [rever seção 2.3.2]. A
partir do trabalho de Diamond et al. (2006) entende-se que até um valor intermediário
de arousal (a hipótese para o presente trabalho é de que este valor seja A <= 3,5),
4.1 Abstrações utilizadas na modelagem 105
o arousal emocional contribui para que o córtex pré-frontal melhore sua capacidade
executiva. Assim, ele o faz via aumento do foco atencional (diminuição dos estímulos
recebidos), o que é refletido na melhora da eficiência comportamental do indivíduo
durante as interações. Por outro lado, acima desse valor intermediário de arousal
(ou seja, A > 3,5), o arousal emocional desorganiza a operação do córtex pré-frontal,
prejudicando-o na realização das atividades executivas, via redução da capacidade do
córtex realizar a LTP. Tal fato se manifesta na redução da eficiência comportamental
do indivíduo. À medida que o arousal emocional aumenta, a capacidade de realização
de LTP no córtex pré-frontal diminui enquanto a capacidade de realização de LTP no
hipocampo e na amígdala aumenta. Ou seja, o arousal alto prejudica diretamente a
atuação do córtex pré-frontal e favorece a atuação do hipocampo e amígdala. Neste
sentido, caso o arousal se encontre acima de um limiar crítico (a hipótese para o pre-
sente trabalho é de que este limiar seja A > 6,3), ele provoca uma mudança no padrão
de LTP do córtex, hipocampo e da amígdala passando do modo “regular” para o modo
“cintilante”. Sendo assim, a LTP do córtex pré-frontal é totalmente inibida por um breve
intervalo de tempo, enquanto a LTP do hipocampo e da amígdala é estimulada ao ex-
tremo, registrando memórias cintilantes.
Vale ressaltar que as equações apresentadas anteriormente tratam apenas do cál-
culo da intensidade emocional das memórias regulares. O cálculo da intensidade
emocional de memór ias cintilantes, por ser tratar de um evento atípico singular, foi
contemplado separadamente. Mais adiante, ele será discutido em detalhes.
O comportamento da IMR, resultante das equações modeladas por este trabalho,
pode ser observado nas Figuras 29 e 30. Na Figura 29 pode-se observar a in-
tensidade emocional de 6 memórias regulares ao longo de 5 situações distintas du-
rante o processo de aquisição e na Figura 30 as mesmas memórias (sob as mesmas
condições) durante o processo de extinção. Em cada gráfico, o eixo Y representa a in-
tensidade da regular, enquanto o eixo X representa o número de interações nas quais
as memórias foram evocadas (ou não). O N
Est
representa o número de estímulos para
situação.
Os resultados apresentados na Figura 29 estão de acordo com os achados de Dia-
mond et al. (2006). Como pode ser observado, até níveis medianos de arousal emo-
cional, quanto menor o número de estímulos de uma interação, mais rapidamente
altos índices de intensidade emocional são alcançado pelas memórias. Observando
o gráfico (A), percebe-se que sob o arousal de 0,05 e apenas 1 estímulo a memória
levou aproximadamente 14 interações para atingir o limiar de saturação da intensidade
4.1 Abstrações utilizadas na modelagem 106
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
Intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(A)
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
Intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(B)
Aurosal igual a 0.05 do valor máximo
Aurosal igual a 0.2 do valor máximo
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(C)
Aurosal igual a 0.5 do valor máximo
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
Intensidade emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(D)
Aurosal igual a 0.8 do valor máximo
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
Intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(E)
Aurosal igual a 0.9 do valor máximo
Figura 29: Intensidade Emocional da Memória Regular (IMR) durante o processo de
aquisição da memória, sob condições distintas de arousal e de estímulos recebidos
em função do número de interações do ASCS no ambiente.
4.1 Abstrações utilizadas na modelagem 107
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
Intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(B)
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
Intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(C)
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interões
Intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(D)
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
Intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(E)
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
8,0
9,0
10,0
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Interações
Intensidade Emocional
N_Est = 1
N_Est = 2
N_Est = 3
N_Est = 4
N_Est = 8
N_Est = 16
(A)
Aurosal igual a 0.05 do valor máximo
Aurosal igual a 0.2 do valor máximo
Aurosal igual a 0.5 do valor máximo
Aurosal igual a 0.8 do valor máximo
Aurosal igual a 0.9 do valor máximo
Figura 30: Intensidade Emocional da Memória Regular (IMR) durante o processo de
extinção da memória, sob condições distintas de arousal e de estímulos recebidos em
função do número de interações do ASCS no ambiente.
4.1 Abstrações utilizadas na modelagem 108
emocional. no gráfico (B), sob o arousal de 0,2 e apenas 1 estímulo, a memória
levou aproximadamente 9 interações para atingir o limiar de saturação da intensidade
emocional. No gráfico (C), sob o arousal de 0,5 e apenas 1 estímulo, a memória levou
aproximadamente 4 interações para o limiar de saturação intencidade emocional.
Sob as mesmas condições de arousal, observa-se também que quanto maior o número
de estímulos de uma interação, menor será a intensidade emocional da memória re-
gular.
Ainda analisando a mesma figura, percebe-se que a partir de níveis intermediários de
arousal emocional, quanto menor o número de estímulos, mais lentamente o limiar de
saturação da intensidade emocional é atingido pela memória, necessitando portanto
de mais interações para alcançar seu ponto de saturação [ver gráficos (D) e (E)].
É importante ressaltar que o número de estímulos de uma interação não é diretamente
proporcional ao ponto de saturação atingido pelas memórias. Por exemplo, no gráfico
(A), a memória que se formou durante a manipulação de 1 estímulo atingiu o limiar de
saturação de intensidade com 10 interações. aquela memória que se formou du-
rante a manipulação de 2 estímulos atingiu o limiar de saturação de intensidade com
6 interações.
Os resultados apresentados na Figura 30 também estão de acordo com o trabalho de
Diamond et al. (2006). Como pode ser observado, até níveis intermediários de arousal
emocional, quanto maior o número de estímulos em uma interação mais rapidamente
a memória se extingue , e menor será a intensidade emocional atingido pelas memó-
rias. No gráfico (A), sob o arousal de 0,05 e 16 estímulos, a memór ia levou aproxi-
madamente 13 interações para ser alcançar seu limiar de saturação, até ser extinta. A
mesma memória no gráfico (B), mediante o arousal de 0,2, levou aproximadamente 4
interações para atingir seu ponto de saturação. no gráfico (C), mediante o arousal
de 0,5, esta memória gastou aproximadamente 2 interações para atingir seu ponto
saturação, até ser extinta. Em contra-partida, sob as mesmas condições de arousal
emocional, quanto menor o número de estímulos da interação, mais lentamente as
memórias se extinguirão e possuirão limiares de saturação mais altos.
Analisando os gráficos (D) e (E) da Figura 30, percebe-se que a partir de valores me-
dianos de arousal, quanto maior o número de estímulos da interação, mais lento será
a extinção das memórias. Sob o arousal de 0,8 e 16 estímulos, a memória necessitou
aproximadamente 7 interações para alcançar seu ponto de saturação. E sob o arousal
de 0,9 e 16 estímulos, a memória utilizou aproximadamente 8 interações para alcançar
seu ponto de saturação, até se extinguir.
4.1 Abstrações utilizadas na modelagem 109
4.1.6 Sobre a formação das memórias cintilantes
Até aqui, foram discutidos alguns aspectos da modelagem das memórias autobiográ-
ficas regulares. Entretanto, este trabalho também contemplou a formação das memó-
rias cintilantes. Como discutido no Capítulo 2, as memórias cintilantes são memórias
de situações singulares e inesperadas que ocorreram sob forte impacto emocional.
Esse tipo de memória se caracteriza por ser fragmentária, e por este motivo contém
poucos detalhes da experiência vivenciada. Dito de outro modo, as memórias cin-
tilantes são pequenos fragmentos extraídos de uma memória regular que tem seu
próprio mecanismo biológico de consolidação, diferente daquele de uma memória re-
gular.
A memór ia cintilante não é consolidada no córtex pré-frontal, mas no hipocampo e
na amígdala, devido ao forte arousal emocional. Por este motivo a memória regular,
que deu origem às memórias cintilantes, ficará repleta de “buracos”, como conseqüên-
cia da inibição temporaria do córtex pré-frontal. Assim sendo, nem sempre um dado
estímulo que esteve presente numa experiência irá elicitar ou evocar uma memória re-
gular, o que quer dizer que o agente não se lembrará do contexto vivenciado naquele
instante.
A questão, portanto, passa a ser quais fragmentos de uma experiência (que dará
origem a uma memória regular) devem constituir as memórias cintilantes? A resposta,
a partir da literatura, é bastante clara. A memória cintilante, por não fazer uso da
memória de trabalho (mas apenas da memória de curta duração), é constituída pela
i-ésima ação (MEE
i
) que ocorreu sob forte impacto emocional, que requer o córtex
pré-frontal (pois a tarefa naquele momento é complexa), e pela ação imediatamente
antecedente (MEE
i1
). Naqueles casos em que a valência da MEE
i
for negativa, a
memória cintilante formada será denominada de “Memória Traumática”. No instante
em que se formar uma memória cintilante será sorteado um número aleatório entre
0 e 3, que indicará o número de MEE que ficarão bloqueadas na memória regular,
indicando assim, a inibição temporária do córtex pré-frontal.
A Figura 31 ilustra o conteúdo de WorkingMemory após o agente ter vivenciado uma
ECQ. Durante a formação da experiência o agente vivenciou 12 MEE, sendo que 3
dessas (MEE
4
, MEE
6
e MEE
10
) ocorreram sob alto nível de arousal emocional e
todas requerem o córtex pré-frontal. A Figura 32 ilustra o conteúdo de LongTerm-
4.1 Abstrações utilizadas na modelagem 110
Memory, após a ECQ tornar-se uma memória. Como pode ser observado, a ECQ
deu origem a 4 memórias, 3 cintilantes e 1 memória regular. Observe que a formação
das memórias cintilantes ocasionou lacunas na memória regular, devido ao tempo de
bloqueio do córtex pré-frontal. Por exemplo, no momento de formação da memória cin-
tilante composta por MEE
3
e MEE
4
, foi bloqueado aleatoriamente 1 MEE da memória
regular. Neste caso, a MEE
3
, que gerou a memória cintilante é automaticamente blo-
queada e adicionalmente a MEE
5
também foi bloqueada. O número de MME a ser
bloqueada sempre inclui aquela que ocorreu sob alto arousal.
MEE1
MEE2
MEE3 MEE4 MEE5 MEE6 MEE7 MEE8 MEE9 MEE10 MEE11
Indica MEE vivenciada sob baixo e médio nível de arousal emocional (<6.3)
Indica MEE vivenciada sob alto nível de arousal emocional (6.3 <= arousal <= 7)
2
4
6
8
10
1 2 3 4 5 6 7
BE
A
1
2
3
9
8
11
5
10
7
6
Experiência Vivenciada – Conteúdo de WorkingMemory
4
12
MEE12MEE1
MEE2
MEE3 MEE4 MEE5 MEE6 MEE7 MEE8 MEE9 MEE10 MEE11
Indica MEE vivenciada sob baixo e médio nível de arousal emocional (<6.3)
Indica MEE vivenciada sob alto nível de arousal emocional (6.3 <= arousal <= 7)
2
4
6
8
10
1 2 3 4 5 6 7
BE
A
1
2
3
9
8
11
5
10
7
6
Experiência Vivenciada – Conteúdo de WorkingMemory
4
12
MEE12
Figura 31: Seqüência de MEE que compõe uma ECQ e seus respectivos níveis de
arousal.
Para o presente trabalho, alto nível de arousal emocional foi quantificado como a MEE
que ocorre com o arousal situado na faixa de 6,3 até 7,0(valor máximo do arousal).
Repetindo, a utilização do córtex cerebral durante a execução de uma tarefa tem haver
com o número de objetos que o agente está manipulando em determinado momento.
Quanto maior o número de objetos manipulados mais o córtex é requerido. Mantendo
coerência com a literatura, foi assumido que durante a fase de aquisição da memória
cintilante, esta possuirá o valor máximo de intensidade emocional, isto é, 10. E que
durante a fase de extinção esta não se extinguirá jamais. Ou seja, a memória cintilante
por ter sido formada durante forte impacto emocional, sempre será um fato marcante
4.1 Abstrações utilizadas na modelagem 111
MEE1 MEE2 MEE3
MEE3 MEE4
MEE6
Conteúdo de LongTerm Memory
Memória regular formada a partir da experiência vivenciada
Três memórias cintilantes formadas a partir da experiência vivenciada
Tempo de bloqueio
do Córtex igual a
2
MEE6 MEE7
Tempo de bloqueio
do Córtex igual a
3
MEE9 MEE10
Tempo de bloqueio
do Córtex igual a
1
MEE12MEE11
MEE1 MEE2 MEE3
MEE3 MEE4
MEE6
Conteúdo de LongTerm Memory
Memória regular formada a partir da experiência vivenciada
Três memórias cintilantes formadas a partir da experiência vivenciada
Tempo de bloqueio
do Córtex igual a
2
MEE6 MEE7
Tempo de bloqueio
do Córtex igual a
3
MEE9 MEE10
Tempo de bloqueio
do Córtex igual a
1
MEE12MEE11
Figura 32: Consolidação da ECQ da Figura 31 em uma memória regular que apresenta
falhas e três memórias cintilantes.
na vida do ASCS, e por este motivo permanecerá vívida em sua memória. (DIAMOND
et al., 2006)
Cabe ressaltar que a curva de eficiência comportamental versus nível de arousal a ser
utilizada durante a execução das MEE “cintilantes” é aquela em forma de “U” invertido,
conforme estabelecido pela Lei de Yerkes-Dodson (c.f, Figura 27). Isso é assim posto
que experiências envolvendo tarefas simples (que não requerem o engajamento do
córtex pré-frontal) não produzem memórias cintilantes (c.f., Capítulo 2).
4.1.7 Unidades funcionais da memória e sua relação com pro-
cesso cognitivo-emocional
Como discutido, o processo de formação de memórias pode ser decomposto nos
processos de consolidação, evocação e reconsolidação de memórias. Diante disso, a
questão que se coloca é quais unidades funcionais (na arquitetura ARTÍFICE) partici-
pam desses processos e como elas colaboram entre si para formarem as memórias.
A arquitetura ARTÍFICE contempla três unidades funcionais distintas de memória: a
memória de curto prazo (do inglês, ShortTermMemory), a memória de trabalho (do
inglês, WorkingMemory) e a memór ia de longo prazo (do inglês, LongTermMemory).
Tais unidades funcionais foram modeladas de acordo com os critérios que as dis-
4.1 Abstrações utilizadas na modelagem 112
tinguem entre si, c.f., discussão do Capítulo 2.
A ShortTermMemory é responsável pelo registro da última ação recém executada
e que corresponde à MEE. A WorkingMemory é responsável pelo armazenamento
temporário do conjunto das MEE em um determinado período de tempo, que jun-
tas irão for mar uma ECQ. Finalmente, a LongTermMemory é responsável por ar-
mazenar/consolidar a ECQ, bem como reconsolidar (via revaloração emocional) as
memórias evocadas pela WorkingMemory.
A Figura 33 descreve a relação entre o processo cognitivo-emocional e a for mação de
memórias experienciais proposta pelo presente modelo.
Memória de
Trabalho
Memória de
Curto Prazo
Memória de
Longo Prazo
Avaliação
Parcial
Avaliação
Completa
Ação
Ação
Valoração
Busca ExpectaƟva
Evoca
ç
ão
Consolida
ç
ão
Reconso
li
da
ç
ão
A
B
D
C
E
G
H
I
F
Estímulos
A’
Body
Figura 33: A circular idade da relação entre o processo cognitivo-emocional e a for-
mação de memórias experienciais.
(A) O agente recebe um ou mais estímulos do ambiente a partir de seus componen-
tes sensores que os transduzem para estímulos internos do sistema nervoso
artificial (A
). Os estímulos internos são recebidos pelo componente de software
PartialAppraisal, que elege tanto a emoção complexa quanto a emoção básica
mais desreguladas e que portanto, devem ser atendida naquele instante. Por
emoção mais desregulada entende-se aquela que apresenta o maior nível de
arousal;
(B) O componente PartialAppraisal informa para WorkingMemory os estímulos inter-
nos percebidos;
4.1 Abstrações utilizadas na modelagem 113
(C) WorkingMemory busca em LongTer mMemory, e armazena temporariamente, as
memórias experienciais (cintilantes ou autobiográficas regulares) que contêm
como objeto de algumas de suas MEE aquele objeto percebido;
(D) O componente PartialAppraisal elege, probabilisticamente, a memória da experi-
ência que melhor pre o resultado da interação com aquele objeto percebido.
A seleção é feita com base na intensidade emocional das experiências memo-
rizadas. Eleita a experiência, a expectativa de regulação emocional para cada
objeto percebido é enviada para o componente FullAppraisal;
(E) O componente FullAppraisal recebe a emoção complexa eleita juntamente com
a expectativa de sua regulação para cada estímulo (objeto) percebido . Aquele
estímulo (objeto) que apresenta maior expectativa de regular a emoção eleita
é selecionado. Portanto, é selecionado pelo agente, com base em sua situação
atual e seu ambiente, qual emoção básica será atendida, qual emoção complexa
será atendida e sobretudo, com qual objeto, dentre aqueles que se encontram no
campo sensoriais, o ASCS irá interagir na expectativa de regular suas emoções.
Sendo assim, com base nas probabilidades da coleção de ações (affordances)
é realizado um sorteio aleatório, onde finalmente é selecionada a ação que será,
de fato, executada pelos componentes efetores do agente.
(F) Após a ação a ser executada ter sido sinalizada para os componentes efetores,
a memória da experiência eleita é reconsolidada em LongTermMemory, onde é
feito o reajuste de sua intensidade emocional, aumentando/diminuindo o grau
de acoplamento entre as MEE subjacentes. Essa experiência irá a tornar-se
mais vívida e permanecer mais tempo em LongTermMemory. As memórias de
experiências que não foram eleitas tendem a serem esquecidas, que seus
respectivos níveis de intensidade emocional são enfraquecidos;
(G) Caso haja interação com o objeto emissor do estímulo, a ação realizada é regis-
trada temporariamente em ShortTermMemory. Essa ação permanece em Short-
TermMemory uma fração de tempo muito pequena, para que possa ser valorada
emocionalmente e, assim, tornar-se uma micro-experiência emocional que será,
então, enviada para registro na WorkingMemory. Caso a ação efetuada não re-
sulte em interação com o objeto emissor do estímulo, nada fica registrado em
ShortTermMemory.
(H) A WorkingMemory irá armazenar todas as MEE que forem formadas até o mo-
4.2 Considerações finais 114
mento em que o nível de arousal da emoção complexa seja restaurado, isto é,
fique abaixo de 2,0. Lembrando que caso o nível de arousal emocional esteja
na faixa de 0,18 (nível de despertar) até 2,0, a emoção é considerada como
regulada e, portanto, o agente se encontra em equilíbrio homeostático.
(I) Após a restauração do nível do arousal à condição de equilíbrio homeostático, as
MEE acumuladas são concatenadas, dando origem a uma experiência (ECQ).
Para a experiência recém formada, será calculada sua intensidade emocional
(valoração emocional da experiência) conforme a equação 4.4 e ela será enviada
para consolidação na LongTermMemory, passando a compor o repertório de
experiências memorizadas pelo agente.
A arquitetura ARTÍFICE não estabelece mecanismos para sincronia em nível micros-
cópico (no nível de operação dos componentes de software). Assim o ajuste dos parâ-
metros da arquitetura é feito observando o comportamento macroscópico do agente-
em-seu-ambiente, buscando deixá-lo coerente com sua dinâmica interna.
Cabe deixar claro que na descrição recém apresentada, embora se tenha colocado
os eventos em seqüência linear, isso foi apenas por razões pedagógicas. Na arquite-
tura ARTÍFICE, cada componente de software é executado em sua própria thread de
processamento. Sendo assim, a dinâmica interna da arquitetura é assíncrona, pois a
cada instante muitos estímulos (externos e internos) são recebidos e enviados, dis-
parando assincronamente um imenso número de eventos internos. Também por esse
motivo juntamente com o fato das escolhas das ações ser feita aleatoriamente, pode-
se dizer também que a arquitetura é não-determinística.
4.2 Considerações finais
Este capítulo teve como objetivo mostrar como foi modelado e incorporado na arquite-
tura ARTÍFICE o processo de formação de memórias experienciais, tanto as regulares
quanto as denominadas memórias cintilantes. A abstração realizada pelo modelo con-
siste de três fases - consolidação, evocação e reconsolidação - que ocorrem ao longo
do processo de aprendizado do ASCS.
A fase de consolidação consiste basicamente em realizar ações e agrupar MEE até
que o ASCS restaure seu equilíbrio homeostático. O final deste processo é marcado
pela formação de uma ECQ, que regula uma emoção complexa. a fase de evo-
4.2 Considerações finais 115
cação consiste em trazer à tona uma ECQ que tenha forte correlação com o objto com
o qual o ASCS esteja interagindo naquele momento. A fase de reconsolidação con-
siste em reforçar a intensidade emocional da ECQ que foi eleita para a guiar a ação a
ser realizada e inibir aquelas que não foram eleitas.
O ponto de partida deste trabalho foi a versão 0.9.0 da arquitetura ARTÍFICE (Silva
(2008)), que por sua vez estendeu a versão 0.7.5 (Campos (2006)). Ambos traba-
lhos, brevemente discutidos no capítulo 1, estabelecem o processo de aprendizagem
da arquitetura, e sua dinâmica interna, respectivamente. A adição do mecanismo de
formação de memórias experienciais, além de oferecer maiores capacidade de adap-
tação para o ASCS, trouxe algumas modificações na aquitetura. Foi incorporado o
conceito de emoção complexas. O cálculo da eficiência comportamental do ASCS foi
melhorado, substituindo a Lei de Hebb pela Lei de Yerkes-Dodson, mais correto do
ponto de vista da neurociência. Além da expansão do mecanismo de valoração da
arquitetura.
O modelo de valoração emocional adotado passou a utilizar expressões matemáticas,
inspiradas no trabalho de Diamond et al. (2006). Essas equações foram utilizadas para
implementar as fases de aquisição e extinção da memória. Antes de implementá-las,
elas foram submetidas à testes de laboratório para encontrar os melhores valores de
seus parâmetros. Os resultados encontrados nos permitem afirmar que elas estão de
acordo, pelo menos qualitativamente, com o proposto por Diamond et al. (2006).
Por fim, a partir do que foi revisado nos Capítulos 2 e 3, pode-se assumir, sem restri-
ções, que a modelagem proposta está coerente com os diversos trabalhos que vem
sendo desenvolvidos nesta área de pesquisa. E diferentemente de outros autores, as
memórias que são formadas mediante alto arousal emocional, isto é, as memórias
cintilantes, foram modeladas com melhor respaldo biológico.
116
5 Aspectos de implementação do
modelo proposto
A dinâmica do mecanismo de formação de memórias experienciais ocorre em con-
junto e como parte inseparável do processo cognitivo-emocional do ASCS. Este pro-
cesso engloba as experiências que contribuem para a manutenção do equilíbrio home-
ostático e que constituem o construto básico da memória de longo prazo.
Para facilitar a adaptação do agente no ambiente, as experiências consolidadas em
sua memória de longo prazo serão evocadas para contribuir com a escolha da ação
mais adequada a ser executada. Aquelas experiências que efetivamente contribuem
para a adaptação do ASCS permanecerão mais tempo em sua memória.
Neste ponto, é importante ressaltar que, numa pespectiva situacionista e evolucionista
[(MATURANA, 1997), (BUCK, 1999), (CLANCEY, 1993)], o comportamento aprendido e
que se passa de geração para geração é a base para a evolução ou surgimento de
uma nova espécie. Neste sentido, basta que seja implementado na arquitetura um me-
canismo de reprodução de ASCS que transmita por herança a seus descendentes as
memórias bem consolidadas, implementando assim um mecanismo de seleção natu-
ral, que poderá levar ao surgimento de espécies de agentes mais adaptados.
O modelo proposto além de permitir que o ASCS forme memórias regulares, permite
que ele também forme memórias cintilantes. Espera-se que de posse deste meca-
nismo, o ASCS aprenda a se adaptar ao seu ambiente de modo mais eficaz e, como
conseqüência, mantenha-se vivo por mais tempo.
Para melhorar a legibilidade deste e dos capítulos seguintes, convencionou-se es-
crever os nomes das classes de software em negrito, iniciando sempre com letras
maiúsculas (por exemplo, ClasseSoftware). os métodos serão sempre escritos em
negrito porém iniciados com letras minúscuas, seguidos de “()” ao final (e.g, método-
DeClasse()). Os pacotes de software, quando necessários, serão referenciados com
seus nomes escritos em itálico.
5.1 Sobre a modelagem do sistema de memória 117
5.1 Sobre a modelagem do sistema de memória
O sistema de memória deste trabalho é composto pela ShortTermMemory, Working-
Memory e LongTermMemory que, juntos, serão responsáveis pela for mação de me-
mória da arquitetura. Este sistema pode ser visualizado na Figura 34, que apresenta
parte do diagrama de classes desenvolvido na Linguagem Unificada de Modelagem
(UML - do inglês, Unified Modeling Language).
Figura 34: O modelo conceitual do sistema de memória da arquitetura ARTÍFICE.
A ShortTermMemory é uma memória muito volátil, que durante poucos instantes
retém a última ação recém executada, o afeto básico que estava desregulado e o valor
de seu arousal emocional imediatamente após a interação do ASCS com o objeto do
mundo. O conteúdo dessa memória dura o tempo suficiente para que o sistema de
valoração da arquitetura (o componente Valuation) possa valorar a MEE formada e
enviá-la para a WorkingMemory.
A WorkingMemory é uma memória com um tempo de duração um pouco maior
que ShortTermMemory. É ela que permite ao ASCS se situar no momento atual,
orientando-o em relação à ECQ que está se formando. O seu conteúdo se altera em
função da fase em que se encontra o processo de formação de memórias. Durante a
fase de consolidação, ela armazena todas aquelas MEE que irão constituir uma ECQ.
Durante a fase de evocação ela busca em LongTermMemory as ECQ que se correla-
cionam com a situação atual. A busca à LongTermMemory é feita a partir daquelas
MEE que são parte integrante da memór ias de longo prazo, comparando o campo alvo
(target) com o estímulo percebido naquele instante. Se a memória possuir o estímulo
percebido em uma de suas MEE então essa memória é evocada.
Assim que uma ECQ é finalizada, ela é armazenada em LongTermMemory. A dura-
bilidade de seu conteúdo é muito maior do que dos outros dois tipos de memór ias
5.2 O mecanismo de valoração das micro-experiências e experiências 118
citados. Ao reconsolidar uma memória em LongTermMemory, o método reconsoli-
dation() é acionado para que a intensidade emocional da memória em questão seja
reajustado. As memórias assim formadas são denominadas episódicas, pois advém
das experiências próprias vivenciadas pelo ASCS mediante interações do ASCS com
seu ambiente e valoradas emocionalmente.
Antes de discutir a dinâmica de operação das três fases que compõem esse processo,
será discutido como são valoradas uma MEE e uma ECQ.
5.2 O mecanismo de valoração das micro-experiências
e experiências
O mecanismo de valoração da arquitetura trabalha estabelecendo correlações. Como
visto na seção 4.1.3, uma micro-experiência é o resultado de uma única interação do
ASCS com um objeto do mundo em busca de manter-se em equilíbrio homeostático,
o que significa regular o nível de arousal das emoções básicas. Por sua vez, uma
ECQ (Experience) é constituída por um conjunto de MEE (MicroExperience), que
juntas regulam o nível de arousal de suas emoções complexas. Porém, antes que
uma micro-experiência componha uma experiência, esta deve ser valorada emocional-
mente levando em consideração alguns atributos. O mesmo acontece com a experi-
ência antes de compor uma memória em LongTermMemory. Essa correlação pode
ser visualizada na Figura 35, bem como os atributos considerados para a valoração
emocional de cada componente citado.
Os atributos envolvidos em uma MEE e que são utilizados para valoração, são:
- affectBasic: afeto básico considerado o mais urgente de ser atendida no momento
da interação;
- action: a ação selecionada conforme estabelecido pelo mecanismo de condiciona-
mento operante;
- target: objeto alvo da interação e emissor do estímulo externo desencadeante;
- weight: peso atribuído à MEE devido à interação com o objeto alvo e relacionado à
recompensa (ou à punição) recebida. Esse valor é diretamente proporcional à
variação sofrida no nível de arousal da emoção básica em questão;
5.2 O mecanismo de valoração das micro-experiências e experiências 119
MicroExperience
affectBasic
action
target
weight
valence
taskComplexityDegree
Experience
ME1 ... ME n
affectComplex
flashBulbMemory
emotionalIntensity
List <MicroExperience> experience
LongTermMemory
List <Experience> Memory
Exp1 ... Exp n
MicroExperience
affectBasic
action
target
weight
valence
taskComplexityDegree
Experience
ME1 ... ME n
affectComplex
flashBulbMemory
emotionalIntensity
List <MicroExperience> experience
LongTermMemory
List <Experience> Memory
Exp1 ... Exp n
Figura 35: Regulação entre MEE, ECQ e memória de longo prazo e respectivos atri-
butos utilizados durante sua valoração emocional.
- valence: variável booleana relativa à experiência hedônica do ASCS, que indica se
a MEE foi prazerosa (true) ou não-prazerosa (false);
- taskComplexityDegree: grau de dificuldade da ação a ser executada em determi-
nado momento. O valor deste atributo é diretamente proporcional ao número de
objetos que se encontram dentro dos campos sensoriais do ASCS numa certa
situação e em certo momento;
os atributos envolvidos em uma ECQ e que são utilizados para valorá-la são:
- affectComplex: emoção complexa, constituída por um conjunto de emoções bási-
cas, considerada a mais urgente de ser atendida no momento;
- flashBulbMemory: variável booleana que indica se a memória formada é cintilante
ou regular. Essa variável será true se a memória formada for cintilante e false
caso contrário;
- emotionalIntensity: intensidade emocional da ECQ formada. O valor deste atributo
representa o quanto a experiência é importante para o ASCS e é diretamente
relacionada à sua durabilidade na memória;
- experience: lista que contém o conjunto de todas as MEE que compõem uma certa
experiência completa com qualia (MCQ).
Vale ressaltar que alguns dos atributos relacionados nessa seção, e.g.,intensidade
emocional, fazem uso de outros atributos mais simples (e.g., valor de saturação (IMR
sat
)
5.3 A dinâmica de funcionamento do processo de formação de memórias 120
e desprovidos de significação mais relevante.
Após ser valorada, a experiência poderá compor a LongTermMemory, e junto com ou-
tras experiências, estará disponível para ser evocada toda vez que o agente vivenciar
situações semelhantes ao longo de sua vida.
5.3 A dinâmica de funcionamento do processo de for-
mação de memórias
Como dito no Capítulo 1, o ASCS é composto por componentes periféricos exter-
nos e internos que interagem entre si e com ambiente de forma não determinística.
As interações entre os componentes ocorrem mediante a troca assíncrona de estí-
mulos, que foram divididos em dois grupos: estímulos puramente internos ao ASCS
(InteroceptiveStimuli) e estímulos advindos do ambiente (EnvironmentalStimuli). A
troca de estímulos é intermediada por dois buffers compartilhados, um denominado In-
teroceptiveStimuliPool, que manipula apenas estímulos internos, e o Environmen-
talStimuliPool, que manipula estímulos externos ao ASCS. Ao analisar a dinâmica
de operação desse modelo, pode-se compreender como se desenvolve o processo de
aprendizagem do ASCS, assim como a formação das memórias.
A estrutura interna do ASCS é composta de alguns componentes que possuem exe-
cução autônoma, i.e, executam em suas próprias threads de processamento. Neste
contexto, se destaca o papel do componente PartialAppraisal, que a todo momento
ao receber estímulos
1
, executa mudanças internas e envia outros tipos de estímulos.
Um dos estímulos enviados por este componente é IntStiAdrenergic. Este estímulo,
que é percebido pelo sistema simpático do ASCS, indica que houve algum desequi-
líbrio na estrutura interna do agente. Como resposta, esse componente envia um
estímulo IntStiSympathetic. Por sua vez, este estímulo é recebido pelo componente
HomeostaticRegulation, que altera (desregulando) o arousal de todas as emoções
do agente, sejam elas básicas ou complexas.
Este processo ocorre a qualquer momento, indicando, por exemplo, que o agente pode
estar estressado porque está com fome, ou pode estar apático porque está entediado.
Assim, o agente, para se manter em homeostase, precisa interagir com os objetos
1
O componente Partial Appraisal tem uma peculiaridade, ele opera e emite estímulos internos
mesmo na ausência de quaisquer outros estímulos. Isso significa que, via sistema emocional, re-
sponsável por manter a homeostase, o ASCS é capaz de sustentar uma dinâmica interna própria inde-
pendentemente de seus sensores estarem recebendo algum estímulo externo.
5.3 A dinâmica de funcionamento do processo de formação de memórias 121
do mundo. Ele deve comer nutrientes para saciar sua fome, e assim diminuir seu es-
tresse, ou brincar várias vezes para não ficar entediado e, assim, diminuir seu grau de
apatia. Após analisar o arousal das emoções, o componente PartialAppraisal elege
uma emoção básica e uma complexa, as mais desreguladas, e envia um IntStiEmo-
tional com essa informação.
O componente FullAppraisal recebe este estímulo, e ao saber quais emoções es-
tão desreguladas, escolhe a ação mais adequada a ser executada naquele momento,
acionando o mecanismo de condicionamento operante (encapsulado na classe Op-
erantConditioning). Neste instante um IntStiCortical é enviado para o componente
efetor correspondente, que recebe o estímulo, executa a ação e envia um estímulo
intStiSomatic.
Quando o ASCS estabelece algum tipo de relação com um objeto do meio externo, o
componente de seu sistema periférico (PeripheralSystem) capta um estímulo externo
(encapsulado na classe EnviromentalStimulus) emitido por este objeto e o coloca no
buffer externo (EnviromentalStimuliPool). O PeripheralSystem executa sua ope-
ração interna, gerando e emitindo um estímulo interno InteroceptiveStimulus que é
colocado no buffer interno (InteroceptiveStimuliPool), sendo disponibilizado para os
demais componentes internos.
O componente sensor, correspondente ao componente periférico que captou o estí-
mulo, recebe o InteroceptiveStimulus produzido e ao executar sua operação interna,
gera e emite um estímulo colinérgico (IntStiCholinergic). Este estímulo é recebido
pelo componente ParasympatheticSystem, que indica que parte do equilíbrio interno
do agente foi restaurado. Este componente executa sua operação interna, gerando e
emitindo um estímulo IntStiParasympathetic.
O estímulo IntStiParasympathetic é recebido pelo componente HomeostaticRegulation,
que executa sua operação interna diminuindo o arousal da emoção correspondente e
gerando um estímulo IntStiValuational.
O componente Valuation recebe este estímulo IntStiValuational , e ao executar sua
operação interna, irá valorar a MEE recém vivenciada. A valoração hedônica é feita
com base no estado do agente imediatamente antes, e depois à ação executada.
Sendo assim, ela será positiva se o arousal da emoção (neste caso a emoção básica)
diminuir. E negativa, caso seu arousal tenha aumentado. Os demais atributos levados
em consideração, no momento da valoração, foram discutidos na seção 5.2.
Todos os componentes da arquitetura que executam autonomamente em suas threads
operam todo o tempo trocando estímulos, ainda que o agente não esteja interagindo
5.3 A dinâmica de funcionamento do processo de formação de memórias 122
com nenhum objeto.
Cabe destacar que esta dinâmica, tal como recém-explicada, tem fins meramente
pedagógicos. A dinâmica da arquitetura ARTÍFICE é assíncrona, sendo impossível
predizer quando um componente irá receber ou emitir um dado estímulo do, ou para
o, buffer e qual componente o fará.
Um esquema, simplificado, representativo da troca de estímulos internos e externos
pode ser visto na Figura 36.
Environmental Stimuli
Pool
Interoceptive Stimuli
Pool
Partial Appraisal
Sensor
Sympathetic System
Parassympathetic System
Homeostatic Regulation
Software
Components
PeripheralSystem
EnviromentalStimulus
EnviromentalStimulus
InteroceptiveStimulus
InteroceptiveStimulus
IntStiCholinergic
IntStiCholinergic
IntStiParassympathetic
IntStiSympathetic
IntStiParassympathetic
IntStiAdrenergic
IntStiAdrenergic
IntStiSympathetic
IntStiValorational
Figura 36: Esquema simplificado da troca de estímulos interoceptivos e ambientais.
Para uma discussão mais por menorizada acerca da dinâmica interna e externa dos
componentes da arquitetura, refira-se ao anexo B deste trabalho e ao Capítulo 4 do
trabalho de Campos (2006). Em ambos documentos é possível verificar que alguns
componentes descritos na Figura 36 são generalizações modeladas e devem ser es-
pecializados ao se instanciar uma aplicação qualquer de modo a estabelecer as es-
pecificidades desejadas. Assim é o caso do componente de software Ball. Esse
componente envia um estímulo de toque, fruto da ação de brincar, para o agente, que
o transforma em um estímulo interno de seretonina (IntStiSeretonin). Esse estímulo
proporcionará uma ação agradável no agente, diminuindo o arousal da emoção básica
tédio e, por conseguinte, da emoção complexa apatia.
Cabe destacar que as fases do processo de formação de memórias da arquitetura
ARTÍFICE ocorrem ao longo da dinâmica interna do ASCS, descrita nos paragráfos
anteriores. Nas seções seguintes, será apresentado o processo de formação de me-
mória propriamente, e como suas fases complementam esta dinâmica.
5.3 A dinâmica de funcionamento do processo de formação de memórias 123
5.3.1 A dinâmica da fase de consolidação da memória
A fase da consolidação se inicia assim que o componente Valuation valora a MEE
vivenciada. Neste momento, o componente WorkingMemory é acionado e, por sua
vez, dispara o método de consolidação (memoryConsolidation()). Este método ve-
rifica o arousal das emoções complexas imediatamente após o envio do estímulo
IntStiSympathetic e imediatamente após o envio do estímulo IntStiParassympa-
thetic, ou seja, ele verifica o estado do agente antes e depois da ação. No gráfico
da eficiência comportamental x arousal (ver Figura 27) foi estabelecido uma faixa de
valor para o arousal emocional que indica quando o agente está em equilíbrio home-
ostático
2
. Se o arousal da emoção complexa eleita estiver acima desta faixa, a micro-
experiência será armazenada. Caso contrário, ela não será armazenada.
Nem sempre a execução de uma única MEE é suficiente para restaurar o equilíbrio
homeostático de uma emoção complexa. Na maioria das vezes, várias MEE precisam
ser executadas e armazenadas em WorkingMemory. Quando o estado de home-
ostase é alcançado (i.e., o arousal volta a ficar dentro da faixa estabelecida), for ma-se
uma ECQ que será consolidada em LongTermMemory.
Antes de ser considerada como uma memória, essa ECQ é valorada levando em con-
sideração os atributos citados na seção 5.2. Entre eles se destaca o cálculo de sua
intensidade emocional. Em seguida essa ECQ é adicionada em LongTermMemory
e uma nova estrutura de dados para armazenamento das micro-experiências é criada
em WorkingMemory. Para facilitar o entendimento do processo descrito, o exemplo a
seguir descreve a consolidação de algumas ECQ.
Como pode ser visto na Tabela 3, foi monitorado o nível de arousal das emoções
complexas antes e após cada interação do ASCS. Assim que esses valores ultra-
passaram a faixa do equilíbrio homeostático (neste caso, arousal 2), as micro-
experiências começaram a ser armazenadas em WorkingMemory. O acúmulo das
micro-experiências acontece até o momento que o equilíbrio é restaurado (neste caso,
arousal < 2). Em seguida, a experiência formada é valorada e consolidada em Long-
TermMemory. Neste exemplo, específico, foram formadas 4 memórias regulares. A
primeira memória abrange a MEE5, a segunda memória abrange as MEE7 e MEE8,
a terceira as MEE9, MEE10 e MEE11, enquanto a quarta memória inclui as MEE9,
2
Neste caso, a faixa considerada é de 0,18 arousal < 2,0.
5.3 A dinâmica de funcionamento do processo de formação de memórias 124
Arousal
Antes
Arousal
Depois
Arousal
Antes
Arousal
Depois
MEE 1
1,5555 0,5655 1,482 1,482
MEE 2
0,77625 0,786 1,515 0,624
MEE 3
1,3785 0,7285 1,074 1,074
MEE 4
1,14775 1,1575 1,461 0,57
MEE 5
2,005 1,02475 1,32 1,329
MEE 6
1,327 1,33675 1,608 0,717
MEE 7
2,21075 2,5205 0,813 0
MEE 8
2,26975 1,2895 1,449 1,458
MEE 9
3,10225 2,11225 3,099 3,099
MEE 10
2,278 2,278 3,252 2,352
MEE 11
2,29525 2,29525 2,211 1,311
MEE 12
2,3725 1,39225 1,41 1,419
MEE 13
1,42 0,43975 1,38 1,389
MEE 14
0,55375 0,301 1,365 1,374
Micro Experiência
Emocional
Estresse
ApaƟa
Tabela 3: Evolução do arousal emocional das emoções estresse e apatia a cada MEE
vivenciada, as células destacadas dão origem às quatro ECQ que serão registradas
na memória de longo prazo.
MEE10, MEE11 e MEE12. A primeira, a segunda e a quarta memória estão associ-
ada à emoção estresse, enquanto a terceira à emoção apatia. A Figura 37 ilustra o
“conteúdo” das memórias formadas e consolidadas em LongTermMemory. Um ar-
quivo de “log” referente à criação destas memórias, pode ser visto no anexo C.
LongTermMemory
Memory 1
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 5.854
Experience:
MEE 5
Memory 2
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 8.143
Experience:
MEE 7 MEE 8
Memory 3
affectComplex: Apathy
flashBulbMemory: False
emotionalIntensity: 8.667
Experience:
MEE 9 MEE 10 MEE 11
Memory 4
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 8.322
Experience:
MEE 9 MEE 10 MEE 11 MEE 12
LongTermMemory
Memory 1
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 5.854
Experience:
MEE 5
Memory 2
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 8.143
Experience:
MEE 7 MEE 8
Memory 3
affectComplex: Apathy
flashBulbMemory: False
emotionalIntensity: 8.667
Experience:
MEE 9 MEE 10 MEE 11
Memory 4
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 8.322
Experience:
MEE 9 MEE 10 MEE 11 MEE 12
Figura 37: Memór ias regulares consolidadas na LTM conforme a Tabela 3 e seus
respectivos parâmetros.
No início do exper imento, apena a emoção estresse estava além da faixa de equilíbrio,
indicando que o agente não estava em homeostase. Neste caso, apenas a MME 5 foi
suficente para restaurar o equilíbrio homeostático desta emoção, dando origem a me-
mória 1. Outro ponto a ser elucidado neste exemplo diz respeito à imbricação das
5.3 A dinâmica de funcionamento do processo de formação de memórias 125
micro-experiência na formação das ECQ. Ao final do experimento, ambas emoções
complexas estavam além da faixa de equilíbrio, indicando que o agente não estava
em homeostase. Para tanto, cada micro-experiência vivenciada contribuiu de forma
diferenciada para a regulação das mesmas, o que resultou, por exemplo, que as MEE
9, MEE 10 e MEE11 compuseram ao mesmo tempo as ECQ 3 e 4. Neste caso,
observa-se que apenas as três micro-experiências foram capazes de restaurar o equi-
líbrio homeostático do agente em relação à emoção apatia. Por outro lado, o mesmo
não aconteceu para emoção a estresse, sendo necessário que o agente vivenciasse
mais uma micro-experiência (MEE12).
Outra característica da fase de consolidação é a formação das memórias cintilantes.
Como visto nas seções anteriores, este tipo de memória ocorre em condições forte
impacto emocional, durante a execução de tarefas que requerem o córtex pré-frontal.
Dessa forma, o método da consolidação, além de verificar se o arousal das emoções
complexas está além da faixa do equilíbrio homeostático, também verifica se ele está
acima do limiar que caracteriza forte impacto emocional e se a tarefa executada requer
o córtex.
O exemplo da Tabela 4 e a Figura 38 mostra a formação de memórias regulares
e cintilantes, e como elas se correlacionam. Neste exemplo, tem-se a formação
de 6 memórias sendo, 1 cintilante e 5 regulares. No primeiro momento, o arousal
das emoções complexas estava desregulado e o método memoryConsolidation()
foi acionado. Para ambas emoções, o nível de seu arousal estava além da faixa de
equilíbrio. Para restaturá-lo foram vivenciadas 4 MEE (MEE1, MEE2, MEE3 e MEE4)
que deram origem a duas memórias regulares (Memory 1 e Memory 2, Figura 38).
Com o passar do tempo o arousal de cada emoção continuou variando, mas apenas a
emoção estresse estava desregulada. Para regulá-la apenas uma MEE foi necessária
(MEE 6), deste processo uma memória regular foi formada (Memory 3). Em seguida o
arousal das emoções variou significativamente, atingindo a faixa de alto arousal emo-
cional.
O fato do arousal estar nessa faixa não quer dizer que obrigatoriamente memórias
cintilantes irão se formar, pois é necessário a atuação do córtex pré-frontal (como
aconteceu durante a restauração do arousal da emoção estresse). Como pode ser
observado na Figura 4, esperava-se a MEE8 desse origem a memória cintilante, mas
não foi o que aconteceu (ver Figura 38). Durante a execução desta MME8 o córtex
pré-frontal não foi envolvido, por este motivo a memória cintilante não se formou. Para
reestabelecimento do arousal da emoção estresse foram executadas 10 MEE (MEE8
5.3 A dinâmica de funcionamento do processo de formação de memórias 126
a MEE17), o que originou uma única memória reular (Memory 4). com relação
a emoção apatia, era esperado a formação de 3 memórias cintilantes derivadas das
MEE8, MEE9 e MEE10, mas apenas 1 se formou. Como mostrado, a execução da
MEE8 não envolveu o córtex pré-fontal, o mesmo aconteceu para a MEE10, por este
motivo essas MEE não deram origem à memórias cintilantes. a execução da MEE9
(envolveu o córtex pré-frontal durante sua execução) e deu origem à única memória
cintilante deste exemplo (Memory 5). Sendo assim, esta memória cintilante é formada
pela MEE 9 e pela MEE imediatamente anterior (MEE8) e possui com o intensidade
emocional o valor máximo, o que neste trabalho é sempre 10. É importante ressaltar
também que esta memória não é traumática, pois a valência da MEE8 é positiva (ver
anexo D), ou seja, a micro-experiência MEE9 foi prazerosa para o ASCS.
Para restaturar o arousal da emoção apatia foram executadas 12 MEE (MEE8 a
MEE19), o que deu origem a uma memória regular (Memory 6). As MEE9, MEE10
e MEE11 foram bloqueadas, como conseqüência do “tempo de bloqueio” do córtex
pré-frontal durante a formação da memória cintilante (ver Figura 38 e o Anexo D).
Neste caso, o tempo de bloqueio é foi de 3 MEE.
LongTermMemory
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 7.85
Experience:
affectComplex: Apathy
flashBulbMemory: False
emotionalIntensity: 7.04
Experience:
Memory 1 Memory 2
MEE 1 MEE 2 MEE 1 MEE 2 MEE 3 MEE 4
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 6.04
Experience:
Memory 3
MEE 6
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 3.47
Experience:
Memory 4
MEE8 MEE9 MEE10 MEE11
MEE13 MEE14 MEE15
MEE12
MEE16 MEE17
affectComplex: Apathy
flashBulbMemory: True
emotionalIntensity: 10.0
Experience:
Memory 5
MEE 8 MEE 9
affectComplex: Apathy
flashBulbMemory: False
emotionalIntensity: 4.01
Experience:
Memory 6
MEE8 MEE9 MEE10 MEE11
MEE13 MEE14 MEE15
MEE12
MEE16 MEE17
MEE18 MEE19
MEE cinƟlante bloqueada
MEE bloqueada
LongTermMemory
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 7.85
Experience:
affectComplex: Apathy
flashBulbMemory: False
emotionalIntensity: 7.04
Experience:
Memory 1 Memory 2
MEE 1 MEE 2 MEE 1 MEE 2 MEE 3 MEE 4
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 6.04
Experience:
Memory 3
MEE 6
affectComplex: Stress
flashBulbMemory: False
emotionalIntensity: 3.47
Experience:
Memory 4
MEE8 MEE9 MEE10 MEE11
MEE13 MEE14 MEE15
MEE12
MEE16 MEE17
affectComplex: Apathy
flashBulbMemory: True
emotionalIntensity: 10.0
Experience:
Memory 5
MEE 8 MEE 9
affectComplex: Apathy
flashBulbMemory: False
emotionalIntensity: 4.01
Experience:
Memory 6
MEE8 MEE9 MEE10 MEE11
MEE13 MEE14 MEE15
MEE12
MEE16 MEE17
MEE18 MEE19
MEE cinƟlante bloqueada
MEE bloqueada
Figura 38: Formação de memórias cintilantes a partir das micro-experïências vivenci-
adas sob forte impacto emocional.
Cabe ressaltar que as memórias cintilantes possuem níveis de intensidade emocional
5.3 A dinâmica de funcionamento do processo de formação de memórias 127
Arousal
Antes
Arousal
Depois
Arousal
Antes
Arousal
Depois
MEE 1 3,1845 2,20425 3,018 3,027
MEE 2 2,2815 1,30125 3,066 3,075
MEE 3 1,5825 1,5825 3,27 2,37
MEE 4 1,719 1,719 2,496 1,596
MEE 5 1,884 1,884 1,716 0,84
MEE 6 2,06625 1,086 0,879 0,888
MEE 7 1,19175 0,30125 0,921 0,921
MEE 8 6,881 5,891 6,51 6,51
MEE 9 5,879 4,89875 6,402 6,411
MEE 10 4,976 4,976 6,45 5,55
MEE 11 5,00525 5,00525 5,577 4,677
MEE 12 5,024 4,04375 4,662 4,671
MEE 13 4,06325 4,06325 4,689 3,789
MEE 14 4,08125 4,091 3,741 2,85
MEE 15 4,1885 3,20825 2,94 2,949
MEE 16 3,26675 2,2865 3,003 3,012
MEE 17 2,3255 1,34525 3,048 3,057
MEE 18 1,4915 1,4915 3,192 2,292
MEE 19 1,5335 1,5335 2,04 1,14
MEE 20 1,69925 0,70925 1,293 1,293
ApaƟa
Micro Experiência
Emocional
Estresse
Tabela 4: Evolução do arousal emocional do estresse e da apatia a cada micro-
experiência vivenciada.
5.3 A dinâmica de funcionamento do processo de formação de memórias 128
significativamente maiores que as das memórias regulares, vide Figura 38. Esta difer-
ença está em conformidade com a literatura [Brown e Kulik (1977), Talarico e Rubin
(2003)], que afirma que essas memórias são mais intensas e, permanecem por tempo
indefinido na memória de longo prazo.
Outro aspecto que merece destaque é com relação à formação da memória cinti-
lante. A memória cintilante é um fragmento da memória regular à qual ela se as-
socia, por esse motivo ela não é tão rica em detalhes. As micro-experiências que
formam uma memória cintilante compõem também a memória regular, entretanto são
inacessíveis pois são bloqueadas pelo trauma
3
. Assim, sua representação na me-
mória regular é apenas uma forma de indicar que naquele ponto exato (i.e, naquele
momento da experiência) existe uma falha da memória regular. Indicando algo que
o agente vivenciou durante forte impacto emocional e que teve como resultado um
bloqueio, traumático. Finalmente, cabe dizer que em versões futuras da arquitetura
ARTÍFICE, se este trauma for tratado, por algum processo (por exemplo, processos
psiquiátrico, psicanalítico, etc), a memória cintilante irá recompor a memória regular,
eliminando esta falha, assim a própria memória cintilante deixará de existir, fenômeno
bastante conhecido na literatura psicobiológica.
5.3.2 A dinâmica da fase de evocação da memória
A fase da evocação da memória ocorre durante a operação do componente Partial-
Appraisal. Num primeiro momento, este componente verifica quais emoções (básica
e complexa) estão desreguladas. As emoções são avaliadas conforme seu nível de
arousal. As emoções fome (Hungry) e estresse (Stress) foram implementadas como
prioritárias. Sendo assim, caso o nível de arousal das demais emoções estejam idên-
ticos, a emoção básica Hungry e a emoção complexa Stress serão eleitas como
prioritárias.
Como pode ser observado no anexo B, o componente Par tialAppraisal recebe três
tipos específicos de estímulos: o IntStiSomatic, o IntStiProprioceptive e o IntSti-
Tactile. O estímulo IntStiSomatic, ao ser recebido pelo PartialAppraisal, sinaliza
que houve uma reação de reflexo. Como este tipo de ação (atos reflexos) não compõe
a memória de longo prazo do agente, neste trabalho especificamente, não se dará
maior atenção a esse tipo de comportamento, embora ele seja fundamental para o
3
Aqui é utilizado a palavra trauma para conotar forte impacto emocional.
5.3 A dinâmica de funcionamento do processo de formação de memórias 129
mecanismo de condicionamento
4
. o estímulo IntStiProprioceptive indica ao Par-
tialAppraisal que o agente está vendo algo, enquanto o IntStiTactile indica que o
agente está em contato fisíco com algum objeto e que objeto específico é este.
De posse das informações do estímulo proprioceptivo e tátil, o PartialAppraisal invoca
uma instância da memória de trabalho (WorkingMemory), para acionar o método de
evocação da memória (memoryEvocation()). O método da evocação percorrerá to-
das as memórias que estão consolidadas em LongTermMemor y e evocará aquelas
que possuírem como alvo de suas MEE os exatos estímulos que o agente recebeu.
De posse das experiências evocadas, o PartialAppraisal irá calcular a expectativa
de interação com cada objeto emissor do estímulo percebido. A expectativa é uma
importante variável, pois é a partir dela que o componente FullAppraisal irá eleger
qual estímulo possivelmente melhor regulará o estado emocional do agente naquele
instante.
O cálculo da expectativa é feito com base nas experiências evocadas e inicia-se sele-
cionando aquelas que ocorreram sob a mesma emoção complexa da situação atual.
Dentre as experiências eleitas, é feito um sorteio randômico ponderado, com base na
intensidade emocional de cada uma. A experiência com maior intensidade emocional
possui maiores probabilidades de ser eleita.
A partir da experiência eleita é recuperada a lista das MEE que a compõe. A partir
das MEE recuperadas são selecionadas aquelas que ocorreram sob a mesma emoção
básica da situação atual e que possuem como alvo o estímulo percebido. Em seguida,
dentre as micro-experiências eleitas, é verificado a valência de cada uma para que sua
expectativa de regulação possa ser recuperada. Se a valência de todas MEE forem
positivas, isto quer dizer que o estímulo percebido foi bom para regular a emoção
complexa no passado. Então o maior valor de expectativa, dentre todas as MEE, é
recuperado. Porém, se as valências forem negativas, isto quer dizer que o estímulo
percebido não foi bom para regular a emoção complexa na experiência passada. En-
tão, o menor valor de expectativa é recuperado.
Se o método da evocação, ao percorrer LongTermMemory, não encontrar nenhuma
experiência para ser evocada, o cálculo da expectativa é feito com base nas micro-
experiências recentemente executadas e que compõem WorkingMemory. Sendo as-
sim, a MEE associada ao estímulo percebido é localizada e a expectativa é recupe-
rada. Caso em WorkingMemory não exista nenhuma MEE que possui como alvo o
estímulo percebido, a expectativa será zero.
4
As ações reflexas e seu papel para o mecanismo de condicionamento da arquitetura ARTÍFICE são
discutidos em detalhes em Silva (2008).
5.3 A dinâmica de funcionamento do processo de formação de memórias 130
O cálculo da expectativa é feito para cada estímulo percebido por PartialAppraisal.
Este atributo, juntamente com as emoções desreguladas e a experiência eleita, com-
põe o IntStiEmotional que é gerado pelo componente PartialAppraisal e enviado
ao buffer. O IntStiEmotional é capturado por FullAppraisal que seleciona o estí-
mulo que possuí maior valor de expectativa de regulação daquela emoção eleita. Em
seguida, após eleger o estímulo desencadeante mais adequado, o método do condi-
cionamento operante (OperantConditioning) é acionado para selecionar a ação que
será executada na experiência em andamento, com base no estímulo e emoções a
serem atendidos.
A escolha da ação a ser executada é realizada probabilisticamente, com ações que
resultaram em recompensas para o objeto em questão tendo uma probabilidade maior
de serem escolhidas frente às ações que resultaram em punições para o agente
5
.
Antes de emitir o IntStiEmotional, o PartialAppraisal também calcula a eficiência
comportamental que irá definir a velocidade de movimentação, a abertura de seu
campo de visão, entre outras características, que serão impostas a próxima ação do
ASCS. O cálculo da eficiência comportamental é dada em função do nível de arousal
da emoção complexa e do número de estímulos percebidos, sendo também enviada
como parâmeto para o componente FullAppraisal.
5.3.3 A dinâmica da fase de reconsolidação da memória
A reconsolidação da memória ocorre durante a operação do componente Valuation,
assim que a ação foi escolhida pelo FullAppraisal e o componente Homeostatic-
Regulation atualizou o arousal das emoções. De posse do identificador da memória
eleita e do nível de arousal das emoções complexas, o componente Valuation cria
uma instância de LongTermMemory e aciona o método da reconsolidação da memó-
ria (memoryReconsolidation()).
Num primeiro momento, o método memor yReconsolidation() percorre todas as me-
mórias que compõem LongTermMemory em busca da memória eleita naquele ins-
tante. Uma vez que a memória eleita é encontrada ela é submetida ao método da aqui-
sição, onde o valor de sua intensidade emocional é recalculado por meio da equação
4.4
6
.
5
Maiores detalhes sobre a atuação do método do condicionamento operante, ver Silva (2008)).
6
Note que a equação 4.4 descreva ambos os processos de aquisição (reforço) e extinção (inibição),
sendo que para cada qual um valor diferenciado de I M R
sat
.
5.4 Considerações finais 131
Em seguida, o método memoryReconsolidation() busca as demais memórias, isto
é, aquelas que não foram eleitas para o cálculo da expectativa de regulação emo-
cional naquela interação. Essas memórias serão, então, submetidas ao processo da
extinção, onde a intensidade emocional de cada uma é enfraquecida através das mes-
mas equação 4.4.
Em virtude das únicas emoções básicas passíveis de regulação implementadas terem
sido Hungry, Tedium e Pain, somente as ações que contribuem para sua regulação
- comer, brincar e tocar - são valoradas. Conseqüentemente, somente experiências
relativas a estas ações poderão ser evocadas e, assim, reconsolidadas.
Para manter coerência com a literatura estudada [Brown e Kulik (1977), Talarico e
Rubin (2003)], o recálculo da intensidade emocional das memórias cintilantes é difer-
enciado das memór ias regulares. Para permitir que este tipo de memória permaneça
por muito tempo na memória do ASCS, foi assumido que ela possuirá intensidade
emocional constantemente e igual ao nível máximo, isto é, 10. Isto quer dizer que
em qualquer circunstância (adquirindo ou se extingüindo) a memória cintilante sempre
possuirá intensidade emocional igual a 10.
5.4 Considerações finais
Este capítulo teve como objetivo descrever em detalhes os aspectos relativos às im-
plementação do modelo da aplicação desenvolvida para realização das simulaçcões
computacionais do modelo proposto.
Ainda que o mecanismo de formação de memórias experiencias tenha sido simpli-
ficado, foi possível comprovar a viabilidade das alterações propostas na arquitetura
e, além disso, verificar que esta proposta se apresenta bastante coerente com os
conceitos teóricos utilizados como fundamentos para o trabalho em questão. Uma
observação a ser feita é que os diversos tipos de memórias utilizados não possuem
execução autônoma (i.e., não rodam em threads próprias). Elas apenas influenciam
a execução de outros por meio de seus conteúdo. Outra ponto a observar é com
relação à complexidade do método implementado para cálculo da expectativa de in-
teração, bem como sua importância para o comportamento do agente. A análise dos
resultados obtidos será descrita no Capítulo 6, onde serão discutidas questões chaves
para melhorar a capacidade de sobrevivência e adaptativa do ASCS segundo o mo-
delo proposto.
132
6 Experimentos Computacionais,
Análise e Discussão dos
Resultados
Este capítulo tem por objetivo apresentar os experimentos computacionais realizados.
Os resultados obtidos serão analisados, avaliando o comportamento do ASCS após a
inclusão do mecanismo de formação de memórias experienciais na arquitetura ARTÍ-
FICE. Os resultados obtidos para um agente dotado de memórias experienciais será
confrontado com os resultados de um agente sem memória, mostrando que a memó-
ria faz com que o agente se adapte mais rápido ao ambiente e sobreviva por mais
tempo. Os experimentos foram realizados na versão 0.9.5 da aplicação ALifeWorld,
que será apresentada na próxima seção.
6.1 Aplicação de vida artificial ALIFEWORLD - 0.9.5
Como dito no Capítulo 4, a aplicação ALIFEWORLD - 0.9.5 foi criada estendendo
a versão 0.9.0, desenvolvida por Silva (2008). Ela pode ser resumida como uma apli-
cação de vida artificial em duas dimensões, onde o ASCS e o ambiente co-evoluem
por meio de interações mútuas. O ASCS busca interagir com o mundo a fim de man-
ter seu equilíbrio homeostático. No mundo artificial podem existir nutrientes, pedras,
brinquedos e abelhas com os quais o ASCS interage. Cada interação caracterizará
uma MEE na medida em que o ASCS a valora, segundo os critérios embutidos no seu
sistema de valoração emocional. Tais critérios, consistem em qualificar a variação dos
níveis de arousal da emoções verificada após cada interação. Um conjunto de MEE
formará uma ECQ à medida que uma emoção do tipo complexa reestabelecer seu
estado de equilíbrio. Ao final, esta ECQ passará a compor a memória de longo prazo
do ASCS.
6.1 Aplicação de vida artificial ALIFEWORLD - 0.9.5 133
Para caracterizar a experiência hedônica do ASCS, foi considerado que interações
que aumentam o nível de arousal das emoções complexas, isto é da emoção apatia e
estresse, terão conseqüências desprazerosas. as interações que contribuem para
diminuir o nível de arousal destas emoções terão consequências prazerosas. Vale
ressaltar que estas emoções são combinações das emoções básicas fome, dor e tédio.
Portanto, as MEE provenientes de interações que aumentam o nível de arousal destas
emoções também terão conseqüências desprazerosas. as MEE provenientes de in-
terações que diminuem o nível de arousal destas emoções serão prazerosas. Quando
o ASCS está sob a emoção básica dor e esta tem seu arousal aumentado, o arousal
da emoção complexa tédio diminui, o que significa que a mesma interação foi de-
sprazerosa com respeito à emoção básica dor e prazerosa com respeito à emoção
complexa tédio. A var iação do nível de arousal das emoções do ASCS é exibida na
interface através de cinco barras de progressão laterais nomeadas Hunger, Sleep,
Pain, Tedium, Apathy e Stress, como mostra a Figura 39. a dinâmica interna
do ASCS, assim como as memórias consolidadas, evocadas e reconsolidadas, será
exibida pelas mensagens na console, cujos “logs” em arquivos textos poderão ser
acessadas após a execução da aplicação
1
.
ASCS
Campo de visão
Green apple
Red apple
Bee
Stone
RedApple GreenApple Stone Bee Toy
Classical
Conditioning
Controle
Operant
Conditioning
Controle
Classical
Conditioning
Graphic
Operant
Conditioning
Graphic
Ball
ASCS
Campo de visão
Green apple
Red apple
Bee
Stone
RedApple GreenApple Stone Bee Toy
Classical
Conditioning
Controle
Operant
Conditioning
Controle
Classical
Conditioning
Graphic
Operant
Conditioning
Graphic
Ball
Figura 39: A interface da aplicação de vida artificial ALifeWorld 0.9.5 e seus elemen-
tos.
1
Os arquivos de textos estão armazenados no diretório raiz com os seguintes nomes: “InternalDy-
namics.txt”, “LTM.txt”, “MemoryEvocation.txt”, “MemoryReconsolidation.txt”.
6.2 Comportamentos emergentes 134
Nos quatros gráficos do canto inferior direito da interface gráfica pode ser visto a
curva da intensidade do condicionamento clássico para os componentes RedApple,
GreenApple, Stone e Bee. o gráfico do canto inferior esquerdo exibe a distribuição
de freqüência das ações a serem executadas para cada componente de software do
ambiente. A freqüência das ações executadas é alterada pela valoração emocional-
cognitiva da interação do agente com cada componente. No lado direito da interface, é
possível verificar os comandos de controle disponibilizados para automatizar o condi-
cionamento clássico e para modelar o comportamento do agente via condicionamento
operante. Os botões Play, Pause e Stop executam funções de continuar, pausar e
terminar a execução da aplicação. Os mecanismos de condicionamento clássico e
operante são os modos basais de aprendizagem associativa do ASCS e, portanto, po-
dem ser consideradas como memórias elementares. No entanto, por não serem foco
deste trabalho, tais mecanismos não serão aqui discutidos, para tanto, refira-se a Silva
(2008).
6.2 Comportamentos emergentes
Para manter seu equilíbr io homeostático, o ASCS precisa atender suas necessidades
corpóreas de fome, sono, tédio, apatia, estresse e evitar interações com objetos que
causam dor. Todas as emoções citadas, exceto a emoção dor, sofrem variação pas-
siva (i.e., que requer interação) do seu nível de arousal com o passar do tempo. Esta
variação será positiva ou negativa conforme as interações do ASCS com os objetos
do mundo. Por exemplo, ocorrerá variação positiva do arousal:
da fome quando o ASCS não receber estímulos energéticos, os quais contribuem
para sua regulação;
do tédio quando o ASCS não interagir com brinquedos;
do sono quando o ASCS fizer um movimento de translação;
da dor quando o ASCS tocar na abelha (Bee) e receber um estímulo de “picada”;
do estresse quando a variação do arousal das emoções fome, sono e dor forem
positivas;
6.2 Comportamentos emergentes 135
da apatia quando a variação do arousal das emoções tédio e sono forem positi-
vas.
Para diminuir o sono, o ASCS deverá ficar imóvel por alguns instantes, o que carac-
teriza a ação dormir. a diminuição da dor ocorre ao longo do tempo, isto é, ela se
desvanece por si só, desde que o ASCS não receba outra picada da abelha. Para
diminuir a fome o ASCS precisa comer maçãs (verdes ou vermelhas) para receber
estímulos energéticos. Para diminuir o tédio o agente precisa brincar com a bola,
recebendo assim, estímulos de serotonina que provocam a diminuição de seu tédio.
A emoção estresse diminui à medida que o arousal das emoções fome, sono e dor
diminuem. a emoção apatia diminui à medida que o arousal da emoção dor au-
menta ou à medida que o arousal das emoções tédio e sono diminuem. Nas Figuras
40 e 41, são mostrados instantâneos da execução da aplicação onde o ASCS realiza
a ação de tocar em uma abelha, em seguida as emoções dor e estresse aumentam e
a emoção apatia diminui.
Bee
ASCS
Arousal das emoções
Bee
ASCS
Bee
ASCS
Arousal das emoções
Figura 40: O ASCS se aproximando de uma abelha. Até este momento seu arousal
de dor (barra lateral esquerda) é nulo. Compare este resultado com o da Figura 41
após o ASCS tocar na abelha.
As ações ou comportamentos voluntários do ASCS serão selecionados em tempo de
execução, conforme os estímulos recebidos do ambiente, as emoções a serem aten-
didas, a expectativa de interação, as possibilidades de interação (affordances) que o
6.2 Comportamentos emergentes 136
Arousal das emoçõesArousal das emoções
Figura 41: O arousal das emoções dor e estresse aumentam, enquanto o arousal da
emoção apatia diminui, após o ASCS ter tocado a abelha e, assim, ter sido “picado”
por ela. Compare este resultado com a o anterior, Figura 40 antes do ASCS tocar a
abelha.
agente dispõe numa certa situação e o nível de condicionamento operante. Na Tabela
5 constam as affordances que foram previstas na aplicação. Dado uma certa situação
do ASCS-em-seu-ambiente, na qual um conjunto de objetos em seu campo sen-
sorial, as affordances caracterizam as possíveis interações a serem executadas com
cada um desses objetos naquele instante.
Toda interação terá como origem uma micro-experiência que é valorada emocional-
mente e ficará armazenada temporariamente em WorkingMemory até que o nível
arousal das emoções complexas voltem para a faixa de equilíbrio homeostático. Quando
o equilíbrio homeostático é alcançado, uma experiência é formada, e esta passará a
compor a LongTermMemory.
Na Figura 42 é exibido o conteúdo de LongTermMemory após algumas pouquissímas
interações do ASCS. Verifica-se que foi formada uma memória apenas, proveniente
da ECQ que regulou o arousal da emoção complexa estresse. Esta experiência é
composta de duas micro-experiências provenientes das ações de comer GreenAp-
ple (Nutrient 2). A primeira micro-experiência foi relativa a emoção básica Hungrer e
foi prazerosa (valência true), pois o ASCS recebeu um estímulo nutritivo. A segunda
micro-experiência, relativa a emoção básica tédio, não foi prazerosa (valência nega-
6.2 Comportamentos emergentes 137
Situação
Objeto
Se está vendo um
objeto
(Vendo)
Se está em contato
İsico com um objeto
(Tocando)
Se não está vendo
nenhum objeto
(Não vendo)
RedApple
GreenApple
Stone
Approach
Avoid
Sleep
Eat
Avoid
Sleep
Bee
Approach
Avoid
Sleep
Touch
Avoid
Sleep
Toy
Approach
Avoid
Sleep
Play
Avoid
Sleep
Sleep
Wander
Tabela 5: As affordances, possibilidade de ação com cada objeto, consideradas na
aplicação ALifeWorld 0.9.5.
tiva), pois o ASCS comeu GreenApple ao invés de brincar com o Toy.
Long Term Memory position(1) Number of the ECQ = 1
Long Term Memory position(1) Memory intensity = 7.8580860075677474
Long Term Memory position(1) Affect complex = Stress
Long Term Memory position(1) It's Flashbulb Memory? False
-------------> Micro Episode(1) affect basic = Hunger
-------------> Micro Episode(1) weight = 0.9815
-------------> Micro Episode(1) valence = true
-------------> Micro Episode(1) action = eat
-------------> Micro Episode(1) target = Nutrient2
-------------> Micro Episode(1) task complexity degree = 0.09516258196404048
-------------> Micro Episode(1) Was it good for experience = true
-------------> Micro Episode(1) MME form traumatic memory = false
-------------> Micro Episode(1) It's Blocked = false
-------------> Micro Episode(2) affect basic = Tedium
-------------> Micro Episode(2) weight = -0.6215000000000193
-------------> Micro Episode(2) valence = false
-------------> Micro Episode(2) action = eat
-------------> Micro Episode(2) target = Nutrient2
-------------> Micro Episode(2) task complexity degree = 0.09516258196404048
-------------> Micro Episode(2) Was it good for experience = true
-------------> Micro Episode(2) MME form traumatic memory = false
-------------> Micro Episode(2) It's Blocked = false
Figura 42: Conteúdo de LongTermMemory do ASCS após pouquíssimas interações,
ilustrando uma memória regular constituída de duas MME.
Uma vez que existam experiências valoradas em LongTermMemory, o ASCS apre-
senta um comportamento seletivo, isto é, ele demonstra preferência por algum objeto
dependendo da emoção básica atual. Por exemplo, ao possuir experiências de comer
maçãs e brincar com a bola, sob a emoção fome, o ASCS irá preterir os brinque-
6.2 Comportamentos emergentes 138
dos, pois neste momento ele precisa de estímulos energéticos para diminuir o arousal
da fome. na ausência de maçãs, os brinquedos são preferidos
2
. Este comporta-
mento também é verificado quando agente elege outro tipo de emoção básica, como
a emoção tédio, por exemplo. Neste caso, ele irá preter ir as maçãs (ou outro objeto
que seja) e irá interagir com eles caso não esteja vendo nenhum brinquedo. Ainda
que o ASCS coma uma maçã sob a emoção de tédio, esta MEE será valorada como
desprazerosa o que irá diminuir as chances dele escolher novamente uma maçã em
suas próximas interações. Tais critérios de seleção, ainda que simples do ponto de
vista biológico, constituem mecanismos de desambiguação das possibilidades de in-
terações (affordances) e de seleção de ação, que atendem os requisitos de adaptação
desta aplicação.
Quando o ASCS experiência apenas um tipo de objeto, pode ser observado no seu
comportamento sua preferência por este objeto. Por exemplo, se o agente possuir
apenas experiências com maçãs vermelhas, ele irá preterir as maçãs verdes, caso
elas também estejam presentes em seu campo de visão. Este tipo de comportamento
ocorre até o momento que o ASCS comer uma maçã verde (que o fará ter maior pro-
babilidade de interagir com esse objeto nas próximas vezes que visualizá-lo). Como
conseqüência, toda vez que o agente estiver sob a emoção fome, ele irá perceber que
a maçã verde o sacia muito mais do que a maçã vermelha. Assim, o agente apresen-
tará um comportamento seletivo, passando a preterir as maçãs vermelhas ao invés
de maçãs verdes, desde que esteja sob a emoção fome. Este comportamento é ob-
servável no ASCS quando ele também interage com outros tipos de objetos, que não
nutrientes
3
.
Outro comportamento emergente do ASCS diz respeito à auto-regulação de sua efici-
ência comportamental para desempenhar suas ações no mundo. O cálculo da eficiên-
cia comportamental (BehaviouralEfficiency) é mensurado conforme a lei de Yerkes-
Dodson, descrita pelas equações 4.1 e 4.2. Se a tarefa não requer o córtex pré-frontal,
isto é, se o ASCS possuir nenhum ou apenas um objeto em seu campo sensorial, a
velocidade de execução desta tarefa será alta, evidenciando sua eficiência comporta-
mental para situações deste tipo. Porém, se a tarefa requer o córtex pré-frontal, isto
é, caso o ASCS tenha mais de um objeto em seu campo sensorial, sua eficiência
comportamental para execução desta tarefa será baixa, neste caso sua velocidade de
movimentação diminui.
2
Este comportamento pode ser comprovado no vídeo mostrando a execução do experimento,
diponível em http://www.lsi.cefetmg.br/artifice/v095/preferenceObject.html
3
O vídeo que comprova este comportamento está disponível em
http://www.lsi.cefetmg.br/artifice/v095/memoryFormation.html
6.3 Experimentos envolvendo a formação das memórias 139
A variação da velocidade do ASCS também é comprovada quando ele interage com
algum objeto e executa uma ação prazerosa. Neste caso, esta ação terá maiores
chances de ocorrer no futuro e mais rápido o ASCS tende a se aproximar mais fre-
quentemente deste objeto. A situação contrária também é verdadeira. Se o agente
interagir com um objeto que tenha como resultado uma valência negativa, como por
exemplo, tocar na abelha (Bee). A probabilidade da ação tocar diminui, e a velocidade
com que o ASCS evita a abelha tende a aumentar
4
.
6.3 Experimentos envolvendo a formação das memó-
rias
Os experimentos envolvendo o mecanismo de formação das memór ias visam compro-
var que o ASCS é capaz que criar um repertório comportamental terceiro nível
5
, por
meio da consolidação, evocação e reconsolidação de suas experiências vivenciadas
e valoradas emocionalmente pelo seu sistema cognitivo-emocional.
À medida que as memórias são formadas, o ASCS faz uso das mesmas para sele-
cionar aquele objeto do mundo com o qual ele (o ASCS) irá interagir. Neste caso,
ele selecionará o objeto cuja expectativa de interação será maior (i.e., que mais regu-
lará sua homeostase). As memórias que contribuirem para sua adaptação terão sua
intensidade emocional reforçada, enquanto aquelas que não contribuem (ou pouco
contribuem) terão sua intensidade emocional enfraquecida.
A dinâmica de desenvolvimento das memórias do ASCS, durante sua ontogênia, é
modulado pelas fases de consolidação, evocação e reconsolidação, com intervenção
dos processos de aquisição e extinção.
É importante destacar que as curvas apresentadas para aquisição (Figura 29) e ex-
tinção (Figura 30) das memórias foram obtidas em condições de “laboratório” e são
utilizadas apenas para fins pedagógicos. De fato, os exper imentos conduzidos em
condições “naturais” mostram que a dinâmica das memórias é diferente. No caso de
um experimento de “laboratório”, o cientista intervem diretamente nas condições do
ambiente, deixando-o cuidadosamente preparado para evidenciar o comportamento
4
O vídeo que demonstra a auto-regulação da eficiência comportamental do ASCS está disponível
em: http:www.lsi.cefetmg.br/artifice/v095 /behaviouralEfficiency.html.
5
Considera-se que o repertório de comportamentos de zerogéssimo nível são as ações reflexas
(posto que foram embutidas no agente), o repertório de primeio nível é constituído pelas associações
estímulo-resposta resultantes do condicionamento clássico, enquanto o repertório de segundo nível é
aquele que resulta dis processos de aprendizagem associativa via condicionamento operante.
6.3 Experimentos envolvendo a formação das memórias 140
desejado, como foi neste trabalho de pesquisa. Sob condições naturais, o ASCS pode
vivenciar diversas experiências que irão compor vários tipos de memórias, sejam elas
regulares ou cintilantes, proporcionando a ele uma diversidade de escolhas a cada
momento de sua evocação. Neste sentido, o ASCS poderá vivenciar “N” situações em
que uma memór ia será evocada e, assim, será submetida ao processo de aquisição,
em que sua intensidade emocional será reforçada. Porém, ele também poderá viven-
ciar “N” situações em que esta memória não será evocada e, sendo assim, será sub-
metida ao processo de extinção em sua intensidade emocional será diminuída. Vale
lembrar que as memórias cintilantes apresentam uma dinâmica bem distinta das me-
mórias regulares. Elas são muito mais intensas e alcançam rapidamente altos níveis
de intensidade emocional (no caso, com um único evento). Por outro lado, quando
submetidas ao processo de extinção, no caso deste trabalho, elas não se extinguem,
ao contrário das memórias regulares.
Para simular o mecanismo de formação de memórias em “condições naturais” foi
realizado um experimento para verificar se o ASCS conseguiria consolidar suas ex-
periências, evocá-las quando necessário e reconsolidá-las ao fim de cada interação
ajustando o nível de sua intensidade emocional. O ambiente de simulação foi com-
posto por maçãs verdes, bolas, maçãs vermelhas, pedras e abelhas que eram inseri-
dos manualmente 1 de cada vez e oferecidos ao ASCS à medida que o arousal de
suas emoções aumentavam ou diminuiam. O experimento foi realizado em uma única
sessão, que durou aproximadamente 7 minutos (420 segundos).
Para a realização desse exper imento, os diversos parâmetros foram ajustados da
seguinte forma:
a) Nível de condicionamento operante inicial:
40% para a ação approach, para todos objetos;
20% para a ação sleep, para todos objetos;
20% para a ação avoid , para todos objetos;
20% para a ação eat, para maçã verde, maçã vermelha e pedra;
20% para a ação play, para a bola;
20% para a ação touch, para a abelha;
b) Intensidade Emocional da Memória Regular (IMR) - processo de aquisição e
extinção:
6.3 Experimentos envolvendo a formação das memórias 141
Rever os parâmetros apresentados na Tabela 2.
Para o cálculo de IMR foram utilizadas as equações 4.4, c.f., seção 4.1.5. Os demais
parâmetros, tais com: P
mr
, IMR
sat
, IMR
i
e outros, foram obtidos em tempo de exe-
cução do experimento.
Vale ressaltar que durante o processo de aquisição e extinção das memórias cinti-
lantes foi assumido que a intensidade emocional deste tipo de memória sempre será
10, como justificado na seção 4.1.6.
6.3.1 Análise e discussão dos resultados
O resultado do experimento pode ser visto na Figura 43, que mostra a Intensidade
Emocional das memórias em função do tempo (real), em milessegundos.
0
2
4
6
8
10
12
0 200000 400000 600000 800000 1000000 1200000
Intensidade Emocional
Tempo (ms)
Formação das Memórias
M1 - Cintilante (C1)
M2 - Regular (R1)
M3 - Cintilante (C2)
M4 - Regular (R2)
M5 - Regular (R3)
M6 - Regular (R4)
M7 - Regular (R5)
M8 - Regular (R6)
M9 - Regular (R7)
M10 - Regular (R8)
C1
R1
C2
R2
R3
R4
R6
R5
R7
R8
Figura 43: Dinâmica da intensidade emocional das memórias formadas em condições
naturais.
Durante o experimento foram formadas dez memórias, sendo duas cintilantes (C1 e
C2) e oito regulares (R1 a R8). A princípio pode-se perceber que a intensidade emo-
cional de todas as memórias oscilou ao longo do tempo e a curva formada nada se
assemelha com as curvas apresentadas nas Figuras 29 e 30 (obtidas em condições
de “laboratório”). Do início do experimento até aproximadamente 3 minutos (ou 180
segundos), percebe-se que o ASCS ainda não havia formado nenhuma memória. Em
seguida, foram formadas duas memórias, uma cintilante (C1) e uma regular (R1). A
memória C1 com o nível de intensidade emocional máximo (10,0) e a memória R1
com valor de intensidade emocional próximo a 4,0. Com o passar de poucos se-
gundos, mais duas memórias foram formadas. Outra memória cintilante (C2) e outra
6.3 Experimentos envolvendo a formação das memórias 142
memória regular (R2). Neste caso, a memória C2 possui o mesmo valor padrão de
intensidade emocional das memórias cintilantes (i.e., 10,0). o nível de intensidade
emocional da memória regular R2 é pouco maior que o da memória R1 (IE
R2
> IE
R1
).
Antes que outras memórias fossem formadas, percebe-se que durante alguns minutos
as memórias R1 e R2 não foram evocadas, que os níveis de intensidade emocional
das duas caíram. Isto indica que as memórias cintilantes, por possuírem altos valores
de intensidade emocional, e terem maior probabilidade de serem eleitas para o cálculo
da expectativa da interação. Reiterando que neste trabalho optou-se por este tipo de
memória nunca se extinguir. Portanto, elas sempre terão intensidade emocional con-
stante e de valor 10,0. Com o passar do tempo, a memória R2 foi eleita e seu nível de
intensidade aumentou, sendo ainda maior que a intensidade da memória R1 (IE
R2
>
IE
R1
).
Logo em seguida, foi formado mais uma memória regular (R3). Das três memórias for-
madas R3 é a que possui maior valor de intensidade emocional (IE
R3
> IE
R2
> IE
R1
),
o que diminui a probabilidade de R1 e R2 serem eleitas. Embora não pareça a in-
tensidade emocional da memória R1 continua decaindo. Próximo aos 6 minutos (400
segundos) do experimento, uma nova memória regular R4 é formada e a intensidade
emocional da memória regular R3 volta a oscilar. A partir deste momento, R3 e R4
têm valores de intensidade muito próximos, enquanto a intensidade emocional de R1
e R2 diminui. Após mais algumas interações do ASCS é formado mais uma memória
regular R5. Num primeiro momento R5 é eleita para cálculo da expectativa de intera-
ção. Logo em seguida, a memória R1 (que até o momento não havia sido sorteada) é
eleita e sua intensidade emocional aumenta, ficando maior que a intensidade de R2.
Neste momento tem-se: IE
R3
> IE
R4
> IE
R1
> IE
R2
> IE
R5
. Em seguida, mais 2 memó-
rias regulares são formadas (R6 - R7), todas com intensidade emocional maior que
R1, R2 e R5. A partir deste instante (entre 7 e 13 segundos do experimento) a LTM
registra 9 memórias - 2 cintilantes e 7 regulares. É observado que mesmo que uma
memória seja prioritária, isto é, tenha maior valor de intensidade emocional, isso não
garante que ela será sempre eleita. Próximo aos minutos finais do experimento mais
uma memória regular compõe LTM (R8). Ao final do experimento vê-se que nenhuma
memória foi extinta por completo, embora as chances de R1 e R5 de serem eleitas
sejam pequenas.
Com este experimento, verifica-se que o ASCS é capaz de estabelecer um mecanismo
de formação de memórias, consolidando suas experiências, evocando-as quando ne-
cessário e as reconsolidando, reajustando o valor de sua intensidade emocional. O
6.4 Experimentos envolvendo o nível de condicionamento, seleção de ações e memória 143
ASCS também é capaz de formar memórias cintilantes altos níveis de intensidade
emocional rapidamente.
Como visto, quanto maior o número de memórias formadas e quanto mais interações
o ASCS estabelecer, maior será a oscilação da intensidade emocional das memórias.
Quando uma memória atinge baixos níveis de intensidade emocional, a variação de
sua intensidade emocional no processo de extinção é muito pequena, gerando assim,
a falsa impressão de que a intensidade emocional da memória, sob estas condições,
é constante (como ocorreu com as memórias R1, R2 e R5). este efeito se deve ao
decaimento exponencial da intensidade emocional quando esta se encontra próx-
imo ao limiar de saturação (mínimo da função). Pode-se perfeitamente, ajustar os
parâmetros de cada memória associada a cada emoção, de modo a ter processos de
aquisição ou de extinção específicos e diferenciados.
6.4 Experimentos envolvendo o nível de condiciona-
mento, seleção de ações e memória
Este experimento teve como objetivo comparar o comportamento de um ASCS dotado
do mecanismo de formação de memórias experienciais desenvolvido neste trabalho
com um ASCS sem este mecanismo. Essa análise foi feita considerando-se diferentes
níveis iniciais de condicionamento. O ASCS com memória poderá evocar as memó-
rias de suas experiências passadas para influenciar na escolha da ação, enquanto o
ASCS sem memória não o poderá fazer.
O ambiente de vida artificial utilizado para realização do experimento consistiu em dis-
tribuir 12 maçãs vermelhas, 18 maçãs verdes e 25 bolas em posições aleatórias do
ambiente para que se pudesse mensurar o tempo que os ASCS (com e sem memória
experiencial) gastaram para interagir com 10 dentre os 55 objetos dispostos no mundo
artificial. O experimento foi realizado para três níveis iniciais distintos de condiciona-
mento operante, que se traduzem nas probabilidades de seleção das ações descritas
na Tabela 6.
Para cada nível inicial de condicionamento operante foram realizadas 20 sessões do
experimento, sendo que a cada nova sessão todos os objetos eram reposicionados
aleatoriamente.
É importante mencionar que à medida que o ASCS interagia com um dado objeto, este
era eliminado do mundo, seja porque o ASCS comeu uma maçã vermelha ou verde,
6.4 Experimentos envolvendo o nível de condicionamento, seleção de ações e memória 144
Nível incial de
condicionamento operante
Valor inicial das probabilidades
de seleção das ações
approach: 25%
avoid: 25%
eat: 25%
sleep: 25%
play: 25%
approach: 40%
avoid: 20%
eat: 20%
sleep: 20%
play: 20%
approach: 70%
avoid: 10%
eat: 10%
sleep: 10%
play: 10%
Média
Alto
Baixo
Tabela 6: Nível do condicionamento operante para os experimentos.
seja porque ao brincar com a bola ele a estourava. Não houve reposição automática
de objetos, portanto ao longo do tempo o número de objetos disponíveis para o ASCS
interagir ia dimnuindo progressivamente. Este fato teve efeitos que serão discutidos
mais à diante.
O arousal inicial para as emoções era o mesmo para todas as sessões realizadas,
sendo o da emoção fome, sono e tédio igual a 0,18 (nível de despertar), o arousal
inicial da dor foi estabelecido em 0,0, enquanto o da apatia e estresse foi estabelecido
em 0,36
6
.
Na Figura 44 tem-se o tempo médio (em milissegundos) gasto por ambos agentes
submetidos a um condicionamento operante inicial baixo para interagirem com 10 ob-
jetos quaisquer dentre os 55 disponíveis no mundo artificial.
Com este nível inicial de condicionamento operante, inicialmente os agentes não ap-
resentam comportamento seletivo, sendo assim todas as ações têm a mesma proba-
bilidade de serem selecionadas em qualquer situação. Isto justifica porque o agente
com memória, em geral, teve melhor desempenho do que o agente sem memória.
Pois sua memória serviu de guia para seu comportamento, permitindo-o interagir com
os objetos que melhor regulam seu equilíbrio corpóreo.
Até a 3
a
. interação, o agente dotado de memória teve poucas exper iências (o que sig-
nifica poucas memórias formadas), isso o faz ter um comportamento semelhante ao
do agente sem memória. À medida que o número de interações aumenta, percebe-se
6
Para a emoção estresse este valor é originado da combinação do arousal da emoções básicas
fome, sono e dor. para emoção apatia este valor é originado da combinação do arousal das emoções
básicas tédio e sono.
6.4 Experimentos envolvendo o nível de condicionamento, seleção de ações e memória 145
Tempo médio para interagir - Condicionamento Operante Inicial: Baixo
0
50000
100000
150000
200000
250000
300000
350000
400000
0 1 2 3 4 5 6 7 8 9 10
Número de Interações
Tempo (ms)
ASCS sem
Memória
ASCS com
Memória
Figura 44: Tempo médio para o ASCS (com e sem memória experiencial) interagir
com os objetos - Condicionamento Operante Inicial: Baixo.
que o agente dotado de memória gasta menos tempo para interagir com os objetos.
Ou seja, quanto maior o número de memórias formadas pelo agente mais eficiente ele
será.
Neste experimento percebe-se que quando o nível de condicionamento inicial é baixo
o número de memórias formadas é fundamental para a eficiência do agente. Quando
realizamos o experimento deixando o ASCS continuar suas interações, após o limiar
de 10, observamos que o agente com memória é cada vez mais eficiente do que o
agente sem memória.
O mesmo experimento foi repetido sob as mesmas condições iniciais, porém o nível
inicial de condicionamento operante foi médio (c.f., Tabela 6). A Figura 45 apresenta o
resultado apurado nas segunda sessão.
Tempo médio para interagir - Condicionamento Operante Inicial: Médio
0
50000
100000
150000
200000
250000
300000
350000
400000
0 1 2 3 4 5 6 7 8 9 10
Número de interações
Tempo (ms)
ASCS sem
Memória
ASCS com
Memória
Figura 45: Tempo médio para o ASCS (com e sem memória experiencial) interagir
com os objetos - Condicionamento Operante Inicial: Médio.
6.4 Experimentos envolvendo o nível de condicionamento, seleção de ações e memória 146
Neste experimento, os agentes apresentam inicialmente um certo comportamento
seletivo, tendo maior probabilidade de interagir com os objetos do que executar as
outras ações. O tempo médio de interação é, assim, sistematicamente menor do que
o gasto no caso do condicionamento operante inicial baixo. Esse efeito exerceu in-
fluência no experimento, pois somente após a metade do experimento (neste caso,
5 interações) é que agente com memória conseguiu ser significativamente mais efi-
ciente do que o agente sem memória.
O que se observa neste caso é que o condicionamento operante funciona, para to-
dos os fins, como um tipo especial de memória, chamado na literatura de memória
de habituação. Sendo assim, da 1
a
. até a 4
a
. interação as memórias for madas pelo
agente exercem pouca influência na sua eficiência e é por este motivo que seu com-
portamento é tão semelhante ao do agente sem memória.
A partir disso fica evidente que para conseguirmos comprovar o que foi observado no
experimento anterior seria necessário que o agente executasse um número maior de
interações. Pois, quanto maior o número de memórias formadas, maior será a experi-
ência do agente e essa passaria a guiar seu comportamento como um todo.
Novamente o experiemento foi repetido, agora com um nível inicial de condiciona-
mento operante alto, e demais condições idênticas. A Figura 46 apresenta o resultado
obtido.
Tempo médio para interagir - Condicionamento Operante Inicial: Alto
0
50000
100000
150000
200000
250000
0 1 2 3 4 5 6 7 8 9 10
Número de interações
Tempo (ms)
ASCS sem
Memória
ASCS com
Memória
Figura 46: Tempo médio para o ASCS (com e sem memória experiencial) interagir
com os objetos - Condicionamento Operante Inicial: Alto.
O resultado deste experimento é similar ao obtido com o nível de condicionamento
operante médio, pois neste os agentes também possuem desde iníco maior pro-
babilidade de se aproximarem dos objetos, e portanto, têm maior probabilidade de
interação. Apenas no final do experimento é que o agente com memória demonstra
6.4 Experimentos envolvendo o nível de condicionamento, seleção de ações e memória 147
sua eficiência, gastando menos tempo para realizar uma interação do que o agente
sem memória.
Este experimento corroborar o que foi observado nos exemplos anteriores. Quanto
maior o nível inicial do condicionamento operante, maior deverá ser o número de ex-
periências do agente com memória para que ele consiga se diferenciar melhor do
agente sem memória. Neste exemplo em específico, com o nível de condicionamento
alto, o comportamento dos agentes é semelhante durante quase todo experimento.
Isso significa que sob essas condições o agente com memória, para ser mais efi-
ciente, precisa formar um número elevado de memórias.
Dito de outra forma, quanto maior for o nível inicial do condicionamento operante, mais
habituado será o ASCS desde o princípio. Portanto as memórias experienciais ap-
resentarão um efeito dominante (sobre a memória de habituação) após um número
crescente de interações.
Os três experimentos comprovam que a memória é um importante fator para a adap-
tação do ASCS, visto o melhor desempenho do agente com memória quando o nível
de condicionamento é baixo ou médio. Enquanto o agente não tiver formado um certo
número de memórias seu comportamento será similar ao comportamento do agente
sem memória. Por outro lado, após formar um número considerável de memór ias seu
comportamento é cada vez mais eficiente em relação ao agente sem memória.
Sob outra perspectiva, o nível de condicionamento operante exerce forte influência no
experimento. Quanto mais condicionado inicialmente o agente está, menos tempo ele
gasta para interagir com os objetos. Ao final de apenas 10 interações esta diferença
de performance é de ±24%(comparando os experimentos para condicionamento ini-
cial alto e baixo).
A fim de comprovar a alteração das probabilidades das ações no decorrer do experi-
mento e ainda verificar que o agente com memór ia possui melhor desempenho do que
o agente sem memória, foram extraídos o intervalo do tempo médio (nas 20 sessões)
gasto para que os agentes encontrassem um objeto no mundo e interagissem com
ele. Os resultados encontrados, para cada nível inicial de , pode ser observado na
Figura 47.
Antes que se faça qualquer comentário a respeito dos resultados obtidos uma justifica-
tiva é necessária. Todos os experimentos realizados foram baseados nos experimen-
tos propostos e realizados por Silva (2008). Particulamente neste tipo de experimento,
Silva (2008) comprovou que quanto mais condicionado o agente está, menor será o
intervalo de tempo médio que ele gasta para interagir com um objeto (ver Figura 48),
6.4 Experimentos envolvendo o nível de condicionamento, seleção de ações e memória 148
Intervalo do tempo médio gasto para encontrar um objeto no ambiente
e interagir - Condicionamento Operante Inicial: Médio
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
50000
0 1 2 3 4 5 6 7 8 9 10
Número de interações (B)
Tempo (ms)
ASCS sem
Memória
ASCS com
Memória
Intervalo do tempo médio gasto para encontrar um objeto no ambiente
e interagir - Condicionamento Operante Inicial: Alto
0
5000
10000
15000
20000
25000
30000
0 1 2 3 4 5 6 7 8 9 10
Número de interações (C)
Tempo (ms)
ASCS sem
Memória
ASCS com
Memória
Intervalo do tempo médio gasto para encontrar um objeto no ambiente
e interagir - Condicionamento Operante Inicial: Baixo
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
50000
0 1 2 3 4 5 6 7 8 9 10
Número de Interações (A)
Tempo (ms)
ASCS sem
Memória
ASCS com
Memória
Figura 47: Intervalo de tempo médio (em 20 sessões) para o ASCS (com e sem me-
mória experiencial) encontrar um objeto no mundo e interagir com ele para cada nível
inicial de condicionamento operante.
6.4 Experimentos envolvendo o nível de condicionamento, seleção de ações e memória 149
ou seja, o intervalo de tempo médio para cada interação é uma função decrescente.
Porém, esta constatação não foi observada no presente trabalho, onde o intervalo de
tempo médio encontrado oscilou ao longo das interações.
Figura 48: Intervalo de tempo médio gasto para encontrar e comer maçãs para os três
níveis iniciais de condicionamento.
FONTE - Silva (2008) p. 115.
Quando Silva (2008) realizou seu experimento, a aplicação era composta de apenas
3 emoções básicas - fome (hunger), sono (sleep) e dor (pain). No caso daquele ex-
perimento, apenas a emoção fome era passiva de regulação através de interações.
Sendo assim, ele utilizou no experimento apenas um tipo de objeto no mundo, qual
seja, maçãs vermelhas. Naturalmente que, a cada interação, o agente sempre recebia
uma recompensa prazerosa, o que fazia o intervalo de tempo médio para encontrar
uma maçã e comê-la sempre diminuir nas próximas interações.
no caso do presente experimento, a situação não foi a mesma. Atualmente a ar-
quitetura conta com 6 tipos de emoções, sendo duas complexas (apatia (apathy) e
estresse stress) e 4 emoções básicas (fome (hunger), sono (sleep), dor (pain) e tédio
(tedium)). No caso deste experimento, as emoções fome, tédio, estresse e apatia são
passíveis de regulação emocional mediante interações com os objetos. Para tanto, du-
rante o experimento, foram utilizados maçãs vermelhas, maçãs verdes e bolas. Sendo
assim, nem sempre o agente receberá recompensas ao final de uma interação. Por
exemplo, se o agente estiver sob a emoção de tédio e estiver vendo apenas nutrientes,
ele irá interagir com eles. A valoração hedônica desta ação será negativa e a probabi-
lidade de repetir a ação comer diminui. Algo similar acontece se o agente estiver sob a
emoção de fome e interagir com bolas. Ele também não será recompensado e a ação
6.4 Experimentos envolvendo o nível de condicionamento, seleção de ações e memória 150
de brincar terá sua probabilidade diminuída , reduzindo as chances dele executá-la
no futuro. Eventos tais como esses recém descritos aconteceram diversas vezes ao
longo do experimento, o que fez o intervalo de tempo das interações oscilar.
Para exemplificar o que foi explicado, foi retirada uma única sessão aleatoriamente en-
tre todas as sessões dos experimentos realizados no caso do agente com memória.
Visando deixar claro esse ponto, a Figura 49 mostra como o intervalo do tempo para
o ASCS interagir com um objeto oscilou.
Condicionamentodio - ASCS com memória
0
10
20
30
40
50
60
70
80
90
0 1 2 3 4 5 6 7 8 9 10
Interações
Tempo (s)
Sob a emoção
fom e interagiu
com a bola
Sob a emoção fom e
inte r agiu com m açã
vermelha
Sob a emoção
fom e interagiu
com m açã verde
Sob a emoção
dio inte r agiu
com a bola
Sob a emoção
fom e interagiu
com m açã verde
Sob a emoção
dio inte r agiu
com a bola
Figura 49: Intervalo de tempo para o ASCS com memória encontrar um objeto no
mundo e interagir com ele - Condicionamento Operante Inicial Médio.
Nas interações 0, 1 e 2 o agente interagiu consecutivamente com a bola mediante
a emoção fome. Como este tipo de interação não é propício para regular a emoção
fome, o tempo das interações aumentou progressivamente. nas interações 3, 4 e
5 o agente interagiu consecutivamente com a maçã vermelha sob a emoção fome. As
interações foram prazerosas, pois comer maçã diminui o nível de arousal da emoção
fome. Sendo assim, o tempo dessas interações diminuiu progressivamente. Na inte-
ração 6, o agente interagiu com a maçã verde sob a emoção fome. Como ele ainda
não havia experienciado este tipo de objeto, o tempo para esta interação foi alto.
na interação 7 ele interagiu novamente com a maçã verde. Como o resultado da in-
teração anterior (6) foi prazeroso e se deu sob as mesmas condições da interação 7,
o tempo de interação diminuiu. Na interação 8 o agente interagiu com a bola sob a
emoção tédio, como as últimas interações com este tipo de objeto não tiveram resul-
tado positivo(interações 1,2 e 3), o tempo para esta interação foi alto. Na interação
9 o agente novamente interagiu com a maçã verde, como havia se passado algum
tempo após a última interação com este tipo de objeto, a memória dessa experiência
se extingüiu, fazendo com que o tempo para esta interação aumentasse um pouco
6.5 Experimentos envolvendo condicionamento, memória e sobrevivência 151
(compare o tempo gasto para interação 7 e o tempo gasto para a interação 9).
a última interação (10), o agente interagiu com a bola, como ele havia recentemente
experienciado este tipo de objeto e seu resultado foi positivo (interação 8), o tempo
para esta interação diminuiu.
Voltando aos gráficos apresentados na Figura 47, de modo geral, eles evidenciam que
o tempo que os dois agentes gastam para encontrar os objetos e interagir com eles
oscilou ao longo dos experimentos. No entanto, pelo exposto anteriormente, o tempo
que um ASCS gasta para encontrar e interargir com um certo tipo de objeto diminui
(ou aumenta) progressivamente, caso as interações sejam prazerosas (desprazerosa).
Outro ponto de destaque é que o nível inicial do condicionamento afeta o resultado,
fazendo com que os agentes que estão sob o nível de condicionamento alto gastem
menos tempo para realizar a tarefa (compare o tempo gasto pelos agentes no gráfico
A, B e C), o que é de fácil compreensão considerando o fenômeno da habituação que
é bem presente quando o nível inicial do condicionamento é aumentado.
Analisando os gráficos A e B sob outra perspectiva, percebe-se que o agente com
memória gasta menos tempo para encontrar e interagir com os objetos. Neste caso, a
formação da memória favoreceu o desempenho do agente, facilitando sua adaptação.
o gráfico C corrobora com o resultado apurado no experimento anterior. Sob alto
nível de condicionamento operante a ação da memória é anulada, fazendo com que os
agentes tenham um comportamento bem próximo. Mais uma vez, o condicionamento
operante funcionou como um mecanismo de formação memórias de habituação, jus-
tificando porque o agente sem memória não possui um comportamento tão errático
quanto se poderia supor.
Realizando novos experimentos, desta vez não limitador a 10 interações, verificou-se
que o agente com memória apresenta um comportamento mais eficaz que o agente
sem memória. Isto se deve ao fato de quanto maior for o número de interações mais
memórias o agente formará e, portanto, terá à sua disposição para auxiliá-lo na se-
leção da ação mais adequada numa dada situação.
6.5 Experimentos envolvendo condicionamento, memó-
ria e sobrevivência
Este experimento teve como objetivo principal verificar se o mecanismo de memória
proposto, influenciado pelos mecanismo de condicionamento operante, possibilita ao
6.5 Experimentos envolvendo condicionamento, memória e sobrevivência 152
ASCS manter-se vivo, adaptando-se ao ambiente no qual esteja inser ido. Para tanto,
também foram utilizadas duas classes de agente, um dotado de memória experiencial
e outro não. Cabe registrar que ambos agentes morriam quando o arousal de qual-
quer emoção atingisse o valor 7 (ver Figura 27).
O ambiente para realização do experimento foi composto por 15 maçãs vermelhas, 20
maçãs verdes, 10 pedras, 10 abelhas e 30 brinquedos, que foram posicionados aleato-
riamente para cada sessão do exper imento. Este experimento também foi repetido
para cada um dos três níveis iniciais de condicionamento operante (vide Tabela 6).
Para cada nível inicial de condicionamento operante foram realizadas 10 sessões do
experimento, sendo que a cada sessão novas sementes de números aleatórios eram
geradas para posicionar os objetos no ambiente. O estado emocional inicial do agente
foi o mesmo citado no experimento anterior. Também neste experimento não havia a
reposição dis objetos, que eram eliminados do mundo a cada interação com o ASCS.
Para manter seu equilíbrio homeostático e impedir que o nível de arousal de suas
emoções chegasse a 7, o que resultaria na sua morte, o ASCS precisava construir,
por si só, um padrão de comportamento que o permitisse aproximar-se de maçãs
e comê-las quando estivesse com fome, aproximar dos brinquedos e interagir com
eles quando estivesse entediado, evitar tocar em abelhas para não ser picado e evitar
comer pedras, que essas não regulam sua fome. Neste caso, é essencial que o
agente escolha a cada interação o objeto mais adequado entre todos os disponíveis,
considerando a emoção mais urgente a ser atendida no momento.
Os gráficos da Figura 50 apresentam o tempo médio de vida (em 10 sessões) dos
ASCS (com e sem memória experiencial) num ambiente gerado aleatoriamente para
cada nível inicial de condicionamento operante. Vale ressaltar que a sessão era
encerrada quando o ASCS morria.
Antes de discutir o resultado apresentado nos gráficos da Figura 50 se faz necessário
justificar as oscilações que ocorreram ao longo das curvas (principalmente no gráfico
A). Este experimento teve como objetivo principal avaliar o tempo médio de sobre-
vivência do ASCS no ambiente, desta forma cada interação realizada pelo agente con-
tribui significativamente para o resultado. Por exemplo, vejamos a Tabela 7, extraída
durante a execução do agente com memória (com condicionamento operante inicial
baixo). Observa-se que a capacidade de adaptação do ASCS ao ambiente aleatóri-
amente produzido varia significativamente Alguns ASCS vivem apenas o suficiente
para realizarem 10 interações, outros vivem o bastante para realizarem acima de 32
interações com os 85 objetos dispostos no mundo. Assim, apenas 3 dos agentes (3
a
,
6.5 Experimentos envolvendo condicionamento, memória e sobrevivência 153
Tempo Médio de Sobrevivência do ASCS-em-seu-ambiente
Condicionamento Operante Incial: Baixo
0
100000
200000
300000
400000
500000
600000
700000
0 5 10 15 20 25 30 35
Número de interações (A)
Tempo(ms)
ASCS sem
mem ória
ASCS com
mem ória
Tempo Médio de Sobrevivência do ASCS-em-seu-ambiente
Condicionamento Operante Incial: Médio
0
100000
200000
300000
400000
500000
600000
700000
800000
900000
1000000
0
5
10
15
20
25
30
35
40
45
50
55
60
65
Número de interações (B)
Tempo (ms)
ASCS sem
mem ória
ASCS com
mem ória
Tempo Médio de Sobrevivência do ASCS-em-seu-ambiente
Condicionamento Operante Incial: Alto
0
100000
200000
300000
400000
500000
600000
700000
800000
900000
1000000
0
5
10
15
20
25
30
35
40
45
50
55
60
65
Número de interações (C)
Tempo (ms)
ASCS sem
mem ória
ASCS com
mem ória
Figura 50: Tempo médio de sobrevivência do ASCS (com e sem memória experiencial)
no mundo, para cada nível de condicionamento operante.
6.5 Experimentos envolvendo condicionamento, memória e sobrevivência 154
4
a
e 6
a
sessões) viveram o suficiente para realizarem 27 interações. na interação
28 o agente da 4
a
. sessão morreu e ele contr ibuía bastante para que a média dos tem-
pos fosse baixa. Isso fez com que a média aumentasse significativamente (observe
a curva rosa do gráfico A, entre as interações 25 e 30). próxima interação (29), o
agente da 6
a
. sessão morreu e ele contribuía para que a média dos tempos fosse alta.
Sua morte fez com que a média diminuísse bruscamente, formando outra oscilação
forte no gráfico. Embora essas oscilações pareçam pontos de destaque nos gráficos,
elas não interferem no resultado como todo e são decorrência de um efeito estatístico
devido ao pequeno número de sessões (ou de ASCS, como queiram) realizadas no
experimento. este efeito tende a diminuir à medida que o universo amostral (número
de ASCS) é aumentado, fato comparado quando foram executados 200 sessões de
um mesmo experiemento.
Número de
Interações
1a. Sessão 2a. Sessão 3a. Sessão 4a. Sessão 5a. Sessão 6a. Sessão 7a. Sessão 8a. Sessão 9a. Sessão 10a. Sessão
1 23172 41687 10234 33515 53750 3172 59063 75047 210609 31734
2 41265 183640 109734 76156 59672 55438 59063 78922 234922 55031
3 51297 197687 177750 103781 62250 89907 99906 95672 253687 81343
4 55265 204484 184062 147890 117047 113875 110313 116078 302265 133406
5 75875 218062 206875 160437 180219 118000 114688 142156 330672 152437
6 78797 244859 209296 160437 180219 138157 133047 173187 346750 178640
7 82375 254968 220203 184015 209516 138157 144406 177250 359515 193437
8 95984 270734 232078 206875 241203 181610 156438 191125 367844 245234
9 98844 295140 260906 223703 244188 183782 216250 192578 369781 248828
10 172312 311671 281218 238703 309719 185235 327016 215297 371781 282750
11 204109 328562 285734 244656 331438 218407 289000 378359 292250
12 216078 331343 324312 264734 334797 221297 298609 384922 307875
13 227594 338390 330546 308422 342969 235125 316531 448156 315281
14 259297 349171 333250 313781 365547 237657 371172 317265
15 265109 366265 337156 347031 374000 246016 379906 332265
16 269328 404015 347734 355828 392797 355594 395625 410500
17 304734 449140 369343 369843 403813 363157 449718 421937
18 307797 452937 383031 398062 376360 454468 437265
19 320687 454890 389484 412468 413157 475015 454390
20 379094 462015 398656 418250 452313 487687 467890
21 413703 501000 443156 422359 462860 473906
22 520078 446437 424672 482454 493468
23 534000 453625 444250 514735 512453
24 541359 485656 447172 548454 538078
25 545937 510218 448906 558688 556859
26 569406 536593 466718 564641 567797
27 539265 476328 573954
28 540968 631782
29 543890
30 617734
31 653859
32 656390
Tempo (ms) de interação do ASCS com memória durante o Condicionamento Operante Incial Baixo
Tabela 7: Tempo (ms) de sobrevivência do ASCS (com memória) sujeito inicialmente
ao Condicionamento Operante Baixo.
No gráfico A, no qual ambos agentes não possuíam inicialmente nenhum tipo de condi-
cionamento operante, observa-se que todas as ações têm a mesma probabilidade de
serem selecionadas em qualquer situação vivenciada por eles. Por este motivo, os
agentes estabelecem poucas interações, o que os faz viverem menos e levarem mais
tempo para se adaptarem. O comportamento do agente com memória é melhor. En-
6.6 Considerações finais 155
quanto ele vive em torno de 30 interações, o agente sem memória vive aproximada-
mente 16 interações. No gráfico B, onde os agentes iniciam o experimento com um
nível de condicionamento médio (uma certa habituação), é apresentado um compor-
tamento mais seletivo. Isto faz com que o agente dotado de memória, tenha maior
número de interações e se mantenha vivo por muito mais tempo. Neste exemplo,
o agente com memória realiza pouco mais de 60 interações, enquanto o agente sem
memória realiza no máximo 25. No gráfico C, ambos agentes têm um forte habituação,
qual seja têm alta probabilidade inicial de se aproximarem dos objetos e interagirem.
Essa facilidade faz com os agentes realizem aproximadamente o mesmo número de
interações. Essa forte habituaçào mascara, por assim dizer, os efeitos da memória de
longo prazo.
Sumarizando os resultados apurados, foi calculado o tempo de médio de sobrevivên-
cia e o número médio de interações de cada tipo de agente. O resultado encontra-se
na Tabela a seguir, que descreve o tempo médio de interações do ASCS sem e com
memória.
ASCS sem memória ASCS com memória
Condicionamento Baixo 9 25
Condicionamento Médio 17 36
Condicionamento Alto 32 40
Os números não deixam dúvidas, no geral o agente com memória teve mais interações
e, por consequência, viveu mais tempo do que o agente sem memória. Quando o
nível do condicionamento é baixo ou médio, o agente com memória vive mais que
o dobro do tempo que o agente sem memória. A conclusão é óbvia, o mecanismo
de memória modelado favorece o comportamento adaptativo do agente, fazendo com
que ele permaneça vivo por mais tempo e realize mais interações para todos os níveis
de condicionamento operante inicial.
6.6 Considerações finais
Os resultados apurados apresentam-se satisfatórios quanto aos objetivos propostos
no início do trabalho.
O experimento relativo à formação da memória permitiu verificar que o ASCS é capaz
de adquirir, consolidar, evocar e reconsolidar (reforçar/esquecer) as memórias de ex-
periências vivenciadas via valoração cognitivo-emocional. Foi identificada a influência
6.6 Considerações finais 156
da emoção neste processo, inclusive na formação das memórias cintilantes, que se
comportaram como descrito por Diamond et al. (2006), se formam rapidamente sob
forte influência emocional e permanecem por muito tempo na memória, não se es-
vanescendo.
Os demais experimentos realizados permitiram comprovar que o ASCS dotado de
memória utiliza suas experiências passadas para se adaptar melhor ao ambiente por
meio de sua auto-regulação interna, criando um mecanismo não-determinista de se-
letividade de interação de acordo com a emoção mais desregulada a ser atendida. O
agente consegue eleger o objeto que possui melhor expectativa de interação em uma
dada situação, o que certamente favorece sua sobrevivência.
É dificil confrontar os resultados aqui obtidos com outros resultados disponíveis na
literatura, posto que cada autor modela seu agente de forma bastante singular e, mais
importante, cada aplicação de vida artificial ou simulação utilizada para se avaliar o
agente é completamente diferenciada das demais e não se encontram disponíveis
para outros autores. Não obstante , e mais a título de curiosidade, cumpre registrar
que o resultado aqui obtido - no qual o agente com memória chega a viver mais que o
dobro que o agente sem memória - é melhor que o resultado obtido por Deutsch et al.
(2008) cujo agente com memória vive apenas 20% mais que o agente sem memória.
Quanto ao software gerado, pode-se ter uma idéia da complexidade pelo número de
classes e de linhas de código gerados, sendo:
Total de Classes Linhas de código
Arquitetura ARTÍFICE 67 6.138
Aplicação ALifeWorld 86 14.805
Para melhor visualização do projeto de software, o diagrama de classes completo da
versão 0.9.5 da arquitetura ARTÍFICE, desenvolvida neste trabalho, está apresentado
no Anexo A, juntamente com o diagrama completo da aplicação ALifeWorld produzida.
Diante da análise dos experimentos aqui descritos, pode-se dizer que a aplicação
implementada atingiu plenamente o objetivo de testar a operação de um mecanismo
de formação de memórias experienciais para a arquitetura ARTÍFICE.
157
7 Conclusão
O presente trabalho foi desenvolvido com o intuito de aprimorar a arquitetura ARTÍ-
FICE - versão 0.9.0, dotando-a de um mecanismo de formação de memórias episódi-
cas. Até o momento, a arquitetura dispunha de uma memória muito rudimentar, que
atendia às necessidades de funcionamento do seu processo cognitivo-emocional e
dos mecanismos de condicionamento clássico e operante. Para cumprir tal objetivo
foi necessário realizar modificações na arquitetura em 5 aspectos: no sistema emo-
cional foi incluído o conceito de emoções complexas, como composições de emoções
básicas; no sistema de valoração, que foi modificado para valorar, além das micro-
experiências, as experiências completas com qualia (aqui entendidas como um con-
junto de micro-experiências emocionais que contribuem para a regulação emocional
de uma emoção complexa); no sistema de expectativa, que foi aprimorado para calcu-
lar a expectativa de interação com objetos do mundo de acordo com a emoção (básica
e complexa) mais urgente a ser atendida na situação atual; no sistema nervoso onde
foram incorporados os sistemas simpático e parassimpático para funcionarem como
marcadores somáticos do início e fim de um episódio emocional (uma experiência
completa com qualia); no sistema de memória que foi totalmente remodelado. Além
disso, diversas outras modificações menores e ajustes necessários foram realizados.
O mecanismo proposto teve como inspiração o processo de formação de memórias
dos organismos vivos e foi composto dos seguintes processos: consolidação, evo-
cação e reconsolidação. Assim que uma experiência completa é formada, ela é valo-
rada emocionalmente e consolidada na memória de longo prazo. Para as interações
futuras, o agente pode evocar suas memórias e utilizá-las no momento da escolha da
ação. O mecanismo proposto é fortemente imbricado com o sistema emocional do
ASCS influenciando e sendo influenciado pelas emoções, formando inclusive as me-
mórias cintilantes.
Para a elaboração desta proposta de funcionamento, primeiramente foi feita uma re-
visão sobre a modelagem e dinâmica de funcionamento da arquitetura ARTÍFICE. Em
seguida, uma revisão da literatura de neurociência e psicobiologia, buscando com-
7.1 Principais contribuições deste trabalho 158
preender o fenômeno biológico de formação de memórias nos organismos vivos, bem
como, e principalmente, a influência das emoções neste. Sobretudo, buscou-se identi-
ficar nestas áreas do conhecimento um conjunto de termos e conceitos que pudessem
servir de construtos básicos para a modelagem, naturalmente, após, serem apropria-
dos e recontextualizados para a área de sistemas inteligentes.
A literatura também foi revisada buscando trabalhos de pesquisa que envolvessem a
construção ou utilização de arquiteturas de agentes inteligentes, que buscam imple-
mentar o processo de formação memória episódica.
A partir do referencial estudado, foi elaborada a proposta do mecanismo de formação
de memórias experienciais da arquitetura ARTÍFICE versão 0.9.5. O modelo contem-
plou os três processos principais relativos à formação e uso das memórias regulares e,
também, das memórias cintilantes. O modelo foi elaborado e implementado de modo
a apresentar a máxima plausibilidade biológica possível. Para validar a modelagem,
uma prova de conceito foi proposta no Capítulo 6 (mediante a realização de um con-
junto de experimentos em vida artificial). Os experimentos computacionais juntamente
com as análises dos resultados podem ser observados também neste capítulo, os re-
sultados apurados mostraram-se satisfatórios em relação aos objetivos propostos.
7.1 Principais contribuições deste trabalho
O presente trabalho se destaca por contribuir com a pesquisa na área de modelagem
e construção de sistemas inteligentes bio-inspirados. Especificamente, quanto ao pro-
jeto ARTÍFICE, a contribuição mais evidente foi aprender, recontextualizar e, assim,
elaborar um referencial teór ico sobre o processo de formação de memórias experi-
enciais dos organismos vivos à luz da neurociência e biologia molecular. Algumas
abstrações feitas durante a elaboração do referencial teórico foram incorporadas em
mecanismos de software para apr imorar o processo de adaptação dos agentes cogni-
tivos criados a partir desta arquitetura. Sendo assim, destaca-se como contribuições
específicas para arquitetura ARTÍFICE as seguintes características:
a incorporação do conceito de emoções complexas, que permitiu aprimorar seu
mecanismo de valoração;
permitir ao agente adquirir, consolidar, evocar e reconsolidar (reforçar/esquecer)
experiências vivenciadas e valoradas segundo o sistema cognitivo-emocional;
7.2 Perspectivas de trabalhos futuros 159
permitir ao agente estabelecer um mecanismo dinâmico de seletividade de affor-
dances em função do grau de desequilíbrio de suas emoções naquele instante
e situação;
a formação de memórias experienciais (autobiográficas), que são a base para
formação de qualquer outro tipo de memória (e.g., memórias declarativas);
a formação de memórias cintilantes, durante situações de forte impacto emo-
cional e como elas se correlacionam com as memórias regulares.
7.2 Perspectivas de trabalhos futuros
Ao longo do trabalho várias possibilidades de pesquisas surgiram e não puderam ser
contempladas aqui, de vez que fugiam ao escopo do presente trabalho. Assim, como
sugestão de trabalhos futuros foram selecionadas algumas destas possibilidades:
1. Implementar o “tratamento” do trauma sofrido pelo agente e que origem às
memórias cintilantes, fazendo com que este fragmento de memória volte a re-
compor a memória regular e, assim, a memória traumática se extinga;
2. Remodelar o mecanismo de condicionamento operante, para que o cálculo de
probabilidade das ações seja assintótico, fazendo com que uma ação nunca pos-
sua probabilidade 0 (zero). Isto é, que uma ação nunca deixe de ocorrer;
3. Criar novos mecanismos de formação para outros tipos de memórias, tal como
memória semântica;
4. Implementar a versão atual da arquitetura ARTÍFICE, como o sistema nervoso
central’ de robôs eletromecânicos que se locomovem em um ambiente real.
5. Inserir novos tipos de emoção básicas e complexas para realizar experimentos
computacionais mais ricos e, então, aprimorar o mecanismo de seletividade de
interação (affordances);
6. Permitir que a escolha da ação seja feita com base nas ações das MEE que
formam uma experiência completa, para que o agente exiba um comportamento
direto e eficiente para reestabelcer o nível de arousal de uma emoção complexa;
7.3 Considerações finais 160
7. Conceituar, modelar e implementar o processo de reprodução dos ASCS, de
modo a incluir a herança filogenética de características dos ASCS - inclusive de
parte de suas memórias (as de maior intensidade emocional), como vistas ao
estudo de formação de diferentes linhagens de agentes.
7.3 Considerações finais
Diante dos objetivos propostos no Capítulo 1, pode-se dizer que este trabalho obteve
êxito. Comparando o comportamento apresentado pelo agente que na versão anterior
da arquitetura dispunha apenas de uma forma elementar de memória associativa (no
condicionamento clássico/operante), os diversos experimentos realizados comprovam
que o agente, agora dotado de memória episódica, apresentou sistematicamente me-
lhor desempenho. Portanto, os experimentos comprovam que a memória experiencial
funciona com um mecanismo adaptativo, possibilitando ao agente melhores condições
de sobrevivência em um certo ambiente, como prescrito na literatura da psicobiologia.
que se destacar o ganho obtido no processo cognitivo emocional da arquitetura
ARTÍFICE, ao favorecê-lo com memórias experienciais, que aprimorou, ainda mais,
seu processo de escolha da ação e abre a possibilidade de formação de outros tipos
de memórias.
Com relação às dificuldades encontradas, pode-se destacar a característica interdis-
ciplinar do tema, objeto de estudo deste trabalho, além da dificuldade de entender,
modelar e integrar as características do mecanismo proposto nas atuais condições da
arquitetura ARTÍFICE.
161
Referências
ABEL, T.; LATTAL, K. M. Molecular mechanisms of memory acquisition, consolidation
and retrieval. Opinion in Neurobiology, v. 11, n. 2, p. 180–187, april 2001.
BATESON, Gregory. Steps to an Ecology of Mind. [S.l.]: Chandler Publ. Group, S.
Francisco, 1972.
BEAR, Mark F.; CONNORS, Barry W.; PARADISO, Michael A. Neurociências
Desvendando o Sistema Nervoso. [S.l.]: Artmed Editora, 2002.
BECHARA, A. The role of emotional in decision-making: evidence from neurological
patients with orbitofrontal demage. Brain and Cognition, v. 55, p. 30–40, 2004.
BLISS, T. V. P.; COLLINGRIDGE, G. L. A synaptic model of memory: Long-term
potentiation in the hippocampus. Nature, v. 361, p. 31–39, January 1993.
BORGES, Henrique Elias. Arquitetura Flexível para a Criação de Agentes de Software
Cognitivos e Situados. Novembro 2000. Dissertação (Projeto de Pesquisa) Centro
Federal de Educação Tecnológica de Minas Gerais, Belo Horizonte, MG, Novembro
2000. 37 f.
BROWN, Roger R.; KULIK, James. Flashbulb memories. Cognition, v. 5, p. 73–99,
1977.
BUCK, Ross. Human Motivation and Emotion. New York: John Wiley & Sons, Inc,
1976.
BUCK, Ross. The biological affects: a typology. Psychological Review, v. 106, n. 2, p.
301–336, 1999.
CAMPOS, Luciana Maria Assis. Modelagem do Processo Cognitivo Emocional de
um Organismo Artificial numa Perspectiva Dinâmico–Interacionista. Agosto 2006.
Dissertação (Mestrado em Modelagem Matemática e Computacional) Centro
Federal de Educação Tecnológica de Minas Gerais, Belo Horizonte, MG, Agosto
2006. 144 f.
CLANCEY, W. J. The biology of consciousness: Comparative review of ’the strange,
familiar, and forgotton: An anatomy of consciousness’ (Israel Rosenfield) and ’Bright
Air, Brilliant Fire: On the Matter of Mind’ (Gerald M. Edelman). Artificial Intelligence,
v. 60, n. 2, p. 313–356, abr. 1993.
CLANCEY, William J. Situated cognition : on human knowledge and computer
representations. Cambridge, U.K. ; New York, NY, USA: Cambridge University Press,
1997. xviii, 406 p. (Learning in doing.).
Referências 162
DAMASIO, Antônio R. O Erro de Descartes: emoção, razão e o cérebro humano.
São Paulo: Compahia das Letras, 2003.
DEUTSCH, T.; GRUBER, A.; LANG, R.; VELIK, R. Episodic memory for autonomous
agents. IEEE, p. 1–6, May 2008.
DIAMOND, David M.; CAMPBELL, Adam M.; PARK, Collin R.; HALONEN, Joshua;
ZOLADZ, Phillip R. The temporal dynamics model of emotional memory processing:
A synthesis on the neurobiological basis of stress-induced amnesia, flashbulb and
traumatic memories, and the yerks-dodson law. Neural Plasticy, v. 2007, p. 1–33,
2006.
DODD, Will; GUTIERREZ, Ridelto. The role of rpisodic memory and emotion in
a cognitive robot. IEEE International Workshop on Robots and Human Interactive
Communication, p. 692–697, 2005.
DUPUY, J. P. Nas origens das ciências cognitivas. São Paulo, Brasil: Editora da
Universidade Estadual Paulista, 1996. 228 p.
EDELMAN, Gerald M.; TONONI, Giulio. A Universe of Consciousness. 1. ed. New
York: Basic Books, 2001. 288 p.
EHLERS, A.; HACKMANN, A.; STEIL, R.; CLOHESSY, S.; WENNINGER, K.;
WINTER, H. The nature of intrusive memories after trauma: the warning signal
hypothesis. Behaviour Research and Therapy, v. 40, n. 9, p. 995–1002, 2002.
EICHENBAUM, Howard. Learning from ltp: A comment on recent attempts to identify
cellular and molecular mechanisms of memory. Learning & Memory, v. 3, p. 61–73,
1996.
GAZZANIGA, Michael S.; IVRY, Richard B.; MANGNUN, George R. Neurosciência
Cognitiva: a biologia da mente. 2. ed. [S.l.]: Artmed, 2006. 768 p.
GLASSMAN, Willian E. Psicologia: abordagens atuais. 4. ed. Porto Alegre: Artmed,
2006. 552 p.
GODA, Yukiko; STEVENS, Charles F. The basis of particular types of learning. Current
Biology, California, v. 6, n. 4, p. 375–378, 1996.
GOLDMAN-RAKIC, P. S. The prefrontal landscape: implications of functional
architecture for understanding human mentation and the central executive.
Philosophical Transactions of the Royal Society of London. Series B, Biological
Sciences, v. 351, p. 1445–1453, 1996.
HEBB, D. O. Drives and the c.n.s. (conceptual nervous system). The Psychological
Review, v. 62, n. 4, p. 243–254, July 1955.
IZQUIERDO, Ivan. Memória. [S.l.]: Artmed, 2002.
KANDEL, Eric R. The molecular biology of memory storage: A dialogue between
genes and synapses. Science, v. 294, p. 1030–1038, 2001.
Referências 163
KANDEL, Eric R.; SQUIRE, Larry R. Memória : Da mente às moléculas. Rio de
Janeiro: Artmed Editora, 2003.
KOLK, B. A. van der; MCFARLANE, A. C.; WEISAETH, L. Trauma and memory
in Traumatic Stress: The effects of Overwhelming Experience on Mind, Body and
Society. New York, NY, USA: The Guilford Press, 1996. 279-302 p.
LeDOUX, Joseph. Emoção, memór ia e o cérebro. Scientific American, Edição
Especial, n. 4, p. 66–75, 2004.
LYNCH, M. A. Long–term potentiation and memory. Physiological Reviews, v. 84, p.
87–136, 2004.
MATURANA, Humberto R. A ontologia da Realidade. Belo Horizonte, MG: Editora
UFMG, 1997.
MATURANA, Humberto R. Cognição, Ciência e Vida Cotidiana: a ontologia das
explicações científicas. Belo Horizonte, MG: Editora UFMG, 2001. 203 p.
MATURANA, Humberto R.; VARELA, Francisco J. A Árvore do Conhecimento: as
bases biológicas da compreensão humana. 2. ed. Cambuci, SP: Palas Athenas, 2001.
288 p. Trad. Mariotti e Diskin.
MCGAUGH, James L. Memory - a century of consolidation. Science, v. 287, p.
248–251, January 2000.
MOREN, Jan. Emotion and Learning A Computational Model of the Amygdala.
2002. Tese (PhD (Thesis)) Lund University Cognitive Studies, Sweden, 2002. 93f.
MORRIS, Richard. Developments of a water-maze procedure for studying spatial
learning in the rat. J Neuroscience Methods, v. 11, n. 1, p. 47–60, 1984.
NEBEL, K.; WIESE, H.; STUDE, P.; GREIFF, A. de; DIENER, H. C.; KEIDEL, M. On
the neural basis of focused and divided attention. Cognitive Brain Research, v. 25, p.
760–776, 2005.
NEISSER, U. Memory observed: Remembering in natural contexts. São Francisco::
Freeman, 1982.
NEISSER, U. The ecological study of memory. Philosophical Transactions of the Royal
Society of London Series B Biological Sciences, v. 352, p. 1697–1701, 1997.
NUXOLL, Andrew M.; LAIRD, Jhon E. A Cognitive of Episodic Memory Integrated with
General Cognitive Architecture. [S.l.].
NUXOLL, Andrew M.; LAIRD, Jhon E. Extending Cognitive Architecture with Episodic
Memory. [S.l.], 2007.
ORTONY, Terence J. Turner; Andrew. What’s basic about emotions? Psychological
Review, v. 97, n. 3, p. 315–331, July 1990 1990.
PANKSEEP, Jaak. A critical role for "affective neuroscience"in resolving what is basis
about basic emotions. Psychological Review, v. 99, n. 3, p. 554–560, July 1992 1992.
Referências 164
PINTO, Amâncio C. Memórias autobiográficas e cintilantes e o problema da datação.
In: NúCLEO DE ANáLISE E INTERVENçãO EDUCACIONAL DA FPCE DA UC.
Ensaios em homenagem a Joaquim Ferreira Gomes. Coimbra: Livraria Minerva,
1998. p. 627–636.
POLYN, Sean M.; KAHANA, Michael J. Memory search and the neural representation
of context. Trends in Cognitive Sciences, v. 12, n. 1, p. 24–30, December 2007.
RESCORLA, R. A.; WAGNER, A. R. A theory of pavlovian conditioning: Variations
in the effectiveness of reiforcement and nonreinforcement. Classical conditioning II:
current research and theory, p. 64–99, 1972.
SA, C.S.C.; MEDALHA, C.C. Aprendizagem e memória - contexto motor. Revista
Neurociências, v. 9, n. 3, p. 103–110, 2001.
SANTOS, Bruno André. Aspectos conceituais e arquiteturais para a criação de
linhagens de agentes de software cognitivos e situados. Junho 2003. Dissertação
(Dissertação (Mestrado em Tecnologia)) Centro Federal de Educação Tecnológica
de Minas Gerais, Belo Horizonte, MG, Junho 2003. 130f.
SARA, Susan J. Retrieval and reconsolidation: Toward a neurobiology of remembering.
Learning & Memory, v. 7, p. 73–84, 2000.
SCHAFE, Glenn E.; KARIM, Nader; HUGH, T. Blair; LEDOUX, E. Joseph. Memory
of pavlovian fear conditioning: a cellular and molecular perspective. Trends in
Neurosciences, v. 24, n. 9, p. 540–546, set. 2001.
SCHMIDT, Stephen R. Autobiographical memories for the september 11th attacks?
reconstructive errors and emotional impairment of memory. Memory & Cognition, v. 3,
p. 443–454, 2004.
SILVA, Fernando H. Lopes da. A Memór ia: Dos Neurônios
às Redes Neuronais. [S.l.], September 1994. Disponível em:
<http://zircon.dcsa.fct.unl.pt/dspace/bitstream/123456789/207/1/15-4.PDF>.
SILVA, Vinícius Alves. Modelagem e Desenvolvimento de um Mecanismo de
Condicionamento para a Arquitetura Artífice. Outubro 2008. Dissertação (Mestrado
em Modelagem Matemática e Computacional) Centro Federal de Educação
Tecnológica de Minas Gerais, Belo Horizonte, MG, Outubro 2008. 120 f.
STEVENS, Charles F. A million dollar question: Does ltp = memory? Neuron, v. 20,
p. 1–2, jan. 1998.
STRATTON, G. M. Retroactive hyper mnesia and other emotional effects on memory.
Psychological Review, v. 26, n. 6, p. 474–486, 1919.
TALARICO, Jennifer M.; RUBIN, David C. Confidence, not consistency, characterizes
flashbulb memories. American Psychological Society, v. 14, n. 5, p. 455–461,
September 2003.
TULVING, Endel. Episodic memory: From mind to brain. Annual Reviews of
Psychology, v. 53, p. 1–25, 2002.
Referências 165
VARELA, Francisco J.; EVAN, Thompson; ROSCH, Eleanor. A Mente Incorporada:
ciências cognitivas e experiência humana. Porto Alegre: Artmed Editora, 2003.
YERKES, Robert M.; DODSON, John D. The relation of strength of stimulus to
rapidity of habit-formation. Journal of Comparative Neurology and Psychology, v. 18,
p. 459–482, 1908.
166
ANEXO A -- Modelo de projeto da arquitetura
ARTÍFICE
167
ANEXO B -- Pool de estímulos internos -
InteroceptiveStimuliPool
Partial
Appraisal
Sympathetic
System
Parassympathetic
System
Vision Sensor
Eye
Sting
Skin Effector
Muscular
Effector
Mouth
Effector
Focus Effector
Body
Mouth Sensor
Full Appraisal
Mouth
Homeostatic
Regulation
Interoceptive Stimuli
Pool
Valuation
Skin
Olfactory
Sensor
Salivary Gland
Salivary Gland
Effector
Salivation
IntStiVisual
IntStiSmell
IntStiAtentional
IntStiAdrenaline
IntStiVisual
IntProprioceptive
IntStiAdrenergic
IntStiSympathetic
IntParasympathetic
IntStiSomatic
IntStiCortical
IntStiCortica
l
IntStiCortical
IntStiMuscular
IntStiSomatic
IntStiAtentiona
l
IntStiMuscular
IntStiCholinergic
IntStiSomatic
IntStiTactile
IntStiNutritional
IntStiSerotonine
IntStiAdrenaline
IntStiSympathetic
IntParasympathetic
IntStiSomatic
IntStiAdrenergic
IntStiAdrenergic
IntStiSympathetic
IntStiCholinergic
IntStiParasympathetic
IntStiVisual
IntStiProprioceptive
IntStiNutricional
IntStiSerotonine
IntStiCholinergic
IntStiSmell
IntStiOlfactory
IntStiTactile
IntStiProprioceptive
IntStiSomatic
IntStiAdrenergic
IntStiCholinergic
IntStiEmotional
IntStiEmotional
IntStiCortical
IntStiSympathetic
IntParasympathetic
IntStiValuational
IntStiValuational
IntStiSomatic
IntStiSomatic
IntStiOlfactory
IntStiVisual
IntProprioceptive
Partial
Appraisal
Sympathetic
System
Parassympathetic
System
Vision Sensor
Eye
Sting
Skin Effector
Muscular
Effector
Mouth
Effector
Focus Effector
Body
Mouth Sensor
Full Appraisal
Mouth
Homeostatic
Regulation
Interoceptive Stimuli
Pool
Valuation
Skin
Olfactory
Sensor
Salivary Gland
Salivary Gland
Effector
Salivation
IntStiVisual
IntStiSmell
IntStiAtentional
IntStiAdrenaline
IntStiVisual
IntProprioceptive
IntStiAdrenergic
IntStiSympathetic
IntParasympathetic
IntStiSomatic
IntStiCortical
IntStiCortica
l
IntStiCortical
IntStiMuscular
IntStiSomatic
IntStiAtentiona
l
IntStiMuscular
IntStiCholinergic
IntStiSomatic
IntStiTactile
IntStiNutritional
IntStiSerotonine
IntStiAdrenaline
IntStiSympathetic
IntParasympathetic
IntStiSomatic
IntStiAdrenergic
IntStiAdrenergic
IntStiSympathetic
IntStiCholinergic
IntStiParasympathetic
IntStiVisual
IntStiProprioceptive
IntStiNutricional
IntStiSerotonine
IntStiCholinergic
IntStiSmell
IntStiOlfactory
IntStiTactile
IntStiProprioceptive
IntStiSomatic
IntStiAdrenergic
IntStiCholinergic
IntStiEmotional
IntStiEmotional
IntStiCortical
IntStiSympathetic
IntParasympathetic
IntStiValuational
IntStiValuational
IntStiSomatic
IntStiSomatic
IntStiOlfactory
IntStiVisual
IntProprioceptive
168
ANEXO C -- Conteúdo da memória de longo
prazo - Arquivo de “log1”
(Formação de memórias
regulares)
169
ANEXO D -- Conteúdo da memória de longo
prazo - Arquivo de “log2”
(Formação de memórias regulares
e cintilantes)
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo