Download PDF
ads:
SOBRE ESTRATÉGIAS DE RESOLUÇÃO
NUMÉRICA DE PROBLEMAS DE CONTATO
Autor: Dorival Piedade Neto
Dissertação de Mestrado apresentada à
Escola de Engenharia de São Carlos da
Universidade de São Paulo como parte dos
requisitos para a obtenção do tulo de
Mestre em Engenharia de Estruturas.
Orientador: Prof. Titular Dr. Sérgio Persival Baroncini Proença
São Carlos
2009
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ads:
Dedicatória
A meus pais,
por serem minha referência,
e a meus avós (in memorian),
por terem sido a referência deles.
Agradecimentos
A Deus, que mesmo por caminhos tortuosos atinge sempre objetivos certeiros.
Aos meus pais, por terem sempre colocado meu estudo como objetivo prioritário,
acima de qualquer obstáculo.
À minha irmã, pelo exemplo de coragem e perseverança que sempre busco seguir.
À Flávia, pelo apoio e incentivo, mesmo antes do início do trabalho.
__________
À Universidade de São Paulo e à Escola de Engenharia de São Carlos pela sólida
formação, e por ter propiciado ambiente satisfatório para encontrar este caminho que sigo.
Ao meu orientador, Professor Sérgio Proença, por toda a atenção e dedicação
empregadas ao longo do trabalho, tendo sido mais que um excelente orientador.
Aos membros da banca examinadora, cuja avaliação e sugestões contribuíram muito
para o resultado final deste trabalho.
Aos demais professores do Departamento de Engenharia de Estruturas pela constante
contribuição em minha formação e no desenvolvimento da pesquisa. Em especial, ao
Professor André Beck, cuja ajuda com a programação orientada a objetos foi fundamental no
desenvolvimento do programa.
__________
Retornar à vida acadêmica após cinco anos é uma opção raramente seguida, e que
apenas foi possível graças a algumas pessoas, a quem serei sempre grato:
Ao Professor Antonio Alves Dias, que ainda na graduação iniciou-me na investigação
científica, tendo sido um ótimo orientador e amigo.
À Sra. Cecília Assis, que assim como a Professora Larissa Driemeier da Escola
Politécnica da USP, foram as principais responsáveis por meu ingresso na Pós-Graduação. A
elas, não tenho palavras para demonstrar minha gratidão.
Aos Engenheiros André Martins e Marcelo Grosso, pelo ‘empurrão’ de volta à USP.
Aos amigos e colegas de graduação Tiago Silva e Cilmar Baságlia, pioneiros da minha
turma a ingressar no SET, pelo exemplo de dedicação acadêmica e inspiração para fazer a
Pós-Graduação.
__________
na condição de mestrando, diversas outras pessoas foram fundamentais, cabendo
igual agradecimento:
A todos os funcionários do SET, sempre prontos a ajudar, em especial ao amigo
Rodrigo Paccola, por sua constante ajuda com a programação.
A todos alunos da Pós, cuja convivência por muitas vezes permitiu extrapolar as
fronteiras do coleguismo, avançando nos campos da amizade. Apesar de inicialmente não
querer citar nomes para evitar injustiças, seria mais injusto não lembrar os amigos de
‘república’ Jesus Daniel, Rodrigo Santos e Manoel Denis, e o amigo Aref Kzam, que por
vezes deixou de desenvolver seu trabalho por algumas horas para me auxiliar na matemática
necessária para o meu trabalho.
Finalmente, mas não com menor importância, à CNPq, pela bolsa concedida.
“A filosofia é escrita neste grandíssimo livro que está
continuamente aberto diante de nossos olhos (eu digo, o
Universo), mas que não se pode entender se primeiro não
se aprende a entender a língua e conhecer os caracteres
em que está escrito. Ele está escrito em língua
matemática e os caracteres são triângulos, círculos e
outras figuras geométricas, sem os quais é humanamente
impossível entender alguma coisa; sem eles é como girar
em vão por um obscuro labirinto.”
Galileo Galilei
i
Índice
1 - Introdução..................................................................................................................1
1.1. Justificativa.....................................................................................................1
1.2. Objetivos.........................................................................................................2
1.3. Estrutura da Dissertação.................................................................................3
2 - Uma introdução à Mecânica do Contato...................................................................5
2.1. Sobre o problema de contato..........................................................................7
2.2. Uma categoria simples de problemas de contato..........................................14
2.3. Considerações finais.....................................................................................23
3 - Abordagem numérica dos problemas de contato.....................................................25
3.1. Modelação de estruturas por meio do Método dos Elementos Finitos.........25
3.1.1. Elementos unidimensionais (elementos de barra)....................................26
3.1.2. Elementos bidimensionais planos (elementos de chapa) .........................30
3.2. Estratégias numéricas para detecção de contato...........................................38
3.2.1. Detecção da distância entre ponto e superfície de contato.......................38
3.2.2. Condição de impenetrabilidade na estratégia dos conjuntos ativos .........42
3.3. Elementos de contato....................................................................................44
3.3.1. Elementos de contato do tipo ‘nó-segmento’ ...........................................45
3.3.2. Elementos de contato ‘mortar’.................................................................48
3.4. Comentários gerais sobre o programa computacional desenvolvido ...........53
4 - Exemplos Numéricos ..............................................................................................57
4.1. Viga em balanço com restrições pontuais de deslocamentos por meio de
vínculos unilaterais ...............................................................................................................58
4.2. Problema de Contato de Hertz......................................................................65
ii
4.3. Viga em balanço sujeita a ação de vínculos unilaterais (modelagem com
elementos bidimensionais)................................................................................................... 74
4.4. Viga com apoios inclinados......................................................................... 84
4.5. Arco com deslizamentos sobre anteparo curvo............................................ 90
5 - Conclusões.............................................................................................................. 99
5.1. Considerações finais .................................................................................... 99
5.2. Conclusões................................................................................................. 102
5.3. Proposta para trabalhos futuros.................................................................. 104
Referências Bibliográficas..........................................................................................107
Bibliografia adicional consultada................................................................................111
Apêndice A - Estratégias de otimização ................................................................. 115
A.1. Formulação matemática de um problema de otimização........................... 116
A.2. Otimização Irrestrita .................................................................................. 121
A.2.1. Método do gradiente ............................................................................. 121
A.2.2. Método dos Gradientes Conjugados..................................................... 123
A.2.3. Método de Newton................................................................................ 127
A.2.4. Métodos do tipo Quase-Newton ........................................................... 128
A.3. Busca Unidimensional ............................................................................... 132
A.4. Otimização Restrita.................................................................................... 138
A.4.1. Estratégia dos Multiplicadores de Lagrange......................................... 140
A.4.2. Estratégia da Penalização...................................................................... 141
A.4.3. A Estratégia dos Conjuntos Ativos....................................................... 142
A.5. Exemplos.................................................................................................... 145
iii
Lista de Símbolos
S - representação de um sólido no modelo físico
Γ - contorno de um sólido, podendo ser subdividido em Γ
t
(contorno de Neumann), Γ
u
(contorno de Dirichlet) e Γ
c
(contorno onde ocorre o contato)
- domínio de um sólido
Π - Energia Potencial Total de um sólido, podendo ser subdividida em uma parcela
interna Π
i
, externa Π
e
e relativa ao contato Π
c
t
c
- vetor que representa a força de contato, podendo ser decomposto em uma
componente normal t
cn
e outra tangencial t
ct
ê
n
- vetor unitário normal à superfície de um sólido
ê
t
- vetor unitário tangente à superfície de um sólido
g - função intervalo de distância, medida entre pontos da superfície de contato
g
- distância inicial entre dois pontos de contato
λ
L
- multiplicador de Lagrange
λ
P
- termo de penalização
L - comprimento de uma barra prismática
A - área da seção transversal de uma barra prismática
I - momento de inércia da seção de uma barra prismática
E - módulo de elasticidade de uma barra prismática
q
a
- força distribuída na direção axial de uma barra
q
t
- força distribuída na direção transversal de uma barra
σ
x
e σ
y
- componentes de tensão normal nas direções x e y, respectivamente
τ
xy
- tensão cisalhante no plano xy
ε
x
e ε
y
- deformação específica linear nas direções x e y, respectivamente
γ
xy
- medida de deformação angular no plano xy
x - símbolo que representa a grandeza vetorial que indica a posição inicial de um
ponto do sólido, dado pelas componentes x e y, respectivamente na direção horizontal e
transversal
x
u
- símbolo que representa a grandeza vetorial que indica a posição atual de um ponto
do sólido, dado pelas componentes
x
u
e y
v
, respectivamente na direção horizontal e transversal
iv
u - símbolo que representa a grandeza vetorial que indica o deslocamento de um ponto
do sólido, dado pelas componentes u e v, respectivamente na direção horizontal e transversal
φ
i
e ψ
i
- funções de forma
υ - coeficiente de Poisson
δ – símbolo que indica a variação de um funcional Π ou das funções que o compõe
ξ, η, ζ e ξ
l
- variáveis adimensionais utilizadas nos elementos de referência
α - escalar que multiplica o vetor deslocamento para que não ocorra penetração
B
- matriz que relaciona os campos de deformação aos deslocamentos nodais de um
elemento bidimensional
D
- matriz constitutiva, que relaciona os campos de tensões e de deformações de um
elemento bidimensional
w
GL
- pesos para integração numérica pela quadratura de Gauss-Legendre
w
H
- pesos para integração numérica da tabela de Hammer (domínios triangulares)
J - jacobiano de uma transformação
Q
- matriz que agrupa funções de forma para obtenção do vetor de forças nodais
equivalentes em elemento bidimensionais
n
q
- vetor que agrupa os valores das forças distribuídas nos nós de um lado do
elemento bidimensional
P, M e N - pontos utilizados para calcular a distância entre dois pontos de contato
K
- matriz de rigidez de um elemento (ou da estrutura, a depender do contexto)
F
- vetor de forças nodais equivalente de um elemento (ou da estrutura, a depender
do contexto)
u
- vetor dos deslocamentos nodais (incógnitas do sistema)
c
K
- matriz que impõe restrições devidas ao contato ao sistema
c
F
- vetor que impõe restrições devidas ao contato ao sistema
Observação: esta lista não contempla o Apêndice A, cujos símbolos utilizados têm seu
significado indicado no decorrer de seu desenvolvimento.
v
Lista de Abreviaturas
BFGS Método do tipo Quase Newton atribuído a Broyden, Fletcher, Goldfarb e
Shanno
CNPq – Conselho Nacional de Desenvolvimento Científico e Tecnológico
DFP – Método do tipo quase Newton atribuído a Davidson, Fletcher na Powell
EESC – Escola de Engenharia de São Carlos
EPD – Estado Plano de Deformações
EPT – Estado Plano de Tensões
ISOT3 – Elemento Isoparamétrico Triangular com 3 nós
ISOQ4 – Elemento Isoparamétrico Quadrilateral com 4 nós
ISOT6 – Elemento Isoparamétrico Triangular com 6 nós
ISOQ8 – Elemento Isoparamétrico Quadrilateral com 8 nós
MEF – Método dos Elementos Finitos
MGC – Método dos Gradientes Conjugados
PTV – Princípio dos Trabalhos Virtuais
PVC – Problema do Valor de Contorno
SET – Departamento de Engenharia de Estruturas de EESC
USP – Universidade de São Paulo
vi
vii
Resumo
PIEDADE NETO, D. (2009). Sobre estratégias de resolução numérica de problemas
de contato. Dissertação (Mestrado) Escola de Engenharia de São Carlos, Universidade de
São Paulo, São Carlos, 2009.
Os problemas de contato representam uma classe de problemas da Mecânica dos
Sólidos para a qual a não-linearidade é introduzida pela alteração das condições de contorno,
as quais só podem ser determinadas no decorrer do processo de resolução. O presente trabalho
trata dos problemas de contato abordando aspectos de sua formulação e implementação
numérica. Apresentam-se, em particular, as formulações de dois diferentes tipos de elemento
de contato revendo-se, mais detalhadamente, o tratamento numérico das restrições decorrentes
de contato. Algumas estratégias para resolução computacional desta classe de problemas,
consistindo em técnicas de otimização, foram implementadas num programa computacional
de elementos finitos e avaliadas comparativamente por meio de exemplos numéricos com
diferentes graus de complexidade.
Palavras-chave: problemas de contato, método dos elementos finitos, métodos de
otimização, elementos de contato
viii
ix
Abstract
PIEDADE NETO, D. (2009). On numerical solution strategies of contact problems.
Dissertação (Mestrado) Escola de Engenharia de São Carlos, Universidade de São Paulo,
São Carlos, 2009.
Contact problems represent a class of Solid Mechanics problems for which the
nonlinear behavior is caused by the change of the boundary conditions during the solution
process. The present work treats contact problems observing aspects of its formulation and
numerical implementation. Specifically, the formulation for two different contact elements is
presented, analyzing, in details, the numerical formulation that results from the contact. Some
strategies for the computational solution of this class of problems, given by optimization
techniques, were implemented in a finite element computational program and were compared
and evaluated by numerical examples with different levels of complexity.
Keywords: contact problem, finite element method, optimization methods, contact
elements
x
1
1 - Introdução
A presente dissertação é resultado de um trabalho de mestrado desenvolvido junto ao
Programa de Pós-Graduação do Departamento de Engenharia de Estruturas (SET) da Escola
de Engenharia de São Carlos (EESC) da Universidade de São Paulo (USP), com apoio
financeiro da CNPq. O tema se insere na linha de pesquisa de Métodos Numéricos, com
enfoque na análise não-linear de estruturas.
1.1. Justificativa
Os problemas de contato representam uma classe de problemas da Mecânica dos
Sólidos para a qual corpos distintos passam a interagir quando partes que os compõe tendem a
ocupar simultaneamente a mesma posição do espaço. Como conseqüência natural da
impenetrabilidade de um sólido sobre outro, surgem forças de ação e reação entre os sólidos,
as quais causam alteração das condições de contorno. Geralmente essas alterações podem
ser determinadas no decorrer do processo de resolução, e dessa forma, o fenômeno possui
comportamento não-linear.
Esta classe de problemas não-lineares é geralmente apresentada como a de maior
dificuldade de resolução, (BELYSTCHKO; LIU; MORAN, 2003)
1
:
“Problemas de Contato/Impacto estão entre os problemas não-lineares de maior
dificuldade, uma vez que sua resposta não é suave. As velocidades normais à superfície de
1
Tradução livre realizada pelo autor da presente dissertação.
2
contato são descontínuas no tempo quando o impacto ocorre. Para os modelos de atrito de
Coulomb as velocidades tangenciais ao longo da superfície também são descontínuas quando
se observa o limite de escorregamento (‘stick-slip behavior’). Essas características do
Contato/Impacto introduzem dificuldades significativas para a integração no tempo das
equações discretizadas e deterioram o desempenho do Método de Newton. A escolha
apropriada de algoritmos e métodos numéricos é essencial para o sucesso dos mesmos, e
técnicas de regularização são muito úteis para a obtenção de procedimentos de resolução
robustos.”
Apesar de o comentário anterior se referir a condições de atrito e impacto, as
limitações relativas ao desempenho dos procedimentos de resolução apresentam-se mesmo
em regimes quase-estáticos de contato sem atrito. Assim sendo, o tema ainda necessita do
aprimoramento das estratégias de resolução, justificando a sua escolha para a elaboração da
presente pesquisa.
1.2. Objetivos
Em princípio o trabalho procurou dar continuidade ao estudo iniciado por (RIGO,
1999), o qual avaliou a utilização de estratégias de otimização para a resolução de problemas
de estruturas prismáticas sujeitas à ação de nculos unilaterais pontuais. As restrições foram
introduzidas por meio da definição de intervalos de valores factíveis para algumas das
variáveis de deslocamento, por esta razão, denominadas variáveis canalizadas.
Tal estratégia foi retomada estendendo-a para simular o contato em estruturas
modeladas por meio de elementos bidimensionais, visando avaliar comparativamente os
diversos métodos de otimização e de restrições de variáveis na resolução aplicados a essa
classe de problema.
3
Sendo essa uma abordagem prioritariamente restrita aos problemas onde a região de
contato é conhecida, a seqüência natural do trabalho foi o desenvolvimento de elementos de
contato, que possibilitam a resolução de problemas de complexidade mais elevada. Nessa
segunda abordagem, foram formulados dois diferentes tipos de elementos de contato, e seu
desempenho avaliado quando associados a diferentes estratégias de restrição de variáveis.
1.3. Estrutura da Dissertação
O texto subdivide-se em cinco capítulos, entre os quais se inclui o presente, além de
um apêndice, que apresenta uma revisão bibliográfica da teoria matemática que fundamenta
as estratégias de otimização implementadas.
No Capítulo 2 apresentam-se as bases teóricas dos problemas de contato, partindo do
modelo físico e desenvolvendo o modelo matemático que representa o mesmo. Ainda, com a
finalidade de ilustrar a aplicação da teoria, apresenta-se um exemplo simples de problema de
contato, discutindo-se a partir dele as possibilidades de formulação geral.
No terceiro capítulo tratam-se aspectos específicos da abordagem numérica do
problema, iniciando-se pela apresentação dos elementos finitos utilizados no programa
computacional elaborado na pesquisa para fins de discretização espacial dos sólidos. Também
são apresentadas as técnicas de detecção de contato e imposição de restrições ao sistema que
representa o problema de equilíbrio, além das formulações dos dois diferentes tipos de
elementos de contato empregados.
No Capítulo 4 apresentam-se exemplos numéricos processados por meio do programa
computacional elaborado, avaliando o desempenho tanto dos métodos de otimização adotados
quanto dos elementos de contato.
4
No quinto e último capítulo reúnem-se as considerações finais e conclusões.
Apresentam-se, ainda, alguns temas identificados ao longo da pesquisa como de interesse para
futuros estudos.
No Apêndice A apresenta-se uma revisão dos métodos de otimização utilizados,
contemplando sua formulação e aplicação mediante um exemplo numérico simples.
5
2 - Uma introdução à Mecânica do Contato
A resenha histórica sobre a Mecânica do Contato descrita a seguir resume a
apresentação mais extensa contida em (KIKUCHI; ODEN, 1988).
Os problemas de atrito foram estudados séculos antes dos problemas de contato. De
fato, já no Século XV Leonardo da Vinci estudou o tema, o qual foi corretamente descrito por
Amontos em 1699 e estendido para o caso dinâmico por Coulomb em 1781. Em todos esses
casos, o atrito sempre foi abordado entre sólidos considerados indeformáveis.
Quanto aos problemas de contato, estes só passaram a ser abordados após o começo do
desenvolvimento da Mecânica dos Sólidos, a partir do Século XIX. O primeiro a tentar tratar
o assunto foi Poisson em 1833 no trabalho Traité de Mécanique’, porém segundo
(KIKUCHI; ODEN, 1988), erros no seu trabalho causaram falhas mesmo na obtenção da
respostas de problemas simples de corpos em colisão. Outros trabalhos também foram
apresentados por Saint-Venant, em 1867 (‘Sur le choc longitudinal de deux barres
élastiques’), e Voight, em 1862, entretanto também com sucesso limitado.
O primeiro trabalho que efetivamente conseguiu descrever adequadamente o
fenômeno é atribuído a Heinrich Hertz, e foi apresentado à Sociedade de Física de Berlim em
1881, sendo denominado Über die Berührung fester Elastischer Körper’. Tal artigo é tido
como o marco inicial da Mecânica do Contato, sendo os problemas por ele abordados
referidos hoje como ‘Problemas de Contato de Hertz’.
Após esse trabalho, desenvolvimentos no assunto foram retomados no início do
Século XX (JOHNSON, 2003). Como novas contribuições nesse século (KIKUCHI; ODEN,
1988) citam o problema geral de equilíbrio de um sólido elástico em contato sem atrito com
um anteparo rígido, formulado por Signorini em 1933, em um trabalho denominado ‘Sopra
6
akune questioni di elastostatica’. Ainda o mesmo autor apresentou em 1959 uma teoria mais
completa sobre o assunto no trabalho ‘Questioni de elasticita nonlinearizzata e semi
linearizzata’.
Os primeiros livros específicos sobre o tema surgiram após a metade do Século XX,
sendo citado por (JOHNSON, 2003) o livro de L. A. Galin, de 1953, com título em inglês
‘Contact Problems in Theory of Elasticity’, um resumo do trabalho do russo Muskhelishvili, e
o livro ‘Contact Problems in the Classical Theory of Elasticity’, de Gladwell, publicado em
1980. Neles ainda o tema é tratado sobre a ótica da Teoria da Elasticidade linear.
Problemas mais gerais, considerando demais efeitos foram desenvolvidos apenas após
o desenvolvimento da Teoria da Plasticidade. Nesse contexto de problemas mais genéricos e,
por conseqüência, mais complexos, a abordagem numérica, principalmente por meio do
Método dos Elementos Finitos, deu abertura a uma grande evolução do tema, abrindo
caminho para a Mecânica do Contato Computacional. Diversos nomes podem ser citados
como autores de artigos sobre o assunto (BATHE, 1996). Aqui, se destacam alguns que
escreveram livros sobre o tema, como (KIKUCHI; ODEN, 1988), (LAURSEN, 2002) e
(WRIGGERS, 2006). Além disso, o tema também é tratado em livros análise não-linear por
meio de elementos finitos, como em (ZIENKIEWICKZ; TAYLOR, 2000) e
(BELYTSCHKO; LIU; MORAN, 2003).
Para iniciar aqui a abordagem do tema, serão retomadas a seguir as hipóteses e teorias
da Mecânica dos Sólidos, com destaque para as que se fazem necessárias para estabelecer um
modelo teórico do fenômeno do contato entre dois sólidos distintos. Apresentadas as formas
de tratar as restrições, as mesmas serão então aplicadas a um problema simples, com a
finalidade de discutir as estratégias utilizadas para a resolução dos problemas dessa natureza.
7
2.1. Sobre o problema de contato
Tome-se um sólido S de domínio e superfície de contorno Γ, esquematizado na
Figura 2.1, para o qual se pretende desenvolver um modelo matemático que represente seu
comportamento físico quando o mesmo é submetido à ação de forças e deslocamentos
impostos.
Figura 2.1 - Modelos físico e matemático de um sólido
Para fins de análise do comportamento em escala macroscópica o sólido é idealizado
como um meio contínuo inserido no espaço euclidiano tridimensional. Nesse sentido, os
pontos do sólido são aqui referenciados como pontos materiais.
O sólido S pode estar sujeito à ação de forças de campo b que atuam em seu domínio
ou a forças de superfície f que se aplicam na parte Γ
t
de seu contorno (contorno de Neumann).
Sobre a parte complementar do contorno (Γ
u
) impõe-se restrições sobre os deslocamentos,
chamadas de condições de Dirichlet. Dada a importância dessas condições para a definição
das características particulares de cada problema, os mesmos são chamados Problema do
Valor de Contorno (PVC).
A resolução do PVC é obtida com a determinação, em todo o domínio do problema,
dos campos de deslocamento, tensão e deformação em correspondência à sua configuração de
S
Γ
t
Γ
u
ϵ R
n
Γ=Γ
u
U
Γ
t
8
equilíbrio. Para tanto, deve-se observar restrições de equilíbrio local de forças,
compatibilidade entre deformações e deslocamentos, e relação constitutiva, envolvendo os
campos de tensão e deformação; tais condições se exprimem mediante um conjunto de
equações diferenciais.
Quando o problema passa a tratar dois sólidos distintos, como os indicados na Figura
2.2, as mesmas relações devem ser observadas para ambos, sendo que novas condições
surgem como conseqüência da interação entre eles.
Figura 2.2 - Modelos físico e matemático para um conjunto de dois sólidos
Como o modelo físico, naturalmente, não deve permitir que partes de sólidos distintos
ocupem a mesma posição do espaço simultaneamente, o modelo passa a incorporar uma nova
condição, dita de impenetrabilidade.
Entretanto, como discute (BELYTSCHO; LIU; MORAN, 2003), a condição de
impenetrabilidade não pode ser aplicada diretamente sobre o sistema, na forma de uma
expressão analítica ou diferencial, podendo apenas ser expressa em termos gerais, como
A B
=
. (2.1)
Ainda segundo o mesmo autor, ela também poderia ser entendida como uma condição
de compatibilidade. Seja qual for a forma de entendimento, o desconhecimento prévio da
região de contato, que configura a situação mais geral, impõe não-linearidade ao problema.
S
A
S
B
A
B
Γ
u A
Γ
t B
Γ
c
Γ
c
Γ
t A
Γ
t B
Γ
u B
A
,
B
ϵ R
n
Γ
=Γ
t
U
Γ
u
U
Γ
c
Γ
c
= Γ
cA
= Γ
cB
Γ
t A
(para S
A
e S
B
)
9
O contorno passa também a apresentar um novo subconjunto, Γ
c
, formado em um dado
instante do processo físico pela região de contato entre os sólidos. Para a caracterização do
contato, introduz-se uma função escalar (g) que mede localmente, em um dado instante, a
distância entre as superfícies dos sólidos, conforme ilustra a Figura 2.3.
Figura 2.3 - Interpretação física dos valores obtidos para função g
A função é definida de tal maneira que, ao apresentar valor nulo, o par de pontos de
referência dos sólidos encontra-se em contato no dado instante. Caso a função tenha valor
positivo, um intervalo de distância entre os mesmos; o valor negativo indica a
penetração, que apesar de não admitida pela teoria, poderá ser permitida em etapas
intermediárias da resolução por estratégias numéricas, como será discutido no próximo
capítulo.
Como conseqüência da interação resultante do contato, na interface entre os sólidos
aparecem forças de ão e reação. Admitindo-se uma superfície regular de contato, em cada
sólido essas forças podem ser decompostas, num dado ponto, segundo as direções normal e
tangencial à mesma, conforme ilustra a Figura 2.4.
g>0
g<0
S
A
S
B
g=0
10
Figura 2.4 - Decomposição das forças de contato em cada sólido
Uma vez que o problema físico não admite a adesão das superfícies, define-se também
uma condição sobre a componente do vetor da força de contato t
c
segundo a direção do vetor
unitário ê
n
, normal à superfície no ponto. Como a situação admissível deve ser sempre de
compressão, a projeção t
cn
deve ser negativa, sendo ela obtida pelo produto interno indicado
em (2.2):
ˆ
cn c n
t t e
=
. (2.2)
Essa segunda condição adicional observada para os problemas de contato tem as
mesmas origens da primeira, sendo que ambas, por meio de g e t
cn
, podem ser analisadas
conjuntamente, definindo duas situações distintas possíveis:
i) quando o contato ocorre para um dado par de pontos da superfície dos sólidos, a
função g apresenta valor nulo, observando-se a ocorrência de ações e reações t
cn
de
compressão (ou seja, negativas) nos mesmos pontos de cada superfície;
ii) quando o contato não ocorre (ou deixa de existir), a função g apresenta valor não-
nulo (positivo) e, nesta situação, as ações e reações t
cn
são nulas.
É notável a relação de dependência entre as duas medidas, sendo que ambas
complementam-se de maneira que uma delas sempre será nula. Esse fato permite a reunião
das duas condições anteriores em uma única, dita condição de complementaridade. Assim
x
y
ê
n
ê
t
t
c
t
cn
t
ct
t
ct
t
c
t
cn
ê
n
ê
t
Γ
A
Γ
B
Γ
A
Γ
B
11
sendo, o produto da função intervalo g pela projeção da força de contato t
cn
em um dado ponto
x de Γ
c
é sempre nulo, ou seja
( ) ( ) 0,
cn c
g x t x x
= Γ
. (2.3)
Uma conseqüência da condição anterior é que as componentes normais de ão e
reação observadas na interface de contato não realizam trabalho no processo físico. Essa
propriedade ganha importância na abordagem energética do problema e será oportunamente
retomada.
Apesar do produto de g por t
cn
ser constante, no decorrer do processo físico as duas
grandezas que o compõe são descontínuas, e isto representa a causa do comportamento não-
linear quando se observa o contato. Para uma melhor análise da relação entre ambas, observe-
se o gráfico da Figura 2.5.
Figura 2.5 - Gráfico da relação entre o valor apresentado pela função g e por t
cn
Apesar da descontinuidade, conforme ilustrado na Figura 2.6(a), a relação entre ambas
pode ser regularizada mediante aproximação por uma hipérbole, definida de tal modo que no
limite reproduz-se a relação original.
g
t
cn
12
0
2
4
6
8
10
-5
-4 -3 -2 -1 0
t
g
g=-1/t
g=-0,1/t
g=-0,01/t
(a)
-5
-4
-3
-2
-1
0
1
2
3
4
5
-5 -4 -3 -2 -1 0 1 2 3 4 5
t
g
(b)
Figura 2.6 - Aproximação da condição de complementaridade por meio de funções
hiperbólicas (a); Comportamento de uma função hiperbólica tanto para valores positivos
quanto negativos da variável do eixo das abscissas (b).
A Figura 2.6(b) mostra que apesar da função hiperbólica aproximar bem o
comportamento da condição de complementaridade no segundo quadrante dos eixos
cartesianos, sua definição geral pode admitir valores positivos para a variável
t
cn
no quarto
quadrante, o que, conforme discutido, não é admitido pelo modelo físico. Esse
comportamento demanda cuidados adicionais quando o procedimento de resolução empregar
tal regularização.
Dadas essas peculiaridades, qualquer procedimento de resolução deve contemplar a
imposição de restrições sobre as variáveis envolvidas no contato. Entre as alternativas mais
difundidas nesse sentido estão as estratégias baseadas em multiplicadores de Lagrange e fator
de penalização, aqui denominadas em conjunto como estratégias de restrição.
A primeira consiste na introdução de uma variável adicional ao sistema (
λ
L
),
multiplicadora da restrição de impenetrabilidade (
g
), no caso, dada por uma igualdade. Dada a
estrutura similar deste produto com a condição de complementaridade (
g t
cn.
), tem-se que o
13
multiplicador λ
L
tem o significado físico atrelado à projeção t
cn
, e consequentemente, a
estratégia equivale à soma de tal condição ao funcional de energia.
a segunda estratégia não introduz novas variáveis ao sistema, como no caso
anterior. Nela, a restrição de impenetrabilidade é obtida por meio do fator de penalização λ
P
,
cujo valor é previamente adotado. Como não equivalência com a condição de
complementaridade, o resultado é que a condição de impenetrabilidade é relaxada. No
entanto, quanto maior é o valor do termo de penalização, menor é o efeito de relaxação,
totalmente anulada no limite do termo de penalização tendendo a infinito.
Assim como no caso do multiplicador de Lagrange, também ao termo de penalização é
possível atribuir um significado físico. Dada sua característica de impor menor ou maior
relaxação à função g, o mesmo pode ser interpretado com o valor da rigidez de uma mola, de
dimensões infinitesimais, posicionada entre os pontos de contato dos sólidos. Quando o termo
apresenta valor pequeno, a mola está bastante distendida e a penetração é significativa;
quando a rigidez tende ao infinito, a mola permanece praticamente indeformada e os pontos
de contato tendem a compartilhar a mesma posição no espaço. A Figura 2.7 ilustra essa
interpretação física.
Figura 2.7 - Interpretação física do termo de penalização nos problemas de contato
λ
P
(2)
0<λ
P
(1)
<
λ
P
(2)
<
λ
P
(3)
Γ
B
Γ
A
Γ
B
Γ
A
Γ
B
λ
P
(1)
λ
P
(3)
Γ
A
14
Para ambos os métodos descritos, como a condição de complementaridade é
implicitamente inserida na forma de uma igualdade, é necessário uma análise adicional para
controlar os sinais das variáveis envolvidas na condição (
0, 0
cn
g t
).
Nesse contexto, no caso dos multiplicadores de Lagrange, essa análise é direta uma
vez que eles representam a força de contato, e assim, uma análise de sinal do valor obtido para
o multiplicador permite concluir sobre a manutenção ou não da imposição de uma restrição
sobre o sistema. No caso do método da penalização essa conclusão não é direta, sendo
necessários outros recursos para essa análise. Esse tema será discutido no próximo capítulo,
que trata das estratégias numéricas utilizadas para a resolução dos problemas de contato.
Apresentadas as bases teóricas necessárias para o desenvolvimento do modelo
matemático que descreve o problema de contato, as mesmas serão aplicadas a um problema
simples, desenvolvido como base no exemplo apresentado em (PROENÇA, 2007), de
maneira a ilustrar a aplicação da teoria discutida.
2.2. Uma categoria simples de problemas de contato
O objetivo deste item é introduzir as estratégias de restrição para a consideração do
contato, particularmente envolvendo o emprego de multiplicadores de Lagrange e termo de
penalização, considerando-se uma categoria simples de problemas, na qual as restrições e os
pontos de contato são previamente conhecidos. Nesta categoria as restrições podem ser
expressas mediante limitações sobre os valores das variáveis de deslocamento dos pontos de
contato, numa forma denominada ‘variáveis canalizadas’.
Seja uma barra prismática de comprimento L, com seção transversal de área A e
composta de material com Módulo de Elasticidade E. Na barra se aplica uma força axial
distribuída q, estando fixa na extremidade esquerda e existindo à direita da extremidade livre
15
um anteparo rígido, que constitui um nculo unilateral, limitante do deslocamento daquela
seção, conforme ilustra a Figura 2.8. A restrição, portanto, é sobre o valor do deslocamento na
extremidade livre, em forma ‘canalizada’ expressa como: 0 ( )
u L g
.
Figura 2.8 - Esquema estrutural da barra com vínculo unilateral à direita
Dadas suas características, o problema pode ser modelado apenas por meio da
coordenada x, coincidente com eixo da barra, sendo a solução caracterizada pelos campos de
deslocamento u(x), na direção x, de tensão
σ
x
(x) e de deformação específica
ε
x
(x).
Adote-se inicialmente uma abordagem local do problema, a qual se refere a um
elemento infinitesimal do sólido. Da aplicação da condição de equilíbrio a tal elemento,
obtém-se a seguinte equação diferencial:
( )
x
d x
q
dx A
σ
= . (2.4)
Para modelar o lido também a necessidade da aplicação da condição de
compatibilidade, que relaciona o campo de deformação
ε
x
(x) ao campo de deslocamento u(x):
( )
'( )
x
du x
u x
dx
ε
= = . (2.5)
Em (2.5) foi utilizada a notação u’(x) para derivada primeira de u em relação a x, bem
como u”(x) seria a derivada segunda de u em relação x e assim sucessivamente.
x
L
g
A, E
q
y
16
Finalmente, completa-se o conjunto de equações que descrevem o sólido fazendo-se
uso da relação constitutiva do material, a qual relaciona o campo de tensões σ
x
(x) ao de
deformações ε
x
(x):
( ) ( )
x
x E x
σ ε
= . (2.6)
Associando as três últimas, obtém-se uma única equação diferencial:
"( )
q
u x
E A
= . (2.7)
A solução dessa equação diferencial pode ser facilmente obtida por meio da integração
sucessiva da mesma:
1
'( ) ''( )
q
u x u x dx x c
EA
= = +
(2.8)
2
1 2
( ) '( )
2
q
u x u x dx x c x c
EA
= = + +
(2.9)
Para a definição das constantes de integração c
1
e c
2
é necessária a aplicação das
condições de contorno do problema.
A primeira delas diz respeito ao deslocamento observado na extremidade esquerda da
barra, cujo valor sempre será nulo devido ao vínculo existente. Assim, a primeira condição de
contorno é u(0)=0.
a segunda condição de contorno o pode ser definida ‘a priori’, uma vez que ela
depende da solução obtida, que por sua vez depende da condição de contorno adotada. Essa
relação de interdependência entre as condições de contorno e resultado obtido ilustra as
dificuldades devidas ao comportamento não-linear observado nos problemas de contato.
Partindo-se da hipótese de que o contato não ocorre, temos como segunda condição de
contorno
σ
x
(L)=E
ε
x
(L)=0, que implica em u’(L)=0. Utilizando-a juntamente com a outra
condição em (2.8) e (2.9) a solução obtida é
2
( )
2
q qL
u x x x
EA EA
= + . (2.10)
17
Novamente é importante ressaltar que a (2.10) é válida apenas quando não ocorre o
contato, ou seja, quando a seguinte relação é observada:
2
( )
2
qL
u L g
EA
= <
. (2.11)
Quando essa hipótese não é observada, a segunda condição de contorno se altera,
passando a ser expressa por ( )
u L g
=
. Da aplicação de ambas as condições sobre (2.9) obtém-
se a solução para o problema quando ocorre o contato com o vínculo unilateral, dada por
2
( )
2 2
q qL g
u x x x
EA EA L
= + +
. (2.12)
Tendo determinado o campo de deslocamentos u(x), é possível obter os campos de
tensão e deformação por meio da condição de compatibilidade e da relação constitutiva.
A fim de ilustrar o comportamento não-linear do modelo, os gráficos na Figura 2.9
ilustram a variação do campo de deslocamento e da força de contato com o aumento do valor
da força distribuída q.
Figura 2.9 - Gráfico da relação entre o valor da força q e os deslocamentos em x=L/2
e x=L (a) e da relação entre a força q e a força de contato t
cn
(b).
Apesar da obtenção simples da solução para o caso apresentado, problemas com
complexidade um pouco maior dificilmente podem ser resolvidos dessa forma,
particularmente quando se pensa em automatizar o processo de solução.
u
q
g
u(x=L)
u(x=L/2)
3qL
2
8EA
2EA
L
2
g
-t
cn
q
2EA
L
2
g
-g
qL
2
EA
L
18
Assim, é mais vantajosa uma formulação global, como por exemplo, a obtida por meio
de princípios variacionais elaborados com base no método da energia (ASSAN, 1996), que
combinada com a técnica dos elementos finitos permite a obtenção de soluções aproximadas
para problemas de complexidade qualquer.
Segundo a abordagem global pelo método da energia é possível estabelecer um
funcional que representa a energia potencial total do sistema estrutural, e expresso em função
do campo de deslocamentos solução do problema. No caso do problema em questão, o
funcional de energia, válido quando o contato não ocorre, pode ser escrito na forma:
2
0
1
( ) . .( '( )) . ( )
2
L L
o
u E A u x dx qu x dx
Π =
. (2.13)
No funcional (2.13) a primeira parcela representa a energia interna acumulada na
estrutura, dada pelo trabalho das tensões sobre as deformações no domínio da barra. A
segunda parcela representa a energia potencial externa representada pelo trabalho das forças
externas distribuídas ao longo do eixo da barra.
Ao equilíbrio corresponde a primeira variação nula do funcional, no caso dada por:
´( ) ´( ) ( )
L L
o o
EAu x u x dx q u x dx
δ δ δ
Π =
. (2.14)
A condição de nulidade da primeira variação do funcional de energia é idêntica à que
seria obtida pelo Princípio dos Trabalhos Virtuais (PTV), onde
δu(x)
passa a ser interpretado
como um campo de deslocamentos virtuais compatíveis e homogêneos nas condições de
contorno essenciais do problema.
A forma obtida em (2.14) também é chamada de forma fraca, enquanto a que foi
obtida por intermédio da abordagem local é dita forma forte. Essa denominação faz referência
ao fato de que, na primeira formulação apresentada, a função solução deve satisfazer a
equação diferencial que rege o problema em todo o seu domínio, enquanto na segunda a
19
solução da equação diferencial é atendida em média, definida por uma ponderação no
domínio.
Quando o método dos elementos finitos é empregado na busca de uma solução
aproximada para a forma fraca, o passo inicial é a discretização do domínio, definindo-se os
nós e a rede de elementos que será utilizada na definição da função de aproximação da
solução.
Considere-se, para a resolução do problema da barra proposto, uma rede composta de
dois elementos de comprimento l=L/2 e três nós, localizados respectivamente em x=0, x=L/2
e x=L, conforme ilustra a Figura 2.10.
Figura 2.10 - Discretização da barra em dois elementos finitos.
Os campos u(x) e δu(x) passam a ser representados pelas seguintes aproximações:
( ) ( ) ( )
( ) ( ) ( )
i i
j j
u x u x u x
u x u x u x
ϕ
δ δ δ ψ
=
=
ɶ
ɶ
(2.15)
Nessas expressões utilizou-se a notação indicial, segundo a qual a repetição de índices
denota o somatório. Ainda nas relações (2.15) φ
i
e ψ
j
representam bases de funções
linearmente independentes, e u
i
e δu
j
são parâmetros nodais. Substituindo-se essas
aproximações em (2.14) e impondo-se sua nulidade, após um desenvolvimento simples,
obtém-se:
(
)
' '
l l
i j i j
o o
EA dx u q dx
ϕ ψ ψ
=
. (2.16)
1
1
2
3
2
elemento
l
φ
1
=1
φ
2
=1
20
Pode-se mostrar que o termo à esquerda de (2.16) é uma forma bilinear, enquanto o da
direita é uma forma linear. A expressão (2.16) trata-se de um sistema de equações que pode
ser representado por:
ij j j
K u F
=
. (2.17)
No sistema, u
j
representa os parâmetros nodais (incógnitas do sistema), K
ij
as
componentes da chamada matriz de rigidez da estrutura e F
j
as componentes do vetor de
forças nodais equivalentes, definidos por:
' '
0
0
l
ij i j
l
j j
K EA dx
F q dx
ϕ ψ
ψ
=
=
(2.18)
Utilizando-se funções de aproximação lineares para ambos os campos, como as
ilustradas na Figura 2.10, é possível obter um sistema cujas incógnitas u
1
, u
2
e u
3
são os
valores dos deslocamentos u nos três nós que a discretizam. Aplicando-se a condição de
contorno relativa ao nó 1 (u
1
=0), o sistema resulta:
2
3
4 2 /2
2 2 /4
u
qL
EA
u
qL
L
=
.
Da resolução do sistema, obtêm-se como respostas:
2 2
2 3
3
;
8 2
qL qL
u u
EA EA
= = .
É importante observar que nesse caso, mesmo se tratando de um método numérico
aproximado, a resposta coincide com a obtida por meio da abordagem local, considerada a
solução exata do problema.
Assim como na resolução anterior, essa resposta é válida apenas para a hipótese de
que o contato não é observado. Quando ele passa a ocorrer, deve ser adicionada ao funcional
de energia uma parcela relativa ao contato.
21
Para tanto, utilize-se inicialmente a estratégia dada pelos multiplicadores de Lagrange,
cuja formulação, como se viu, é idêntica a obtida pela introdução da condição de
complementaridade no funcional, resultando em:
2
0
1
( , ) . .( '( )) . ( ) ( ( ))
2
L L
L
o
u E A u x dx q u x dx g u L
λ λ
Π = +
. (2.19)
Conforme fora mencionado, introduz-se ao funcional uma nova incógnita
λ
L
, que
multiplica a restrição dada por meio da função
( ) ( )
g L g u L
=
. Nota-se que a condição de
impenetrabilidade implica em:
g(L)0.
A primeira variação do funcional expresso em (2.19) é:
. . '( ). '( ) . ( ). . ( ) .( ( ))
L L
L L
o o
E Au x u x dx q u x dx u L g u L
δ δ δ λ δ δλ
Π = +
. (2.20)
Os dois primeiros termos de (2.20) tem o mesmo significado que os expressos em
(2.14), sendo o terceiro termo relativo ao trabalho virtual da força de contato na extremidade
direita da barra, agora representada pelo 3. O quarto termo representa a imposição da
restrição de ‘compatibilidade’ entre
g
e
( )
u L
com o auxílio da força virtual δλ
L
.
Para os campos u(x) e δu(x) utilizam-se as mesmas aproximações expressas em (2.15).
Em princípio os multiplicadores de Lagrange, por serem variáveis, também admitem
aproximação. No presente caso λ
L
é uma variável associada a um único ponto da barra, e,
além disso, não existe nenhuma ordem de derivada sobre ela. Assim, sua aproximação por
uma constante é suficiente e a forma aproximada da expressão (2.20), igualada a zero, passa a
ser dada por:
(
)
(
)
( )
. . . . ( ) ( ( )) 0
L L
i j i j j j L j j L
o o
E A dx u u q u L u g u L
ϕ ψ δ ψ δ λ ψ δ δλ
+ =
. (2.21)
Impondo-se a condição que a relação anterior deve ser válida para todos os campos
virtuais de deslocamento (compatíveis e homogêneos nas condições de contorno essenciais) e
multiplicadores de Lagrange, após algum desenvolvimento obtém-se um sistema com a
seguinte representação:
22
0
T
q
c
F
u
K L
F
L
λ
=
. (2.22)
No sistema expresso em (2.22)
K
é mesma matriz de rigidez obtida no caso anterior,
assim como
q
F
é o vetor de forças nodais equivalentes; as componentes de ambas as
grandezas seguem a definição dada na (2.18). As matrizes
L
e
T
L
, assim como o vetor
c
F
tem suas componentes determinadas pelas seguintes relações:
j L j
c
L
F g
λ ψ
= −
= −
(2.23)
Nota-se que o vetor incógnito é composto pelo vetor de deslocamentos nodais u e pelo
vetor λ, no caso com um único componente.
Considerando-se a discretização do problema tratado, o sistema resultante, imposta
a condição de contorno u
1
=0, assume a forma:
2
3
4 2 0 /2
2 2 /( ) /4
0 /( ) 0
L
u qL
EA
L EA u qL
L
L EA g
λ
=
.
A resposta coincide com a solução obtida por meio da forma forte, para a situação em
que se observa o contato:
2
2 3
; ;
8 2 2
L
qL g EA qL
u u g g
EA L
λ
= + = = .
Por outro lado, empregando-se a estratégia da penalização, o funcional de energia,
incluindo a restrição, fica dado por:
2 2
0 0
1 1
( ) . .( '( )) . ( ) ( ( ))
2 2
L L
P
u E A u x dx qu x dx g u L
λ
Π = +
. (2.24)
Como comentado, esta abordagem não implica na introdução de novas variáveis ao
sistema, sendo
λ
P
um escalar de valor a ser previamente adotado. A primeira variação de
(2.24) é expressa por:
23
0 0
. . ( ). ( ) . ( ) . ( ). ( ) . . ( )
L L
P P
E Au x u x dx q u x dx u L u L g u L
δ δ δ λ δ λ δ
Π = +
. (2.25)
Procedendo da mesma maneira que nos casos anteriores, o sistema resultante é:
2
3
(4 )/ ( 2 )/ /2
( 2 )/ (2 )/ / 4
P P
u
EA L EA L qL
uEA L EA L qL g
λ λ
=
+ +
Da sua resolução obtém-se:
3 2
2
2 2
2
3
( 4 ) 3
8 8
2
2 2
P
P
P
P
qL gAEL qAEL
u
EAL A E
gL qL
u
L AE
λ
λ
λ
λ
+ +
=
+
+
=
+
Observa-se que:
2
2
3
Quando , ;
8 2
Quando , .
P
P
qL g
u
EA
u g
λ
λ
+
Assim, a resposta obtida converge para o valor exato quando o termo de penalização
λ
P
tende a infinito. Na prática utilizam-se valores elevados para termo de penalização, a fim
de se obter uma aproximação suficientemente precisa e ainda próxima da que seria obtida
com o uso dos multiplicadores de Lagrange.
2.3. Considerações finais
Apesar de simples, o exemplo apresentado no item anterior permite elaborar algumas
considerações gerais importantes a respeito dos problemas de contato, particularmente em
relação à sua formulação e resolução, que serão bastante úteis no desenvolvimento do
presente trabalho.
O problema de contato formulado via método da energia por um lado pode ser
entendido como um problema de minimização com restrição, isto é, a configuração de
24
equilíbrio além de satisfazer as condições de contorno usuais bilaterais em deslocamentos e
estáticas, deve atender a um conjunto de restrições associadas ao contato. Nessa forma,
aplicam-se algoritmos de otimização restrita, desenvolvidos no âmbito da programação
matemática, que se mostram estáveis, elegantes e com atributos de convergência garantidos
sob certas condições. Tais algoritmos, por meio do emprego das estratégias de restrição,
incorporam as restrições ao funcional da energia, transformando o problema em uma
minimização irrestrita.
Outra formulação possível para o problema de contato é baseada diretamente na
aplicação do princípio dos trabalhos virtuais, cuja expressão pode ser interpretada com a
primeira variação da energia potencial total do método da energia. Nesse caso, o problema se
resume à resolução de um sistema de equações não-lineares, para a qual se aplica uma
estratégia do tipo Newton-Raphson, por exemplo. Entretanto, a característica de possível
desativação do contato dentro do próprio processo iterativo penaliza a taxa de convergência,
podendo ocorrer instabilidades a depender do tipo de problema, passo da carregamento, etc.
Esse tipo de formulação, apesar permitir enquadrar os problemas de contato entre os
problemas de análise não-linear em geral, pode conduzir a procedimentos de resolução menos
efetivos ou eficientes do que aqueles proporcionados pelos métodos de otimização.
Com base nessas constatações, o presente trabalho faz uso de estratégias de otimização
como ferramenta matemática para a resolução de problemas de contato modelados por meio
do MEF. Entretanto, em função de sua extensão, a descrição de tais estratégias é reservada
para o apêndice. Ao longo do texto, priorizam-se a abordagem numérica dos problemas de
contato quanto à aplicação do MEF, o desenvolvimento de estratégias para detecção do
contato e a apresentação dos elementos de contato, seguindo o arranjo descrito no item 1.3.
25
3 - Abordagem numérica dos problemas de
contato
Uma vez que para a modelação numérica o presente trabalho faz uso do todo dos
Elementos Finitos (MEF), este capítulo se inicia introduzindo a formulação dos diversos
elementos finitos empregados para a discretização dos sólidos e estruturas analisadas. Na
seqüência, discutem-se as estratégias numéricas que permitem introduzir as restrições de
contato e os elementos finitos de contato, formulados e implementados no programa
computacional desenvolvido.
3.1. Modelação de estruturas por meio do Método dos Elementos Finitos
Conforme discutido no capítulo anterior, o Método dos Elementos Finitos (MEF)
trata-se de uma metodologia que em última análise permite a descrição aproximada do
comportamento de um sólido, tendo por base a determinação numérica de parâmetros
associados a pontos discretos do mesmo, ditos nós.
No caso deste trabalho o MEF é empregado também na geração de formas
aproximadas para os funcionais de energia envolvidos, elaborados com base no Método da
Energia.
Na abordagem adotada, restringindo-se o funcional da energia potencial total ao
domínio de um elemento finito genérico empregado na discretização do sólido, da parcela de
energia potencial interna Π
i
, pode-se obter a matriz de rigidez do elemento, e da parcela de
energia potencial externa
Π
e
, o vetor de forças nodais equivalentes.
26
As restrições de contato, em conformidade com as abordagens tanto por penalização
quanto por multiplicador de Lagrange, discutidas no capítulo anterior, provêm de termos de
energia Π
c
, no primeiro caso relativo ao trabalho interno realizado na região de contato numa
situação de interpenetração admitida, e no segundo, relativo ao trabalho da ‘força de contato’.
Como resultado, para o problema de um sólido com ocorrência de contato, o funcional
de energia total resulta em: Π=Π
i
+Π
e
+Π
c
.
A seguir serão apresentadas as matrizes de rigidez e o vetor de forças nodais
equivalentes dos elementos implementados no programa computacional desenvolvido, e
empregados na discretização dos sólidos. As hipóteses e desenvolvimentos matemáticos
correspondentes são apresentados de maneira sucinta, por se tratarem de elementos de
formulação clássica encontrada em diversas referências sobre o assunto como: (ASSAN,
2003), (SAVASSI, 2000) ou (ZIENKIEWICZ; TAYLOR, 2000), entre outros.
A estratégia de detecção do contato e os elementos finitos correspondentes são
descritos na complementação deste capítulo.
3.1.1. Elementos unidimensionais (elementos de barra)
Elementos finitos de barra de eixo reto são representados num espaço euclidiano
bidimensional, referenciado por um sistema cartesiano com eixo x na direção horizontal e
eixo y na vertical. Nesse espaço, os elementos podem estar sujeitos a forças distribuídas
segundo as direções axial e/ou transversal.
A formulação aqui descrita restringe-se aos casos de deformações suficientemente
pequenas, desprezando-se, ainda, as deformações por cortante no caso da flexão.
Adote-se, então, uma barra prismática de comprimento L alinhada com o eixo de
referência x, de seção transversal de área A, momento de inércia I e constituída de material
27
elástico linear com módulo de elasticidade E. Sendo u(x) e v(x) componentes de deslocamento
nas direções horizontal e vertical, respectivamente, a parcela interna do funcional de energia é
dada por:
2 2
0 0
1 1
( '( )) ( "( ))
2 2
L L
i
EA u x dx EI v x dx
Π = +
. (3.1)
Em (3.1) a primeira parcela decorre das tensões geradas pelas forças atuantes na
direção axial e a segunda pelas forças aplicadas na direção transversal ao eixo. Sua primeira
variação, de interesse para obter a matriz de rigidez do elemento, é dada por:
0 0
'( ) '( ) "( ) "( )
L L
i
EA u x u x dx EI v x v x dx
δ δ δ
Π = +
. (3.2)
O elemento finito clássico apresenta um em cada extremidade da barra, e cada
possui como graus de liberdade os deslocamentos u e v, e o giro, representado pela primeira
derivada de v (v’). A Figura 3.1 ilustra o elemento e seus respectivos graus de liberdade.
1
1
1
2
2
2
'
'
u
v
v
u
u
v
v
=
Figura 3.1 - Elemento finito de barra
Tendo-se em vista as ordens de derivadas sobre as componentes de deslocamento
observadas em (3.2), utiliza-se uma aproximação por polinômio do primeiro grau para u(x) e
do terceiro grau para v(x), expressas nas formas:
1 1 2 2
( ) ( ) ( )
u x u x u x
ϕ ϕ
= +
ɶ
e
1 1 1 2 2 3 2 4
( ) ( ) ' ( ) ( ) ' ( )
v x v x v x v x v x
ψ ψ ψ ψ
= + + +
ɶ
. Aproximações análogas são adotadas para as
variações
δ
u e
δ
v.
x
v
1
v
2
2
1
L
v’
1
v’
2
y
u
1
u
2
28
As bases de funções indicadas são:
Para o campo u:
1
( ) 1
x
x
L
ϕ
=
; (3.3)
2
( )
x
x
L
ϕ
=
. (3.4)
Para o campo v:
3 2
1
( ) 2 3 1
x x
x
L L
ψ
= +
; (3.5)
3 2
2
2
( ) 2
x x
x x
L L
ψ
= +
; (3.6)
3 2
3
( ) 2 3
x x
x
L L
ψ
= − +
; (3.7)
3 2
4
2
( )
x x
x
L L
ψ
= . (3.8)
Aplicando-se (3.3) a (3.8) em (3.2), e após algum desenvolvimento algébrico, que
consistem em integrações por partes de modo a isolar as variações sobre as componentes do
deslocamento, obtém-se a matriz de rigidez do elemento, dada por:
3 2 3 2
2 2
3 2 3 2
2 2
/ 0 0 / 0 0
0 12 / 6 / 0 12 / 6 /
0 6 / 4 / 0 6 / 2 /
/ 0 0 / 0 0
0 12 / 6 / 0 12 / 6 /
0 6 / 2 / 0 6 / 4 /
EA L EA L
EI L EI L EI L EI L
EI L EI L EI L EI L
K
EA L EA L
EI L EI L EI L EI L
EI L EI L EI L EI L
=
. (3.9)
Para a obtenção do vetor de forças nodais equivalentes, emprega-se a parcela de
energia potencial associada ao carregamento externo:
0 0
( ) ( ) ( ) ( )
L L
e a t
q x u x dx q x v x dx
Π = −
. (3.10)
29
Considere-se, por exemplo, os carregamentos com distribuição linear, descritos com a
ajuda das mesmas bases (3.3) e (3.4) conforme indicado na Figura 3.2.
1 1 2 2
1 1 2 2
( ) ( ) ( )
( ) ( ) ( )
t t t
a a a
q x q x q x
q x q x q x
ϕ ϕ
ϕ ϕ
= +
= +
Figura 3.2 - Distribuição linear de forças axiais e transversais na barra
Com desenvolvimento semelhante ao anterior sobre a primeira variação da (3.10),
pode-se deduzir o vetor de forças nodais equivalentes na forma:
1 2
1 2
2
1 2
1 2
1 2
2
1 2
(2 ) /6
(7 3 ) / 20
(3 2 ) /60
( 2 ) /6
(3 7 ) / 20
(2 3 ) /60
a a
t t
t t
a a
t t
t t
q q L
q q L
q q L
F
q q L
q q L
q q L
+
+
+
=
+
+
+
. (3.11)
Para generalizar a aplicação deste elemento a uma composição estrutural qualquer é
necessário transformar a matriz
K
e o vetor
F
para uma situação de barra com inclinação
qualquer no espaço, o que é feito por operações que envolvem a matriz de rotação no plano.
Portanto, para uma barra de inclinação θ arbitrária com relação ao eixo x, define-se a matriz
de rotação
R
por:
cos sen 0 0 0 0
-sen cos 0 0 0 0
0 0 1 0 0 0
0 0 0 cos sen 0
0 0 0 -sen cos 0
0 0 0 0 0 1
R
θ θ
θ θ
θ θ
θ θ
=
(3.12)
1
2
q
t2
q
t1
q
a1
q
a2
30
A matriz de rigidez do elemento inclinado no sistema global de coordenadas globais
G
K
, assim como o vetor de forças nodais
G
F
são obtidos pelas transformações:
T
G
K R K R
=
T
G
F R F
=
Considerando um arranjo estrutural, uma vez que todas as matrizes e vetores dos
elementos que compõe a estrutura estejam todos escritos em relação ao mesmo sistema
(global), pode-se então associá-los formando o sistema que representa o equilíbrio global
como um todo.
3.1.2. Elementos bidimensionais planos (elementos de chapa)
A aplicação de elementos bidimensionais em um espaço euclidiano de mesma
dimensão pode ser utilizada para modelar particularmente duas situações de interesse
esquematicamente representadas na Figura 3.3: o Estado Plano de Tensões (EPT) e o Estado
Plano de Deformações (EPD).
Figura 3.3 - Exemplos de idealizações de sólidos segundo o EPT (a) e o EPD (b)
x
y
z
x
y
σ
y
(a)
(b)
τ
yx
σ
y
σ
x
σ
z
τ
xy
τ
xz
τ
zx
τ
zy
τ
yz
σ
y
σ
x
τ
xy
τ
yx
σ
x
τ
xy
τ
yx
EPT
EPD
31
O primeiro deles se aplica a sólidos que apresentam uma de suas dimensões bem
menor que as demais, definida como sua espessura e, adotando-se, então, o plano médio em
relação a esta dimensão como referência. As hipóteses do EPT relacionam-se à não ocorrência
de forças na direção perpendicular ao plano de referência e carregamento com valor constante
ao longo da espessura do sólido, resultando em componentes de tensão σ
x
, σ
y
e τ
xy
(Figura 3.3)
constantes na espessura, sendo nulas as demais.
O EPD se aplica na situação onde o sólido apresenta uma de suas dimensões bastante
superior às outras duas; segundo esta dimensão a geometria e o carregamento não se alteram
(ASSAN, 2003). Nessa situação, resultam não-nulas apenas as componentes de deformação
ε
x
, ε
y
e γ
xy
em seções transversais consideradas suficientemente longe das extremidades do
sólido; as demais componentes de deformação são nulas.
Em ambos os casos a parcela relativa à energia interna é dada por:
( )
1
2
i x x y y xy xy
V
dV
σ ε σ ε τ γ
Π = + +
. (3.13)
Nota-se que são válidas para o plano as seguintes condições de compatibilidade:
; e
x y xy
u v u v
x y y x
ε ε γ
= = = +
. (3.14)
Quando se utiliza o MEF, a relação entre os campos de deformações, agrupados em
um vetor
(
)
T
x y xy
ε ε ε γ
= , e o vetor de deslocamentos nodais
u
pode ser obtida por meio
de uma matriz
B
tal que
B u
ε
= , a qual será descrita mais adiante.
Quanto à relação constitutiva entre os campos de tensão e deformação, (ASSAN,
2003) apresenta uma matriz
D
em forma genérica, isto é, que pode ser aplicada tanto ao EPT
quanto ao EPD, dada por:
32
( )
2
1 '
2
1 ' 0
'
' 1 0
1 '
0 0
E
D
υ
υ
υ
υ
=
(3.15)
Onde:
Para o EPT tem-se E’=E e υ’=υ;
Para o EPD tem-se E’=E/(1-υ
2
) e υ’=υ/(1-υ).
Cabe ressaltar que υ trata-se do Coeficiente de Poisson, observando-se que esse
modelo aplica-se a um material isótropo.
É possível, com algum desenvolvimento algébrico, obter a matriz de rigidez de
elementos finitos aplicáveis para ambas as situações, a qual, fazendo-se uso da matriz
D
apresentada em (3.15), possui a seguinte representação genérica:
T
K B eDBd
=
. (3.16)
Para os elementos desenvolvidos adotou-se uma formulação isoparamétrica, segundo a
qual se utilizam as mesmas bases de funções de aproximação para representar a geometria e
os campos de deslocamento. Nessa formulação empregam-se elementos de referência aos
quais se atrelam coordenadas adimensionais ξ e η (e ζ, para domínios triangulares), que serão
ilustradas mais adiante. Uma vantagem dessa abordagem é que os elementos podem se
adaptar melhor à geometria do sólido modelado.
Quatro elementos distintos foram implementados, para os quais se adotou a
nomenclatura indicada na Figura 3.4. Na mesma figura apresentam-se as formas dos
elementos de referência e as coordenadas adimensionais utilizadas para descrever cada um
deles.
33
Figura 3.4 - Elementos finitos implementados e suas características
Nota-se que os elementos com domínio triangular utilizam coordenadas com valores
entre 0 e 1, enquanto os quadrilaterais utilizam o intervalo de -1 a 1. Isso se deve ao fato de
que no primeiro caso utiliza-se as tabelas de Hammer, que parametrizam o domínio no
intervalo de 0 a 1 (COWPER, 1972), enquanto no segundo caso os pontos de Gauss-Legendre
são distribuídos no intervalo de -1 a 1.
Para passar dos elementos de referência para os elementos do domínio discretizado,
um operador importante é o Jacobiano da transformação, dado por:
ISOT3
ξ
η
1
2
3
Aproximação 1º Grau
3 nós - 6 Graus Liberdade
(u e v p/ cada nó)
0
1,0
0
1,0
ISOQ4
ξ
η
1
2
4
Aproximação 1º Grau
4 nós - 8 Graus Liberdade
(u e v p/ cada nó)
-1,0
1,0
-1,0
1,0
3
ISOT6
ξ
η
1
2
3
Aproximação 2º Grau
6 nós - 12 Graus Liberdade
(u e v p/ cada nó)
0
1,0
0
1,0
ISOQ8
ξ
η
1
2
4
Aproximação 2º Grau
8 nós -
16 Graus Liberdade
(u e v p/ cada nó)
-1,0
1,0
-1,0
1,0
3
5
6
8
7
ζ=1-ξ-η
ζ=1-ξ-η
4
5
6
34
x y y x
J
ξ η ξ η
=
. (3.17)
Passando à consideração das matrizes de rigidez de cada elemento, expressas
genericamente pela (3.16), para o elemento ISOT3, por exemplo, cujo vetor de parâmetros
nodais é dado por
( )
1 1 2 2 3 3
T
u u v u v u v
=
, a matriz
B
apresenta a seguinte forma:
3
1 2
3
1 2
3 3
1 1 2 2
0 0 0
0 0 0
x x x
B
y y y
y x y x y x
ϕ
ϕ ϕ
ϕ
ϕ ϕ
ϕ ϕ
ϕ ϕ ϕ ϕ
=
. (3.18)
Sendo φ
i
, x e y funções de ξ e η, os termos de
B
podem ser obtidos por:
i i i
x x x
ϕ ϕ ϕ
ξ η
ξ η
= +
; (3.19)
i i i
y y y
ϕ ϕ ϕ
ξ η
ξ η
= +
. (3.20)
Para os demais elementos a matriz
B
apresenta estrutura análoga, mudando de
dimensão de acordo com os graus de liberdade respectivos a cada um deles.
Com isso, retomando a (3.16), podem-se obter as matrizes de rigidez dos elementos
quadrilaterais e triangulares, mediante integração numérica, respectivamente representadas
por:
( , ) ( , ) ( , ) ( ) ( )
T T
i j i j i j GL i GL j
i j
K B DBedxdy B D B eJ w w
ξ η ξ η ξ η ξ η
= =
(3.21)
( , , ) ( , , ) ( , , ) ( , , )
T T
i i i i i i i i i H i i i
i
K B DBedxdy B D B eJ w
ξ η ζ ξ η ζ ξ η ζ ξ η ζ
= =
(3.22)
35
Em (3.21) e (3.22) w
GL
são os pesos dados pela quadratura de Gauss-Legendre para os
pontos de integração definidos pelo par (ξ
i
,η
j
) e w
H
os pesos dados para os pontos (ξ
i
,η
i
,ζ
i
)
definidos pela tabela de integração de Hammer.
Para finalizar, apresentam-se as funções de forma utilizadas para cada elemento:
Elemento ISOT3:
1
ϕ ξ
=
; (3.23)
2
ϕ η
=
; (3.24)
3
1
ϕ ζ ξ η
= =
. (3.25)
Elemento ISOQ4:
(
)
(
)
1
1 1
4
ξ η
ϕ
= ; (3.26)
(
)
(
)
2
1 1
4
ξ η
ϕ
+
= ; (3.27)
(
)
(
)
3
1 1
4
ξ η
ϕ
+ +
= ; (3.28)
(
)
(
)
4
1 1
4
ξ η
ϕ
+
= . (3.29)
Elemento ISOT6:
(
)
1
2 1
ϕ ξ ξ
=
; (3.30)
(
)
2
2 1
ϕ η η
=
; (3.31)
(
)
3
2 1
ϕ ζ ζ
=
; (3.32)
4
4
ϕ ξη
= ; (3.33)
5
4
ϕ ηζ
= ; (3.34)
6
4
ϕ ζξ
= . (3.35)
36
Elemento ISOQ8:
(
)
(
)
(
)
1
1 1 1
4
ξ η η ξ
ϕ
+ +
= −
; (3.36)
(
)
(
)
(
)
2
1 1 1
4
ξ η η ξ
ϕ
+ +
= ; (3.37)
(
)
(
)
(
)
3
1 1 1
4
ξ η η ξ
ϕ
+ + +
= ; (3.38)
(
)
(
)
(
)
4
1 1 1
4
ξ η η ξ
ϕ
+
= −
; (3.39)
(
)
(
)
(
)
5
1 1 1
2
ξ ξ η
ϕ
+
= ; (3.40)
(
)
(
)
(
)
6
1 1 1
2
ξ η η
ϕ
+ +
= −
; (3.41)
(
)
(
)
(
)
7
1 1 1
2
ξ ξ η
ϕ
+ +
= −
; (3.42)
(
)
(
)
(
)
8
1 1 1
2
ξ η η
ϕ
+
= . (3.43)
O vetor de forças nodais equivalentes, para forças distribuídas nas direções x e y do
sistema global, origina-se da parcela de variação de energia potencial das forças externas.
Definindo-se um sistema local Γ ao longo de um lado do elemento, tal parcela é dada por:
(
)
e x y
q u q v d
δ δ δ
Γ
Π = − + Γ
. (3.44)
Para a integração ao longo dos lados dos elementos, as funções de forma passam a ser
dadas em termos da coordenada local adimensional ξ
l
pelas seguintes relações:
ISOT3 e ISOQ4 (1º grau)
1
1
2
l
ξ
ϕ
=
; (3.45)
2
1
2
l
ξ
ϕ
+
=
. (3.46)
37
ISOT6 e ISOQ8 (2º grau)
(
)
1
1
2
l l
ξ ξ
ϕ
= ; (3.47)
2
2
1
l
ϕ ξ
=
; (3.48)
(
)
3
1
2
l l
ξ ξ
ϕ
+
= . (3.49)
As funções que descrevem as componentes do carregamento distribuído ao longo dos
lados podem também ser aproximadas empregando-se as mesmas bases φ
i
. Aplicando tais
funções sobre a expressão (3.44), após algum desenvolvimento, pode-se escrever a integração
numérica que proporciona o vetor de forças nodais equivalentes na forma:
( ) ( )
( ) ( )
T
q
l i GL l i
n
i
F Q Qq eJ w
ξ ξ
=
. (3.50)
Em (3.50) e é a espessura do elemento, w
GL
e
ξ
li
são o peso e os pontos dados pela
quadratura de Gauss-Legendre. Observa-se que agora o Jacobiano da transformação, J, é dado
por:
2 2
l l
x y
J
ξ ξ
= +
. (3.51)
Ainda na expressão (3.50), o vetor
n
q
reúne os valores na altura dos nós das
componentes da força distribuída no lado do elemento; a matriz
Q
agrupa as funções de
forma adotadas. Para o caso linear, por exemplo, esses elementos são dados por:
1
1
2
2
x
y
n
x
y
q
q
q
q
q
=
; (3.52)
1 2
1 2
0 0
0 0
Q
ϕ ϕ
ϕ ϕ
=
. (3.53)
38
3.2. Estratégias numéricas para detecção de contato
Conforme discutido no capítulo anterior, para os casos particulares onde o contato
resulta de uma restrição aos deslocamentos do sólido na forma de um anteparo rígido reto
horizontal ou vertical, os valores máximos e mínimos de deslocamento a serem observados
em cada são bem definidos, e assim, é possível realizar a abordagem do fenômeno com
recurso às variáveis canalizadas.
Para o caso mais geral onde as superfícies de contato são deformáveis e podem
apresentar qualquer geometria no espaço, as restrições a serem impostas ao sistema não são
conhecidas de início e, portanto, é necessário acrescentar estratégias numéricas para detectar a
distância entre as possíveis superfícies de contato; tais estratégias se aplicam em cada estágio
do processo de análise. Uma vez que a distância se anule ou passe a apresentar sinal negativo,
deve-se ativar a condição de impenetrabilidade. No caso particular da utilização da estratégia
dos conjuntos ativos, essa condição é imposta mediante a determinação de um valor escalar
que deve multiplicar os deslocamentos previstos para o sólido em cada etapa do processo,
conforme será detalhado mais adiante.
3.2.1. Detecção da distância entre ponto e superfície de contato
Considerando-se o espaço bidimensional, utilizado neste trabalho, define-se a posição
inicial de um ponto do sólido por meio de um vetor x, posicionado em relação a um
referencial adotado.
39
Em um determinado instante do processo físico, cada um dos pontos apresenta um
deslocamento, com relação à posição inicial, representada por um vetor u=(u,v). Para o
mesmo instante, a posição atual do ponto passa a ser representadas pelo vetor x
u
=(x
u
,y
v
),
resultando que x
u
=x+u=(x+u,y+v). Tais vetores são ilustrados na Figura 3.5.
Figura 3.5 - Significado dos vetores x, u e x
u
no espaço bidimensional
No caso geral, para descrever a geometria da linha de contato utilizam-se as funções
(3.45) a (3.49), que permitem aproximar sua forma por segmentos de curva definidos por
interpolação das posições de nós distribuídos sobre a mesma.
Tome-se inicialmente o caso de determinar a distância de um ponto P até um segmento
de reta como ilustrado na Figura 3.6(a).
Figura 3.6 - Determinação da distância entre um ponto P e um segmento de curva
definido com funções de forma de 1º grau (a) e de 2º grau (b)
x
y
x
u
x
u
x
u
=x+u
(x
u
,y
v
)=(x+u,y+v)
P
N
1
2
(x
1
,y
1
)
(x
2
,y
2
)
(x
N
,y
N
)
(x
P
,y
P
)
P
N
1
2
(x
1
,y
1
)
(x
3
,y
3
)
(x
N
,y
N
)
(x
P
,y
P
)
3
(x
2
,y
2
)
ê
t
(a)
(b)
40
Tal distância é definida como o comprimento P-N de um segmento de reta
perpendicular ao segmento de reta 1-2. Deve-se, portanto, em primeiro lugar, obter a posição
do ponto N que satisfaça tal condição.
Uma vez que N localiza-se no segmento 1-2 é possível obter suas coordenadas x
N
e y
N
e também o valor de sua coordenada adimensional local ξ
lN
; o modo adotado de obtê-la é
descrito no quadro que consta na Figura 3.7.
Figura 3.7 - Estratégia de obtenção da coordenada adimensional ξ
lN
para um
segmento definido por função de aproximação de 1º grau
A grande vantagem da utilização da estratégia apresentada na Figura 3.7 é que ela
possibilita a rápida identificação de segmentos sobre os quais o ponto P apresenta projeção,
uma vez que não existindo tal projeção o valor obtido para ξ
lN
não estará no intervalo que
define pontos pertencentes ao segmento (-1 a 1). A eficiência deste procedimento de
identificação evidencia-se especialmente quando a superfície de contato é descrita por um
número bastante grande de segmentos.
Tendo-se obtido ξ
lN
pode-se calcular as coordenadas do ponto N por meio das funções
de forma (3.45) e (3.46), resultando:
1) Definir
o ponto médio M:
M
P
2 1 2 1
( , ) ,
2 2
M M
x x y y
x y
+ +
=
2) Definir o vetor
PM
:
3) Definir a projeção de PM sobre
o vetor tangente unitário do
segmento 1-2:
4) Obter o valor da coordenada
adimensional, dada por:
( , )
P M P M
x x y y
Proj=PM
t
ê
Proj
L/2
lN
ξ
=
1 1
lN
ξ
Segmento de
Comprimento L
1
2
N
1 1
lN
ξ
41
1 1 2 2
( ) ( )
N lN lN
x x x
ϕ ξ ϕ ξ
= + ; (3.54)
1 1 2 2
( ) ( )
N lN lN
y y y
ϕ ξ ϕ ξ
= + . (3.55)
Finalmente o valor da distância g pode ser avaliado por meio da projeção do vetor P-N
sobre o versor normal ao segmento 1-2 (ê
n
). Nesse sentido, chama-se a atenção para a
importância da definição adequada da conectividade dos nós que definem o segmento,
atentando para que o versor ê
n
aponte para fora do sólido, de tal forma que a penetração do
ponto P gere valores de g negativos.
Tome-se agora o caso de segmentos com geometria dada por uma aproximação do
grau, como o ilustrado na Figura 3.6(b). Também neste caso, a distância é dada por um
segmento de reta normal à curva. Entretanto, para a curva do grau, os vetores tangentes
dependem da posição no segmento.
Para um ponto qualquer dessa curva, o vetor tangente é dado por (x’(ξ
l
),y’(ξ
l
)), sendo
x’ e y’ as derivadas de x e y com relação à coordenada adimensional ξ
l
. Ainda,
especificamente para o ponto N, que define a menor distância entre o ponto P e a curva, deve
ser observada a seguinte relação, conforme ilustra a Figura 3.6(b):
(
)
(
)
, '( ), '( ) 0
P N P N lN lN
x x y y x y
ξ ξ
=
. (3.56)
O produto interno apresentado resulta na seguinte equação:
[
]
[
]
( ) '( ) ( ) '( ) 0
P lN lN P lN lN
x x x y y y
ξ ξ ξ ξ
+ =
. (3.57)
A equação (3.57) pode ser resolvida numericamente de diversas maneiras, tendo-se
adotado o Método Iterativo das Falsas Posições ou Regula Falsi’, (HAMMING, 1973), pelo
mesmo motivo que se utilizou a estratégia escolhida no caso linear: facilidade em identificar
se há projeção sobre o segmento.
O Método das Falsas Posições baseia-se no fato de que para uma função contínua, se
há uma raiz em um intervalo, seus valores nos extremos do mesmo apresentam sinais opostos.
42
Assim, calcula-se o valor resultante dos termos à esquerda da igualdade em (3.57),
considerando-se cada um dos pontos extremos de ξ
l
no segmento, ou seja, -1 e 1, em lugar de
ξ
lN
. Se para ambos, o valor desse termo tiver o mesmo sinal, isso significa que não
projeção sobre aquele segmento. Caso contrário, a projeção existe e aplica-se o método para
encontrar o valor de ξ
lN
.
Encontrado tal valor, passa-se a um procedimento análogo ao do caso anterior para
determinar a distância, ou seja, calcula-se (x
N
,y
N
) e encontra-se a projeção de P-N sobre ê
n
,
definindo-se assim o valor da distância g.
Como observação final sobre as estratégias descritas, cabe ressaltar que apesar de
todas as formulações terem sido apresentadas para a posição ‘inicial’ x, as mesmas também
podem ser aplicadas utilizando-se a posição ‘atual’, dada pelo vetor x
u
. Neste caso, a
estratégia serve para identificar a violação da condição de impenetrabilidade em uma dada
etapa do processo de resolução.
3.2.2. Condição de impenetrabilidade na estratégia dos conjuntos
ativos
Por outro lado, quando se emprega a estratégia dos conjuntos ativos, a condição de
impenetrabilidade não deve ser violada em nenhum instante, o que pode ser garantido por
meio do uso de um fator escalar α que multiplica os deslocamentos previstos dos nós do
sólido, de tal maneira a atender com igualdade aquela condição. Tal escalar deve ser
calculado para cada um dos pontos de controle (nó ou ponto de Gauss) que potencialmente
possa entrar em contato com a superfície do outro sólido, devendo ser adotado o menor valor
positivo encontrado entre todos.
43
As estratégias para cálculo do fator α são brevemente descritas a seguir.
Considere-se novamente o caso de linha de contato descrita por segmentos lineares, e
que para o ponto P tenha sido previsto um vetor deslocamento u=(u,v), conforme ilustrado na
Figura 3.8(a).
Figura 3.8 - Determinação do escalar α para um segmento de curva polinomial (a)
de 1º grau e (b) de 2º grau
Uma vez que o vetor u=(u,v) aplicado em P cruza o segmento 1-2, é evidente que se
pode determinar um escalar α tal que a seguinte relação vetorial seja satisfeita:
( )
P l
α ξ
+ =x u x . (3.58)
A expressão (3.58) resulta em um sistema nas incógnitas α e ξ
l
(coordenada
adimensional do ponto de contato), dado por:
1 1 2 2
1 1 2 2
( ) ( )
( ) ( )
P l l
P l l
x u x x
y v y y
α ϕ ξ ϕ ξ
α ϕ ξ ϕ ξ
+ = +
+ = +
(3.59)
Isolando-se α em ambas as equações do sistema anterior, igualando-se as mesmas e
após algumas manipulações algébricas, obtém-se a seguinte equação:
[
]
[
]
1 1 2 2 1 1 2 2
( ) ( ) ( ) ( ) 0
l l P l l P
y y y u x x x v
ϕ ξ ϕ ξ ϕ ξ ϕ ξ
+ + =
. (3.60)
P
1
2
(x
1
,y
1
)
(x
2
,y
2
)
(x
P
,y
P
)
P
1
2
(x
1
,y
1
)
(x
3
,y
3
)
(x
P
,y
P
)
3
(x
2
,y
2
(a)
(b)
(x
uP
,y
vP
)
(u,v)
(x
uP
,y
vP
)
(u,v)
44
A equação (3.60) também pode ser resolvida numericamente por meio do Método das
Falsas Posições, com a vantagem que com essa abordagem na primeira iteração se pode
identificar se o vetor u aplicado em P cruza ou não o segmento, possibilidade esta que pararia
o processo.
Entretanto, uma vez que se tenha obtido o valor da coordenada adimensional ξ
l
, isto é,
que se encontre uma raiz para (3.60), é preciso confirmar se a interceptação com a linha de
contato efetivamente ocorre. Assim, ainda é necessário analisar o valor de α, obtido a partir de
qualquer uma das equações que formam o sistema (3.59).
Para linha de contato representada por segmentos quadráticos, com geometria dada
pelas funções (3.47) a (3.49), o procedimento é similar, resultando na equação:
[
]
[
]
1 1 2 2 3 3 1 1 2 2 3 3
( ) ( ) ( ) ( ) ( ) ( ) 0
l l l P l l l P
y y y y u x x x x v
ϕ ξ ϕ ξ ϕ ξ ϕ ξ ϕ ξ ϕ ξ
+ + + + =
. (3.61)
No que segue, o procedimento é idêntico ao caso linear.
3.3. Elementos de contato
Diferentemente dos elementos finitos descritos em 3.1, os elementos de contato não
apresentam geometria, tratando-se, na verdade, de restrições a serem impostas ao sistema. Por
essa razão, aos mesmos aplica-se o conceito de restrição ativa ou inativa (Apêndice A).
Assim, esses elementos devem ser prescritos nas regiões do contorno passíveis de
contato, e em cada etapa do processo de resolução, avaliam-se, por meio das técnicas
discutidas no item anterior, quais deles devem ser ativados ou desativados. Ao serem
ativados, uma interpretação simplificada que se pode adotar é que fisicamente os mesmos
‘colam-se’ à outra superfície, e quando desativados, ‘descolam-se’ da mesma.
45
Serão a seguir apresentados os dois diferentes tipos de elemento de contato
implementados no programa desenvolvido. Cabe ainda ressaltar que no presente trabalho,
optou-se pela particularização da formulação para o caso específico do contato de um sólido
com superfície indeformável e sem atrito, também conhecido como Problema de Signorini
(WRIGGERS, 2006).
3.3.1. Elementos de contato do tipo ‘nó-segmento’
Tratam-se de elementos que se aplicam isoladamente a nós do sólido que entraem
contato com o anteparo. Esses elementos proporcionam uma generalização das estratégias
aplicadas no caso da abordagem de variáveis canalizadas e uma vez que a linha de contato é
descrita por meio de segmentos de curva, serão denominados, neste trabalho, como do tipo
‘nó-segmento’.
O elemento de contato é ativado quando em uma etapa do processo de resolução
identifica-se que o ao qual está atrelado encostou ou penetrou na superfície de contato,
condição que é detectada pelas estratégias discutidas no item anterior, aplicadas para a
posição atual x
u
do ponto (nó) P.
Identificado o ponto (N) do segmento com o qual, na próxima etapa do processo
iterativo, o deve estar em contato, ativa-se no sistema resolvente a restrição que
corresponde à condição de impenetrabilidade, por meio da função g
PN
, dada pelo seguinte
produto interno:
(
)
(
)
(
)
PN P P N x P P N y
g x u x n y v y n
= = + + +
uP N n
x x ê
. (3.62)
Em (3.62) x
uP
é o vetor que representa a posição ‘atual’ do ponto P, x
N
a posição
inicial do ponto N (que por hipótese não se altera ao longo do processo), e ê
n
=(n
x
,n
y
), o vetor
46
normal unitário em N. Desenvolvendo-se a igualdade de modo a separar os valores constantes
dos incógnitos, obtém-se:
( ) ( )
( )
P
PN P N x P N y P x P y x y
P
u
g x x n y y n u n v n g n n
v
= + + + = +
. (3.63)
Em (3.63) o termo
g
é um valor escalar, dado por:
(
)
(
)
P N x P N y
g x x n y y n
= + . (3.64)
Pode-se então utilizar a forma apresentada pela última igualdade em (3.63) para
definir os termos que devem ser somados ao sistema em equivalência com a restrição de
impenetrabilidade.
Para o caso da utilização de multiplicadores de Lagrange como forma de considerar a
restrição de impenetrabilidade, o termo do funcional relativo ao contato (Π
c
) possui primeira
variação dada por:
c L PN L PN
g g
δ λ δ δλ
Π = + . (3.65)
Sendo λ
L
aplicada a um único ponto, sua aproximação pode ser dada por uma
constante. Desenvolvendo-se (3.65), e considerando que a (3.63) também fornece
PN
g
δ
,
obtém-se em forma matricial:
{ }
0 0 0
0 0 0
0
x P
P P L y P
x y L
n u
u v n v
n n
g
δ δ δλ
λ
+
(3.66)
Com a (3.66) e a condição de primeira variação nula do potencial de energia total,
pode-se identificar as componentes de rigidez e força nodal equivalente que devem ser
adicionados ao sistema global para levar em conta a situação de contato. Tais componentes
podem ser reunidas numa matriz
c
K
e no vetor
c
F
dados por:
47
0 0
0
0 0
0
0
x
T
y
c
x y
n
L
K n
L
n n
= =
; (3.67)
0
0
c
F
g
=
. (3.68)
Uma vez ativado um elemento de contato em certa iteração, nas próximas deve-se
verificar o sinal do multiplicador de Lagrange associado, como forma de identificar uma
eventual perda de contato no passo. Assim, um valor positivo para o multiplicador indica que
o contato deve ser desativado e a correspondente restrição retirada do sistema.
No caso de se utilizar o termo de penalização como forma de inserir a restrição de
impenetrabilidade,
c
δ
Π
resulta em:
c P PN PN
g g
δ λ δ
Π = (3.69)
Desenvolvendo (3.69), obtém-se novas componentes de rigidez e força nodal
equivalente que devem ser adicionados ao sistema global, nas posições relativas à u
P
e v
P
,
para levar em conta a situação de contato. Neste caso, a matriz
c
K
e o vetor
c
F
ficam
expressos por:
x x x y
P
c
y x y y
n n n n
K
n n n n
λ
=
; (3.70)
x
c
P
y
g n
F
g n
λ
=
. (3.71)
Ainda no caso do método da penalização, a avaliação quanto à desativação de um
dado elemento demanda o uso de uma etapa de análise adicional, uma vez que não existem
variáveis associadas diretamente à força de contato, como no caso dos multiplicadores de
Lagrange.
48
No presente trabalho, a estratégia adotada para estimar a força de contato consiste num
cálculo simples de reações nos vínculos unilaterais, empregando-se a matriz de rigidez do
sistema livre das restrições de contato. Uma vez obtidas as componentes das reações nos
vínculos unilaterais segundo o referencial global, realizam-se as suas projeções sobre o vetor
normal unitário ê
n
à superfície de contato (uma vez que não havendo atrito a reação é
ortogonal à superfície) com o objetivo de avaliar o sinal da resultante; se o sinal obtido indicar
tração sobre o anteparo, a restrição deve ser desativada. Essa situação é ilustrada na Figura
3.9.
Figura 3.9 - Avaliação da desativação de elemento do tipo ‘nó-segmento’ com
formulação de penalização
3.3.2. Elementos de contato ‘mortar’
Diferentemente dos elementos anteriores que se aplicam a nós isoladamente, os
elementos de contato ‘mortar’ estão atrelados a um segmento do contorno do sólido que
entrará em contato com o anteparo e derivam de uma técnica originalmente desenvolvida para
compatibilizar redes de malhas não-coincidentes (BERNADI; MADAY; PATERA, 2001)
apud (FISHER; WRIGGERS, 2005).
ê
n
ê
t
1
2
3
0
>
n
d ê
anteparo
(desativar)
d
49
O método é uma técnica de discretização baseada nos multiplicadores de Lagrange,
segundo a qual as restrições são atendidas por meio da interpolação de tais multiplicadores ao
longo do lado de um elemento (WRIGGERS, 2006). Resulta que a função g também é
interpolada ao longo do lado do elemento.
No caso tratado de contato entre um sólido deformável e um anteparo rígido, este
último é tomado como referência, sendo dito superfície ‘mortar’, enquanto a superfície do
primeiro é referida como superfície ‘non-mortar’, conforme ilustrado na Figura 3.10.
Figura 3.10 Lados de elementos finitos aos quais se aplicam elementos ‘mortar’
com funções de aproximação linear (a) e quadrática (b), e seus respectivos anteparos.
Uma vez que o método emprega a integração numérica, a formulação é imposta
considerando-se os pontos de integração de Gauss da superfície ‘non-mortar’ (ξ
(l)i
) e seus
respectivos pares de contato na superfície ‘mortar (ζ
(l)i
). No presente trabalho, para o caso
linear adotam-se dois pontos de Gauss (Figura 3.10(a)) e três pontos de integração para o caso
quadrático (Figura 3.10(b)).
Quando verificada a condição de penetração, o contato deve ser ativado sobre todo o
lado do elemento. Assim, para avaliar a penetração no caso geral, essencialmente assume-se
que se a maior parte do elemento atende à condição, então todo ele entra em contato com o
anteparo. Uma forma de realizar tal controle consiste em estimar o sinal da área sobre o
non-mortar
(anteparo)
1
2
A
B
C
non-mortar
mortar
A
B
C
D
E
1
3
2
(elemento)
(elemento)
mortar
(a)
(b)
ξ
l1
ξ
l
2
ζ
l1
ζ
l
2
ξ
l1
ξ
l
2
ξ
l
3
ζ
l1
ζ
l
2
ζ
l
3
(anteparo)
50
gráfico da função g ao longo do elemento, o que pode ser obtido, por integração numérica
sobre um domínio adimensional de referência na forma:
( ) ( ) ( ) ( )
( , ) ( ) ( )
e
m l i l i GL l i l i
i
g gd g w J
ξ ζ ξ ξ
Γ
= Γ =
. (3.72)
Então, se g
m
0 deve-se ativar a restrição.
Analogamente ao caso dos elementos do tipo ‘nó-segmento’, quando utilizada a
estratégia dos conjuntos ativos, a verificação da ativação do contato é precedida pelo cálculo
do fator
α
que multiplica o vetor deslocamento aplicado em cada iteração (vide estrutura geral
do algoritmo no item 3.4). Neste caso, se o valor de
α
estiver atrelado a cada um dos pontos
de Gauss isoladamente, isto pode gerar não-convergência para a solução, uma vez que devido
à utilização do critério dado pela (3.72), o elemento ‘mortar se ativaria apenas quando todos
os pontos de Gauss apresentassem o mesmo valor de
α
. Assim sendo, neste trabalho, ao
empregar a estratégia dos conjuntos ativos com o elemento mortar’, o valor do escalar
α
é
determinado por:
[ ]
e i
máx
α α
=
, sendo
α
i
os escalares
α
calculados nos pontos de Gauss (
ξ
(l)i
)
do elemento.
Uma vez constatada a penetração ou contato com o anteparo, a restrição relativa ao
elemento deve ser adicionada ao sistema. Para o desenvolvimento desta formulação, tome-se
inicialmente o caso linear, ilustrado na Figura 3.10(a).
Devido à abordagem ao longo de uma face, a componente da primeira variação do
funcional de energia é representada por:
(
)
c
c L L
g g d
δ δλ λ δ
Γ
Π = + Γ
. (3.73)
Conforme discutido, o valor de (3.73) é obtido por meio de integração numérica,
sendo necessário desenvolver a formulação que representa
λ
L
(ξ
(l)i
)
e
g(ξ
(l)i
)
nos pontos de
Gauss
ξ
(l)i
. A primeira delas pode ser facilmente obtida por meio das funções de forma (3.45)
e (3.46):
51
( )
1
1 2
2
( )
( )
( )
li
L li L L
li
ϕ ξ
λ ξ λ λ
ϕ ξ
=
. (3.74)
tendo sido determinado o ponto ζ
(l)i
do anteparo onde o contato com o ponto dado
por ξ
(l)i
ocorre, o termo g(ξ
(l)i
) é calculado de forma análoga à procedida para os elementos do
tipo ‘nó-segmento’, sendo dado por:
( )
1 ( ) ( )
1 ( ) ( )
( ) 1 1 2 2
2 ( ) ( )
2 ( ) ( )
( ) ( )
( ) ( )
( )
( ) ( )
( ) ( )
l i x l i
l i y l i
l i
l i x l i
l i y l i
n
n
g g u v u v
n
n
ϕ ξ ζ
ϕ ξ ζ
ξ
ϕ ξ ζ
ϕ ξ ζ
= +
. (3.75)
Em (3.75)
g
é dado por:
(
)
(
)
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
l i l i x l i l i l i y l i
g x x n y y n
ξ ζ ζ ξ ζ ζ
= + . (3.76)
Aplicando-se (3.74) e (3.75) em (3.73) e realizando desenvolvimento semelhante ao
apresentado para o elemento do tipo ‘nó-segmento, obtém-se matriz
c
K
e o vetor
c
F
:
( ) ( ) ( ) ( )
( , ) ( ) ( )
l i l i GL l i l i
c ci
i
K K w J
ξ ζ ξ ξ
=
; (3.77)
( ) ( )
0
( , )
0
T
l i l i
ci
L
K
L
ξ ζ
=
; (3.78)
1 ( ) 1 ( ) ( ) 2 ( ) 1 ( ) ( )
1 ( ) 1 ( ) ( ) 2 ( ) 1 ( ) ( )
1 ( ) 2 ( ) ( ) 2 ( ) 2 ( ) ( )
1 ( ) 2 ( ) ( ) 2 ( )
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
( ) ( ) ( ) (
l i l i x l i l i l i x l i
l i l i y l i l i l i y l i
T
l i l i x l i l i l i x l i
l i l i y l i l i
n n
n n
L
n n
n
ϕ ξ ϕ ξ ζ ϕ ξ ϕ ξ ζ
ϕ ξ ϕ ξ ζ ϕ ξ ϕ ξ ζ
ϕ ξ ϕ ξ ζ ϕ ξ ϕ ξ ζ
ϕ ξ ϕ ξ ζ ϕ ξ
=
2 ( ) ( )
) ( ) ( )
l i y l i
n
ϕ ξ ζ
; (3.79)
( ) ( ) ( )
( ) ( ) ( )
c ci
l i GL l i l i
i
F F w J
ξ ξ ξ
=
; (3.80)
( )
1 ( )
2 ( )
0
0
0
( )
0
( )
( )
i
c
l i
l i
l i
F
g
g
ξ
ϕ ξ
ϕ ξ
=
. (3.81)
52
Para as expressões anteriores, o jacobiano J é o mesmo dado por (3.51).
No caso dos elementos quadráticos (Figura 3.10(b)), a formulação é desenvolvida
utilizando-se as funções de interpolação (3.47) a (3.49), resultando em uma matriz
c
K
de
dimensão (9x9) e um vetor
c
F
de dimensão (6x1), semelhantes aos obtidos para o caso linear,
sendo a dimensão de
T
L
igual a (3x6).
Apesar de terem sido criados com base na formulação dos multiplicadores de
Lagrange, também é possível desenvolver sua formulação para o método da penalização.
Nesse caso, a primeira variação do funcional da energia relativa ao contato fica dada por:
c
c P
g g d
δ λ δ
Γ
Π = Γ
. (3.82)
No que segue o desenvolvimento é semelhante ao realizado para os multiplicadores de
Lagrange, resultando para o caso linear nos mesmos somatórios expressos em (3.77) e (3.80),
sendo a matriz
ci
K
e o vetor
ci
F
dados por:
1 1 1 1 1 2 1 2
1 1 1 1 1 2 1 2
2 1 2 1 2 2 2 2
2 1 2 1 2 2 2 2
x x x y x x x y
x x y y y x y y
ci
x x x y x x x y
y x y y y x y y
n n n n n n n n
n n n n n n n n
K
n n n n n n n n
n n n n n n n n
ϕ ϕ ϕ ϕ ϕ ϕ ϕ ϕ
ϕ ϕ ϕ ϕ ϕ ϕ ϕ ϕ
ϕ ϕ ϕ ϕ ϕ ϕ ϕ ϕ
ϕ ϕ ϕ ϕ ϕ ϕ ϕ ϕ
=
; (3.83)
1
1
2
2
y
ci
x
y
g n
g n
F
g n
g n
ϕ
ϕ
ϕ
ϕ
=
. (3.84)
É importante lembrar que em (3.83) e (3.84) φ
1
e φ
2
são calculadas em ξ
(l)i
e n
x
e n
y
em
ζ
(l)i
. O caso quadrático resulta em forma semelhante, com matriz
ci
K
de dimensão (6x6) e
vetor
ci
F
de dimensão (6x1).
53
Quanto à avaliação da condição de tensão para desativação de elementos, no caso da
formulação dos multiplicadores de Lagrange, a mesma é semelhante à efetuada nos elementos
do tipo ‘nó-segmento’, adotando-se agora como referência o valor preponderante no
elemento:
( ) ( ) ( )
( ) ( ) ( )
e
Lm L L l i GL l i l i
i
d w J
λ λ λ ξ ξ ξ
Γ
= Γ =
. (3.85)
No caso do método da penalização, em lugar de
λ
L
na expressão (3.85) toma-se o valor
estimado da reação no anteparo, já discutida no item 3.3.1.
3.4. Comentários gerais sobre o programa computacional desenvolvido
Apresentadas as estratégias numéricas adotadas para modelação dos sólidos e
tratamento do contato, apresenta-se neste item uma breve descrição da estrutura do programa
desenvolvido.
Para a elaboração do programa empregou-se a linguagem Fortran. Apesar da versão
utilizada (Fortran 95) não possuir funções específicas para programação orientada a objetos,
buscou-se na medida do possível elaborar a estrutura do código de maneira a se obter os
benefícios dessa filosofia. Para tanto, os trabalhos apresentados em (BECK, 2008) e
(DECYK; NORTON; ZSYMANSKI, 1996) foram de fundamental importância.
Em linhas gerais, a programação orientada a objetos é um paradigma de programação
que, entre inúmeras outras vantagens, acaba possibilitando que o código do programa
apresente uma estrutura mais flexível, em termos de possibilidades de expansão, do que
aquela que seria obtida por meio da programação estruturada convencional.
Para tanto, abstrações de entidades reais (objetos) são criadas no código, sendo
separadas em classes. As classes são unidades de software basicamente compostas por uma
54
estrutura de dados, que definem os atributos do objeto, e seus métodos, que são as funções e
rotinas que a ela se aplicam. Fazendo ainda uso de outros conceitos, é possível elaborar de
maneira organizada programas de estrutura bastante complexa, cujo sistema resultante se
por meio do funcionamento integrado de todas as classes.
A estrutura geral do programa desenvolvido é apresentada na Figura 3.11.
Figura 3.11 - Estrutura geral do programa desenvolvido
No caso do programa elaborado, quando o mesmo é iniciado, existe a opção de
analisar diretamente uma estrutura isolada, sem contato ou com contato por variáveis
Classe Deslocamento Imposto
Classe Deslocamento Restringido
Classe Elemento
Elemento Treliça
PROGRAMA PRINCIPAL
Bibliotecas
Classe Nó
Classe Seção
Classe Material
Classe Força Concentrada
Classe Força Distribuída
Classe Tensão
Classe Deformação
Classe Esforço
Elemento Pórtico
Elemento ISOT3
Elemento ISOT6
Elemento ISOQ4
Elemento ISOQ8
Classe Elemento de Contato
Elemento ‘nó-segmento’
Elemento ‘mortar’ linear
Elemento ‘mortar’ quadrático
Classe Segmento
Elemento Segmento 2 Nós
Elemento Segmento 3 Nós
Classe Conjunto Estrutural
Classe Estrutura
Entrada de Dados
Álgebra
Otimização
Saída de Dados
Hammer
Visualizador
Solver
55
canalizadas, ou definir um conjunto estrutural, composto por um sólido deformável e um
anteparo rígido.
A partir de então a classe estrutura passa a gerenciar as demais classes, solicitando
métodos de competência exclusiva das mesmas, que por sua vez também interagem entre si.
No caso específico do contato essa estrutura contribuiu bastante para organização do código,
permitindo ao programa realizar tarefas de maneira mais livre do que aquela que seria obtida
por meio da programação estruturada.
No caso do contato entre sólido deformável e anteparo rígido, a estrutura geral do
algoritmo para tratamento do contato é a seguinte:
1) Calcular a matriz de rigidez e vetor de forças nodais do sólido deformável; Avaliar
se existe contato na situação inicial e, caso exista, somar restrições respectivas ao
sistema.
2) Enquanto nº iterações menor que nº máximo adotado de iterações fazer:
2.1) Conforme o método de Newton, calcular o vetor gradiente grad=Ku-F e
resolver o sistema utilizando-o como vetor. A resposta resulta num vetor u;
2.2) Se estiver utilizando estratégia dos conjuntos ativos, calcular α; caso contrário,
α=1 (Método de Newton); Calcular então novo vetor u
it+1
=u
it
+α∆u e nº it. =nº it.+1;
2.3) Avaliar quais elementos de contato foram ativados; somar novas restrições ao
sistema;
2.4) Avaliar a norma do vetor gradiente |grad|. Se |grad|<tolerância então:
2.4.1) Verificar se há restrições a serem desativadas;
a) Caso não haja desativação, terminar o processo iterativo;
b) Caso contrário, atualizar restrições e retornar a 2.1).
Além da estrutura de classes apresentada, complementam as classes algumas
bibliotecas que dão subsídio para o funcionamento das mesmas. Dentre elas, destaca a
56
biblioteca ‘otimização’, que contém os métodos descritos no Apêndice A, bem como o
processo iterativo de Gauss-Seidel (PROENÇA; SAVASSI; MUNAIAR NETO, 1987),
também implementado no programa e avaliado neste trabalho.
Além dela, ressalta-se a importância da biblioteca desenvolvida denominada ‘álgebra’,
que faz a preparação dos dados para utilização de um ‘solver’ de matrizes esparsas empregado
no programa (DUFF; REID, 1983), desenvolvido pelo Numerical Analysis Group, do
Rutherford Appleton Laboratory.
Especificamente no caso desse último aspecto, devido à alta esparsidade dos sistemas
obtidos, o mesmo apresenta importância fundamental no programa, possibilitando ganhos
muito elevados de desempenho computacional. Para ilustrar esse ganho, a Figura 3.12
apresenta um comparativo entre os recursos computacionais disponibilizados para o
armazenamento e resolução para sistemas esparsos gerados aleatoriamente.
Relação entre recursos computacionais dispendidos
(Matriz cheia / Matriz reduzida)
0
500
1000
1500
2000
2500
3000
3500
4000
4500
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Número de graus de liberdade
Razão entre espaço/tempo dispendidos
(Matriz Cheia/Matriz Reduzida)
Espaço para Armazenamento Tempo de Resolução do Sistema Tempo de Multiplicação Matriz x Vetor
Figura 3.12 - Comparação entre recursos computacionais despendidos com a
utilização de matrizes cheias (com todos os termos) e reduzidas (apenas termos não-nulos)
57
4 - Exemplos Numéricos
Para avaliar o desempenho das estratégias propostas quanto aos aspectos de precisão e
eficiência, diversos exemplos de problemas de contato foram resolvidos por intermédio do
código computacional desenvolvido. Em particular, destacam-se os exemplos que apresentam
os resultados obtidos com os elementos nó-segmentoe mortar’, os quais permitem avaliar
vantagens e desvantagens na utilização de uma ou outra opção.
Em todos os casos considerou-se linearidade geométrica e contato sem atrito.
O termo de penalização adotado (nos casos em que se utilizou tal estratégia) é igual ao
valor do maior termo da matriz de rigidez multiplicado por 10
7
. Com exceção do último
exemplo, todos os demais tiveram o carregamento aplicado em apenas um passo de carga.
Na avaliação quanto à precisão, as respostas obtidas por meio do programa foram
confrontadas com resultados analíticos ou numéricos fornecidos pelo programa de elementos
finitos ANSYS
; naturalmente os valores de referência serão apresentados em cada exemplo.
para comparar a eficiência relativa entre os métodos estudados foram considerados
dois outros aspectos: número de iterações e tempo de processamento. Para que este último
aspecto não seja subjetivo, é importante informar as características do equipamento utilizado:
um computador com processador Intel Pentium III® de 650 MHz e memória RAM de 256
MB.
É importante ressaltar que todas as figuras de resultados obtidos com o código
computacional deste trabalho foram elaboradas com a ajuda do Pós Processador do GMEC
(Grupo de Mecânica Computacional do Departamento de Engenharia de Estruturas (SET) da
Escola de Engenharia de São Carlos (EESC)), programa desenvolvido pelo Dr. Rodrigo
Ribeiro Paccola, que autorizou sua utilização no presente trabalho.
58
4.1. Viga em balanço com restrições pontuais de deslocamentos por meio
de vínculos unilaterais
Este exemplo visa avaliar o aspecto de eficiência dos métodos de otimização com
variáveis canalizadas quando a modelagem envolve um número reduzido de variáveis e
discretização por elementos unidimensionais de viga. Para esta abordagem, a condição de
contato é ativada ou não mediante restrição sobre o valor de algumas das variáveis, no caso os
deslocamentos dos nós sujeitos à ação dos vínculos unilaterais.
A Figura 4.1 indica os detalhes do problema.
Figura 4.1 - Esquema estrutural da viga
A distância entre a face inferior da viga e os vínculos unilaterais (01 e 02) é igual a
1,00. A intensidade da força aplicada pode induzir o contato naqueles vínculos, sendo ainda
possível a desativação do contato no apoio 02.
O resultado referência é apresentado na Figura 4.2, indicando-se o valor dos
deslocamentos nodais verticais v no ponto de aplicação da força e nos nós onde ocorre o
contato, bem com os diagramas de esforço cortante (V) e momento fletor (M). Tal resultado
pode ser facilmente obtido procedendo a resolução conforme apresentado nos exemplos do
item 2.2.
100
100
50
P=30
EI=450.000,00
01
02
59
Figura 4.2- Deformada e diagramas de esforço cortante e momento fletor para P=30
Foram processados exemplos com três redes distintas de elementos finitos, visando
comparar a eficiência de cada um dos métodos com o aumento do número de variáveis. A
Tabela 4.1 indica as características de cada rede.
Tabela 4.1 – Informações gerais das redes utilizadas para resolução do exemplo.
Rede Número de
Elementos
Comprimento do
Elemento
Número de Nós Número de Graus
de Liberdade
01 4 50,00 5 15
02 20 10,00 21 63
03 40 5,00 41 123
Foram aplicados todos os métodos de otimização tratados no Apêndice A, associados
às seguintes estratégias para imposição das restrições sobre as variáveis: estratégia dos
multiplicadores de Lagrange, estratégia da penalização, estratégia dos multiplicadores de
Lagrange associada à estratégia dos conjuntos ativos e estratégia da penalização associada à
estratégia dos conjuntos ativos, referenciados na Tabela 4.2 respectivamente por L’, ‘P’,
‘L+C.A.’ e ‘P+C.A.’
V
M
401,25
697,50
21,975
8,025
x, u
y, v
v=-0,92
v=-1,00
v=-0,417
60
Tabela 4.2 - Número de Iterações (N.I.) e Tempo de Processamento (T.P.) para cada
uma das redes testadas, para os diversos métodos avaliados.
Rede 01
Rede 02
Rede 03
Método de
otimização
E. restrição
variáveis
N.I. T.P. (s) N.I. T.P. (s) N.I.
T.P. (s)
L 53 0,0000 423 0,0501 1097
0,2203
P 35 0,0000 358 0,0401 937
0,2003
L+C.A. 54 0,0100 540 0,0601 1367
0,2704
Gradientes
Conjugados
P+C.A. 41 0,0000 450 0,0501 1219
0,2504
L 3 0,0000 3 0,0000 3
0,0100
P 3 0,0000 3 0,0100 3
0,0100
L+C.A. 4 0,0000 4 0,0100 4
0,0100
Newton
P+C.A. 4 0,0000 4 0,0000 4
0,0100
L 10 0,0000 50 0,1001 87
0,5808
P 10 0,0000 45 0,0601 88
0,4206
L+C.A. 13 0,0100 63 0,1402 132
0,8813
Quase-Newton
DFP
P+C.A. 11 0,0000 61 0,0901 132
0,6309
L 10 0,0000 44 0,1001 85
0,6309
P 10 0,0100 44 0,0701 86
0,4306
L+C.A. 11 0,0000 49 0,1102 94
0,701
Quase-Newton
BFGS
P+C.A. 11 0,0000 49 0,0801 93
0,4707
Processo Iterativo Gauss-Seidel 34 0,0000 - - 25834
5,4879
O critério de parada para este e os demais exemplos foi que a norma L2 (módulo do
vetor gradiente) fosse menor que 10
-6
e/ou número de iterações superior a 30000.
Todos os métodos convergiram para a mesma solução, com exceção do Processo
Iterativo de Gauss-Seidel, o qual para a Rede 02 mostrou-se de convergência muito lenta, não
tendo sido atingida com o número máximo de iterações adotado.
Observa-se que o Método dos Gradientes com variáveis canalizadas tem sua aplicação
limitada aos casos em que não desativação das restrições e, por este motivo, não foi
aplicado neste exemplo.
Ainda como se observa da Tabela 1.2, claramente o Método de Newton apresentou
resultados incomparavelmente superiores, preservando eficiência mesmo nas redes mais
refinadas; os demais métodos se mostraram menos eficientes com o aumento do número de
variáveis.
61
Para melhor ilustrar essa variação relativa entre os métodos do tipo Quase-Newton e
Gradientes Conjugados, na Figura 4.3 apresenta-se um gráfico comparativo do número de
iterações.
Número de Iterações - Métodos de Otimização
0
200
400
600
800
1000
1200
1400
1 2 3
Rede
Número de Iterações
GC - Lagrange
GC - Penalização
GC - Lagrange+C.A.
GC - Penalização+C.A.
DFP - Lagrange
DFP - Penalização
DFP - Lagrange+C.A.
DFP - Penalização+C.A.
BFGS - Lagrange
BFGS - Penalização
BFGS - Lagrange+C.A.
BFGS - Penalização+C.A.
Figura 4.3 - Comparativo do Número de Iterações entre o Método dos Gradientes
Conjungados (GC) e os Métodos Quase-Newton DFP e BFGS
Observa-se que existe uma diferença substancial entre o número de iterações
apresentado pelo Método dos Gradientes Conjugados em relação aos Métodos do tipo Quase-
Newton. Uma comparação exclusivamente focada no número de iterações advogaria em favor
destes métodos, entretanto, apesar de parecer mais subjetivo, o comparativo dos tempos de
processamento (Figura 4.4) mostra que este parâmetro também deve ser levado em conta na
análise de eficiência.
62
Tempo de Processamento - Métodos de Otimização
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
1 2 3
Rede
Tempo de Processamento (s)
GC - Lagrange
GC - Penalização
GC - Lagrange+C.A.
GC - Penalização+C.A.
DFP - Lagrange
DFP - Penalização
DFP - Lagrange+C.A.
DFP - Penalização+C.A.
BFGS - Lagrange
BFGS - Penalização
BFGS - Lagrange+C.A.
BFGS - Penalização+C.A.
Figura 4.4 - Comparativo do Tempo de Processamento (em segundos) entre o Método
dos Gradientes Conjungados (GC) e os Métodos Quase-Newton DFP e BFGS
Como se pode observar, apesar de resultar em um número de iterações maiores, o
Método dos Gradientes Conjugados apresentou tempo de processamento menor do que os
Métodos Quase-Newton. Além disso, para um mesmo método de otimização, a resolução
utilizando a estratégia dos conjuntos ativos resultou em um número maior de iterações e
maior tempo de processamento com relação às estratégias que não a utilizaram. Isso se deve
ao fato de que a mesma procede a busca pela solução sempre dentro da região factível, e
portanto, cada vez que ocorre o contato em um ponto, o processo é reiniciado de tal maneira a
continuá-la sem a observação de penetração.
Cabe também observar que em termos gerais, para o presente problema, a estratégia da
penalização apresentou-se mais eficiente que a estratégia dos multiplicadores de Lagrange,
associada ou não à estratégia dos conjuntos ativos.
63
Para finalizar este primeiro exemplo, é interessante registrar a deformada da estrutura
com o aumento da força aplicada. Para tanto a Figura 4.5 ilustra as configurações deformadas
da viga para diferentes valores de força.
Figura 4.5 - Configurações deformadas da viga para valores de força entre 0 e 30.
O primeiro contato, com o apoio 02, ocorre para P=1,97. A partir deste valor, o mesmo
passa a exercer uma reação na estrutura. Para P=9,50 inicia-se o contato também com o apoio
01, e a partir deste valor, com o aumento de P, observa-se então uma diminuição gradativa da
reação no apoio 02 e uma aumento da reação no apoio 01. Para P maior que 21,60 cessa o
contato com apoio 02 e passa haver o contato exclusivamente como o apoio 01. Este
comportamento não-linear pode ser bem visualizado nas Figuras 4.6 e 4.7.
P=0
P=1,00
P=1,97
P=9,50
P=21,60
P=30,00
64
Força P x Deslocamento
-1,20
-1,00
-0,80
-0,60
-0,40
-0,20
0,00
0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00
Força
Deslocamento
Deslocamento v - Apoio 01 Deslocamento v - Apoio 02
Figura 4.6 - Deslocamento vertical de acordo com a Força P
Força P x Reação nos Apoios
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00
Força
Reação nos Apoios
Reação - Apoio 01 Reação - Apoio 02
Figura 4.7 - Reação nos apoios 01 e 02 de acordo com a Força P
65
4.2. Problema de Contato de Hertz
De acordo com (JOHNSON, 2003), o primeiro estudo relativo à mecânica do contato
foi desenvolvido por Heinrich Hertz em seu artigo “Über die Berührung fester Elastischer
Körper” em 1881, como forma de explicar os efeitos do contato sobre o desvio de imagens
em lentes. Deste estudo resultou a solução analítica para um problema de contato tido hoje
como clássico, ilustrado na Figura 4.8 com valores aqui adotados para sua resolução
numérica.
Figura 4.8 - Exemplo de problema de contato de Hertz, com valores adotados para o
raio(r), força distribuída(q), Módulo de Elasticidade (E) e Coeficiente de Poisson (υ).
Trata-se de um problema envolvendo um sólido deformável e um anteparo rígido, para
o qual as características de geometria, restrições e força aplicada permitem a modelagem
como problema bidimensional em Estado Plano de Deformações (EPD).
A solução encontrada por Hertz para caracteriza-se por:
Largura da semi-faixa de contato (metade da largura final da zona de contato):
1/2
*
4 .
P r
a
E
π
=
r=8,00
E=1000,00
υ=0,3
q=30,00
66
Na relação anterior, P é a força por unidade de comprimento longitudinal do cilindro,
e E
*
é dado por
*
2
1
E
E
υ
=
.
Pressão máxima (reação) de contato:
1/2
*
0
2P PE
p
a r
π π
= =
Tensão máxima de cisalhamento:
0
0,30 (em 0 e 0,78 )
p x y a
τ
= = =
Considerando-se os dados adotados, tem-se:
0
2,11; 144,87; 43,46
a p
τ
= = =
Para a modelagem do sólido foram utilizadas redes de malhas irregulares formadas por
elementos triangulares, tanto de elementos com 3 nós (ISOT3) quanto com 6 nós (ISOT6). A
Figura 4.9 apresenta o aspecto das redes utilizadas.
ISOT3-Rede 01
66 Graus Liberdade
ISOT3 - Rede 02
156 Graus Liberdade
ISOT3 - Rede 03
320 Graus Liberdade
ISOT3 – Rede 04
858 Graus Liberdade
ISOT6-Rede 01
70 Graus Liberdade
ISOT6 - Rede 02
202 Graus Liberdade
ISOT6 - Rede 03
434 Graus Liberdade
ISOT6 - Rede 04
1242 Graus Liberdade
Figura 4.9 - Redes de elementos triangulares de 3 nós (ISOT3) e de 6 nós (ISOT6)
67
Como a superfície inferior constitui um anteparo rígido reto, e o processo de
carregamento não implica em desativação de vínculos de contato, neste problema, ao
contrário do anterior, o método do gradiente passou também a ser empregado. Além disso,
duas abordagens são consideradas: variáveis canalizadas, nos moldes do exemplo anterior, e o
emprego de elementos de contato (do tipo ‘nó-segmento’ e ‘mortar’).
Tome-se inicialmente a primeira abordagem. A fim de avaliar a eficiência dos mesmos
métodos utilizados no exemplo anterior, os resultados obtidos quanto ao número de iterações
e tempo de processamento estão indicados nas Tabela 4.3 e 4.4.
Tabela 4.3 - Parâmetros de eficiência (N.I. Número de Iterações e T.P Tempo de
Processamento) dos métodos de otimização com variáveis canalizadas para redes com
elementos ISOT3
Variáveis Canalizadas - ISOT3
Rede 01 Rede 02 Rede 03 Rede 04
N.I. T.P. (s)
N.I. T.P. (s) N.I. T.P. (s) N.I. T.P. (s)
M. Gradiente 7660
2,9743
9214
9,3034 22589
48,6299 - -
L 187 0,0300
683 0,2604 3050 2,3734 8692
19,2777
P 147 0,0200
444 0,1602 1162 0,8813 2340
5,2375
L+C.A.
223 0,0300
858 0,3104 2163 1,8426 7182
15,7326
Gradientes
Conjugados
P+C.A.
229 0,0300
746 0,2504 1400 1,0515 3663
7,5809
L 6 0,0200
13 0,1202 14 0,3104 19 1,6624
P 4 0,0100
13 0,1001 17 0,3705 18 1,4321
L+C.A.
3 0,0000
5 0,0401 7 0,1502 10 0,8312
Newton
P+C.A.
3 0,0000
5 0,0401 7 0,1502 10 0,7911
L 261 0,8612
279 4,7769 468 34,3794 - -
P 60 0,1102
108 1,0715 164 8,342 274 96,8993
L+C.A.
87 0,2804
281 4,6467 640 47,1879 - -
Quase-Newton
DFP
P+C.A.
- - 110 1,0916 167 8,5823 275 98,7019
L 210 0,6810
8392
141,0628
3336 252,7835
- -
P 60 0,1102
106 1,0415 156 8,0015 304 107,4545
L+C.A.
- - - - - - - -
Quase-Newton
BFGS
P+C.A.
60 0,1102
106 0,9213 154 7,7111 253 88,287
Gauss-Seidel 527 0,0801
1085
0,3906 1299 0,9814 3058
6,3692
68
Tabela 4.4 - Parâmetros de eficiência (N.I. Número de Iterações e T.P Tempo de
Processamento) dos métodos de otimização com variáveis canalizadas para redes com
elementos ISOT6
Variáveis Canalizadas - ISOT6
Rede 1 Rede 2 Rede 3 Rede 4
N.I. T.P. (s) N.I. T.P. (s)
N.I. T.P. (s) N.I. T.P. (s)
M. Gradiente 8816 5,6381 - - - - - -
L 167 0,0401 1260 0,9313 5201 8,4421 17241
99,4129
P 190 0,0401 705 0,5107 1813 2,9142 4426 24,6855
L+C.A.
282 0,0701 1617 1,1817 5796 9,4636 23641
136,9469
Gradientes
Conjugados
P+C.A.
296 0,0701 1160 0,8412 3327 5,2776 10267
58,4240
L 4 0,0200 15 0,2103 18 0,6710 7 1,2117
P 6 0,0200 11 0,1502 12 0,4406 9 1,6524
L+C.A.
3 0,0000 5 0,0801 9 0,3205 16 2,6438
Newton
P+C.A.
3 0,0100 5 0,0701 9 0,3205 16 2,8441
L 127 0,5107 338 10,5852
832 113,4431
- -
P 71 0,1803 158 3,2447 244 23,0531 434 325,6382
L+C.A.
141 0,5608 386 11,9872
- - - -
Quase-Newton
DFP
P+C.A.
74 0,1903 165 3,4049 237 22,3121 410 312,4493
L 179 0,7210 - - 940 131,8195
- -
P 71 0,1803 153 3,3048 228 21,0603 - -
L+C.A.
- - - - - - - -
Quase-Newton
BFGS
P+C.A.
71 0,1602 152 3,0344 228 21,2606 386 285,9111
Gauss-Seidel 349 0,0701 2362 1,6323 3349 5,1574 6123 37,6341
Para estas tabelas também se utilizou a indicação L’ para a estratégia dos
multiplicadores de Lagrange, ‘P’ para estratégia da penalização e +C.A.’ quando as mesmas
foram associados à estratégia dos conjuntos ativos. Os casos indicado por ‘-’ não convergiram
dentro do número máximo de iterações adotado (30000 para Método dos Gradientes,
Gradientes Conjugados e Processo Iterativo de Gauss-Seidel, e 1000 para os métodos do tipo
Quase-Newton).
Para avaliar a precisão das estratégias em cada uma das redes, os valores obtidos
foram confrontados com os resultados analíticos de referência, sendo o de compressão na
direção vertical (p
0
) apresentado na Figura 4.10, e os resultados de tensões de cisalhamento na
Figura 4.11. Também são apresentados nas mesmas figuras os resultados do pacote
computacional ANSYS ®, utilizando redes e elementos idênticos aos utilizados no programa
69
desenvolvido. Cabe observar que, de um modo geral, todas as estratégias produziram valores
numéricos praticamente idênticos, salvo em situações que serão descritas mais adiante.
Tensão
σ
y
máxima (compressão)
0,00
20,00
40,00
60,00
80,00
100,00
120,00
140,00
160,00
180,00
1 2 3 4
Rede
Tensão
σ
y
máxima (valor absoluto)
ISOT3 ISOT6 PLANE42 PLANE82 Analítico
Figura 4.10 - Tensão de compressão máxima obtida para cada uma das redes
Tensão cisalhante
τ
xy
máxima
0,00
5,00
10,00
15,00
20,00
25,00
30,00
35,00
40,00
45,00
50,00
1 2 3 4
Rede
Tensão
τ
xy
máxima (valor absoluto)
ISOT3 ISOT6 PLANE42 PLANE82 Analítico
Figura 4.11 - Tensão cisalhante máxima obtida para cada uma das redes
70
Na segunda abordagem a resolução do mesmo problema foi conduzida utilizando-se
elementos de contato. Cabe lembrar que tais elementos constituem uma estratégia de
resolução geral que se aplica para superfícies de contato de qualquer geometria.
Em particular, os elementos de contato do tipo ‘nó-segmento’, por empregarem um
critério de contato pontual, constituem uma generalização da estratégia das variáveis
canalizadas. De fato, os resultados obtidos com esse tipo de elemento foram idênticos aos
obtidos pelos métodos de otimização com variáveis canalizadas. Nesse sentido, tal
concordância constitui-se numa primeira comprovação da boa implementação e precisão dos
mesmos.
os elementos de contato ‘mortar’ apresentam uma formulação mais elaborada, e
empregam um critério de contato que envolve não apenas o e seus respectivos graus de
liberdade, mas um conjunto de graus de liberdade associados ao lado do elemento. Por esse
motivo é bastante interessante proceder a comparação dos resultados obtidos por meio dos
mesmos com os apresentados anteriormente.
Observou-se que alguns dos resultados obtidos utilizando-se elementos ‘mortar’
mostraram-se sensíveis ao arredondamento ou precisão numérica, não conseguindo apresentar
uma configuração de equilíbrio simétrica, tanto para redes assimétricas (Figura 4.12 (a)),
quanto simétricas (Figura 4.12 (b)).
(a)
(b)
Figura 4.12 - Exemplos de diagramas de cores do deslocamento vertical v não-simétrico
obtidos por meio do uso de elementos de contato ‘mortar’
71
A assimetria observada tem origem numérica, e uma vez que ocorreram apenas para
tais elementos, evidenciam uma maior sensibilidade dessa estratégia a esse tipo de erro.
É importante ressaltar, entretanto, que os problemas do elemento ‘mortar’ quanto à
simetria podem ser contornados quando os mesmos são associados com a estratégia dos
conjuntos ativos. Nessa situação, as respostas obtidas foram simétricas, sendo idênticas as que
foram obtidas por meio dos elementos do tipo ‘nó-segmento’.
A Figura 4.13 ilustra os resultados satisfatórios que foram obtidos utilizando-se a
estratégia dos conjuntos ativos para resolução via elementos ‘mortar’, para as mesmas redes
apresentadas na Figura 4.12.
(a)
(b)
Figura 4.13 - Exemplos de diagramas de cores do deslocamento vertical v simétrico
obtidos por meio do uso de elementos de contato ‘mortar’ associados a estratégia dos conjuntos
ativos, para as mesmas redes apresentadas na Figura 4.12.
Quanto aos resultados obtidos com os elementos do tipo ‘nó-segmento’, as
distribuições de tensões obtidas utilizando-se a rede 4 de elementos ISOT6 são apresentados
nas Figura 4.14, 4.15 e 4.16.
72
Figura 4.14 - Campo de tensão na direção x (
σ
x
) obtido para a rede 04 de elementos
ISOT6, com elementos de contato do tipo ‘nó-segmento’
Figura 4.15 - Campo de tensão na direção y (
σ
y
) obtido para a rede 04 de elementos
ISOT6, com elementos de contato do tipo ‘nó-segmento’
73
Figura 4.16 - Campo de tensão cisalhante (
τ
xy
) obtido para a rede 04 de elementos
ISOT6, com elementos de contato do tipo ‘nó-segmento’
O aspecto dos diagramas contempla simetria e é bastante similar ao obtido por meio
do ANSYS utilizando-se a rede 04 de elemento PLANE82 (equivalente ao elemento ISOT6),
indicados na Figura 4.17.
Figura 4.17 - Diagramas da distribuição de tensões obtidos por meio do ANSYS
74
4.3. Viga em balanço sujeita a ação de vínculos unilaterais (modelagem
com elementos bidimensionais)
Este terceiro exemplo trata-se basicamente do mesmo problema apresentado em 4.1,
agora modelado com elementos bidimensionais (Estado Plano de Tensões). Os detalhes estão
apresentados na Figura 4.18.
Figura 4.18 - Esquema estrutural e dimensões do problema da viga
A distância entre a face inferior da viga e a face superior dos apoios, diferentemente de
em 4.1 é igual a 2,00. Adotou-se também um Módulo de Elasticidade diferente do adotado
para a outra modelagem, para tornar a deformada mais pronunciada e com melhor
visualização.
Novamente duas abordagens foram empregadas: variáveis canalizadas e elementos de
contato. A primeira abordagem serviu de referência particularmente para os resultados obtidos
utilizando-se os elementos do tipo ‘nó-segmento’, por motivo mencionado anteriormente.
Os resultados de ambas as abordagens foram comparados com uma solução de referência
gerada com o ANSYS a partir das seguintes características:
- Rede regular com 2000 elementos PLANE42 (10x200 elementos), totalizando 2211
nós, ou seja, 4422 graus de liberdade.
E=100,00; υ=0,3
P=15
50
95
10
85
10
A
A
2,6
10
75
- Para o contato foram utilizados elementos CONTACT175, cuja formulação
considera contato entre e superfície, sendo esta última definida por elementos
TARGET169. Observa-se que a estratégia disponibilizada no ANSYS é mais próxima da
abordagem aqui realizada com o elemento ‘nó-segmento’. Para restrição de variáveis utilizou-
se a estratégia Lagrangiano Aumentado, opção ‘default’ do programa.
Nestas condições, foram obtidos como valores extremos de deslocamento 16,35 (para
cima, na extremidade livre) e -6,82 (para baixo, no ponto de aplicação da força).
De início, programaram-se simulações com o programa deste trabalho utilizando redes
de malhas regulares compostas por elementos quadrilaterais tanto do tipo ISOQ4 quanto
ISOQ8; as características destas redes constam na Tabela 4.5.
Tabela 4.5 - Características das redes regulares (N.E. - número de elementos, N.N -
número de nós e N.G.L. - número de graus de liberdade)
Rede de elementos ISOQ4 Rede de elementos ISOQ8
Rede N.E. N.N. N.G.L Rede N.E. N.N. N.G.L
01 320 (4x80) 405 810 01 80 (2x40) 325 650
02 720 (6x120) 847 1694 02 180 (3x60) 667 1334
03 1280 (8x160) 1449 2898 03 320 (4x80) 1129 2258
04 2000 (10x200)
2211 4422 04 500 (5x100) 1711 3422
Entretanto, após os processamentos das redes compostas por elementos ISOQ8
combinadas com elementos de contato do tipo ‘mortar, notaram-se respostas inconsistentes,
brevemente descritas no que segue.
A Figura 4.19 ilustra as soluções obtidas utilizando os elementos de contato ‘mortar’
(a) e ‘nó-segmento’ (b), para o nível máximo de força aplicado, que deve induzir
‘descolamento’ da extremidade livre em relação ao apoio. Claramente a resposta obtida com o
elemento ‘mortar’ é incoerente.
76
(a)
(b)
Figura 4.19 - Configuração de equilíbrio obtida por rede de elementos ISOQ8; (a) para
elementos de contato do tipo ‘mortar’; (b) para elementos de contato do tipo ‘nó-segmento’
Lembrando que nos elementos de contato ‘mortar’ o valor da tensão de controle
considerado na interface de contato é obtido por uma integração das tensões ao longo da face
do elemento, o comportamento incoerente obtido pode ser mais facilmente compreendido
observando-se em detalhe a região do apoio extremo, ao qual a viga ficou, por assim dizer,
‘presa’ (vide Figura 4.20).
Figura 4.20 - Região do apoio extremo na configuração deformada obtida para a
rede 02 de elementos ISOQ8 utilizando-se elementos de contato ‘mortar’ (diagrama de cores
referente a tensão na direção y (
σ
y
))
77
Na Figura 4.20 pode-se claramente observar a ocorrência de tensões de tração e de
compressão ao longo da interface de contato (regiões com coloração azul clara e em
tonalidades de verde). Na integração ao longo da face, as tensões de compressão prevalecem,
não desativando o contato.
Quando a mesma rede foi utilizada com elementos de contato do tipo ‘nó-segmento’,
esse comportamento não foi observado, como mostrado na Figura 4.19(b), que os mesmos
tomam valores pontuais de tensão como referência para a desativação do contato.
Isto não quer dizer que os elementos ‘mortar’ não sejam eficientes, mas sim que, a
depender do caso, sua utilização adequada possa requerer maior refinamento das redes, ou
ainda, a combinação com estratégias de refinamento do tipo adaptativo.
Evidenciada a limitação descrita, optou-se por dar continuidade ao estudo do presente
problema apenas considerando as redes de elementos ISOQ4.
Primeiramente, avalia-se a estratégia de otimização pelo Método de Newton com
variáveis canalizadas.
A Tabela 4.6 apresenta o número de iterações e tempo de processamento despendido
para a resolução com cada uma das quatro possibilidades de restrição de variáveis estudadas.
Tabela 4.6 - Número de iterações e tempo de processamento observados para
resolução pelo Método de Newton com variáveis canalizadas
Número de Iterações
Lagrange Penalização Lagrange+C.A. Penalização+C.A.
Rede 1 6 6 20 20
Rede 2 6 6 26 26
Rede 3 7 7 32 32
Rede 4 7 7 39 39
Tempo de Processamento (s)
Lagrange Penalização Lagrange+C.A. Penalização+C.A.
Rede 1 0,2804 0,2904 0,9313 0,9313
Rede 2 0,7611 0,7911 3,2046 3,2847
Rede 3 1,9929 2,0129 9,0730 8,9128
Rede 4 3,2747 3,4349 18,4365 18,8771
78
Como pode ser observado, para o exemplo em questão o desempenho tanto da
estratégia dos multiplicadores de Lagrange quanto da penalização foi praticamente
equivalente, o que também foi evidenciado quando ambas foram associadas à estratégia dos
conjuntos ativos. Cabe também ressaltar que quando esta foi utilizada, observou-se um
aumento significativo no número de iterações e tempo de processamento, proporcionalmente
ao número de graus de liberdade da rede. Na Figura 4.21 esse aspecto fica bastante evidente.
Tempo de Processamento - M. Newton - Variáveis Canalizadas
0.0000
2.0000
4.0000
6.0000
8.0000
10.0000
12.0000
14.0000
16.0000
18.0000
20.0000
1 2 3 4
Rede
Tempo de Processamento (s)
Lagrange Penalização Lagrange+Conjuntos Ativos Penalização+Conjuntos Ativos
Figura 4.21 - Tempo de processamento para as diversas redes de elemento ISOQ4
utilizando-se o Método de Newton com variáveis canalizadas
Na seqüência, na abordagem utilizando elementos de contato, optou-se por tomar
apenas a resolução utilizando a estratégia da penalização. A Tabela 4.7 apresenta os
parâmetros de eficiência obtidos para cada caso, incluindo, para confronto, aqueles
correspondentes à abordagem por variáveis canalizadas.
79
Tabela 4.7 - Comparativo da eficiência da resolução utilizando elementos de contato
com relação a otimização com variáveis canalizadas (V.C.)
Número de Iterações Tempo de Processamento (s)
Rede
mortar nó-segmento
V.C.
Rede
mortar nó-segmento V.C.
01 8 6 6 01 0,4206 0,3305 0,2904
02 10 6 6 02 1,3519 0,8612 0,7911
03 10 7 7 03 2,9943 2,1531 2,0129
04 100 7 7 04 49,3309 3,6753 3,4349
Um primeiro aspecto bastante evidente é que para todas as redes a resolução por
elementos do tipo ‘nó-segmento’ demandou exatamente o mesmo número de iterações que a
resolução por variáveis canalizadas.
Tal diagnóstico era esperado, uma vez que ambas tratam-se basicamente da mesma
estratégia de restrição de variáveis, conforme já discutido no exemplo anterior. Já quanto ao
tempo de processamento, elementos do tipo ‘nó-segmento’ requerem tempos ligeiramente
superiores devido ao processamento adicional para a avaliação da ocorrência do contato.
Quanto à solução com elementos ‘mortar’ pode-se notar que o desempenho sempre foi
inferior, tanto em termos de número de iterações quanto de tempo de processamento. Mais
ainda, para a rede 04, com maior número de graus de liberdade, observou-se um salto grande
no número de iterações e tempo de processamento com relação à tendência que vinha sendo
observada para as demais redes. A Figura 4.22 apresenta este comportamento ainda não
totalmente esclarecido (uma explicação plausível é apresentada mais adiante).
80
Tempo de Processamento - M. Newton+Penalização
0.0000
5.0000
10.0000
15.0000
20.0000
25.0000
30.0000
35.0000
40.0000
45.0000
50.0000
1 2 3 4
Rede
Tempo de Processamento (s)
Método Mortar Método Nó-Segmento Método Variáveis Canalizadas
Figura 4.22 - Comparação do tempo de processamento necessário para resolução
utilizando-se as diferentes abordagens adotadas.
Em relação à precisão dos resultados é necessário retomar os valores de referência
citados anteriormente, no caso, relativos ao deslocamento máximo (maior valor de
deslocamento para cima) e nimo (maior valor de deslocamento para baixo). A Figura 4.23
indica a convergência para o primeiro valor, enquanto a Figura 4.24 indica a convergência
para o segundo.
Pode ser notado que tanto a solução obtida utilizando-se variáveis canalizadas quanto
a obtida utilizando elementos de contato do tipo ‘nó-segmento’ aproximaram-se bastante dos
resultados de referência, mesmo para as redes com malhas mais grosseiras. Já os elementos de
contato mortar’ não propiciaram resultados tão próximos dos valores adotados como de
referência, divergindo para a rede mais refinada.
81
Deslocamento máximo (para cima) - M. Newton + Mult. de Lagrange
0,00
2,00
4,00
6,00
8,00
10,00
12,00
14,00
16,00
18,00
1 2 3 4
Rede
Deslocamento v
Método Mortar Método Nó-Segmento Método das Variáveis Canalizadas Referência
Figura 4.23 - Convergência do valor de deslocamento máximo (para cima)
Deslocamento Mínimo (para baixo) - M. Newton+Mult. Lagrange
-7,00
-6,80
-6,60
-6,40
-6,20
-6,00
-5,80
-5,60
-5,40
-5,20
1 2 3 4
Rede
Deslocamento v
Método Mortar Método Nó-Segmento Método Variáveis Canalizadas Referência
Figura 4.24 - Convergência do valor de deslocamento mínimo (para baixo)
82
A explicação para o distanciamento entre os resultados de referência e os obtidos
utilizando-se elementos de contato ‘mortar’ pode mais uma vez ser obtida analisando-se mais
detalhadamente a região de contato que ocorre no apoio intermediário (Figura 4.25).
(a)
(b)
(c)
(d)
Figura 4.25 - Campos de tensão vertical obtidos utilizando elementos de contato
‘mortar’ (a) e do tipo ‘nó-segmento’ (b). Em (c) e (d) são apresentadas apenas a configuração
das redes deformadas, para facilitar visualização da região/ponto de contato.
Mais uma vez a causa do mau comportamento dos elementos de contato ‘mortar’ foi
basicamente o fato de eles admitirem tensões de tração no contato. A ativação ou desativação
do contato com base na integral da tensão em toda a face de cada elemento (Figura 4.25 (a) e
(b)) pode, então, dar origem a configurações deformadas bastantes distintas (Figura 4.25 (c) e
(d)). É importante também atentar nas mesmas figuras que em ambos os elementos observou-
penetração
penetração
83
se a ocorrência de penetração entre as superfícies de contato, que constitui um erro decorrente
da discretização adotada.
Para finalizar, apresentam-se os campos de tensões obtidos utilizando-se elementos de
contato do tipo ‘nó-segmento’, na Figura 4.26.
(a)
(b)
(c)
Figura 4.26 - Campos de tensões obtidos utilizando-se elementos de contato do tipo
nó-segmento (rede 02 elementos ISOQ4), sendo (a) a tensão na direção horizontal (
σ
x
), (b)
na direção vertical (
σ
y
) e (c) a tensão cisalhante (
τ
xy
).
84
4.4. Viga com apoios inclinados
Visando avançar no nível de dificuldade de resolução, propõe-se um novo problema,
relativo a uma viga com as mesmas dimensões da utilizada no problema anterior, agora sujeita
à ação de anteparos não-retos, conforme o esquema da Figura 4.27.
Figura 4.27 - Esquema estrutural para o presente exemplo
Nas simulações os s pertencentes à seção do meio do vão tiveram seus
deslocamentos horizontais impedidos para eliminar movimento de corpo rígido nesta direção.
Mais uma vez o valor de referência foi gerado com o ANSYS, com as mesmas
características (rede e elementos) descritas no exemplo anterior.
No ANSYS o fato de as restrições darem-se apenas por contato impôs grande
dificuldade para o algoritmo de resolução. Para superar essa dificuldade foi necessário ativar a
opção de não-linearidade geométrica e, também, alterar a opção do comportamento entre as
superfícies de contato, impondo-se o status ‘Rough’ nas opções do elemento CONTACT175,
seguindo orientações do manual do programa para essa situação.
Como o ANSYS apresenta hipóteses distintas das utilizadas pelo programa
desenvolvido, foram tomados como referência apenas os valores para o deslocamento
máximo (para cima) e mínimo (para baixo), respectivamente iguais a 2,55 e -9,20.
anteparo rígido
q=1,0
10
40
E=10.000,00; υ=0,3
10
10
200
85
Uma vez que foram processados exemplos com as mesmas redes do exemplo anterior,
as características são idênticas às da Tabela 4.5.
Neste exemplo, em função da geometria da restrição não é possível empregar a
abordagem por variáveis canalizadas.
Em termos dos resultados com a abordagem por elementos de contato, em primeiro
lugar, a estratégia de penalização não apresentaram convergência. As estratégias de conjuntos
ativos também não foram bem sucedidas. A única estratégia que apresentou convergência
para todas as redes foi a que emprega multiplicadores de Lagrange (não-associada à estratégia
dos conjuntos ativos).
Para esta estratégia, as respostas em termos de deslocamento máximo e mínimo são
ilustradas respectivamente nas Figuras 4.28 e 4.29.
Deslocamento v máximo (maior deslocamento para cima)
0,00
0,50
1,00
1,50
2,00
2,50
3,00
1 2 3 4
Malha
Deslocamento v
ISOQ4 - Mortar ISOQ4 - Nó-Segmento ISOQ8 - Mortar ISOQ8 - Nó-Segmento Referência
Figura 4.28 - Deslocamento máximo (para cima) obtido utilizando-se para a restrição
de variáveis a estratégia dos multiplicadores de Lagrange
86
Deslocamento v mínimo (maior deslocamento para baixo)
-10,00
-9,00
-8,00
-7,00
-6,00
-5,00
-4,00
-3,00
-2,00
-1,00
0,00
1 2 3 4
Malha
Deslocamento v
ISOQ4 - Mortar ISOQ4 - Nó-Segmento ISOQ8 - Mortar ISOQ8 - Nó-Segmento Referência
Figura 4.29 - Deslocamento mínimo (para baixo) obtido utilizando-se para a
restrição de variáveis a estratégia dos multiplicadores de Lagrange
Os valores de deslocamento máximo aproximaram-se mais do valor de referência do
que os valores de deslocamento mínimo, para os quais se observou uma diferença
considerável. Entretanto, cabe novamente ressaltar que a resposta de referência foi gerada a
partir de condições distintas das adotadas no programa desenvolvido.
Mais uma vez os resultados mais destoantes comparativamente foram os obtidos com
elementos ‘mortar’, para os quais novamente observou-se a ocorrência de tensões de tração
localizadas em regiões de ocorrência de contato (Figura 4.30).
87
(a) (b)
Figura 4.30 - Distribuição de tensões na direção vertical (
σ
y
) na região de contato,
utilizando elementos de contato ‘mortar’ (a) e do tipo ‘nó-segmento’ (b).
Este efeito torna-se mais evidente quando analisados os valores de tensões de tração
máximos obtidos para cada um dos tipos de elementos de contato, conforme pode ser visto na
Figura 4.31; localmente os elementos ‘mortar’ geram tensões de tração sem correspondência
física.
Tensão
σ
y
máxima (maior tração)
0,000
50,000
100,000
150,000
200,000
250,000
1 2 3 4
Malha
Tensão
σ
y
máxima
ISOQ4 - Mortar ISOQ4 - Nó-Segmento ISOQ8 - Mortar ISOQ8 - Nó-Segmento
Figura 4.31 - Tensão na direção y (σ
y
) máxima (tração) obtida para cada situação
88
Apresentam-se na Figura 4.32 os campos de tensões obtidos para a rede 04 de
elementos ISOQ8, utilizando-se elementos de contato do tipo ‘nó-segmento’.
(a)
(b)
(c)
Figura 4.32 - Campos de tensões obtidos utilizando-se elementos de contato do tipo
nó-segmento (rede 04 elementos ISOQ8), sendo (a) a tensão na direção horizontal (σ
x
), (b)
na direção vertical (σ
y
) e (c) a tensão cisalhante (τ
xy
).
89
Dada a geometria curva dos apoios é interessante ainda apresentar algumas
configurações deformadas para diversos valores de carga, para as quais se observam
alterações consideráveis não apenas da forma viga, mas principalmente da posição da região
de contato ao longo dos apoios curvos. A Figura 4.33 ilustra as configurações de equilíbrio
obtidas por intermédio do programa desenvolvido para diferentes valores de força q.
Figura 4.33 - Configurações de equilíbrio para diversos valores de força q
90
4.5. Arco com deslizamentos sobre anteparo curvo
Como último exemplo optou-se por analisar um problema de contato com maior grau
de complexidade. Para tanto escolheu-se o problema do contato entre um arco e um anteparo
curvo indeformável, conforme esquematizado na Figura 4.34.
Figura 4.34 - Dimensões, formas e deslocamentos imposto para o presente problema
Nas simulações adotou-se inicialmente um deslocamento imposto u igual a 8,00, para
o qual ocorre o contato entre os sólidos.
Para discretizar o arco foram geradas redes de malhas retangulares compostas pelos
elementos isoparamétricos ISOQ4 e ISOQ8 em Estado Plano de Tensões. Os aspectos das
redes, bem como os dados sobre número de elementos, nós e graus de liberdade, estão
apresentados na Figura 4.35.
6,00
2,00
5,00
3,00
u
u
(0,00;0,00)
(10,00;12,00)
E=10000,00
υ=0,3;e=1,0
91
ISOQ4 – Rede 01
800 elementos – 909 nós
1818 graus de liberdade
ISOQ4 – Rede 02
3200 elementos – 3417 nós
6834 graus de liberdade
ISOQ8 – Rede 01
200 elementos – 709 nós
1418 graus de liberdade
ISOQ8 – Rede 02
800 elementos – 2617 nós
5234 graus de liberdade
Figura 4.35 - Redes utilizadas para a discretização do arco
Mais uma vez o resultado de referência adotado foi obtido por meio do ANSYS,
utilizando-se uma rede de malhas irregulares compostas por elementos triangulares
(PLANE42) e elementos de contato CONTACT175. A superfície rígida foi discretizada por
elementos TARGET169. Os resultados de tensões máximas e mínimas obtidas estão
apresentados na Tabela 4.8.
92
Tabela 4.8 - Valores máximos e mínimos de tensão obtidos por meio do ANSYS
Valor Máximo Valor Mínimo
σ
x
88,312 -144,667
σ
y
106,283 -133,208
τ
xy
33,162 -41,957
Assim como no exemplo anterior, o emprego de multiplicadores de Lagrange se
mostrou o mais eficiente, convergindo para todos os casos, motivo pelo qual foi a estratégia
adotada para a avaliação dos elementos de contato ‘mortar’ e do tipo ‘nó-segmento’. Os
resultados obtidos para as diferentes redes, para ambos os tipos de elementos de contato, são
apresentados na Tabela 4.9.
Tabela 4.9 - Valores de tensões máximos e mínimos obtidos por meio do programa
elaborado, utilizando-se os dois diferentes elementos de contato.
Elementos de contato
‘mortar’
Elementos de contato
do tipo ‘nó-segmento’
σ
x
máximo
σ
x
mínimo
σ
x
máximo
σ
x
mínimo
ISOQ4 – Rede 01
92,11 -126,72 91,86 -126,17
ISOQ4 – Rede 02
92,72 -138,54 92,60 -138,53
ISOQ8 – Rede 01
98,98 -141,05 93,01 -131,42
ISOQ8 – Rede 02
93,17 -131,21 92,55 -130,50
σ
y
máximo
σ
y
mínimo
σ
y
máximo
σ
y
mínimo
ISOQ4 – Rede 01
98,74 -117,68 98,76 -117,70
ISOQ4 – Rede 02
115,33 -140,47 116,07 -141,29
ISOQ8 – Rede 01
101,48 -123,46 101,15 123,58
ISOQ8 – Rede 02
116,49 -145,93 116,86 -146,24
τ
xy
máximo
τ
xy
mínimo
τ
xy
máximo
τ
xy
mínimo
ISOQ4 – Rede 01
33,55 -40,30 32,28 -40,30
ISOQ4 – Rede 02
29,63 -41,26 29,53 -41,42
ISOQ8 – Rede 01
44,38 -41,58 30,73 -41,81
ISOQ8 – Rede 02
36,18 -42,16 31,94 -42,22
Como pode ser observado, não houve um comportamento predominante de um ou
outro elemento em relação aos valores de referência, uma vez que, de modo geral, todas as
redes apresentaram valores de tensão máximos e mínimos relativamente próximos entre si.
93
Por se tratar de um exemplo com geometria e condições de contorno não-triviais,
resultando, portanto, em configurações deformadas e campos de tensões igualmente
complexos, optou-se por complementar os diagramas de cores dos campos de tensão com uma
imagem reduzida da distribuição dos campos de tensões correspondentes do ANSYS.
Atentando-se para as ordens inversas dos diagramas de cores resultantes do programa
desenvolvido e do ANSYS, pode-se observar que visualmente em ambos as distribuições de
tensões são semelhantes (Figuras 4.36, 4.37 e 4.38).
Figura 4.36 - Tensões na direção horizontal (
σ
x
) obtidas utilizando-se elementos de
contato ‘nó-segmento’; no topo à direita, imagem gerada pelo ANSYS para o mesmo campo
94
Figura 4.37 - Tensões na direção vertical (
σ
y
) obtidas utilizando-se elementos de
contato ‘nó-segmento’; no topo à direita, imagem gerada pelo ANSYS para o mesmo campo
Figura 4.38 - Tensões cisalhantes (
τ
xy
) obtidas utilizando-se elementos de contato
‘nó-segmento’; no topo à direita, imagem gerada pelo ANSYS para o mesmo campo
95
É ainda importante mencionar que os exemplos anteriores foram processados a partir
da imposição do valor total do carregamento. Ao contrário, este exemplo demandou a
utilização de um processo incremental-iterativo (com subdivisão da carga aplicada em
incrementos regulares). Além disso, observou-se que a estabilidade do sistema é bastante
sensível ao tamanho do passo de carga.
Numa etapa final de análise, optou-se por processar novas situações com diferentes
valores para o deslocamento final (u) imposto (variando de 6 a 12). Em cada uma delas
procurou-se observar o desempenho dos dois tipos de elementos. Os parâmetros para
avaliação do desempenho são apresentados na Tabela 4.10, e ilustrados na Figura 4.39 e 4.40.
Tabela 4.10 - Número de iterações e tempo de processamento para diversos valores
de deslocamento imposto u.
ISOQ4 - Rede 01 ISOQ8 - Rede 01
Número de
Iterações
Tempo de
processamento (s)
Número de
Iterações
Tempo de
processamento (s)
u mortar nó-seg. mortar nó-seg. u mortar nó-seg. mortar nó-seg.
6 32 14 6,41 3,70 6 24 38 5,05 6,62
8 49 36 9,73 6,76 8 45 76 9,62 13,45
10 92 43 18,44 8,07 10 148 101 31,58 18,08
12 197 57 38,79 10,74 12 123 163 26,02 29,11
ISOQ4 - Rede 02 ISOQ8 - Rede 02
Número de
Iterações
Tempo de
processamento (s)
Número de
Iterações
Tempo de
processamento (s)
u mortar nó-Seg. mortar nó-seg. u mortar nó-seg. mortar nó-seg.
6 39 19 42,56 17,86 6 35 41 44,51 39,54
8 67 34 71,78 32,22 8 72 75 90,89 72,70
10 163 51 172,70 48,77 10 104 491 132,88 464,08
12 291 48 305,14 47,27 12 144 167 183,99 163,50
96
Tempo de Processamento x Deslocamento u (Rede 1)
0
5
10
15
20
25
30
35
40
5 6 7 8 9 10 11 12 13
Deslocamento u
Tempo de Processamento (s)
ISOQ4 - Mortar ISOQ4 - Nó-Segmento ISOQ8 - Mortar ISOQ8 - Nó- Segmento
Figura 4.39 - Tempo de processamento para diversos valores de deslocamento
imposto u, para as redes menos refinadas (redes 01)
Tempo de Processamento x Deslocamento u (Rede 2)
0
50
100
150
200
250
300
350
400
450
500
5 6 7 8 9 10 11 12 13
Deslocamento u
Tempo de Processamento (S)
ISOQ4 - Mortar ISOQ4 - Nó-Segmento ISOQ8 - Mortar ISOQ8 - Nó-Segmento
Figura 4.40 - Tempo de processamento para diversos valores de deslocamento
imposto u, para as redes mais refinadas (redes 02)
97
Mais uma vez pode-se afirmar que não um elemento com comportamento
predominante em termos de desempenho.
Para finalizar são apresentadas na Figura 4.41 as configurações deformadas para
alguns valores de deslocamento imposto adotados.
(a)
(b)
(c)
(d)
(e)
(f)
Figura 4.41 - Configuração deformada do arco para diversos valores de deslocamento
imposto; (a) u=0;(b) u=6; (c) u=8; (d) u=10; (e) u=12; (f) u= 13,5
98
99
5 - Conclusões
Inicialmente são apresentadas algumas considerações elaboradas principalmente com
base nas observações realizadas durante a implementação do programa e nos resultados
obtidos por intermédio do mesmo.
Na seqüência, são levantadas as principais conclusões resultantes da pesquisa.
Finalmente, indicam-se os principais assuntos identificados como de interesse para
desenvolvimento de estudos futuros.
5.1. Considerações finais
A pesquisa iniciou-se avaliando a aplicação de cnicas de otimização com variáveis
canalizadas para modelar exemplos simples de contato (RIGO, 1999). O primeiro exemplo
numérico apresentado retomou este estudo, utilizando elementos prismáticos para modelar
uma estrutura sujeita à ação de vínculos unilaterais.
Conforme discutido no Capítulo 4, no primeiro exemplo o Método dos Gradientes não
foi utilizado devido à sua incapacidade de tratar problemas com desativação de variáveis.
No entanto foi avaliado o Método dos Gradientes Conjugados (MGC), que constitui
um aprimoramento do Método dos Gradientes, possuindo uma taxa de convergência bastante
superior à do primeiro. É importante observar que no caso dos problemas lineares irrestritos o
MGC apresenta eficiência elevada; especialmente com sistemas esparsos se observa um
ganho de desempenho notável quando exploradas estruturas de armazenamento e resolução de
100
sistemas que desconsideram os termos nulos. Entretanto, quando o método foi utilizado com a
introdução de restrições no sistema, essa eficiência acabou sendo bastante diminuída.
Com relação ao Método de Newton, que recai na resolução sucessiva de sistemas
lineares, este sem dúvida apresentou-se como o método mais eficiente e robusto. Entretanto,
nota-se que sua destacada eficiência em relação aos demais métodos deve-se ao uso das
funções de resolução de sistemas esparsos comentadas no capítulo 3.
Finalmente, duas variantes de métodos do tipo Quase-Newton foram testadas, como
forma de obter uma aproximação para a inversa da matriz de rigidez (‘hessiana’). Porém, nos
testes preliminares, observou-se que o grau de esparsidade da aproximação da matriz inversa
obtida era muito menor do que a inversa do sistema original, inviabilizando o uso das
estratégias de exclusão de termos nulos. Isto tornou o método adequado apenas para sistemas
com pequeno número de variáveis.
Com relação ao processo iterativo de Gauss-Seidel, apesar de ter se mostrado
ineficiente no primeiro exemplo, observou-se que o mesmo teve resultado bastante superior
no segundo exemplo, mesmo este apresentando número bem maior de incógnitas. Cabe relatar
que este comportamento havia sido observado nos testes realizados durante o
desenvolvimento do programa. Nesses testes, quando utilizado com elementos prismáticos de
barra em flexão (pórtico), o método era capaz de resolver apenas sistemas pequenos; quando
utilizado para problemas bidimensionais, apresentou-se eficaz para sistemas muito maiores.
Realizado o estudo comparativo dos métodos de otimização nos dois primeiros
exemplos, partiu-se então para a avaliação dos elementos de contato desenvolvidos, variando-
se apenas as estratégias de restrição de variáveis (multiplicadores de Lagrange ou
penalização). Para a resolução do sistema, utilizou-se o Método de Newton, que nos exemplos
anteriores se mostrou incomparavelmente superior aos demais.
101
Dois tipos distintos de elementos de contato foram utilizados: os elementos do tipo
‘nó-segmento’, que constituem uma generalização das estratégias utilizadas na abordagem em
variáveis canalizadas, e os elementos ‘mortar’, para os quais o contato deixa de ser pontual e
passa a ser considerado em toda a face do elemento.
O segundo e terceiro exemplo foram propositalmente propostos de maneira a permitir
uma avaliação da precisão da resolução por meios desses elementos e, também, o confronto
com os resultados obtidos pelo emprego da estratégia por variáveis canalizadas.
No problema de Hertz observou-se que os elementos do tipo ‘nó-segmento’
apresentaram resultados idênticos aos obtidos com o uso de variáveis canalizadas. Já para os
elementos ‘mortar observou-se a convergência para configurações de equilíbrios não-
simétricas, incoerente com o esperado em função da simetria inicial do problema,
evidenciando que provavelmente esses elementos são mais sensíveis às questões de precisão
numérica. Entretanto, observou-se que a combinação com a estratégia dos conjuntos ativos
solucionou este problema.
No terceiro problema, os elementos ‘mortar’ também apresentaram resultados
inadequados, particularmente devido ao fato da condição de contato estabelecida na
formulação dos mesmos ser dependente de um valor ‘médio’ de tensão. Nesse sentido podem
ocorrer tensões de tração em alguns trechos da interface de contato e ainda assim o mesmo
continuar ativado, com reflexos negativos sobre os aspectos de convergência e precisão.
No quarto exemplo, propôs-se um problema com anteparos gidos curvos, visando
avaliar a capacidade do algoritmo de tratar superfícies com essa geometria.
Para tal problema, a única estratégia de restrição de variáveis que foi capaz de
convergir para todas as redes propostas foi a dos multiplicadores de Lagrange. Em uma
análise de convergência, para situações equivalentes em termos do número de graus de
liberdade, observou-se que os elementos do tipo ‘nó-segmento’ apresentaram resultados
102
sempre próximos entre si, tanto quando utilizadas redes de elementos ISOQ4, quanto de
elementos ISOQ8. O mesmo não ocorreu para os elementos ‘mortar’, principalmente quando
utilizados em conjunto com os elementos ISOQ8, provavelmente em decorrência das
dimensões das malhas.
O último exemplo apresenta o grau de dificuldade mais elevado, por tratar não apenas
de superfícies de contato curvas, mas pelo fato do carregamento induzir escorregamentos
relativos entre os sólidos. Cabe observar que dos exemplos apresentados este foi o único que
demandou a adoção de uma estratégia incremental-iterativa. Nessas condições, observou-se
uma forte dependência do tamanho do passo de carga para a convergência da solução, sendo
que passos muito pequenos não necessariamente garantiram convergência. Entretanto, é
importante observar que ao aplicar essa estratégia, não foi explorado o recurso à matriz
tangente, mas sim um método direto, atualizando-se a matriz de rigidez secante de acordo
com a ativação ou desativação das restrições. Também é importante informar que assim como
no quarto exemplo, a única estratégia de restrição de variáveis que convergiu para todas as
redes, e para ambos os elementos de contato, foi a dos multiplicadores de Lagrange.
5.2. Conclusões
Apesar de muitas das estratégias de otimização estudadas terem apresentado
comportamento satisfatório nos problemas de estruturas de barras, como havia sido
constatado por (RIGO, 1999), as mesmas perderam eficiência quando extrapoladas para casos
com grande número de graus de liberdade associados a problemas de modelagem bi e
tridimensional; nestas situações o Método de Newton apresentou eficiência e robustez muito
maiores. Observa-se, também, que em sistemas lineares resultantes do Método de Newton
103
com esparsidade baixa, provavelmente a alternativa mais eficiente para a sua resolução é dada
pelo Método dos Gradientes Conjugados.
Quanto aos elementos de contato utilizados, os dois exemplos finais demonstraram
que o código desenvolvido foi capaz de reproduzir resultados adequados, bastante próximos
aos obtidos pelo código computacional consagrado, tomado como referência.
Em geral, os elementos de contato do tipo ‘nó-segmento’ apresentaram resultados mais
adequados que os elementos ‘mortar’. Entende-se que a principal causa dos resultados
insatisfatórios destes últimos decorre do critério de contato, baseado na consideração do valor
preponderante da força no elemento, que acaba permitindo a ocorrência de tensões de tração
em alguns trechos da superfície sem desativação do contato. Essa situação pode proporcionar
grandes diferenças tanto na distribuição local de tensões quanto na configuração deformada
da estrutura.
Entretanto, apesar dos resultados adequados obtidos, deve-se atentar para o fato de que
o elemento ‘nó-segmento’ considera o contato apenas nos nós, o que em superfícies curvas
pode representar uma aproximação grosseira a depender da discretização adotada, podendo
violar a condição de impenetrabilidade entre nós.
Por outro lado, nos casos de contato entre sólidos deformáveis, os elementos ‘mortar’
quando ativos implicam em relacionamento dos graus de liberdade dos nós dos sólidos
distintos pertencentes à região de contato, o que reduz uma eventual violação da condição de
impenetrabilidade entre nós quando comparado com o elemento do tipo ‘nó-segmento’. Isto
acaba também por constituir uma grande vantagem desses elementos, particularmente em
redes não-coincidentes, pois a minimização de energia do sistema fornece a posição
equilibrada para qualquer que seja a posição relativa dos nós.
Quanto às estratégias de restrição de variáveis, por multiplicadores de Lagrange ou
Penalização, apesar de em alguns exemplos o programa desenvolvido o ter obtido solução
104
para ambas quando utilizados os elementos de contato, não caberia uma defesa exclusiva em
favor daquela que funcionou nos dois últimos exemplos, isto é, os multiplicadores de
Lagrange. Na verdade, não se investiu no aprimoramento do algoritmo implementado para a
estratégia de penalização, que, em tese, deveria ser mostrar tão eficiente quanto à primeira;
isto pode ser objeto de desenvolvimentos futuros.
Além disso, deve-se ressaltar que mesmo em programas comerciais consagrados,
muitas dessas dificuldades de convergência são igualmente constatadas. Assim, tratando-se da
resolução de problemas de contato, um bom código deve apresentar mais de uma estratégia de
restrição de variáveis, de maneira que se possa testá-las e optar pela mais adequada a
depender das características do problema formulado.
Quanto à utilização da estratégia dos conjuntos ativos em combinação com as
estratégias de restrição, observaram-se vantagens apenas para alguns casos. Esperava-se obter
um procedimento capaz de evitar a penetração durante o processo iterativo, evitando a
geração de campos de tensões irreais durante o mesmo, comprometendo a convergência do
sistema. Entretanto, ao contrário do esperado, foi com o seu uso que a resolução do sistema
mostrou-se menos estável, como foi observado nos dois últimos exemplos, para os quais o
processo iterativo em certo ponto passou a oscilar indefinidamente entre algumas
configurações de equilíbrio. A causa provável dessa instabilidade numérica é a incapacidade
do algoritmo em identificar as direções de busca quando mais de uma restrição passou a ser
ativada simultaneamente.
5.3. Proposta para trabalhos futuros
Considerando o comportamento observado pelos elementos de contato ‘mortar’, e
levando-se em consideração as vantagens discutidas no item anterior, uma proposta bastante
105
promissora para trabalhos futuros é o desenvolvimento de alterações na formulação dos
mesmos, visando solucionar os problemas evidenciados no presente trabalho decorrentes do
critério de contato.
Quanto à resolução de sistemas de equações, um estudo quanto às causas das
instabilidades observadas e possíveis soluções para esta questão seria outro tema para futuros
trabalhos.
Além das propostas anteriores, pode-se com especial atenção citar a possibilidade do
emprego do Método dos Elementos Finitos Generalizados para problemas de contato, uma
vez que o recurso ao enriquecimento das aproximações, inerente a este método, pode
proporcionar alternativas eficientes aos elementos de contato aqui testados.
106
107
Referências Bibliográficas
ASSAN, A. E. (1996). Métodos Energéticos e Análise Estrutural. Editora Unicamp.
Campinas.
ASSAN, A. E. (2003). Métodos dos Elementos Finitos – Primeiros Passos. Segunda
Edição. Editora Unicamp. Campinas.
BATHE, K. J. (1996). Finite Element Prodecures. Prentice-Hall, Inc. Englewood
Cliffs, New Jersey.
BECK, A. T. (2008). Programação Orientada a Objetos em Fortran. Notas de
Aula. São Carlos. Escola de Engenharia de São Carlos. Universidade de São Paulo.
BELYTSCHKO, T.; LIU, W.; MORAN, B. (2000). Nonlinear Finite Elements for
Continua and Structures. JohnWiley & Sons. New York.
BERNARDI C.; MADAY Y.; PATERA A. (2001). A new conforming approach to
domain decomposition: the mortar element method. In Brezis H, Lions JL (eds). Nonlinear
Partial Differential Equations and Their Applications. John Wiley & Sons. New York, pp 13-
51
COWPER, G. R. (1972). Gaussian Quadrature Formulas for Triangles.
International Journal for Numerical Methods in Engineering. Vol. 7, Issue 3: 405-408.
108
DECYK, V. K.; NORTON, C. D.; ZSYMANSKI, B. K. (1996). Introduction to
Object-Oriented Concepts using Fortran90. Disponível em: http://exodus.physics.ucla.edu/
Fortran95/F90_Objects.pdf. Acesso em: fevereiro de 2008
DUFF, I. S.; REID, J. K. (1983). The multifrontal solution of Indefinite Sparse
Symmetric Linear Equations. ACM Transactions on Mathematical Software. Vol. 9. N.
3. p. 302-325.
FISHER, K. A.; WRIGGERS, P. (2005). Frictionless 2d contact formulation for
finite deformations based on the mortar method. Computational Mechanics. 36: 226-244.
FOX, R. L. (1971). Optimization Methods for Engineering Design. Addison -
Wesley Publishing Company.
HAMMING, R. W. (1973) Numerical Methods for Scientists and Engineers.
Second Edition. Dover Publications Inc. New York.
HUMES, A. F. P. C. et al. (1984). Noções de cálculo numérico. McGraw-Hill. São
Paulo.
JOHNSON, K. L. (2003) Contact Mechanics. Cambridge University Press.
KIKUCHI, N.; ODEN, J. T. (1988). Contact Problems in Elasticity: A Study of
Variational Inequalities and Finite Element Methods. Society of Industrial and Applied
Mathematics, Philadelphia, U.S.A.
109
LAURSEN, T. A. (2002). Computational Contact and Impact Mechanics:
Fundamentals of Modeling Interfacial Phenomena in Nonlinear Finite Element Analysis.
Springer-Verlag, Heidelberg.
LUENBERGER, D. G. (2005). Linear and Nonlinear Programming. Second
Edition. Springer.
MCDEVITT, T. W.; LAUSERN, T.A. (2000). A mortar-finite element formulation
for frictional contact problems. International Journal for Numerical Methods in
Engineering. 48:1525-1547.
NOCEDAL, J.; WRIGHT, S. J. (2006). Numerical Optimization. Second Edition.
Springer. New York.
PROENÇA, S. P. B.; SAVASSI, W. MUNAIAR NETO, J. (1987). Aplicação do
procedimento iterativo de Gaus-Seidel na automatização do cálculo de vigas contínuas.
Publicação 009/87. Escola de Engenharia de São Carlos. Universidade de São Paulo. São
Carlos
PROENÇA, S. P. B. (2007). Análise Não-Linear de Estruturas. Notas de Aula. São
Carlos. Escola de Engenharia de São Carlos. Universidade de São Paulo.
PROENÇA, S. P. B. (2007). Introdução aos Métodos Numéricos. Notas de Aula.
São Carlos. Escola de Engenharia de São Carlos. Universidade de São Paulo.
110
RIGO, E. (1999). Métodos de otimização aplicados à análise de estruturas. São
Carlos, Dissertação (Mestrado). Escola de Engenharia de São Carlos. Universidade de São
Paulo.
SAVASSI, W. (2000). Introdução ao método dos elementos finitos em análise
linear de estruturas. Reimpressão. Serviço de publicações da EESC. São Carlos.
WRIGGERS, P. (2006). Computational Contact Mechanics. Second Edition.
Springer-Verlag. Berlin.
ZIENKIEWICZ, O. C.; TAYLOR, R. L. (2000). The finite element method, Vol. I. e
II. 5
th
edition. Butterworth-Heinemann. Oxford.
111
Bibliografia adicional consultada
ARENALES, M. N. (1998). Otimização Não Linear. Notas de Aula. São Carlos.
Universidade de São Paulo
BARBOSA, H. J. C.; FEIJÓO, R. A. (1984). Numerical Algorithms for contact
problems in linear elastostatics. Relatório de Pesquisa e Desenvolvimento 013/84.
Laboratório Nacional de Computação Científica. Petrópolis. RJ.
BARBOSA, H. J. C.; RAUPP, F. M. C.; BORGES, C. C. H. (1993). Estudo
comparativo de algoritmos para resolução de inequações variacionais em mecânica.
Relatório de Pesquisa e Desenvolvimento 025/93. Laboratório Nacional de Computação
Científica. Petrópolis. RJ.
BECKER, R.; HANSBO, P.; STENBERG, R. (2003). A finite element method for
domain decomposition with non-matching grids. Mathematical Modelling and Numerical
Analisys. Vol. 37, Nº 2: 209-225.
CUNHA, M. C. C. (2003). Métodos Numéricos. Editora da Unicamp. Editora da
Unicamp. Campinas.
CUNHA, R. D. (2005). Introdução à linguagem de programação FORTRAN 90.
Editora da UFRGS. Porto Alegre.
112
FANCELLO, E. A.; FEIJÓO, R. A.; ZOUAIN, N. (1990). Formulação variacional
do problema de contato com atrito: resolução via regularização. Relatório de Pesquisa e
Desenvolvimento Nº 035/90. Laboratório Nacional de Computação Científica. Petrópolis. RJ.
FLEMISCH, B.; PUSO, M. A.; WOHLMUTH, B. I. (2005). A new dual mortar
method for curved interfaces: 2D elasticity. International Journal for Numerical Methods in
Engineering. 63:813-832.
FRACAROLLI, S. (1961). Princípios dos trabalhos virtuais. Teoremas de Betti -
Maxwell - Clapeyron - Castigliano - Menabrea. FAU. Universidade de São Paulo. São
Paulo.
FREY, S. L.; SAMPAIO, R.; GAMA, R. M. S. (1989). Simulação de problemas de
contato unilateral a partir de problemas clássicos de contorno. Relatório de Pesquisa e
Desenvolvimento Nº 030/89. Laboratório Nacional de Computação Científica. Petrópolis. RJ.
GEYMONAT, L. (1997). Galileu Galilei. (Tradução: Eliana Aguiar). Editora Nova
Fronteira. Rio de Janeiro.
GRECO, M. (2004). Análise de problemas de contato/impacto em estruturas de
comportamento não linear pelo método dos elementos finitos. Tese (Doutorado). Escola de
Engenharia de São Carlos. Universidade de São Paulo.
LAURSEN, T. A. (1992). Formulation and treatment of frictional contact
problems using finite elements. (Ph.D. Dissertation). Standford University.
113
MINSKI, R. L. (2008). Aprimoramento de formulação de identificação e solução
do impacto bidimensional entre estrutura e anteparo rígido. Dissertação (Mestrado).
Escola de Engenharia de São Carlos. Universidade de São Paulo.
PAIVA, J. B. (2007). Aplicações do Método dos Elementos Finitos. Notas de Aula.
São Carlos. Escola de Engenharia de São Carlos. Universidade de São Paulo.
PARK, K. C.; FELIPPA, C. A.; REBEL, G. (2000). A simple algorithm for localized
construction of non-matching structural interfaces. International Journal for Numerical
Methods in Engineering. 53:2117-2142.
REBEL, G.; PARK, K. C.; FELIPPA, C. A.; (2002). A contact formulation based on
localized Lagrange multipliers: formulation and application to two-dimensional
problems. International Journal for Numerical Methods in Engineering. 54:263-297.
SIMMONS, G. F. (1987). Cálculo com Geometria Analítica, Vol. I e II. McGraw-
Hill. São Paulo.
SIMO, J. C.; WRIGGERS, P.; TAYLOR, L. (1984). A perturbed Lagrangian
formulations for the finite element solution of contact problems. Computer Methods in
Applied Mechanics and Engineering. 50: 163-180
SORIANO, H. L. (2003). Método de elementos finitos em análise de estruturas.
Edusp. São Paulo.
114
STADTER, J. T.; WEISS, R. O. (1979). Analysis of contact through finite element
gaps. Computer & Structures. Vol. 10. pp 867-873.
TIMOSHENKO, S. P. (1969). Resistência dos Materiais, Vol. I. Ao livro Técnico
S.A. Rio de Janeiro.
TIMOSHENKO, S. P.; GOODIER, J. N. (1983). Teoria da elasticidade. .edição
Editora Guanabara Dois, Rio de Janeiro.
VALLIAPPAN, S. (1981). Continuum Mechanics Fundamentals. A. A. Balkema.
Rotterdam, Netherlands.
115
Apêndice A - Estratégias de otimização
Em termos matemáticos, otimização é a minimização ou maximização de uma função
sujeita a restrições em suas variáveis. Segundo (NOCEDAL; WRIGHT, 2006) sua origem
ocorreu junto ao Cálculo Variacional e nos trabalhos de Euler e Lagrange, tendo evoluído
muito a partir da década de 1940 com o desenvolvimento da informática e das técnicas de
programação.
Em geral, os algoritmos clássicos de otimização têm como estrutura básica adotar um
valor inicial para a solução e iterativamente buscar soluções melhores, ou seja, que mais se
aproximem do valor nimo (ou máximo) da função objetivo, atendendo às restrições
impostas pelo modelo. Supondo um problema de minimização, a estrutura geral de um
algoritmo de otimização é da forma:
Passo 1: Caso se trate do início do procedimento, adotar um valor inicial para o vetor
solução x
k
envolvendo as variáveis da função objetivo;
Passo 2: Obter uma direção de descida representada pelo vetor d
k
, segundo um
procedimento denominado busca direcional;
Passo 3: Determinar o fator escalar α que deve multiplicar o vetor d
k
de tal maneira
que se obtenha o menor valor da função objetivo na direção de d
k
(tal determinação decorre de
uma estratégia de busca unidimensional);
Passo 4: Obter o novo valor de x, (valor perturbado de x na iteração k) dado por
x
k+1
=x
k
+αd
k
;
Passo 5: Retornar ao passo 2 e repetir o processo até que um dado de critério de
verificação de convergência em relação à solução seja satisfeito.
116
A estratégia de busca direcional adotada, mencionada em termos gerais no passo 3,
distingue cada algoritmo dos demais, os quais, conforme (NOCEDAL; WRIGHT, 2006),
idealmente devem possuir:
Robustez: funcionamento satisfatório em diversas variedades de problemas,
para qualquer valor inicial aceitável adotado;
Eficiência: não demandar tempo de processamento e armazenamento de dados
excessivos;
Acurácia: capacidade de encontrar a solução com precisão, sem afetar-se pelo
arredondamento de valores no decorrer das iterações.
Não existe um método que seja superior aos demais para toda e qualquer situação,
existindo sim diversos algoritmos, cada qual com características mais adequadas para
determinada classe de problema. Assim a escolha de um algoritmo conveniente para certo
problema a ser tratado é de extrema importância, influindo não apenas na velocidade de
convergência da solução, mas principalmente no sucesso da busca do ponto ótimo.
Neste apêndice apresentam-se alguns dos diversos métodos de otimização não-linear
existentes, apontando suas características mais expressivas.
A.1. Formulação matemática de um problema de otimização
Considere-se o problema da minimização de uma função definida no espaço R
n
.
Quando as variáveis independentes podem assumir valores quaisquer, tem-se um
problema de otimização irrestrita, da forma:
117
Minimizar ( ),
: , ;( 1,..., )
n
n
i
f x x R
f R R x x i n
= =
(A.1.1)
Quando existem restrições sobre o valor que as variáveis podem assumir, tem-se um
problema de otimização restrita, colocado em forma geral como:
Minimizar ( )
sujeito a ( ) 0,
( ) 0,
i
i
n
f x
c x i Eq
c x i In
x R
=
Ω ⊂
(A.1.2)
Em (A.1.2) Eq é o conjunto das restrições do problema dadas por igualdades
(equações), e In o conjunto das restrições dadas por desigualdades (inequações).
Quando a função objetivo f(x) e/ou qualquer das expressões dadas por c
i
(x) não são
lineares, tem-se um problema de otimização não-linear.
Para o caso particular das restrições serem dadas exclusivamente por imposição da
faixa de valores permitidos por cada uma das variáveis isoladamente, tem-se um tipo
simplificado de problema restrito dito otimização com variáveis canalizadas, da forma:
{
}
Minimizar ( ), /
: , ; ; ;( 1,..., )
n
i i i
f x x x R a x b
f R x x a a b b i n
Ω =
= = = =
(A.1.3)
Em qualquer um dos casos apontados a resolução do problema consiste em encontrar o
valor das n variáveis, reunidas no vetor n-dimensional x*, para o qual a função apresenta valor
mínimo. O vetor x* é dito a solução ótima, sendo caracterizado matematicamente por:
* *
/ ( ) ( ), x f x f x x
<
(A.1.4)
Em outras palavras, diz-se que o vetor é um mínimo global, ou seja, garante o menor
valor da função objetivo em todo seu domínio.
118
Como geralmente apenas uma região da função é conhecida, tem-se também o
conceito de mínimo local, que proporciona o valor mínimo da função para uma determinada
região do domínio.
Para ilustrar ambos, tome-se o caso mais simples de otimização, dado por uma função
objetivo com n=1, neste caso representada por um polinômio de quarto grau, o qual possui
três pontos estacionários candidatos a mínimo da função (Figura A.1.1).
-4
-2
0
2
4
6
8
-3 -2 -1 0 1 2
4 3
2
( )
4 4
x x
f x x
= +
Mínimo Global Mínimo Local
Figura A.1.1 - Mínimo global e local de uma função de uma única variável.
Para uma função suave de uma única variável diz-se que um ponto é estacionário
quando sua primeira derivada é nula, enquadrando-se nesta situação os pontos de máximo, de
mínimo e de inflexão. Quando um ponto estacionário tem segunda derivada positiva, pode-se
afirmar que ele se trata de um ponto de mínimo local.
Esses conceitos estendem-se para funções com argumentos de qualquer dimensão,
para os quais se definem o vetor gradiente e a matriz hessiana, respectivos equivalentes à
derivada primeira e segunda no cálculo de funções de uma única variável.
O vetor gradiente é dado pela taxa de variação da função com relação a cada uma das
variáveis, ou seja, seus componentes são obtidos pelas derivadas parciais da função com
relação a cada uma das variáveis:
119
1
2
( )
( )
( )
( )
n
f x
x
f x
x
f x
f x
x
=
A matriz hessiana tem seus termos obtidos pelas derivas parciais dos componentes do
vetor gradiente com relação a cada uma das variáveis:
2 2 2
2
1 1 2 1
2 2 2
2
2
2 1 2 2
2 2 2
2
1 2
( ) ( ) ( )
( ) ( ) ( )
( )
( ) ( ) ( )
n
n
n n n
f x f x f x
x x x x x
f x f x f x
f x
x x x x x
f x f x f x
x x x x x
=
Para funções de várias variáveis o vetor gradiente e a matriz hessiana constituem-se
em elementos de extrema utilidade para identificação de pontos extremos. Utilizando esses
recursos matemáticos, enunciam-se a seguir dois teoremas de fundamental importância para o
estudo de pontos extremos de funções de várias variáveis, cuja prova pode ser obtidas em
livros relativos ao assunto, como (NOCEDAL;WRIGHT, 2006).
Teorema 1: Condições necessárias de Primeira Ordem
Se x* é um mínimo local e f(x) é continuamente diferenciável na vizinhança de x*,
então o gradiente de f(x) em x=x* é nulo.
Teorema 2: Condições suficientes de Segunda Ordem
Seja uma função f(x) com gradiente nulo em x=x*, com matriz hessiana contínua
nessa vizinhança. Se a matriz hessiana em x* é definida positiva, então x* é um mínimo local.
120
Da álgebra linear tem-se que uma matriz definida positiva é uma matriz simétrica (ou
seja, para a qual A
T
=A) tal que, tomando-se qualquer vetor u não nulo, tem-se que u
T
Au>0.
Mais uma vez estabelece-se um paralelo com o cálculo de uma única variável, sendo a
condição de matriz hessiana definida positiva equivalente à de derivada segunda positiva no
cálculo de uma variável.
Tem-se ainda um terceiro teorema de interesse para o caso de funções objetivo
convexas.
Teorema 3: Mínimos irrestritos em funções convexas
Quando f(x) é convexa, todo ponto de mínimo x* é um mínimo global. Além disso, se
f(x) é diferenciável, então todo ponto estacionário x* é um mínimo global de f(x).
Aproveita-se ainda para enunciar também o Teorema de Taylor para aproximação de
funções, generalizado para o caso de espaço de dimensão qualquer, o qual será muito
utilizado tanto na definição dos métodos de busca direcional (determinação de uma direção de
descida), quanto na busca unidimensional (determinação do tamanho do “passo” a ser dado
em certa direção).
Teorema 4: Teorema de Taylor
Seja f(x), f: R
n
R continuamente diferenciável e x* um dado ponto de R
n
. Numa
vizinhança de x* a função f(x) pode ser obtida por
* * * * 2 * * * 2
1
( ) ( ) ( )( ) ( ) ( )( ) ( )
2
T
f x f x f x x x x x f x x x x x
ϑ
= + + +
sendo a última parcela dada por termos de ordem superior caracterizadas por
121
* 2
*
*
( )
0 para
( )
x x
x x
x x
ϑ
A.2. Otimização Irrestrita
Apesar do principal interesse para o presente trabalho estar nos métodos de otimização
com restrições de variáveis, os métodos de otimização irrestrita são base para os problemas
com restrições, uma vez que estes utilizam basicamente as mesmas estratégias para busca
direcional e unidimensional, acrescidas de outras técnicas que serão tratadas mais adiante.
A.2.1. Método do gradiente
Conforme mencionado, a estratégia geral dos métodos de otimização consiste em
partir de um ponto do espaço R
n
e seguir sucessivamente em direções para as quais o valor da
função objetivo mais se aproxima do valor ótimo procurado. Dentro de um processo iterativo,
um novo ponto é dito o valor perturbado de x na iteração k, sendo representado por um vetor
x
k+1
. Tal ponto é obtido pela soma ao vetor posição na atual iteração (x
k
) de um vetor d
k
escalonado por um fator α, ou seja,
1
, com e ( 1,..., ),
k k k
i i
x x d d d x x i n R
α α
+
= + = = =
O fator α define o “passo” a ser dado segundo a direção d
k
.
Seja então uma aproximação da função f(x) no valor perturbado na iteração k, dada
pelo desenvolvimento de série de Taylor explicitado até o termo de primeira ordem:
122
( ) ( ) ( ) ( )
k k k T k k
f x d f x f x d
α α ϑ α
+ = + +
(A.2.1)
Manipulando-se os termos de (A.2.1) e dividindo-se ambos os lados da igualdade por α
obtém-se:
( ) ( ) ( )
( )
k k k
T k k
f x d f x
f x d
α ϑ α
α α
+
= +
(A.2.2)
Para α>0, no limite de α→0, tem-se que:
( ) ( ) ( )
e 0
k k k
f x d f x df
d
α ϑ α
α α α
+
(A.2.3)
Admitindo-se que a direção d
k
seja de descida então o valor da função no ponto
perturbado deve ser menor do que em x
k
. Assim, por um lado tem-se que o lado esquerdo da
igualdade (A.2.2) é negativo, e por outro lado como para α tendendo a zero o segundo termo
do lado direito tende a zero, conclui-se que:
( ) 0
T k k
f x d
<
(A.2.4)
O produto expresso em (A.2.4) equivale ao produto interno do vetor gradiente de f em
x
k
com o vetor d
k
. Como o produto interno de dois vetores tem por significado geométrico a
projeção de um vetor sobre o outro, tem-se que o maior valor em módulo do produto será
obtido quando ambos estiverem na mesma direção. Por definição, o vetor gradiente aponta a
direção de maior variação positiva de uma função no ponto. Conseqüentemente tomando-se o
sentido oposto do gradiente obtém-se a direção de maior variação negativa. Assim sendo, a
direção de descida d
k
dada pelo Método do Gradiente é dada por:
( )
k k
d f x
= −∇
(A.2.5)
Determinada a direção, o valor do escalar α é obtido por um dos métodos de buscas
unidimensional apresentados mais adiante no item A.3.
123
Apesar da direção indicada pelo método ser a de maior inclinação negativa, observa-se
que a aplicação do Método do Gradiente proporciona uma trajetória de busca de soluções em
‘ziguezague’ até o ponto de mínimo, com taxa de convergência bastante lenta (ver exemplos
no item A.5). Ainda assim, segundo (LUENBERGER, 2005), o método é extremamente
importante sob ponto de vista teórico, servindo como base para outros métodos, bem como
padrão de referência para comparação da taxa de convergência dos mesmos.
A.2.2. Método dos Gradientes Conjugados
O Método dos Gradientes Conjugados compõe uma classe de métodos propostos
originalmente para resolver grandes sistemas de equações com vantagens sobre o Método de
eliminação de Gauss nessas condições. O todo do Gradiente Conjugado Linear foi
proposto por Hestenes e Stiefel nos anos 1950, sendo que a primeira variante não linear foi
dada por Fletcher e Reeves nos anos 1960.
Parte-se de um problema de minimização quadrática da forma
1
min ( )
2
T T
f x x Ax b x
=
(A.2.6)
onde A é uma matriz
n
x
n
simétrica definida positiva, sendo seu gradiente dado por
( )
f x Ax b
=
(A.2.7)
Da condição de primeira ordem tem-se que o gradiente é nulo no ponto de mínimo, e
assim o problema de otimização equivale ao sistema de equações lineares
Ax b
=
(A.2.8)
124
Pode-se assim resolver (A.2.8) tomando-se a estratégia geral utilizada nos métodos de
otimização, ou seja, partir-se de um ponto inicial x
0
e iterativamente aplicar a ele
deslocamentos até encontrar o ponto x
k
onde Ax
k
é igual a b. Mais ainda, pode-se tratar o
gradiente de f(x) com uma função resíduo r
k
dada por
( )
k k
r x Ax b
=
(A.2.9)
a qual busca-se anular para a resolução de (A.2.6) ou equivalentemente (A.2.8).
Os deslocamentos no valor de x
k
nada mais são do que a soma de vetores d
k
multiplicados por escalares α
k
que minimizam a função na direção d
k
, ou seja
1
k k k k
x x d
α
+
= +
(A.2.10)
Desenvolvendo a função por Série de Taylor e aplicando (A.2.9) obtém-se o valor
exato de α
k
para a função quadrática (A.2.6), resultando
( )
( )
k T k
k
k T k
r d
d Ad
α
=
(A.2.11)
Das diversas seqüências de direções a serem adotadas em (A.2.10) destaca-se o
conjunto de vetores não-nulos d
k
, k=1,....,n tais que
0,
T
i j
d Ad i j
=
(A.2.12)
ditos conjugados com a matriz simétrica definida positiva A, vetores esses linearmente
independentes entre si. A vantagem em se utilizar tais direções conjugadas é indicada no
Teorema 5.
Teorema 5:
Para qualquer x
0
pertencente a R
n
a seqüência {x
k
} gerada por direções conjugadas
segundo (A.2.12) com α
k
de acordo com (A.2.11), converge-se para a solução x
k
do sistema
linear (A.2.8) em no máximo n iterações.
125
A prova do Teorema 5 é simples e pode ser obtida em (NOCEDAL; WRIGHT, 2006).
O conjunto dos auto-valores de A é um dos inúmeros conjuntos de direções
conjugadas que podem ser utilizados, sendo, entretanto, uma opção com custo computacional
elevado para as aplicações que o método se propõe (grandes sistemas de equações).
O método de ortogonalização de Gram-Schimidt seria outra opção, devendo ser feitas
pequenas adaptações para encontrar direções conjugadas ao invés de direções ortogonais,
porém também a um custo computacional elevado.
Destaca-se então a principal vantagem do Método dos Gradientes Conjugados: ele é
capaz de gerar um conjunto de direções conjugadas calculando-se cada direção d
k
utilizando
apenas a direção anterior d
k-1
sem necessitar das demais anteriores.
Cada direção é obtida por
1
k k k k
d r d
β
= − +
(A.2.13)
sendo β
k
um escalar tal que d
k
e d
k-1
sejam conjugados com relação à matriz A.
Para tomar vantagem da propriedade decorrente de (A.2.12) multiplica-se ambos os
lados da igualdade (A.2.13) por [d
k-1
]
T
A, obtendo
1 1 1 1
[ ] [ ] [ ] 0
k T k k T k k k T k
d Ad d Ar d Ad
β
= − + =
(A.2.14)
de onde finalmente obtém-se
1
1 1
[ ]
[ ]
k T k
k
k k
r Ad
d Ad
β
=
(A.2.15)
O primeiro d
k
é dado pela direção obtida pelo Método do Gradiente no ponto inicial x
0
.
Tem se assim elementos suficientes de maneira a criar um algoritmo preliminar
segundo a filosofia desse método. Entretanto é possível ainda simplificar o cálculo de
α
k
e β
k
obtendo-se o algoritmo padrão do método, o qual apresenta a seguinte forma:
126
Passo 1: Adotar o valor inicial de partida x
0
Passo 2: Calcular r
0
e d
0
por
0 0 0 0
, , 0
r Ax b d r k
= = − =
Passo 3: Enquanto r
k
0 (maior que uma dada tolerância) proceder a seguinte
seqüência:
( )
( )
k T k
k
k T k
r r
d Ad
α
=
1
k k k k
x x d
α
+
= +
1
k k k k
r r Ad
α
+
= +
1 1
1
( )
( )
k T k
k
k T k
r r
r r
β
+ +
+
=
1 1 1
k k k k
d r d
β
+ + +
= − +
1
k k
= +
Fim do Enquanto (Passo 3)
Observa-se que no algoritmo são utilizados vetores apenas das duas últimas iterações,
o que significa baixo custo computacional relacionado ao armazenamento de valores na
memória e baixo custo relacionado ao processamento, uma vez que o realizadas apenas
operações de multiplicação entre vetores e matrizes.
Para casos onde a função objetivo não é quadrática foram desenvolvidos variantes do
Método, dentre elas as mais famosas atribuídas as duplas Fletcher-Reeves e Polak-Ribière.
Uma vez que tais formulações não serão desenvolvidas no presente trabalho, deixa-se de
mencionar detalhes das mesmas, que podem ser obtidos em (NOCEDAL; WRIGHT, 2006).
127
A.2.3. Método de Newton
No Método de Newton parte-se de uma aproximação da função f(x) no valor
perturbado na iteração k, utilizando-se o desenvolvimento por série de Taylor explicitada até o
termo de segunda ordem:
2 2 2
1
( ) ( ) ( ) ( ) ( )
2
k k k T k k k T T k
f x d f x f x d d f d
α α α ϑ α
+ = + + +
(A.2.16)
Então como ao ponto de mínimo corresponde a nulidade do gradiente da função, tem-
se que em x
k
+
α
d
k
:
( ) 0
k k
f x d
α
+ =
. Assim, desprezando-se a contribuição dos termos de
ordem superior para o gradiente da (A.2.16), obtém-se:
2
( ) ( )
k k k
f x d f x
α
= −
(A.2.17)
Supondo-se que matriz hessiana seja positiva definida, a direção de descida
α
d
k
é
obtida pela resolução do sistema (A.2.17), sendo que o vetor associado possui o tamanho
necessário para determinar o valor perturbado, sem necessidade da definição de
α
na busca
unidimensional.
O Método de Newton se destaca pela taxa de convergência quadrática do processo de
busca da solução, superior à dos demais métodos. Entretanto é importante lembrar que o
método parte da suposição de que a matriz hessiana é positiva definida, tendo sido imposta
apenas a condição necessária de primeira ordem (vide
Teorema 1
no item A.1). Caso a matriz
não seja positiva definida, pode-se obter uma solução perturbada x
k+1
que se distancia da
solução do problema, ou mesmo ter-se uma matriz não inversível, o que inviabiliza a solução
do sistema.
Uma alternativa para tais casos é a utilização de aproximações numéricas para a matriz
hessiana, desenvolvidas de maneira que tal aproximação origine uma matriz positiva definida.
128
Tais métodos são genericamente chamados de Métodos do tipo Quase Newton, os quais serão
desenvolvidos a seguir.
A.2.4. Métodos do tipo Quase-Newton
O primeiro método do tipo Quase Newton foi desenvolvido em meados de 1950 por
W.C. Davidson com a finalidade de solucionar um problema de otimização cuja solução não
estava sendo alcançada pelos limitados recursos disponíveis na época. Davidson desenvolveu
então um algoritmo que para (NOCEDAL; WRIGHT, 2006) veio a tornar-se uma das idéias
mais criativas da 0timização não-linear. Rapidamente Fletcher e Powell demonstraram que o
novo algoritmo era bastante eficiente e o Método passou a ser referido pelas iniciais do
sobrenome dos três (DFP).
O nome Quase Newton é devido ao fato do método ter sido desenvolvido baseado no
Método de Newton, com a diferença de utilizar uma aproximação para a matriz hessiana.
Para a aproximação são utilizadas apenas informações relativas ao vetor gradiente,
mas apesar disto taxa de convergência obtida é muito superior ao Método dos Gradientes,
principalmente em problemas de elevada dimensão. A literatura se refere à taxa de
convergência do método como superlinear, por ser superior à convergência linear do Método
do Gradiente e inferior à quadrática do Método de Newton. Ainda segundo (NOCEDAL;
WRIGHT, 2006) apesar da taxa de convergência ser inferior à do Método de Newton, devido
ao custo computacional para a obtenção das derivadas segundas exigidas por este ser elevado,
a eficiência global dos Métodos Quase Newton em muitos problemas mostra-se superior.
Assim como no Método de Newton, parte-se de uma aproximação truncada na
segunda ordem da função objetivo, em x
k
+αd
k
:
129
1 2 2
1
( ) ( ) ( ) ( ) ( ) ( )
2
k k k k T k k k T k k
f x f x d f x f x d d f x d
α α α
+
= + = + +
O gradiente em
x
k+1
, já considerando uma aproximação
B
K+1
para a hessiana fica:
1 1
( ) ( ) ( )
k k k k k k
f x f x d f x B d
α α
+ +
= + = +
(A.2.18)
Rearranjando-se os termos de
(A.2.18)
obtém-se:
1 1
( ) ( )
k k k k
B d f x f x
α
+ +
=
(A.2.19)
O vetor
αd
k
equivale à diferença entre os ‘vetores-posição’
x
k+1
e
x
k
e é usualmente
referido na literatura por
s
k
, sendo também comum a referência ao vetor originado pela
diferença dos gradientes do termo à direita da igualdade como
y
k
. Com essa simplificação na
notação (A.2.19) passa a ser expressa como
1
k k k
B s y
+
=
(A.2.20)
também referida na literatura como Equação Secante.
Pré-multiplicando ambos os lados da Equação Secante pelo transposto do vetor
s
k
obtém-se no termo da esquerda o produto (
s
k
)
T
B
k+1
s
k
, o qual, sendo positivo para qualquer
s
k
garante que a matriz
B
k+1
seja definida positiva. Isso resulta em
( ) 0
k T k
s y
>
(A.2.21)
também referida como Condição de Curvatura, a qual uma vez satisfeita garante que
B
k+1
possa ser obtida por intermédio da Equação Secante. Existindo infinitas soluções possíveis
para
B
k+1
, outras condições devem ser impostas, entre elas a de que entre duas iterações
B
k+1
e
B
k
sejam o mais próximo possível uma da outra, originando um problema de otimização na
forma
min || ||
sujeito a e
k
T k k
B B
B B Bs y
= =
(A.2.22)
130
Das diferentes normas que podem ser utilizadas na minimização (A.2.22) derivam os
diferentes tipos de Método Quase Newton, sendo que a dada por
1/2 1/2
|| || || ||
W F
A W AW
ou Weighted Frobeniu’s Norm’, que de acordo com (NOCEDAL; WRIGHT, 2006), além de
possibilitar uma resolução fácil do problema origina um método de otimização não sensível à
escala.
Feitas estas imposições e desenvolvidas as formulações obtém-se a aproximação de
B
k+1
desenvolvida por Davidson, Fletcher e Powell, a qual resulta em
1
( ) ( )
k k k kT k k k kT k k kT
B I y s B I s y y y
ρ ρ ρ
+
= +
(A.2.23)
onde ρ
k
é a inversa da multiplicação expressa na Condição de Curvatura, ou seja
1
( )
k
k T k
y s
ρ
=
(A.2.24)
resultando na fórmula proposta por Davidson em 1959.
ainda como tornar mais prático o método utilizando a inversa da aproximação da
matriz hessiana dada por
1
( )
k k
H B
=
e procedendo manipulações algébricas obter a formulação para H
k+1
, com a vantagem de que
com a inversa da hessiana é possível encontrar a direção de descida apenas pela multiplicação
1
( )
k k k
d H f x
+
= −
não recaindo em uma resolução de sistema de equações com em (A.2.19).
Segue a formulação final do Método do tipo Quase Newton desenvolvida por
Davidson, Fletcher e Powell:
131
(DFP)
1
( ) ( )
( ) ( )
k k k T k k k T
k k
k T k k k T k
H y y H s s
H H
y H y y s
+
= +
(A.2.25)
A aproximação obtida pelo método é atualizada a cada passo pela subtração e soma do
segundo e terceiro termo de (A.2.25), respectivamente, à aproximação obtida no passo
anterior, que ainda carrega informações nela introduzidas nas iterações anteriores.
Posteriormente, baseado no DFP, foi elaborado um novo método por Broyden,
Fletcher, Goldfarb e Shanno, (BFGS), o qual segundo (NOCEDAL; WRIGHT, 2006); é
considerado o mais eficiente dos métodos do tipo Quase Newton.
Basicamente o método parte da Equação Secante (A.2.20) do DFP, porém ao invés de
considerar a hessiana B
k+1
trabalha com sua inversa H
k+1
, ou seja:
1
k k k
H y s
+
=
(A.2.26)
Procedendo analogamente, para esta abordagem a minimização (A.2.22) passa agora a
ser:
min || ||
sujeito a e
k
T k k
H H
H H Hy s
= =
(A.2.27)
Utilizando a mesma norma e procedidos os devidos desenvolvimentos, obtém-se a
aproximação de H
k+1
proposta por Broyden, Fletcher, Goldfarb e Shanno:
(BFGS)
1
( ) ( )
k k k kT k k k kT k k kT
H I s y H I y s s s
ρ ρ ρ
+
= +
(A.2.28)
Para (A.2.28)
ρ
k
também é dado por (A.2.24).
132
Caso se tenha interesse, também é possível o cálculo da hessiana e não de sua inversa,
que será dada por:
1
( ) ( )
( ) ( )
k k k T k k k T
k k
k T k k k T k
B s s B y y
B B
s B s y s
+
= +
(A.2.29)
Tanto para o DFP quanto para o BFGS, o primeiro passo é dado segundo o método do
gradiente, uma vez que a formulação do método requer informações do passo anterior. A
partir da segunda iteração adota-se uma primeira aproximação da hessiana e aplica-se método
para a busca direcional como nos demais métodos já mencionados.
O primeiro valor de hessiana a ser considerado, segundo (NOCEDAL; WRIGHT,
2006), pode ser uma aproximação feita pelo método das diferenças finitas (ou sua inversa, nas
fórmulas que trabalham com ela) ou mesmo a matriz identidade I multiplicada por um escalar,
a fim de refletir a escala do problema em questão. Cita ainda como um procedimento
heurístico bastante efetivo para determinar a primeira inversa da hessiana:
0
( )
( )
k T k
k T k
y s
H I
y y
=
(A.2.30)
(NOCEDAL;WRIGHT, 2006) indica também que para a eficiência adequada dos
métodos Quase Newton apresentados, o método de busca unidimensional a ser utilizado deve
atender às condições dadas por Wolfe, referidas na literatura em língua inglesa com ‘Wolfe
Conditions’, as quais são apresentadas em A.3.
A.3. Busca Unidimensional
A busca unidimensional concentra-se na obtenção de um valor escalar α que
multiplicado pelo vetor d
k
, previamente obtido por um dos métodos de busca direcional,
133
minimiza a função naquela direção. Trata-se, portanto, de um problema de minimização de
uma função de uma única variável, já que sendo fixados x
k
e d
k
a função f(x
k
+αd
k
) passa a ter
como única variável o escalar α.
No caso da função de uma variável apresentada na Figura A.1.1, os candidatos a ponto
de mínimo anulam o valor da primeira derivada da função, ou seja
3 2 2
( ) 3 3
2 0 ( 2) 0
4 4
df x
x x x x x x
dx
= + = + =
o que resulta em três pontos:
1 2 3
3 137 3 137
0; 1,838; 1,088
8 8
x x x
+
= = =
A identificação de quais deles são pontos de máximo ou de nimo se pela análise
do sinal da derivada segunda de f(x):
2
2
2
( ) 3
3 2 ''( )
2
d f x
x x f x
dx
= + =
Uma vez que f’’ em x
2
e em x
3
é positiva, tem-se que eles são pontos de mínimo; f’’
em x
1
é negativo, sendo um ponto de máximo local. Ainda da análise comparativa dos valores
da função nesses pontos, conclui-se que x
3
é um mínimo local, enquanto x
2
é o mínimo global.
A determinação dos pontos com derivada primeira nula, para o caso em questão,
demandou a resolução exata de uma equação do terceiro grau. Uma alternativa numérica para
a resolução dessa equação seria a utilização do Método de Newton, o qual parte de uma
aproximação quadrática para função, utilizando uma Série de Taylor estendida até o termo de
segundo grau:
1 1 1 2
1
( ) ( ) '( )( ) ''( )( )
2
k k k k k k k k
f x f x f x x x f x x x
+ + +
= + +
(A.3.1)
Pretende-se que na próxima iteração (k+1) encontre-se o ponto de mínimo, onde a
derivada se anula, o que sendo imposto em (A.3.1) resulta em
134
1 1
'( ) '( ) ''( )( ) 0
k k k k k
f x f x f x x x
+ +
= + =
(A.3.2)
Procedidas as devidas manipulações algébricas obtém-se:
1
'( )
''( )
k
k k
k
f x
x x
f x
+
=
(A.3.3)
Utilizando-se (A.3.3) parte-se de um ponto inicial, e iterativamente aproxima-se do
ponto estacionário mais próximo, o qual pode ser de máximo ou de mínimo, a depender do
sinal da derivada segunda.
Para o caso de uma função no R
n
a idéia é basicamente a mesma, introduzindo-se o
conceito de derivada direcional, que é a derivada de uma função de várias variáveis segundo
uma direção d, sendo definida matematicamente como:
0
( ) ( )
( ( ); ) lim
f x d f x
D f x d
α
α
α
+
=
(A.3.4)
A derivada segunda é definida de maneira análoga, resultando em:
2
0
'( ) '( )
( ( ); ) lim
f x d f x
D f x d
α
α
α
+
=
(A.3.5)
É possível obter a derivada direcional (A.3.4) partindo-se da Série de Taylor truncada
no termo linear:
( ) ( ) ( ) || ||
T
f x d f x f x d
α α ϑ α
+ = + +
(A.3.6)
Manipulando-se os termos de (A.3.6) obtém-se:
( ) ( ) || ||
( )
T
f x d f x
f x d
α ϑ α
α α
+
= +
(A.3.7)
135
Quando α tende a zero, o termo à esquerda de (A.3.7) se aproxima da definição da
derivada direcional (A.3.4), assim como o segundo termo do lado direito tende a zero. Desta
forma a direcional definida em (A.3.4) é dada por:
( ( ); ) ( )
k T k
D f x d f x d
=
(A.3.8)
Da mesma forma, pode-se obter a derivada direcional (A.3.5) partindo-se da Série de
Taylor truncado no termo de segunda ordem:
2 2 2
1
( ) ( ) ( ) ( ) || ||
2
T T
f x d f x f x d d f x d
α α α ϑ α
+ = + + +
(A.3.9)
Manipulando-se os termos de (A.3.9) obtém-se:
2
2
'( ) '( ) || ||
( )
T
f x d f x
d f x d
α ϑ α
α α
+
= +
(A.3.10)
Procedendo a mesma análise analogamente à feita anteriormente, obtém-se a
expressão para a derivada direcional definida em (A.3.5):
2 2
( ( ); ) ( )
k T k
D f x d d f x d
=
(A.3.11)
Definidas as derivas direcionais, procede-se a aproximação por séries de Taylor da
função em x
k+1
, analogamente ao feito caso unidimensional, agora para a função de várias
variáveis:
1 2 2
1
( ) ( ) ( ( ); ) ( ( ; ))
2
k k k k
f x f x D f x d D f x d
α α
+
= + +
(A.3.12)
Pretende-se que na próxima iteração (k+1) encontre-se o ponto de mínimo, onde a
derivada na direção d anula-se, o que sendo imposto em (A.3.12) resulta em:
1 2
( ( ; )) ( ( ; )) ( ( ; )) 0
k k k
D f x d D f x d D f x d
α
+
= + =
(A.3.13)
136
Procedendo as manipulações algébricas necessárias, obtém-se a fórmula da busca
linear pelo Método de Newton:
2 2
( ( ; )) ( )
( ( ; )) ( )
k T k
k T k
D f x d f x d
D f x d d f x d
α
= − = −
(A.3.14)
Para o caso de uma função quadrática, como em (A.2.6), o valor de α obtido é exato,
uma vez que a aproximação adotada possui o mesmo grau da função a ser minimizada.
para os demais casos, tem-se um processo iterativo como o descrito por (A.3.3),
resultando na fórmula iterativa:
1
i i i
x x d
α
+
= +
(A.3.15)
Procede-se a iteração dada por (A.3.15) até que o módulo da diferença em x
i+1
e x
i
seja
menor que um valor pequeno arbitrado (tolerância). O valor de α é a soma do valor dos n α
i
calculados nas n iterações procedidas, ou seja:
1
n
i
i
α α
=
=
(A.3.16)
Tem-se que em problemas de grande escala esse método apresenta um custo elevado
relativo ao processamento para obtenção da hessiana, situação na qual podem ser utilizados
outros métodos que demandam tempos menores de processamento como o Método da
Secante, o Método da Bisseção e o Método das Falsas Posições, também conhecido como
‘Regula Falsi’.
Alerta-se, porém, que para os métodos aproximados é importante avaliar a qualidade
do valor do α obtido, ou seja, se seu valor permite obter uma redução suficiente da função
objetivo segundo aquela direção. Para tanto se utilizam alguns critérios, referidos na literatura
como ‘Condições de Wolfe’ (‘Wolfe Conditions’).
137
A primeira delas visa garantir uma diminuição suficiente do valor da função objetivo,
impondo-se que o valor mínimo de redução em um dado ponto seja proporcional ao tamanho
do passo α e da derivada direcional, sendo dita Condição de Diminuição Suficiente, também
citada na literatura como Condição de Armijo, dada em termos matemáticos por:
1 1
( ) ( ) ( ( ) ), 0 1
k k k T k k
f x d f x c f x d c
α α
+ + < <
(A.3.17)
Alguns métodos de busca unidimensional inexata são baseados apenas em (A.3.17),
porém ela permite a adoção de valores de α muito pequenos que podem prejudicar a eficiência
do método de otimização.
Para resolver esta questão, uma segunda condição, denominada Condição de
Curvatura é introduzida. Ela impõe que a inclinação da função, ou seja, sua derivada
direcional, tenha valor pequeno, proporcional à inclinação da função no ponto de início da
busca (α=0). Em sua forma mais forte tal imposição é feita com base no dulo desse valor,
resultando:
2 1 2
| ( ) | | ( ) |, 0 1
T k k k T k k
f x d d c f x d c c
α
+ < < <
(A.3.18)
Em (NOCEDAL; WRIGHT, 2006) são citados alguns valores adotados na prática para
essas constantes. Para c
1
cita-se o valor 10
-4
, enquanto para c
2
valores típicos são 0,9 para os
Métodos de Newton ou Quase-Newton, e 0,1 para os métodos não-lineares de Gradiente
Conjugados (Fletcher-Reeves e Polak-Ribière). Os mesmos autores apresentam ainda um
método de busca inexata visando o atendimento dessas condições.
Um método bastante prático e eficiente é apresentado por (FOX, 1974) e consiste em
tomar três ponto da função na direção de d
k
e utilizá-los para interpolar uma função de
aproximação quadrática. Tomando-se o ponto x
k
como primeiro ponto (x
1
), e o segundo e
terceiro para
α=t e 2t respectivamente, ou seja, x
2
=x
k
+td
k
e x
3
=x
k
+2td
k
, e impondo-se a
nulidade da derivada da função de interpolação, pode-se facilmente obter a expressão:
138
2 1 3
.
2 2 1
4 ( ) 3 ( ) ( )
4 ( ) 2 ( ) 2 ( )
aprox
f x f x f x
t
f x f x f x
α
=
(A.3.19)
Cuidados adicionais com relação ao sinal da derivada segunda são necessários para
garantir que
α
indique a posição de um valor de mínimo, o que implica que
3 1 2
( ) ( ) 2 ( )
f x f x f x
+ >
(A.3.20)
condição que pode ser imposta por regras na adoção do valor
t
, completando a lógica do
algoritmo para a busca aproximada de
α
.
A literatura em geral recomenda sempre a adoção de algoritmos não excessivamente
refinados, os quais em geral podem representar um esforço desnecessário que pouco
influencia na eficiência global do processo de minimização.
A.4. Otimização Restrita
O problema de otimização restrita ocorre quando existem limitações impostas sobre o
problema, reduzindo o espaço para busca da solução ótima, que no caso irrestrito era o
próprio
R
n
. Tais restrições podem ser dadas diretamente sobre intervalos de valores permitidos
para cada uma das variáveis ou por meio de igualdades (Equações) ou desigualdades
(Inequações) relacionando as mesmas. A formulação matemática geral dos problemas de
otimização restrita é da forma:
Minimizar ( )
sujeito a ( ) 0,
( ) 0,
i
i
n
f x
c x i Eq
c x i In
x R
=
Ω ⊂
(A.4.1)
139
Define-se como região factível o subespaço obtido pela intersecção dos subespaços
dados por todas as restrições, representando o conjunto de pontos candidatos à solução. Por
conseqüência, os pontos que a essa região pertencem são ditos pontos factíveis.
Havendo uma redução no espaço de candidatos à solução é direta a conclusão de que
as condições de primeira e segunda ordem apresentadas para o caso irrestrito não são mais
válidas. Mais ainda, tem-se que devido à existência de limitações no espaço, a noção de
direção de descida precisa ser complementada, surgindo então a definição de direção factível.
Define-se direção factível como uma direção d
k
tal que a solução perturbada x
k+1
a ser
obtida por x
k+1
=x
k
+αd
k
, assim com x
k
, também seja factível.
Utilizando simultaneamente as definições de direção factível e de direção de descida
(direção que gera diminuição na função objetivo), ter-seque o ponto de mínimo local, no
caso de minimização restrita, se quando não existe direção de descida factível, ou seja,
qualquer perturbação factível que seja aplicada ao ponto implique em aumento na função
objetivo, ou ainda:
1 1
/ ( ) ( ) para factível
k k k k
x f x f x d
+ +
<
(A.4.2)
No caso de restrições de igualdade a verificação quanto à factibilidade de uma direção
de descida é direta. Já para os casos que possuem restrições de desigualdade (ou seja, para os
quais In não é um conjunto vazio), essa análise depende não apenas da direção, mas também
do ponto em que a mesma esteja sendo tomada, uma vez que tal ponto pode estar em um
limite da região factível.
Define-se então conjunto ativo (W) como o conjunto de todas as restrições c
i
(x) de
igualdade somado a todas as restrições de desigualdade que estão em seu limite, ou seja, para
as quais em uma dada iteração vale a igualdade da inequação, resultando:
{ /( ) ( : 0)}
i
W i i Eq i In c= =
(A.4.3)
140
Nesta situação, refere-se à restrição de desigualdade como ativa.
O conhecimento de quais restrições estão ativas em uma dada iteração permite que o
problema com restrições definidas por desigualdade possa ser resolvido como um problema
com restrições de igualdade que se alteram dependendo da posição no hiperespaço das
soluções. Nessa abordagem as condições de contorno se alteram de acordo com o valor do
vetor incógnito, configurando-se, desta forma, um problema não-linear.
Na seqüência introduzem-se duas doas mais difundidas estratégias para abordagem de
problemas de otimização restrita: a estratégia dos multiplicadores de Lagrange e a estratégia
da penalização. Em seguida é apresentada a estratégia dos conjuntos ativos, a qual pode ser
associada com ambas de maneira a impedir que a busca se estenda a regiões não-factíveis
antes de atingir o ponto de mínimo restrito.
A.4.1. Estratégia dos Multiplicadores de Lagrange
Para introduzir-se o significado dos Multiplicadores de Lagrange tome-se um
problema de minimização quadrático sujeito a uma restrição linear dada por uma igualdade.
No item A.2.1 viu-se que o vetor gradiente apresenta a propriedade de indicar a
direção de maior variação positiva de uma função em um dado ponto do domínio. No caso de
um problema restrito como o apresentado tem-se que no ponto de mínimo o vetor gradiente da
função objetivo possui mesma direção e sentido contrário ao gradiente da função que define a
restrição. Fazendo uso desta constatação define-se um escalar λ
L
>0 que no ponto de mínimo
do problema restrito atende à seguinte relação
*
( ) ( ) para
L
f x c x x x
λ
= − =
(A.4.4)
ou ainda
141
( ) ( )
0
L
i i
f x c x
x x
λ
+ =
(A.4.5)
O escalar
λ
L
é denominado multiplicador de Lagrange, com o qual se pode definir uma
nova função chamada Função Lagrangiana ou Lagrangiano de
f
(
x
):
( , ) ( ) ( )
L
l x f x c x
λ λ
= +
(A.4.6)
O Lagrangiano é uma função definida num espaço de dimensão superior ao de
f
(
x
),
uma vez que o escalar
λ
L
constitui uma incógnita a mais a ser determinada para a resolução do
problema. É importante observar que a condição dada por
(A.4.5)
equivale a impor que o
gradiente do Lagrangiano seja igual a zero, analogamente ao um problema restrito, uma vez
que:
( , ) ( ) ( )
L
l x f x c x
λ λ
= +
(A.4.7)
É possível generalizar a definição para o caso de várias restrições, devendo-se atentar
que são inseridas no Lagrangiano apenas aquelas que estão ativas. Para o caso de uma função
no
R
n
com
m
restrições ativas, ter-se-á um sistema de dimensão
(n+m)
cuja solução
corresponde à resposta do problema sujeito àquelas restrições.
A.4.2. Estratégia da Penalização
A idéia básica da estratégia da Penalização é transformar o problema de otimização
restrita em um problema equivalente irrestrito. A estratégia consiste em alterar a função
objetivo de tal forma que fora da região factível se soma uma função, por exemplo quadrática,
multiplicada por um fator de penalização. Ao se adotar um valor elevado para esse fator, o
mínimo da função alterada passa a estar contido dentro da região factível, atendendo,
portanto, à restrição.
142
A minimização da função f(x) sujeita à restrições passa, então, a ser resolvida como:
Minimizar ( ) ( )
P
f x P x
λ
+
(A.4.8)
onde P(x) é a função de penalização a ser adotada.
Existem diversas funções de penalização que podem ser empregadas, mas uma
alternativa bastante utilizada na prática é defini-la a partir do próprio conjunto de funções de
restrição:
2
1
( ) (max[0, ( )]) para
2
i
i
P x c x i In
=
(A.4.9)
Apesar de parecer ideal a aplicação inicial de um parâmetro λ
P
bastante elevado,
(FOX, 1976) demonstra por meio de exemplos que a aplicação de valores muito grandes para
λ
P
deformam exageradamente a topologia da função, reduzindo drasticamente a convergência
dos métodos de busca. Com base nisso, aquele autor sugere, sempre que possível, a adoção de
um processo de aumento gradativo do fator de penalização, partindo-se de um valor
moderado, até que se observe a convergência do método para a solução do problema restrito.
A.4.3. A Estratégia dos Conjuntos Ativos
A Estratégia dos Conjuntos Ativos é baseada na idéia de dividir as restrições de
desigualdade em dois grupos: um das restrições ativas, assim chamadas porque serão tratadas
como igualdades, e outro das inativas, que basicamente são ignoradas até que se tornem
ativas.
Para caracterizar cada um dos grupos, a estratégia parte da premissa de que em
nenhum momento a busca ao ponto ótimo extrapole os limites da região factível
(naturalmente, parte-se de um ponto dentro desta região para iniciar a busca). Quando o
143
método de otimização utilizado indica um ponto que ultrapassa os limites da região factível, a
estratégia determina que seja tomada a posição limite daquela região (por meio da adoção de
um passo α adequado) e imposta a igualdade da correspondente restrição de desigualdade,
continuando a busca, a partir daí, no espaço de dimensão reduzida.
Cada vez que uma restrição é ativada procede-se da mesma maneira, até que se atinja
o ponto de mínimo do espaço reduzido. Avalia-se então se naquele ponto restrições ativas
que devam ser desativadas. Havendo mais de uma, (LUENBERGER, 2005) afirma que se
deve desativar uma a uma, escolhendo-se sempre a mais crítica, sob o risco de gerar
instabilidade no processo.
A avaliação de qual restrição deve ser desativada depende da estratégia de imposição
de restrição utilizada. No caso do emprego dos multiplicadores de Lagrange, o sinal e o
módulo dos mesmos indicam qual delas deve ser a escolhida. No caso da estratégia da
penalização, pode-se utilizar como subsídio para a decisão o vetor gradiente.
A fim de ilustrar a estratégia, tome-se o exemplo fictício de minimização restrita de
uma função de duas variáveis, cuja topologia pode ser visualizada por meio das curvas de
nível apresentadas na Figura A.4.1.
Figura A.4.1 - Trajetória de busca utilizando Método dos Conjuntos Ativos
x
1
2
x
1
2
3
4
5
6
7
144
Trata-se um problema com cinco restrições de desigualdade e nenhuma restrição de
igualdade, sendo a solução indicada pelo ponto 7. Inicialmente é adotado um ponto factível,
no caso o ponto 1.
Na primeira iteração (trajeto de 1 a 2) tem-se uma busca que não é afetada por
nenhuma das restrições. na iteração 2 o mesmo não ocorre, já que a busca unidimensional é
limitada por uma das restrições, no caso limitante do valor da variável x
1
. Adota-se, portanto,
um valor de α tal que esta restrição passe a ser ativa. A partir do ponto 3 a busca passa a ser
realizada no espaço reduzido representado pela restrição, até se obter o ponto de mínimo 4.
Desconsiderando a imposição da igualdade da restrição anterior (ou seja,
‘desativando’ a restrição) e realizando a busca direcional encontra-se uma direção de descida
que aponta para dentro da região factível (direção de descida factível), indicando que 4 é
ponto de mínimo apenas para o espaço reduzido. Prossegue-se então a minimização na nova
direção de busca obtida.
O processo é continuado, observando-se ainda a ativação e desativação de mais uma
restrição, até que o ponto de mínimo (ponto 7) seja atingido.
Nota-se que durante o processo de busca algumas das restrições não foram ativadas,
sendo que se procedeu como se elas não existissem. Além disso, o conjunto das restrições
ativas variou com o decorrer do processo, aumentando ou reduzindo.
Segundo (NOCEDAL; WRIGHT, 2006) a estratégia é uma das mais eficientes para
problemas de otimização restrita de pequeno e médio porte. Tal eficiência é também relatada
por (RIGO,1999), que obteve resultados bastante satisfatórios empregando a estratégia dos
conjuntos ativos junto ao Método de Newton e Quase-Newton para a resolução de problemas
de contanto unilateral.
145
A.5. Exemplos
Para entender melhor o funcionamento de cada um dos métodos é interessante o
desenvolvimento de um exemplo numérico simples em que a função objetivo é definida no
espaço R
2
, permitindo a visualização de suas curvas de nível no plano.
Seja o problema de minimização irrestrita dado por
2 2
1 2 1 2
min ( , ) 3( 2) ( 3)
f x x x x
= +
cuja solução é f(x
1
,x
2
)=0 para x
1
=2 e x
2
=3.
O vetor gradiente e a hessiana dessa função são dados por
1
2
2
6 12
6 0
;
2 6
0 2
x
f f
x
= =
Partindo-se do ponto x
1
=0; x
2
=0, inicia a busca pelo Método do Gradiente, cuja
direção de descida é dada por
0
12
(0;0)
6
d f
= − =
Sendo a função quadrática, é possível obter o valor de α por
( )
( )
0
0 2 0
12
12 6
6
180
0,192307
6 0 12
( ) 936
12 6
0 2 6
T
f d
d f d
α
= − = − = − =
e com ambos valores obter o novo ponto
1 0 0 1 1
1 2
0 12 2,307692
0,192307 ; ( ; ) 3,918370
0 6 1,153846
x x d f x x
α
= + = + = =
Calculando-se o gradiente neste ponto obtém-se
1 1
1 2
1,846152
( , )
3,692308
f x x
=
cujo módulo nitidamente é bem maior que zero, e portanto não é ponto de mínimo da função.
146
Avançando nas iterações, observar-se-á que os pontos obtidos se aproximam
lentamente da solução, seguindo uma trajetória em ziguezague, como se pode observar nos
valores de x nas iterações de 2 a 4:
2 2 3 3 4 4
1 2 1 2 1 2
1,648352 2,054100 1,938172
( ; ) ;( ; ) ;( ; )
2,472527 2,675402 2,907258
x x x x x x
= = =
Adotando-se como critério de parada o módulo do vetor gradiente ser menor que 10
-3
são necessárias 10 iterações, obtendo-se como valores finais:
10 10 10 10 7 10 10
1 2 1 2 1 2
1,999664
( ; ) ; ( ; ) 5,93.10 ;| ( ; )| 0,000434
2,999496
x x f x x f x x
= = =
Utilizando o Método dos Gradientes Conjugados observa-se uma grande melhora na
convergência para a solução. Em sua primeira iteração (k=0), os valores de d
0
e α são os
mesmos obtidos no primeiro método, assim como x
1
. Calcula-se então o resíduo r
1
:
1 0 0
12 6 0 12 1,846104
0,192307
6 0 2 6 3,692316
r r d
α
= + = + =
Com r
1
calculado, pode-se calcular β
1
:
( )
( )
1 1
1
0 0
1,846104
1,846104 3,692316
3,692316
( ) 17,041297
0,094674
12
( ) 180
12 6
6
T
T
r r
r r
β
= = = =
Termina-se a iteração calculando a direção de descida da nova interação (k=1):
1 1 1 0
1,846104 12 0,710016
0,094674
3,692316 6 4,260360
d r d
β
= − + = + =
+
Já para a iteração nova, calcula-se inicialmente o valor no de α:
( )
( )
1 1
1 2 1
1,846104
1,846104 3,692316
3,692316
( ) 17,041297
0,433333
6 0 0,710016
( ) 39,326071
0,710016 4,260360
0 2 4,260360
T
T
r r
d f d
α
= = = =
Finalmente se calcula o valor do novo x:
147
2
2,307692 0,710016 2,000018
0,433333
1,153846 4,260360 3,000002
x
= + =
Observa-se que na segunda iteração obteve-se praticamente o valor exato, que o
método anterior demorou 10 iterações para obter. De fato, calculando-se o resíduo nesse
ponto, tem-se que o mesmo atende o critério de parada de mesma ordem de grandeza da
tolerância adotada no Método do Gradiente:
2 1 2 1
1,846104 6 0 0,710016 0,000064
0,433333
3,692316 0 2 4,260360 0,000007
r r f d
α
= + = + =
É importante observar ainda que a expectativa de convergência desse último método,
dada pelo Teorema 5, foi plenamente atendida.
Resultado melhor ainda é observado pelo Método de Newton. Segundo ele o valor da
direção de descida em seu tamanho final é obtido pela resolução do sistema:
1 1 1
2
2 2 2
6 0 12 2 2
( ) ( )
0 2 6 3 3
k k k
d d x
f x d f x
d d x
= −∇ = = =
Na verdade, como a função objetivo é quadrática, nesse caso específico tem-se que o
Método de Newton encontra diretamente a solução.
Para finalizar é interessante observar a capacidade de geração de aproximações da
hessiana pelos Métodos do Tipo Quase Newton; para tanto se toma a variante DFP.
A primeira iteração do método é feito segundo o Método do Gradiente, e, portanto
partindo-se de (0;0) obtém-se os mesmos valores de d
o
, α e x
1
. Passando-se à iteração k=1,
inicialmente calcula-se:
1 1 0
2,307692 0 2,307692
1,153846 0 1,153846
s x x
= = =
1 1 0
1,846152 12 13,846152
( ) ( )
3,692308 6 2,307692
y f x f x
= = =
148
( )
1
1 1
1 1 1
0,028889
2,307692
( ) 34,615375
13,846152 2,307692
1,153846
T
y s
ρ
= = = =
Utilizando-se a identidade como primeira aproximação da hessiana (B
0
), desenvolve-
se a aproximação (B
1
):
(
)
(
)
1 1 1 1 0 1 1 1 1 1 1
( ) ( ) ( )
T T T
B I y s B I s y y y
ρ ρ ρ
= +
1
0,0769198 0,461540 1 0 0,0769198 0,153847 5,53
8481 0,923080
0,153847 0,923077 0 1 0,461540 0,923077 0,9230
80 0,153847
B
= +
1
5,757417 0,485209
0,485209 1,029586
B
=
Tendo-se obtido a primeira aproximação da hessiana, procede-se a resolução do
sistema:
1 1
1 1 1
2 2
5,757417 0,485209 12 0,648648
( )
0,485209 1,029586 6 3,891892
d d
B d f x
d d
= −∇ = =
Passa-se então ao cálculo do passo
α
, o qual resulta:
15,567567
0,474359
32,818112
α
= =
Obtendo-se x
2
com
α
e d
1
:
2
2,307692 0,648648 2,000000
0,474359
1,153846 3,891892 3,000000
x
= + =
Apenas para observar a capacidade de aproximação da hessiana, apresenta-se o valor
que é obtido para B
2
2
5,900527 0,020566
0,020566 2,480143
B
=
a qual como se pode observar se aproxima relativamente bem da hessiana exata.
Seguem na Figura A.4.2 as trajetórias de aproximação da solução para cada um dos
métodos desenvolvidos para o exemplo.
149
Figura A.4.2 - Trajetória da aproximação da solução de cada um dos métodos
Gradiente
Newton
2
x
Gradientes Conjugados
Quase Newton - DFP
x
1
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo