( PDF ) A concordância nominal e o revisor gramatical eletrônico do word

Download PDF

ads:

HENRIETTE MARCEY ZANINI

A CONCORDÂNCIA NOMINAL E O

REVISOR GRAMATICAL ELETRÔNICO DO WORD

Cuiabá

2007

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

HENRIETTE MARCEY ZANINI

A CONCORDÂNCIA NOMINAL E O

REVISOR GRAMATICAL ELETRÔNICO DO WORD

Dissertação apresentada ao Programa de Mestrado

em Estudos de Linguagem da Universidade Federal

de Mato Grosso – UFMT, como requisito parcial para

obtenção do título de Mestre em Estudos de

Linguagem.

Área de concentração: Estudos Lingüísticos

Orientadora: Profª. Drª. Alice Maria Teixeira Saboia

Instituto de Linguagens da UFMT

Cuiabá

2007

ads:

Dedico e agradeço...

A Wendy e Tayná, amores e razões primeiras de todo meu viver.

A minha mãe, Marley, guerreira que, entre outras coisas, me ensinou a nunca desistir, por

mais árdua, longa e acidentada se mostrasse a minha trilha.

A meu pai, Toni, onde quer que ele se encontre depois de ter partido para os Campos

Elíseos. Demorou, mas hoje eu sei que ele realmente acreditava que eu podia realizar

qualquer coisa que me propusesse a fazer.

A minha irmã Andréa, que, uma semana antes da minha defesa, foi levada para trabalhar

no departamento dos anjos de Deus. Minha maior incentivadora, em tudo!

Aos meus irmãos, Luiz Francisco, Jeancarlo e Thiago (e suas famílias), por terem,

principalmente, “agüentado” minhas reclamações, meu cansaço, muitas vezes meu

desânimo, e porque sem eles, ao meu lado, sou menos gente.

Ao Toninho, que de um modo muito especial também me acompanhou nessa jornada.

A minha avó, Natalina Ellert, que aos 91 anos teima em dizer a todos com quem conversa

que, agora, eu sou “doutora”; a minha tia Sirley, que soube entender minhas angústias e

acalmar meu coração; a minha tia Leda, com quem aprendi a amar os livros e a música.

A minha amiga-irmã Vera Lúcia Eilert, por seu incentivo constante e fé absoluta no “meu

poder”, e pelos fichamentos que me ajudou a fazer.

Às minhas amigas do coração, Tereza Sartori, Terezinha Konopaktzi, Irene Cajal, Luzia

Guimarães, Vera Lúcia Lopes, Mariângela Sola López Díaz, Sônia Zaramella, Ana Maria

de Souza e Maura Guimarães. Cada uma, à sua maneira, me apoiou, me ajudou, me

“empurrou”, iluminando meu caminhar.

Aos amigos queridos, Lívio Wogel, Delarim Martins Gomes e Javier Eduardo López

Díaz, pelo “ombro” e pela ajuda incondicional sempre que precisei.

À minha turma do Mestrado, amigos inesquecíveis, meus Professores de Vida: Carmen

Hornick, Caroline Akie, Degmar dos Anjos, Edsônia Melo, Marcelo Silvestrim, Neusa

Phillipsen, Paula Jeorgea, Rodney Mendes de Arruda e Ruth Dourado.

A meus professores, formadores de mais um pouco de mim: Denise Dal’Bello, Lúcia

Helena Vendrúsculo Possari, Manoel Mourivaldo, Marcos Moura Vieira, Maria Inês

Pagliarini Cox, Maria Rosa Petroni e Marieta Prata.

À minha professora-orientadora Profª. Drª. Alice Maria Teixeira Sabóia que, sem me

conhecer e contra todas as probabilidades, acreditou firmemente que eu pudesse fazer um

trabalho de qualidade.

Agradeço, em especial, à banca de avaliação: Profª. Drª. Maria Inês Pagliarini Cox e Prof.

Dr. Cláudio Cezar Henriques, por tão generosamente despenderem seu tempo para

compartilharem comigo uma parte do seu imenso conhecimento.

Henriette Marcey Zanini

Os limites da minha

linguagem são os

limites do meu

mundo.

Wittgenstein

RESUMO

ZANINI, Henriette Marcey. A concordância nominal e o revisor gramatical eletrônico

do Word

Resumo: Esta dissertação aborda o revisor gramatical eletrônico do “Microsoft Office

Word” para o português. Recorta-se em especial a aplicação da regra de

concordância nominal, testada esta em exemplos extraídos de três gramáticas

diferenciadas entre si, pelo modelo teórico-metodológico utilizado no tratamento da

linguagem verbal, para detectar o modelo gramatical subjacente ao revisor estudado.

Neste trabalho busca-se entender como se comporta o revisor gramatical quanto às

regras de concordância nominal contidas em sua gramática, comparando-as às da

gramática normativa e às dos usos cotidianos do português brasileiro padrão. Os

resultados da análise do material permitem inferir que o modelo adotado pela

referida ferramenta computacional assenta-se, em parte, na gramática tradicional, no

que tange à regra geral, deixando, todavia, de observar as regras excepcionais

prescritas.

Palavras-chave: revisor gramatical eletrônico, concordância nominal, norma

lingüística

Abstract: This paper approaches the automatic grammar checker of the Microsoft

Office Word for Portuguese Language. It observes especially the use of the nominal

concordance rulers, tested themselves through examples from three diferent

grammar books, by a theoretical and methodological model used in the treatment of

verbal language, in order to detect the grammatical model that underlies the focused

checker. Here, we search to understand how the grammar checker behaves itself

facing nominal concordance rulers in its grammar, compare them with those into the

normative grammar and the daily uses of standard Brazilian Portuguese. The results

of the analysed material take us to grasp that the adopted model by the automatic

grammar checker settling is based partly on the traditional grammar, relating to

general rule, but it doesn’t observe the excepcional rules prescribed by that grammar.

Key-words: automatic grammar checker, nominal concordance, linguistic rule

SUMÁRIO

Dedicatória e agradecimentos................................................................................iii

Epígrafe..................................................................................................................iv

Resumo/Abstract.....................................................................................................v

INTRODUÇÃO......................................................................................................07

Capítulo I – METODOLOGIA ................................................................................13

Capítulo II – O ADVENTO DO REVISOR GRAMATICAL ELETRÔNICO.............18

2.1 A Lingüística Computacional................................................................19

2.2 A Sintaxe Computacional.....................................................................24

2.3 O Revisor Gramatical Eletrônico..........................................................30

2.3.1 Como “nasceu” o Revisor......................................................41

2.3.2 Como funciona o revisor gramatical do Word........................49

Capítulo III – A CONCORDÂNCIA NOMINAL.......................................................55

3.1 Em Napoleão Mendes de Almeida.......................................................57

3.2 Em Evanildo Bechara...........................................................................66

3.3 Em Maria Helena Moura Neves...........................................................78

Capítulo IV – O (DES)COMPASSO ENTRE AS NORMAS DE

CONCORDÃNCIA NOMINAL CONSTANTES NAS

TRÊS GRAMÁTICAS E NO REVISOR ELETRÔNICO...................84

Capítulo V – CONCLUSÃO.................................................................................101

REFERÊNCIAS BIBLIOGRÁFICAS....................................................................108

ANEXO A - Informática: símbolos digitais e glossários.......................................111

ANEXO B - O ReGra: Revisor Gramatical do Word............................................116

ANEXO C - Telas de Aconselhamento da gramática eletrônica do Word...........120

Introdução

As línguas são de certo modo seres que nos rodeiam e nos iluminam como grandes arcanjos

viventes: é necessário lhes dar um espaço interior de acolhida e estar dispostos a escutá-los e a

lhes prestar atenção.

Ivonne Bordelois (1934-), lingüista argentina.

Desde o começo dos primeiros estudos lingüísticos a preocupação com a

norma, a preocupação no sentido de fixar o “bom uso” e a correção estão dentre as

motivações mais fortes que levaram os estudiosos a descrever as línguas,

resultando na seleção de uma determinada modalidade lingüística em detrimento de

outras consideradas vulgares, impuras, incorretas, ilegítimas. Apoiada nesse

pressuposto, toda a tradição lingüística ocidental atribuiu duas funções básicas ao

gramático: dizer o que a língua é, descrevendo-a, e, simultaneamente, dizer o que

ela deve ser.

Desta forma, não é de se estranhar a ênfase no fato de a linguagem ser

considerada um procedimento importantíssimo, que qualifica ou desqualifica, pela

forma utilizada, o que é dito e quem o diz.

Essa preocupação com o bom, com o adequado uso da linguagem

encontra-se vividamente dentro de empresas, de órgãos públicos, nas redações de

grandes jornais, para citar apenas alguns exemplos, e tem suscitado o

aparecimento de programas de aperfeiçoamento, fazendo surgir um número

considerável de manuais de cultura idiomática. Com a Internet, vários passaram a

ser disponibilizados para consulta on-line, na tentativa de agilizar a vida do usuário

que não dispõe, no momento em que precisa, de material impresso para tirar suas

dúvidas em relação ao uso considerado correto do seu idioma.

Hoje, usuários que necessitam redigir um texto, e que não são tão

proficientes na escrita da língua portuguesa, encontram à sua disposição alguns

softwares de correção gramatical desenvolvidos para auxiliá-los no momento de

escritura de seus textos.

Interessa-nos, aqui, particularmente, falar sobre o revisor gramatical

eletrônico do Microsoft Word, o programa de edição de textos mais utilizado no

mundo, e objeto de nossa pesquisa.

A idéia de trabalhar com este tema nasceu da observação de inadequações

sintáticas no que diz respeito às concordâncias verbal e/ou nominal, apresentadas,

principalmente, em textos de alunos de graduação. Inicialmente nos parecia que

eles não procediam a uma revisão gramatical de seus escritos, porém como

asseguravam que “pediam ajuda ao computador”, mais especificamente à tecla F7,

percebemos a necessidade de averiguar o que se passava.

Não costumávamos utilizar o recurso de clicar em Ferramentas: ortografia e

gramática (desconhecíamos, ainda, que o atalho era a tecla F7) por dois simples

motivos: primeiro, pelo conhecimento razoavelmente bom do idioma, e por

recorrermos constantemente ao dicionário e à gramática; segundo, a quase total

falta de intimidade com a maioria dos recursos computacionais, ou seja, a não

utilização nem de 1/3 dos recursos que o computador oferece, entre eles como

procurar a ajuda do revisor, quer ortográfico, quer gramatical.

Então, ao começarmos a expor ao revisor eletrônico do Word alguns

problemas lingüísticos apresentados pelos alunos, acabamos nos deparando com

outros problemas que ele nos apresentava. Parecia analisar e sugerir alterações

aleatoriamente, como se não houvesse um padrão que seguisse. Referimo-nos a

padrão, aqui, como regras ditadas pela gramática normativa da língua portuguesa. E

o mais preocupante é que para os usuários do revisor, ou seja, para as pessoas que

não têm um conhecimento maior de estruturas sintáticas e regras de concordância,

ele é tido como um instrumento confiável de colaboração para a correção gramatical

de seus escritos.

Vale uma ressalva, aqui: o termo “corretor” tem como sinônimos “revisor” e

“verificador”. Optamos por utilizar com maior freqüência o termo revisor, primeiro por

achá-lo, particularmente, mais adequado e, em segundo, porque é esse termo que

aparece na configuração do Microsoft Office Word, presente em cada PC, tanto para

Revisor Ortográfico quanto para Revisor Gramatical.

Assim, é natural que, em virtude das tentativas vãs em entender a lógica com

que o revisor operava, algumas interrogações começaram a nos atiçar a

curiosidade, tais como: por que a descrição gramatical do revisor eletrônico não diz

respeito à verificação de grande parte das estruturas usuais do português do Brasil

em relação às regras de Concordância Nominal? Que gramática subjaz ao revisor

gramatical eletrônico? Trata-se de uma gramática casuística, composta de um

elenco de frases, que considera caso a caso? Trata-se de uma gramática que vê a

língua como um conjunto de enunciados pré-estabelecidos?

Destes questionamentos originou-se a pergunta principal de nossa pesquisa:

quais normas constam da memória da gramática eletrônica em relação à

concordância nominal? Seguem o modelo tradicional ou não?

E, sem respostas imediatas a essas e outras questões, principalmente no

retorno das correções feitas nos textos dos alunos, surgiu, então, o desejo de

procurar essas respostas por meio de uma investigação científica que desse

respaldo às nossas discussões com os alunos quando eles se deparassem com as

correções feitas em seus textos e os pedidos para não confiarem tanto no revisor

eletrônico, mas, sim, nas velhas e boas regras encontradas nas gramáticas

impressas que, sabemos, a maioria não gosta de, ou não sabe como, pesquisar.

Aliás, essa confiança no revisor gramatical é um dos aspectos que precisa ser

debatido, pois realmente chama a atenção ver como usuários comuns se apóiam no

que lhes aconselha o revisor como correção. Confiança não compartilhada com os

homens de letras - aqui representados por pessoas com conhecimento maior das

normas gramaticais em relação àqueles -, como se pôde perceber, por exemplo,

nas opiniões de professores de português, dispostas no subcapítulo dedicado ao

funcionamento do revisor.

Desta forma, pensamos realizar um trabalho que pretende, por meio da

investigação científica, demonstrar qual o grau de (in)adequação da gramática

eletrônica, no que diz respeito às regras de Concordância Nominal apresentadas

pelo revisor do Word, com relação às regras da gramática normativa e aos usos

cotidianos da língua portuguesa.

Para saber mais e conseguir chegar a conclusões claras e consistentes para a

composição do texto, como um todo, optamos escolher traçar um caminho que, a

nosso ver, nos embasaria teoricamente e nos forneceria dados para a compreensão

buscada.

No primeiro capítulo encontra-se a metodologia, desenhada por nós, uma vez

que não conseguimos encontrar no gênero algo com o qual pudéssemos trabalhar.

Considerações sobre o revisor gramatical eletrônico estão dispostas no

segundo capítulo, bem como considerações acerca da lingüística computacional e

da sintaxe computacional. Acerca do revisor, dispusemos as informações que

conseguimos (a maioria pela Internet) e que consideramos ainda um pouco

inconsistentes para compreender bem a complexidade desta ferramenta de trabalho

de que dispõe um usuário de computador quando utiliza um editor de textos. Há

testes que fizemos com um anúncio de venda de um revisor gramatical, infelizmente

sem nome e sem datação, mas de grande ajuda para o início das reflexões acerca

de algo que não conhecíamos ainda. Informações de como proceder – apenas

algumas dentre as diversas orientações fornecidas pelo programa - para utilizar o

revisor estão no primeiro subcapítulo e, no segundo, quem esteve e está por trás da

criação, do desenvolvimento e do aprimoramento dos revisores ortográfico e

gramatical para a língua portuguesa utilizados pela Microsoft Word nos

computadores que se utilizam do sistema Office Word.

O terceiro capítulo é dedicado às noções de concordância – ênfase na

concordância nominal - prescritas para o uso do português culto, bem como os

capítulos destinados ao assunto pelos três gramáticos escolhidos por nós, com as

respectivas telas copiadas quando o revisor detectava um problema com alguma

regra.

No quarto capítulo, as análises contrastivas entre as normas de concordância

nominal constantes nas três gramáticas e no revisor gramatical. Também as

respostas para as perguntas iniciais de pesquisa, com as análises julgadas

pertinentes.

No quinto capítulo, as conclusões a que chegamos.

Como anexos, disponibilizamos algumas telas de aconselhamento ofertadas

pelo revisor gramatical eletrônico sobre outros tópicos gramaticais, que não apenas

a concordância nominal, com os quais nos deparamos, durante a digitação do texto

desta pesquisa, sublinhados com a linha ondulada verde. Servem a título de

ilustração e também de exemplificação de alguns dos aspectos que ainda precisam

ser melhorados pelos pesquisadores/idealizadores do revisor. Há, também, outros

dois anexos: do universo da informática retiramos informações sobre o que são

símbolos digitais e dois glossários de termos; e a transcrição de um artigo publicado

pelo NILC quando da apresentação da última versão do ReGra – Revisor

Gramatical.

Por ter trabalhado com Napoleão Mendes de Almeida, Evanildo Bechara e

Maria Helena Moura Neves, pensamos ser relevante a observação disposta no

próximo parágrafo, o que também já nos serve de fecho para esta apresentação.

No contraponto entre a gramática eletrônica e as gramáticas citadas acima há

um conhecimento que se faz necessário e, para obtê-lo, fizemos no segundo

capítulo deste trabalho uma breve incursão aos domínios da lingüística

computacional. Breve incursão porque sabemos não haver condições temporais e

cognitivas para um aprofundamento nesse tema. Pretendemos apenas

compreender melhor como se processa a linguagem que o computador utiliza para

reconhecer como gramaticais sentenças de línguas naturais. Em melhores termos,

como um programador consegue introduzir regras gramaticais para o uso efetivo do

revisor eletrônico.

Nesse quesito, trabalhamos principalmente com Othero e Menuzzi (2005) e

suas orientações na construção de um parser lingüístico, além de suas reflexões

acerca da gramática e das programações de máquinas para responder a comandos

de usuários em sua própria língua. Com relação ao trabalho do lingüista, dizem no

comentário de orelha do livro:

Por trás desse tipo de trabalho, deve estar o lingüista: ele é o

cientista que busca compreender coisas como as nuances

semânticas de uma expressão, as regras sintáticas de uma língua

ou os detalhes de funcionamento de seus sons. É preciso “ensinar”

essas coisas ao computador, se quisermos que essa máquina

venha a interagir conosco.

Pensamos que ensinar, ou reensinar, coisas ao computador depende de

estudos como o que pretendemos levar a cabo. Aí reside a importância social que

acreditamos ter uma pesquisa como a nossa. Alguns problemas com a gramática

eletrônica serão detectados, outros, provavelmente, ficarão “sem sugestões”, haja

vista a dificuldade que encontramos com o “humor” da tecla F7: às vezes, aparece a

sublinha verde sob uma estrutura frasal e, às vezes, quando a mesma sentença é

exposta novamente ao corretor, não aparece sublinhada em verde. Em outras,

ainda, o revisor sublinha o texto, mas na janela de ortografia e gramática surge a

expressão “(sem sugestão)”, ainda que seja oferecida uma explicação gramatical.

(Vide tela na página seguinte.)

De qualquer modo, temos a intenção de contribuir, mesmo que timidamente,

para que novos estudos sejam realizados no intuito de se melhorar o desempenho

da gramática eletrônica do Word, ao menos quanto às regras de concordância

nominal contidas nela.

Capítulo I - Metodologia

Em virtude de não conseguirmos encontrar um modelo metodológico o qual

servisse à nossa intenção de demonstrar a adequação ou a inadequação do revisor

gramatical eletrônico do Microsoft Office Word, houve a necessidade de desenhar

um método próprio, sem a mínima pretensão ou ilusão de que seja algo

inteiramente novo.

Para buscar e encontrar respostas às dúvidas suscitadas e relatadas na parte

introdutória deste trabalho, a pesquisa objetivou alcançar:

• um inventário dos critérios utilizados para a organização do revisor

gramatical do Word;

• as normas (ou pelo menos uma boa parte delas) de Concordância

Nominal constantes da memória gramatical eletrônica, verificando se

seguem ou não o modelo tradicional;

• exemplos de quais sentenças, dentre as submetidas e consideradas

gramaticais, são reconhecidas pelo revisor, como também de sentenças

tidas como corretas gramaticalmente, usuais, e que não são

reconhecidas por ele;

• e, ainda, a identificação de qual(is) nível(is) de linguagem é(são)

contemplado(s) pela gramática do revisor do Word e pelas gramáticas

utilizadas para retirada de exemplos para o corpus da pesquisa,

aproximando-os ou afastando-os, conforme resultados obtidos.

Alcançar estes objetivos nos auxiliará a encontrar resposta para a pergunta

principal de nossa pesquisa:

1. Que normas constam da memória da gramática eletrônica em relação à

Concordância Nominal? Seguem o modelo tradicional ou não?

E também para responder às questões auxiliares:

1. Por que a descrição gramatical do revisor eletrônico não diz respeito à

verificação de grande parte das estruturas usuais do português do Brasil em

relação às regras de Concordância Nominal?

2. Que gramática subjaz ao revisor gramatical eletrônico? Trata-se de uma

gramática casuística, composta de um elenco de frases, que considera

caso a caso? Trata-se de uma gramática que vê a língua como um conjunto

de enunciados pré-estabelecidos?

Nosso universo de pesquisa abrangeu a gramática eletrônica do Word e as

gramáticas de Napoleão Mendes de Almeida: Gramática metódica da língua

portuguesa, numa edição de 1975, a Moderna gramática portuguesa, edição 1999,

de Evanildo Bechara, e a Gramática de usos do português, publicada em 2000, de

Maria Helena Moura Neves.

Esses autores foram escolhidos por suas abordagens bem diversas no trabalho

com a gramática normativa da Língua Portuguesa, além da distância temporal

existente entre as publicações de seus estudos gramaticais, principalmente entre

Napoleão e Bechara. O primeiro, de cunho purista; o segundo, um gramático

tradicional de formação lingüística mais recente, tradutor de um dos maiores

pensadores da lingüística moderna, Coseriu; e Moura Neves, de tradição filosófica,

que distingue o que é prescrição e o que é uso na língua, servindo como

contraponto a Napoleão e Bechara.

O procedimento de coleta consistiu na verificação e extração de sentenças

fornecidas como exemplos das regras de concordância nominal encontradas nas

gramáticas dos autores citados no parágrafo anterior. Para isso, os capítulos, de

cada uma das gramáticas dedicados ao tema, foram redigitados por nós para que

as próprias regras de concordância fossem submetidas ao crivo do revisor

gramatical. Os textos redigitados encontram-se no capítulo III.

A cada vez que, na redigitação, aparecia a sublinha verde, o revisor era

consultado. As telas com a amostragem da marcação verde do revisor e as

sugestões e explicações gramaticais fornecidas por ele encontram-se nos corpos

dos capítulos escolhidos, imediatamente após a regra de concordância explicitada e

não reconhecida e/ou aceita pelo revisor.

O mesmo procedimento descrito acima foi feito durante a redação deste

trabalho, com as telas impressas servindo como “prova”. Alguns exemplos não são

especificamente de problemas de concordância nominal, porém achamos

interessante mostrá-los porque nos auxiliaram na análise do que chamamos de

“humores da F7”, a tecla de atalho para a janela de Ferramentas: Ortografia e

Gramática.

Para conseguirmos as telas impressas, aprendemos que devemos proceder

aos seguintes passos:

1º) selecionar a palavra/expressão/frase;

2º) apertar a tecla F7 (atalho, mais rápido);

3º) apertar a tecla Print Screen SysRq, à direita, superior, do teclado alfabético;

4º) posicionar o cursor em um documento do Word e, então, “colar” por meio

de CtrlC ou do botão direito do mouse. Depois, apenas redimensionar tamanhos, de

acordo com a necessidade.

O procedimento de análise consistiu em colher as sugestões fornecidas pelo

revisor gramatical eletrônico - ou não fornecidas, pois, às vezes, ele sublinha, mas

não tem sugestões a dar (vide exemplo na tela abaixo) -, além de colher as

explicações gramaticais (regras e “dicas”) que o revisor apresenta para, no final,

comparar quais concordâncias, exemplificadas nas gramáticas, o revisor reconhece

ou não como corretas.

Interessante explicar que algumas sentenças são detectadas pelo revisor,

outras não, conforme a configuração do computador no qual se está trabalhando.

Por isso, serão encontradas telas neste trabalho com cores diferentes, pois foram

copiadas de máquinas diferentes em configuração.

As telas que aparecem na cor cinza, como esta acima, e principalmente as que

se encontram nos capítulos redigitados de Napoleão Mendes de Almeida e Maria

Helena Moura Neves respectivamente, foram retiradas de uma máquina com a

seguinte configuração:

Microsoft Office Word 2000 Sistema Windows XP Home

Versão 2002 – Service Pack 2

Computador: Intel® Celeron ™ processador 1100 MHz, 128 MB de RAM

Itautec/Philco S.A., 2001.

Já as telas em cor azul, maioria, foram copiadas do nosso computador pessoal,

que traz as seguintes informações de configuração:

Microsoft Office Word 2003 Sistema Windows XP Professional Edição 2003

Versão 2002 – Service Pack 2

Computador: AMD Duron™ processador 950 MHz, 248 MB de RAM

Itautec/Philco S.A., 2001.

É importante a observação de que as duas máquinas trazem tanto o Revisor

Ortográfico quanto o Revisor Gramatical para Língua Portuguesa na sua versão 7.

Já foi lançado, pela Microsoft, para download inclusive, o Office 2007, porém não o

quisemos conhecê-lo ainda, nem analisá-lo, porque acreditamos que seriam

necessárias algumas reformulações neste texto, para o que não há mais tempo

hábil, além do que recebemos a informação de especialistas no assunto de que o

novo programa necessita, para funcionar bem, de um computador com mais

recursos, mais potência para suportar as novas ferramentas. O que também não é o

caso do computador com o qual estamos trabalhando.

Em resumo, nosso universo de pesquisa foi extraído das gramáticas dos

autores mencionados acima e da gramática encontrada no revisor eletrônico do

Word. Trabalhamos com um critério de análise que passou pelo método

comparativo para encontrar respostas às nossas questões de pesquisa, porém essa

pesquisa teve caráter predominantemente qualitativo.

Este, enfim, é um trabalho que requereu muito esforço, principalmente pela

ausência de similares no tema. Resta de bom o conhecimento adquirido e a

tentativa de abordagem inicial para futuros outros estudos.

No capítulo a seguir, considerações sobre lingüística e sintaxe computacionais

e, também, como foi criado e como funciona o revisor gramatical eletrônico do Word,

ou revisor gramatical automático, como o chamam seus criadores.

Capítulo II – O advento do revisor gramatical eletrônico

Escrita, leitura, visão, audição, criação, aprendizagem são capturados por uma

informática cada vez mais avançada. (...) Emerge, neste final do século XX, um conhecimento

por simulação que os epistemologistas ainda não inventariaram.

Pierre Lévy

A primeira impressão é sempre aquela que fica, como se costuma ouvir por

aí? Pensamos que não, pois cada um de nós já teve, certamente, oportunidade para

refazer uma primeira impressão. Se não naturalmente, pelo próprio repensar uma

opinião, ao menos forçosamente, pela contingência de algum fato cotidiano.

É estranho, para dizer o mínimo, para pessoas como nós – estudantes,

professores, escritores, letrados, cidadãos conscientes e participativos do/no atual

momento histórico, globalizado, por que passa o mundo moderno – pensar que

alguém ainda não saiba tudo, ou quase tudo, sobre computadores. Afinal, já fazem

parte do nosso viver, já não sabemos trabalhar sem eles. No entanto, quando

deixamos nossa prepotência de lado, vemos que muitos ainda não conseguem ter

um relacionamento harmonioso e satisfatório com esta ferramenta tecnológica. O

senso comum costuma afirmar que tudo que é novo provoca certo medo, até se

conhecer e dominar o novo.

A verdade é que se ouve, ainda hoje, alguém afirmando, saudosamente, que

com sua máquina de datilografia era feliz e não sabia. E muitas reclamações sobre

o PC são ouvidas: “É lento!”, “Trava sempre!”, “È caro para comprar e para

consertar.”, “Quero escrever de um jeito, ele muda automaticamente.”, É para

enlouquecer qualquer cristão!”.

Só que os computadores vieram para ficar, e a cada dia se aperfeiçoam,

ultrapassam todas as idéias pré-concebidas sobre si e nos fazem engolir em seco,

uma vez que somos nós a ter que nos adaptar a ele, e não o contrário, sonho de

todo usuário.

Para entendermos melhor como funciona um revisor, quer seja ele

ortográfico, quer seja ele gramatical, precisamos conhecer como é feito um

programa para a criação da gramática eletrônica que o subsidia. E, então, entramos

na seara da lingüística computacional, ciência que, se comparada a outras, é bem

jovenzinha ainda. E, ao entrarmos nesse campo, nos deparamos com a sintaxe

computacional e seus termos diferentes, como parser/parsing, Prolog etc. É o que

pretendemos mostrar nos próximos subcapítulos.

2.1 A Lingüística Computacional

De acordo com o pesquisador Ray Kurzweil, pioneiro em inteligência artificial, em 2029 um

computador com o preço de um PC de nossos dias (aproximadamente U$ 800) terá a capacidade

de computação equivalente à do cérebro humano. E, ainda segundo Kurzweil, em 2060 uma

máquina que custe em torno de U$ 1.000 terá a capacidade de todos os cérebros humanos

somados, o que nos levaria a atingir um progresso de vinte milênios em apenas cem anos!

(Othero e Menuzzi, 2005:16)

Pierre Levy (s/d), em um artigo publicado no site www.faced.ufba.br , afirma

que uma tecnologia intelectual não precisa ser efetivamente utilizada por uma

maioria estatística de indivíduos para ser considerada dominante. Diz ele que até o

começo do século XIX, a maior parte dos franceses não sabia ler, mas mesmo

assim a escrita era, havia muito, a tecnologia intelectual motriz no plano tanto

imaginário como religioso, científico ou estético. “Durante séculos a verdade foi

escrita, bem como o destino. O mundo desenrolava uma imensa página coberta de

sinais a serem interpretados.”.

Para Levy, assim como a escrita, a informática, por sua dimensão empírica,

deve ser analisada como tecnologia intelectual,

mas essas máquinas de calcular, essas telas, esses programas não

são apenas objetos de experiência. Enquanto tecnologia intelectual,

contribuem para determinar o modo de percepção e intelecção pelo

qual conhecemos os objetos. Fornecem modelos teóricos para as

nossas tentativas de conceber, racionalmente, a realidade.

Enquanto interfaces, por seu intermédio é que agimos, por eles é

que recebemos de retorno a informação sobre os resultados de

nossas ações. Os sistemas de informação efetuam a mediação

prática de nossas interações com o universo.

Este subcapítulo será dedicado a considerações acerca de um assunto

extremamente complexo ainda, muito mais desconhecido, para a maioria das

pessoas. A incursão aos domínios da lingüística computacional se dará de forma

bastante simples, até mesmo infantil, uma vez que não há espaço, neste trabalho,

para aprofundamento desse conhecimento. Porém, é necessária esta abordagem,

mesmo que deficitária, por estar esse conhecimento intrinsecamente relacionado às

perguntas que norteiam o nosso pensar e para as quais buscamos respostas.

A referida incursão será breve, porque sabemos não haver condições

temporais e cognitivas para um aprofundamento nesse tema. Pretendemos apenas

compreender melhor como se processa a linguagem que o computador utiliza para

reconhecer como gramaticais sentenças de línguas naturais. Em melhores termos,

como um programador consegue introduzir regras gramaticais para o uso efetivo do

corretor eletrônico. Nesse quesito, trabalharemos principalmente com Othero &

Menuzzi (2005) e suas orientações na construção de um parser lingüístico, além de

suas reflexões acerca da gramática e das programações de máquinas para

responder a comandos de usuários em sua própria língua.

Comecemos, então, pela definição desta nova ciência, dada por Othero e

Menuzzi (2005):

Lingüística computacional é a área da ciência lingüística

preocupada com o tratamento computacional da linguagem e das

línguas naturais. Ela pode ser dividida em duas linhas de pesquisa

distintas: a Lingüística de Corpus e o Processamento da Linguagem

Natural.

A Lingüística de corpus é a parte que estuda diferentes fenômenos das

línguas com base em corpora eletrônicos. Conforme Berber Sardinha (2000c:2), ela

“se ocupa da coleta e exploração de corpora, ou conjunto da dados lingüísticos

textuais que foram coletados criteriosamente com o propósito de servirem para a

pesquisa de uma língua ou variedade lingüística”.

Já o Processamento de Linguagem Natural (PLN) é a área de estudo da

linguagem voltada diretamente para a construção de softwares e sistemas

computacionais específicos. Alguns resultados desse tipo de estudo são a criação e

desenvolvimento de programas de tradutores automáticos, chatterbots, parsers,

reconhecedores automáticos de voz, dentre outros.

Cabe à área de PLN desenvolver programas capazes de processar

(leia-se compreender e produzir) informações em LINGUAGEM

NATURAL. Esses programas podem envolver diferentes áreas da

lingüística, como a fonologia, a fonética, a semântica, a sintaxe, a

pragmática etc. (Othero & Menuzzi, 2005:124).

Ainda segundo Othero & Menuzzi (2005:11), as máquinas estão sendo

programadas, cada vez mais, para responder a comandos do usuário em sua língua

materna, qualquer que seja ela. Isto é resultado da busca por uma melhor interação

entre humanos e máquinas, o que está se dando através da linguagem natural, ou

seja, da linguagem do homem.

Por trás desse tipo de trabalho, deve estar o dedo do lingüista:

afinal, é ele o cientista da linguagem, o cientista que busca

compreender coisas como as nuances semânticas de uma

expressão, as regras sintáticas de uma língua ou os detalhes de

funcionamento de seus sons. E é preciso “ensinar” essas coisas a

um computador – ou melhor, programar esse conhecimento na

“máquina binária”, dos “zeros” e dos “uns”, isto é, do sim e do não -

se quisermos que essa máquina esteja pronta a interagir

naturalmente conosco. (Othero e Menuzzi, 2005:12)

É claro que desenvolver computadores com capacidade de interagir de forma

natural com humanos ainda está distante da realidade atual, mas é um dos objetivos

da lingüística computacional, que se ocupa do tratamento computacional da

linguagem para diversas finalidades práticas.

Os autores acima (2005:18) acreditam que, antes de tentar fazer com que

uma máquina interaja efetivamente com humanos e os compreenda, é

inevitavelmente necessário fazer com que ela aprenda a se comunicar com um ser

humano, e a maneira mais fácil de este tipo de comunicação ocorrer é através da

própria língua materna da pessoa usuária de um computador. E completam:

Por isso, muitos pesquisadores vêm trabalhando com o tratamento

computacional da linguagem humana (ou das línguas humanas),

isto é, com maneiras de simular, no computador, aquilo que

fazemos naturalmente quando conversamos com alguém. Isso

exige, no entanto, que se avance no estudo do funcionamento das

línguas naturais e na descrição formal dos sistemas lingüísticos, e é

aí que começamos a falar da lingüística computacional.

Uzskoreit (apud Othero & Menuzzi, 2005:18), pesquisador da área da

informática, afirma que:

Ainda que os sistemas existentes em TL [tecnologias lingüísticas]

estejam longe de alcançar a habilidade humana, eles têm diversas

aplicações possíveis. O objetivo é criar softwares que tenham

algum conhecimento da linguagem humana. (...) Há necessidade

urgente deles para que se possa melhorar a interação humano-

máquina, já que o obstáculo principal na interação entre um

humano e um computador é simplesmente um problema de

comunicação. Os computadores de hoje não entendem nossa

língua, e as linguagens de computação, por outro lado, são difíceis

de se aprender e não correspondem à estrutura do pensamento

humano. (Uzskoreit, sd:2).

Percebe-se, agora, a dificuldade – talvez até o ceticismo de alguns – em se

encontrar respostas para questões como: O que se deve fazer para que o

computador “compreenda” uma língua natural? Como fazer para que uma máquina

consiga produzir textos ou falas em uma língua natural? Chegará o dia em que uma

máquina poderá ser capaz de dominar a sintaxe, o sistema fonológico, as nuanças

semânticas e o uso pragmático, entre outros conhecimentos, de uma língua natural?

Os autores com os quais estamos trabalhando neste capítulo (dentre inúmeros

outros) acreditam que, algum dia, os computadores serão capazes sim de dominar a

linguagem natural de maneira satisfatória e, assim, interagir de tal modo com os

humanos, em uma determinada língua natural, que não se conseguirá distinguir as

respostas da máquina das de um outro ser humano.

Porém, voltemos ao que realmente nos interessa: o estudo computacional da

sintaxe da língua portuguesa, ou seja, com o modo como as frases da nossa língua

se organizam e o modo como esta organização é reconhecida pelo computador.

Além da fonética e da fonologia, é indiscutível a importância dos estudos da

morfossintaxe e da semântica para o desenvolvimento de programas de PLN

[Processamento da Linguagem Natural], pois esses estudos são fundamentais para

sistemas que envolvam a compreensão ou a geração automática de frases de uma

língua. Este é o caso, por exemplo, dos chatterbots, programas desenvolvidos para

interagir com usuários humanos através de diálogos em linguagem natural, na

modalidade escrita. “O primeiro chatterbot desenvolvido foi ELIZA, criado pelo

pesquisador Joseph Weinzenbaum, no MIT, em 1966”. (Othero e Menuzzi,

2005:31).

ELIZA era um programa de conversação que se utilizava de um sistema

baseado em “moldes” (templates, em inglês) para construir suas frases, e que,

como todos os chatterbots baseados em moldes, tinha, como uma de suas

limitações, a repetição eventual de suas próprias frases e as de seu interlocutor,

apresentando, freqüentemente, contradição em suas “opiniões”.

Por isso, acreditamos que as próximas gerações de chatterbots

devem exigir dos programadores um profundo conhecimento da

sintaxe (que permitirá que desenvolvam no programa a capacidade

de gerar infinitas sentenças da língua combinando um número finito

de regras e elementos lexicais) e de semântica (o que tornará

possível fazer com que o programa seja capaz de interpretar o

significado do input lingüístico fornecido pelo usuário humano).

(Othero & Menuzzi, 2005:35).

Além dos chatterbots e dos tradutores automáticos, conhecimentos em

sintaxe e semântica são fundamentais, também, para outros aplicativos, como

parsers, geradores automáticos de resumos, corretores ortográficos e gramaticais,

classificadores automáticos de documentos digitais etc.

O termo parsing vem da expressão latina pars orationes (partes do discurso)

e tem suas raízes na tradição clássica. “De acordo com Mateus & Xavier

(1992:886), parsing pode ser entendido como o ‘processo de atribuição de uma

estrutura e de uma interpretação a uma seqüência lingüística’.”. (apud Othero &

Menuzzi, 2005: 39)

Um parser, no contexto da lingüística computacional, é um

analisador automático (ou semi-automático) de sentenças. Esse tipo

de programa é capaz de analisar uma sentença com base em uma

gramática preestabelecida de uma determinada língua, verificando

se as sentenças fazem parte ou não da língua, de acordo com o

que autoriza a sua gramática. (...) também analisa sintaticamente as

sentenças, decompondo-as em uma série de unidades menores,

primeiramente em nódulos não-terminais (os sintagmas), até chegar

a nódulos terminais (os itens lexicais) atribuindo-lhes uma estrutura

de constituintes. Essa estrutura de constituintes, que representa a

organização hierárquica e sintática da frase, é apresentada

comumente através de árvores sintáticas ou através de colchetes

rotulados. (Othero & Menuzzi, 2005:49).

E de acordo com Covington (1994:42, apud Othero & Menuzzi, 2005:40),

fazer o parsing de uma sentença é “determinar, por um processamento algorítmico,

se a sentença é gerada por determinada gramática, e se for, que estrutura a

gramática atribui a ela”.

Bons exemplos de um simples algoritmo que pode fazer uma medida

analítica da linguagem são os corretores ortográficos e gramaticais. Porém, uma

das armadilhas dos corretores ortográficos está na leitura de uma determinada

palavra dentro de um contexto.

O computador não pode encontrar um erro ortográfico se a palavra

estiver correta para um outro contexto (por exemplo, conserto e

concerto). A habilidade da mente humana em analisar e reconhecer

corretamente falas, estilos e gramática não é reproduzida

satisfatoriamente pelos computadores, porque mentes e

computadores trabalham diferentemente.

[http://labbi.uesc.br/apostila]

Mesmo assim, o poder dos computadores é inegável. Hoje, escrever um texto

utilizando um processador de textos, por exemplo, se tornou tão mais fácil e tão

popular, que, para milhões de usuários, é uma ferramenta considerada

indispensável.

2.2 A Sintaxe Computacional

Para compor o início deste subcapítulo serão utilizadas informações

disponibilizadas pelo programa de pós-graduação em computação do Instituto de

Informática da Universidade Federal do Rio Grande do Sul [www.inf.ufrgs.br],

especialmente de um trabalho feito para a disciplina de Arquiteturas Especiais de

Computadores, assinado por Fábio Abreu Dias de Oliveira, intitulado

“Processamento de linguagem natural: princípios básicos e a implementação de um

analisador sintático de sentenças da língua portuguesa”. A escolha recaiu nesses

dados em virtude de sua linguagem acessível, simples e clara. Porém, também

continuaremos atentos ao que Othero & Menuzzi (2005) ensinam sobre o assunto.

Para que um sistema computacional interprete uma sentença em linguagem

natural, é necessário manter informações morfológicas, sintáticas e semânticas,

armazenadas em um dicionário, juntamente com as palavras que o sistema

compreende.

A primeira etapa do processamento dessa linguagem natural passa,

obrigatoriamente, pelo analisador morfológico, que identifica palavras ou expressões

isoladas em uma sentença. Esse processo é auxiliado por delimitadores (pontuação

e espaços em branco). As palavras identificadas são classificadas de acordo com

seu tipo de uso, ou, em linguagem natural, categoria gramatical.

Assim, uma instância de uma palavra em uma sentença gramaticalmente

válida pode ser substituída por outra do mesmo tipo, configurando uma sentença

ainda válida (exemplo: substantivos, pronomes, verbos, etc.). Dentro de um mesmo

tipo de palavra, existem grupos de regras que caracterizam o comportamento de um

subconjunto de vocábulos da linguagem, como, por exemplo, a formação do plural

de substantivos terminados em “ão” e as flexões dos verbos regulares terminados

em “ar”, dentre outros. Assim, a morfologia cuida das palavras quanto a sua

estrutura, forma, flexão e classificação, no que se refere a cada um dos tipos de

palavras.

Para Rich & Knight (1993) o “emprego do analisador morfológico é

fundamental para a compreensão de uma frase, pois para formar uma estrutura

coerente de uma sentença, é necessário compreender o significado de cada uma

das palavras componentes.”

Já o analisador sintático, através da gramática da linguagem a ser analisada

e das informações do analisador morfológico, procura construir árvores de derivação

para cada sentença, mostrando como as palavras estão relacionadas entre si.

Durante a construção da árvore de derivação, é verificada a adequação das

seqüências de palavras às regras de construção impostas pela linguagem na

composição de frases, períodos ou orações. Dentre estas regras, a concordância e

a regência nominal e/ou verbal, assim como o posicionamento de termos na frase.

Um termo corresponde a um elemento de informação (palavra ou expressão), e é

tratado como unidade funcional da oração, participando da estrutura como um de

seus constituintes, denominados sintagmas.

Como sabemos, a análise sintática de uma oração em português deve levar

em conta os seguintes sintagmas: termos essenciais (sujeito e predicado), termos

integrantes (complementos verbal e nominal) e termos acessórios (adjuntos

adverbial e nominal, e aposto). A análise do período, por sua vez, deve considerar o

tipo de período (simples ou composto), sua composição (por coordenação ou

subordinação) e a classificação das orações (absoluta, principal, coordenada ou

subordinada).

Nos sistemas de processamento de linguagem natural, o maior problema é a

transformação de uma frase potencialmente ambígua em uma não-ambígua, a qual

será utilizada pelo sistema. Esta transformação é conhecida como parsing, termo já

explicado anteriormente.

As abordagens de linguagens formais são utilizadas com muito sucesso no

estudo da análise sintática em PLN. Dentre as principais, temos:

• Gramáticas Regulares: para o processamento sintático da linguagem

natural, estas gramáticas são bastante simples e facilmente reconhecidas, porém

apresentam um poder de expressão limitado (equivalente ao poder de expressão de

um autômato finito, reconhecedor utilizado para a análise morfológica).

• Gramáticas Livres de Contexto: são muito úteis no que tange à descrição

de gramáticas em linguagem natural e, em geral, são mais poderosas que as

regulares já que permitem a representação de linguagens com um certo grau de

complexidade. No entanto, a dificuldade em expressar dependências simples, como

por exemplo a concordância entre verbo e sintagma nominal, constitui um dos

maiores problemas para sua utilização no tratamento da língua natural. O autor

mencionado como fonte principal dessas informações, afirma que abordagens

puramente livres de contexto não são suficientemente poderosas para captar a

descrição adequada deste gênero de linguagem. Mas que, ainda assim, é utilizada

uma notação denominada com Definite Clause Grammar (DCG), disponível em

Prolog, para definir gramáticas livres de contexto e analisar sentenças, ou seja,

realizar o parsing.

• Gramáticas Sensíveis ao Contexto: os problemas de dependência

expressos anteriormente são resolvidos nesta classe de gramática. Porém,

conforme Rich & Knight (1993), ainda assim as gramáticas sensíveis ao contexto

não abordam satisfatoriamente o tratamento de restrições gramaticais. O

impedimento para seu uso reside na questão do reconhecimento.

O problema de decidir se uma sentença pertence a uma gramática

sensível ao contexto é uma função exponencial sobre o tamanho da

sentença, o que torna a implementação do procedimento de

verificação uma questão complexa, do ponto de vista

computacional. (idem)

Vale lembrar a existência de gramáticas irrestritas, também presentes na

hierarquia de Chomsky, as quais não são utilizadas para a construção de interfaces

em linguagem natural.

O artigo-base desses dados informa que a maioria das pesquisas atuais

propõe trabalhar em modelos que se situem em um nível intermediário entre as

gramáticas livres de contexto e as sensíveis ao contexto, aliando boa capacidade de

representação, incluindo construções que permitam modelar dependências, e um

modelo computacional viável.

Com relação à gramática, ainda, Othero & Menuzzi (2005:44) alertam para

fato de que

a maioria das versões recentes do Prolog vem equipada com uma

extensão nocional conhecida como DCG, ou Gramática de Cláusula

Definida (do inglês Definite Clause Grammar), que facilita a

implementação de regras formais de parsing. A DCG é um

formalismo de representação de gramáticas livres de contexto.

Ela torna muito mais fácil implementar uma gramática e desenvolver um

parser em Prolog, já que “uma gramática descrita em uma DCG é diretamente

executada pelo Prolog com um analisador sintático” (Bratko, 1997:431, apud Othero

& Menuzzi, idem).

Prolog - PROgramming in LOGic - é uma linguagem de programação

baseada na lógica. Ao contrário da maioria das linguagens de programação, que

são de natureza “procedural”, o Prolog é uma linguagem “declarativa”, conforme

ensinam Othero & Menuzzi (2005:42).

(...) outras linguagens de programação, como o Basic e o Pascal,

apresentam ao computador uma solução para um problema na

forma de uma série de instruções para que a máquina as execute

estritamente na ordem em que foram especificadas.

Programar com Prolog (...) deve ser declarativo, um programa deve

simplesmente ser o enunciado do problema. A maneira como o

problema é solucionado e a seqüência de instruções por que o

computador deve passar para resolvê-lo são decididas pelo

sistema. (McDonald & Yazdani, 1990:ix, apud Othero & Menuzzi,

2005:44)

Porém, mesmo após todas essas informações do mundo computacional,

como entender o processo de criação de uma gramática eletrônica? A obra que nos

tem servido como base primeira, para este capítulo, escrita por Gabriel Othero e

Sérgio Menuzzi, trata justamente desse ponto. Eles ensinam como desenvolver um

aplicativo computacional para o tratamento da linguagem natural, com exemplo de

uma aplicação prática de conhecimentos da sintaxe no desenvolvimento de um

sistema de análise das frases do português – um “parser sintático” programado em

linguagem Prolog. (Vide definição de parser por Othero & Menuzzi disposta no final

do subcapítulo 2.1).

Othero & Menuzzi simulam a criação de um parser para o reconhecimento

automático de sentenças em língua portuguesa. Um parser que deverá reconhecer

as sentenças gramaticais – e somente elas – e atribuir-lhes uma estrutura de

constituintes.

Não é possível, aqui, naturalmente, reproduzir o passo-a-passo dos

procedimentos que os autores ensinam, pois envolvem teorias e metodologias

diversas, tornando-se inviável uma demonstração fiel. Contudo, decidimos resumir

algumas das várias etapas que constituem o trabalho, apenas para que se tenha

uma idéia, mesmo que distante, de como uma gramática “se forma no interior de

uma máquina”.

• começa com o reconhecimento e distinção de frases consideradas

gramaticais/agramaticais;

• faz representações delas em diagramas arbóreos (com divisão das

frases em “blocos”, ou sintagmas, até os itens lexicais);

• pode ter que realizar diferentes “testes” para identificar um

constituinte/sintagma (testes de coordenação, interpolação, anáfora,

entre outros);

• nas regras de reescrita (ou regras sintagmáticas) utiliza-se dos

símbolos usados por Chomsky (S,SN, SV, Det., N, V), e são elas que

validam as sentenças;

• há, ainda, as regras de inserção lexical, as responsáveis por introduzir

as palavras abaixo de cada símbolo respectivo. Obs.: Essas regras (de

reescrever e de inserção) são chamadas de gerativas, pois elas geram

sentenças gramaticais a partir de instruções precisas e explícitas. Após

a aplicação dessas regras, obtém-se a estrutura de uma frase válida, ou

gramatical na língua definida pela gramática escolhida;

• finalmente é estruturada a árvore sintática da frase a partir das regras,

trabalhando como um parser top-down (que constrói uma sentença a

partir de seu topo, até chegar ao nível das palavras);

Os autores ressalvam, porém, que “é sabido que a gramática sintagmática

apresenta uma série de limitações e precisa ser enriquecida com recursos

adicionais” (idem:64). Isso se deve ao fato de a gramática criada poder gerar

também sentenças claramente agramaticais, principalmente se algumas palavras

forem expandidas para outra categoria. Por isso, no exemplo que dão, eles

precisam adicionar alguns recursos às regras sintagmáticas e trabalhar com a

descrição e classificação do léxico para implementar o tipo de gramática na

linguagem Prolog.

Como, na maioria dos casos, o Prolog está tentando descobrir se uma

afirmação é verdadeira ou falsa, ou está tentando encontrar alguma combinação de

variáveis que torne uma afirmação verdadeira, para executar um programa em

Prolog é preciso fazer uma consulta à sua base de dados. “E uma consulta nada

mais é do que uma chamada de uma cláusula do programa, equivalendo a uma

solicitação para provar se o que pedimos é verdadeiro de acordo com a base de

dados do programa “ (ibid: 66).

Há basicamente dois tipos de perguntas que podemos fazer ao Prolog:

perguntas sim/não (envolvendo respostas sim ou não), e perguntas QU (wh-

questions en inglês, envolvendo pronomes interrogativos: quem, qual, quando, onde

etc.).

Voltando à criação do parser, começa, então, a etapa de escrever um

programa, que deve ser aberto em um editor de textos, como o bloco de notas,

presente em todas as versões do MS Windows disponíveis no mercado. É no editor

que serão desenvolvidos os programas que mais tarde serão rodados na plataforma

do Prolog. Tudo deve ser escrito em letras minúsculas e sempre haver um ponto

final no fim de cada linha. As letras maiúsculas serão usadas para as variáveis.

Como exemplo de um programa simples, Othero e Menuzzi (2005:67) dão o

seguinte:

Sócrates é homem.

O homem é mortal.

Em notação Prolog, deve-se escrever:

homem(socrates).

mortal(X) :- homem(X).

Em PROLOG Em PORTUGUÊS

homem(socrates). Sócrates é homem.

mortal(X) :- homem(X). O homem é mortal.

Tradução – PROLOG x PORTUGUÊS

A primeira premissa (homem(socrates).) é chamada em Prolog de fato. Os

fatos são regras que, de certa forma, se auto-satisfazem, ou seja, são dados

sempre verdadeiros, nunca apresentando variáveis. A segunda premissa (mortal(X)

:- homem(X).) é uma regra em Prolog: ela apresenta uma variável e uma relação de

condicionalidade, expressa pelo operador “:-“ . Ao contrário dos fatos, as regras

consistem sempre de duas partes: a cabeça e o corpo:

mortal(X) :- homem(X)

Cabeça Corpo

Para que a cabeça da regra seja verdadeira, as condições expressas em seu

corpo devem ser satisfeitas. A interpretação de uma regra desse estilo é bastante

simples:

a :- b. “a” é verdadeiro se “b” é verdadeiro

a :- b, c, d. “a” é verdadeiro se “b”, “c” e “d” forem verdadeiros

E, então, depois desse processo (extremamente resumido e simplificado,

aqui), o programador utiliza-se do recurso de DCG (já conceituado anteriormente).

Com esse recurso, as regras de reescrita podem ser convertidas de maneira

bastante simples e transparente para a notação em Prolog. “Grosso modo, a DCG

pode ser entendida como um recurso que torna mais fácil ao lingüista a

implementação de regras sintagmáticas em Prolog”. (Othero e Menuzzi, 2005:77)

Em resumo, para o desenvolvimento de uma gramática em Prolog, deve-se:

a) implementar regras sintagmáticas relativas à descrição sintática do português

(por exemplo, a regra: S SN SV); b) a partir dessa regra, elaborar outras para o

SN e para o SV, ou conferir o que consta na literatura pertinente. (Exemplo:

SN Det N; SV V SN; c) implementar itens lexicais (Exemplo: Det o,a:

N João, Maria; V ama; d) implementar na gramática do parser algumas

regras consagradas na literatura; e) a partir delas, pode-se usar exemplos

apresentados na literatura que servem para ilustrar ou testar a regra; f) por último,

trabalhar com as dificuldades encontradas para implementar uma regra em Prolog

da melhor maneira possível.

Os autores consultados deixam claro que há diferentes maneiras de se

trabalhar com parsers sintáticos, e diversas têm sido as alternativas de

desenvolvimento de ferramentas de linguagem natural que tratem da sintaxe de

uma língua.

Esperamos ter conseguido aclarar um pouco o que seja uma linguagem de

programação, principalmente no que concerne ao desenvolvimento de uma

gramática, que é um dos principais aspectos que nos interessam neste trabalho.

2.3 - O Revisor Gramatical Eletrônico

A maneira mais simples e rápida de escrever corretamente. Com o Revisor

Gramatical você revisa os seus textos corrigindo erros de concordância verbal e

nominal, erros de ortografia, acentuação, conjugação de verbos, colocação de

pronomes, dúvidas do dia-a-dia e muito mais! Também apresenta regras

gramaticais que esclarecem suas dúvidas, otimizando o seu trabalho.

O excerto acima faz parte de um texto on-line [www.amigomouse.com.br], na

seção de oferta de compra de produtos de informática. Achamos apropriado

utilizarmo-nos dessa propaganda para começar este capítulo, pois há informações

interessantes, muitas, talvez, não do conhecimento da maioria dos usuários de

computador. Deixando de lado o objetivo de publicidade que o texto tem, vamos

apresentar essas informações porque elas nos servirão, mais além, para provar

nossa tese de que os revisores ainda precisam ser melhorados, e muito, em vários

aspectos. Como principais características do Revisor Gramatical, aparecem:

• Possui um dicionário ortográfico com mais de 2 milhões de palavras na

língua portuguesa;

• Revisa a gramática e a ortografia;

• Possui explicação gramatical dos erros encontrados (para todo erro

gramatical encontrado pelo Revisor, basta clicar no botão “Ajuda”, que o

mesmo apresenta as regras gramaticais.);

• Acentuador automático (reconhece palavras de uma única grafia

acentuadas incorretamente e, automaticamente, corrige a acentuação,

facilitando e agilizando o processo de correção ortográfica.);

• Informa a existência de palavras homógrafas (as palavras homógrafas

perfeitas se escrevem e se pronunciam da mesma forma. As

homógrafas imperfeitas diferenciam-se entre si por um detalhe apenas

(a acentuação, por exemplo). O Revisor Gramatical aponta as palavras

que têm homógrafas imperfeitas para que se possa conferir se seu uso

está correto.);

• Corretor automático inteligente (durante a digitação, se o usuário

cometer o mesmo erro ortográfico por 03 (três) vezes num mesmo

documento, o Revisor Gramatical permite ao usuário inserir este erro no

Dicionário Inteligente. Depois de inserto, o Revisor irá corrigir o erro

automaticamente, agilizando a correção.);

• Conjugador verbal (conjuga verbos em todos os tempos e modos da

língua portuguesa de modo simples e fácil. Reconhece inclusive verbos

impessoais como “chover”, “ventar”, etc., destacando as formas mais

usuais).

Este Revisor anunciado serve para aplicativos como Microsoft Word

Compatíveis, Microsoft Word 2000 (Português/Inglês) versão 9.0, Microsoft Word 97

(Português/Inglês) versão 8.0 e Microsoft Word 95 (Português/Inglês) versão 7.0.

Como requisitos mínimos de funcionamento precisa de um PC 486 ou superior, 16

MB de RAM, 2 MB de espaço livre no disco rígido, drive de CD-ROM, Windows 95

ou superior previamente instalado, rede: NT & Novell.

Decidimos testar partes dele, apenas para servir como exemplos de sua

funcionalidade efetiva.

A palavra “conjugador”, por exemplo, que aparece no último item das

características do Revisor, não faz parte dos 2 milhões do dicionário do mesmo, e

aparece sublinhada em vermelho. O mesmo ocorre com a palavra “acentuador”, no

4º item. A sugestão de ortografia correta para “conjugador” encontra-se na tela 1,

copiada na página seguinte. Estas, então, são palavras que precisaríamos

acrescentar ao dicionário do nosso PC.

Com relação ao reconhecimento das homógrafas imperfeitas (da forma como

apresentado neste texto), como por exemplo, “Ela esta bem.” e “Ela está bem.” , o

revisor gramatical do computador que estamos utilizando não apontou nenhum

problema, tanto com uma como com a outra forma. Assim, se não soubermos que a

primeira frase torna-se inadequada, sem o acento em “esta”, também não teremos

como o saber, pois o revisor não nos avisa disso. Em “Ele para, olha e fica

pensando...” e “Ele para mim é um anjo.” , também não há manifestação contrária

por parte do revisor quanto à acentuação que deveria existir no verbo “para” na

primeira frase. Em: “Fizeram boa viajem?”, pensamos que o revisor distinguiria o

verbo “viajem” do substantivo “viagem”. Isso não aconteceu. Ele sublinhou em verde

“fizeram boa” e sugeriu o que aparece na tela 2. Concluindo: o revisor NÂO aponta

as homógrafas imperfeitas para conferência de sua correção.

Quanto ao reconhecimento e correção automática, por parte do revisor, de

palavras de grafia única acentuadas incorretamente, em alguns casos isso se

mostra verdadeiro, em outros, não. Vejamos:

“Vocé”, digitada propositalmente por nós, foi realmente corrigida

imediatamente, aparecendo “Você”. Se se utilizar a tecla F7 (ortografia e gramática),

a sugestão de grafia “Você” aparecerá. Mas quando digitamos a palavra “pêrola”,

ele apresentou 25 sugestões de escritura de diferentes palavras, mas não a grafia

“pérola” .(Vide tela 3.)

Tela 1

Tela 2

Tela 3

O teste agora é da conjugação de verbos em todos os tempos e modos,

inclusive os impessoais. Somente alguns exemplos:

“Chove chuva, chove sem parar...”

“Amaram-no mais que tudo neste mundo.”

“Fazer silêncio, por favor.”

Mas, em:

“(...) Se me ainda amas, por amor não ames:

Trairias-me comigo.”

(Já sobre a fronte – Poesia Completa. Ricardo Reis/Fernando Pessoa)

Tela 4

A ênclise na forma verbal “trairias-me” não foi reconhecida como correta pelo

revisor, que apresentou a sugestão de ortografia conforme tela acima.

Por pura curiosidade, decidimos reescrever o trecho não aceito antepondo o

pronome oblíquo ao verbo, e o revisor, após mostrar a sublinha verde, manifestou-

se assim:

Se me ainda amas, por amor não ames:

Me trairias comigo.

Tela 5

Como se pôde perceber até agora, o revisor gramatical tem lá seus humores.

Não são de admirar, então, as inúmeras reclamações dos mais diversos tipos de

usuários quando se utilizam do editor de textos do Word e pedem “ajuda” ao revisor

eletrônico para verificar a correção de seus textos. Algumas sugestões do revisor

tornam-se engraçadas, porque completamente ilógicas para qualquer falante

razoável da língua portuguesa.

Dílson Catarino, professor, em um de seus textos de dicas de gramática no

site do uol/vestibulares, quando mostra como se deve usar os pronomes

demonstrativos em textos, faz a seguinte advertência: Somente mais um

comentário, sem ligação alguma com os estudos de hoje: ao escrever um texto em

seu computador, nunca confie no corretor do Word, pois ele apresenta falhas

clamorosas. E cita como exemplo, uma das frases do próprio texto que ele

escreveu naquele dia.:

Onde escrevi: Não se deve andar com os vidros do automóvel

abertos nas grandes cidades brasileiras, o sinistro Word diz: Não

se deve andar com os vidros do automóvel aberto nas grandes

cidades brasileira ou Não se deve andar com os vidros dos

automóveis abertos nas grandes cidades brasileiros. (grifos do

autor)

E termina com um desabafo revoltado:

Que é isso, meu santo protetor dos professores de Português?!

Como deixam acontecer isso? Será que nossa Língua é tão

desprezada assim? Será que nenhum dos nossos ilustres imortais

usa computador? Ou será que eles escrevem como o Word quer?

Quanto à “acusação” aos imortais não podemos nos pronunciar, uma vez que

não dispomos de informações confiáveis de que eles se comportem ou não como

supõe o autor acima.

Quanto à reclamação do referido professor, redigitamos a frase mencionada

e acionamos a tecla F7. O revisor nada acusou. Porém, este é um dado sobre o

qual já alertamos anteriormente: a configuração de cada computador pessoal

interfere quanto às manifestações do revisor eletrônico, seja o ortográfico, seja o

gramatical. Acreditamos que o PC de Catarino não dispunha, à época, da mesma

configuração deste que estamos utilizando agora.

Quanto à confiança cega que alguns usuários depositam no revisor

eletrônico, o Jornal do Brasil publicou matéria, em 27/09/2001, cujo título era

Viciados em F7. (Imediatamente o revisor sublinhou em verde o título. A tela com a

sugestão ortográfica e a explicação gramatical está mais à frente). O articulista

começa explicando o que é a tecla F7 e diz que

Para quem se garante nos quesitos ortografia e gramática, o

corretor automático é um chato que fica sublinhando, em verde ou

vermelho (conforme o caso), nomes de pessoas, palavras que não

estão no dicionário e erros que não existem – como segue regras

rígidas, muitas vezes ele aponta como erro formas que na verdade

são opcionais ou licenças poéticas.

Mais adiante, o texto fala sobre a tábua de salvação que é a tecla F7 para os

não “tão craques” em português, impedindo que não sejam entregues trabalhos

repletos de “erros ortográficos constrangedores”, uma vez que os possíveis erros

são apontados pelo revisor, que oferece soluções para os problemas. Afirma o JB,

Assim, formou-se uma verdadeira legião de viciados em F7.

Indiferentes à discussão sobre qual é o melhor dicionário, eles

dispensam cuidados ao digitar e não se preocupam com a

ortografia. O relaxamento pode chegar a tal ponto de a pessoa

repetir o mesmo erro diversas vezes, ignorando a possibilidade de

aprender a grafia correta.

O artigo termina com uma fala do exemplo citado pelo jornal, um “ex-

dependente” nas palavras do articulista, e que hoje tira suas dúvidas no dicionário,

em vez de continuar confiando apenas no corretor eletrônico: O mercado de

trabalho exige que se escreva corretamente, e eu pretendo acompanhar o mercado.

Tela relativa à página anterior. O revisor considera inadequada a concordância feita no

título.

Como era de se esperar, o artigo no Jornal do Brasil suscitou respostas em

defesa do uso do revisor eletrônico. Duas leitoras de Belo Horizonte, Carla Viana

Coscarelli e Else Martins, enviaram carta ao jornal, intitulada Viciados em F7?

Nossa resposta ao JB (27/09/2001), que foi publicada em outubro de 2001. Assim

começa o texto:

A informática entrou em nossa vida – isso não tem retorno - e sua

influência na escrita é inevitável. De pouco adianta torcer o nariz ou

fechar os olhos para as conseqüências que o uso do teclado e dos

programas de texto provocam na escrita das pessoas. Necessário

se faz estudar essas modificações e, sem pré-conceitos, analisar

até onde isso é bom ou não. (...) A crítica que mais se faz ao uso

dos corretores de texto e das comunicações sincrônicas (chats) e

assincrônicas (e-mail) é o fato de que eles levam o indivíduo a

escrever errado. No primeiro caso, inclusive, dizem até que “vicia”!

As autoras da resposta ao JB defendem que é preciso entender que alguns

aspectos da escrita merecem mais atenção do que ortografia e separação de

sílabas, entre outras “questões menores”, na visão delas. Afirmam que língua não

se resume a ortografia. Há muito além disso, a sintaxe, a semântica, a textualidade,

os fatores pragmáticos, a discursividade, e ninguém discute isso na imprensa. A

ortografia é sempre a grande vedete. O que elas propõem é a desnecessidade de

perder tempo com questões ortográficas, e deixar sua resolução por conta do

corretor ortográfico. Acreditam que quanto menos tivermos de nos preocupar com

isso no momento da criação, melhor, pois sobrará tempo e recursos cognitivos para

as atividades de planejamento e organização das idéias no texto, para escolher

melhor os recursos lingüísticos a serem usados e as estratégias textuais que melhor

seduzirão o leitor. (sic)

Acrescentam ainda, as duas leitoras, que não há programa de computador

que consiga substituir as escolhas semânticas e estruturas frasais de cada produtor.

Além disso, pelo fato de seguir normas rígidas, o recurso de correção sintática e

ortográfica não exclui a participação do usuário: Apareceu o risquinho verde no texto

e, imediatamente, vai-se verificar o que está acontecendo, que tipo de correção é

sugerida. Apareceu o risquinho vermelho e vai-se verificar o erro ortográfico

cometido.

E concluem, em sua resposta:

Que diferença faz tirar dúvidas no dicionário de papel ou no

eletrônico? Muita. Enquanto o rapaz do nosso exemplo está a

consultar um dicionário, o colega ao lado já analisou e aceitou ou

não a correção proposta e produziu infinitamente mais. (...) o texto

produzido em computador vai aos poucos instalando um texto novo,

criativo, ágil e que exige um leitor que domine os recursos de

produção desse texto, para melhor entendê-lo.

À parte acusações ou defesas, o corretor eletrônico permanece impassível

diante de tudo isso. As considerações anteriores, sobre os textos publicados no

Jornal do Brasil, foram feitas no intuito de servirem de exemplos, dentre os tantos

encontrados por nós, principalmente na Internet, das opiniões favoráveis ou

contrárias ao uso do revisor eletrônico do Word.

Hélio Consolaro, professor de português e coordenador do site

www.portrasdasletras.com.br, num artigo intitulado “Revisor do Word”, afirma que

“Os limites do revisor são dois: a qualidade do conhecimento lingüístico de quem

abasteceu o seu léxico (o dicionário) e a limitação do programa”. E continua:

As nuanças de concordância, regência. Exemplo: Juliana era as

esperanças do time. O revisor aponta erro de concordância, porque

não distingue que Juliana se trata de nome de pessoa, nesse caso

o verbo SER concorda com ele.

Grifamos, em verde, o que estava sublinhado pelo corretor, na citação acima,

para comprovar a afirmação de Consolaro.

Tela 6

Mais uma surpresa: a sugestão vem na forma de “era as esperança”,

concordando “esperança”, provavelmente, com “do time”, termo subseqüente, mais

próximo. Quando digitada a frase “era as esperança”, o corretor permaneceu em

silêncio.

Consolaro, como tantos outros, não necessariamente professores de

português apenas, aconselha levar a sério os apontamentos que o Word apresenta,

verificando se há razão ou não dos mesmos estarem sendo feitos, não deixando de

pesquisar em gramáticas ou dicionários quando houver dúvidas. E termina o

conselho com uma advertência: “Erra mais quem tem muita certeza”.

2.3.1 Como “nasceu” o Revisor

Não nos foi fácil, nem rápido, conseguir informações sobre a criação e os

criadores do revisor gramatical do Word, mesmo tendo a Internet e o site da

Microsoft à nossa disposição. Os e-mails enviados, solicitando ajuda, ficaram sem

respostas.

Tínhamos, em mãos, um único texto - um artigo de divulgação - encontrado

num site e que falava sobre um revisor gramatical chamado ReGra, da Itautec.

Porém, como ignorávamos completamente o significado do ícone da Itautec-Philco,

que vem, conforme a configuração de algumas máquinas, na tela de iniciação do

computador, não conseguíamos aliar uma coisa à outra. Após inúmeras buscas,

conseguimos encontrar uma fonte fidedigna sobre a origem do revisor que temos

em nossas máquinas de sistema do Windows: um texto escrito pelos próprios

pesquisadores/criadores do ReGra, conseguido via Internet, e apresentado em São

Paulo, em 2002, num encontro de Estudos Lingüísticos.

Restou-nos, dessa forma, trabalhar com apenas duas fontes e a impressão de

que não há dados suficientes e satisfatórios para compor esse subcapítulo. No

entanto, disponibilizaremos o que conseguimos mesmo correndo o risco de serem

insuficientes as informações sobre como surgiu o revisor que utilizamos

rotineiramente.

No site http://inventabrasilnet.t5.com.br/revgram.htm

há um artigo intitulado

Revisor Gramatical falando sobre a Itautec, empresa brasileira de computadores e

softwares, que precisou desenvolver, em 1993, um revisor ortográfico para um

processador de texto utilizado nos computadores fabricados por ela. A empresa

procurou o Núcleo Interinstitucional de Lingüística Computacional (NILC), formado

por pesquisadores dos Institutos de Ciências Matemáticas e de Computação e de

Física da USP de São Carlos e da Faculdade de Letras da Universidade Paulista

(Unesp), de Araraquara.

Esse grupo, composto de alunos e professores, pesquisava, à época, um

software de processamento da língua portuguesa. A Itautec-Philco, que já possuía

um revisor ortográfico de textos, interessou-se pela pesquisa, pois pretendia

aprimorar seu revisor ortográfico, incluindo um revisor gramatical capaz de detectar

e corrigir erros de concordância e de regência verbal e nominal, entre outros.

Em 1994, Maria das Graças Volpe Nunes, pesquisadora-responsável pelo

NILC, e seus colaboradores apresentaram o Revisor Gramatical Automático para o

Português. A princípio, o revisor deveria apenas se preocupar com os erros mais

comuns das secretárias, devido ao perfil corporativo dos clientes Itautec-Philco, mas

o produto acabou posteriormente incorporado ao Word da Microsoft.

O projeto foi aprovado no PITE, em 1996, e contou também com a

colaboração dos professores Cláudio Lucchesi, Tomas Kowaltowski e Jorge Stolfi,

do Instituto de Computação da Unicamp. Em São Carlos, sob a coordenação da

professora Maria das Graças Volpe Nunes, foram desenhados os algoritmos e

formado o banco de base de palavras e, em Campinas, desenvolveu-se a

compactação do sistema e a diminuição do tempo de resposta do programa.

Em 1997, a empresa começou a vender, no varejo, a primeira versão do

revisor gráfico e gramatical, em caixas próprias, como um produto de prateleira. No

final desse ano, a Microsoft procurou a empresa para incorporar o revisor no

programa Office, o mais vendido no Brasil e em todo o mundo. O antigo revisor

criado em Portugal para a língua portuguesa comportava 200 mil palavras; o da

Itautec já dispunha de 1,5 milhão de palavras. O revisor foi incorporado ao Office

2000. A empresa brasileira licenciou o produto por um período de três anos e, pelo

trabalho desenvolvido, o professor Lucchesi recebeu o Prêmio Santista de

Informática, em 1999.

Anunciava o artigo:

Com as funções de revisão licenciadas, o usuário de qualquer um

dos aplicativos que compõem o Microsoft Office poderá ter seus

erros gramaticais e ortográficos corrigidos automaticamente, desde

erros de concordância verbal, uso de crase, regência, colocação

pronominal até a grafia correta das palavras em português. Além de

todos esses recursos, o Microsoft Office contará também com um

dicionário de sinônimos e antônimos (thesaurus), como recurso

extra de consulta. As demais funções do Revisor Word não

licenciadas pela Microsoft continuarão a ser comercializadas

pela Itautec sob o nome de Revisor Plus. Constarão do Revisor

Plus os recursos de conjugação de verbos, consulta à gramática da

língua portuguesa, acentuação automática de documentos, consulta

a verbetes semelhantes, dicas sobre erros mais freqüentes,

consulta a brocardos jurídicos e dicionários português/português,

português/inglês e inglês/português. Também farão parte do

produto dicionários temáticos nas áreas de Medicina, Direito,

Administração e Informática. O Revisor Plus estará disponível para

comercialização simultaneamente com o lançamento da próxima

versão do Microsoft Office em português. (grifo nosso)

Afirma o artigo ainda que, apesar de as pesquisas em processamento de

linguagem natural (PLN) de português terem se iniciado muito antes da década de

1990, praticamente nada havia sido feito que visasse à criação de uma ferramenta

robusta e de uso genérico requerendo recursos lingüísticos e computacionais de

grande monta.

O PLN trata do processamento envolvendo análise, interpretação e produção

de uma linguagem humana por uma máquina, sendo uma área da inteligência

artificial voltada para os estudos e desenvolvimento de sistemas que permitam

interpretar e gerar linguagem natural. “O processamento de linguagem natural

ainda é coisa nova. (...) Além das limitações do PLN, tínhamos o limite da falta de

experiência em produção de produtos comerciais”, afirma Maria das Graças Volpe

Nunes, no citado artigo.

O sistema de correção gramatical foi chamado de ReGra, não incluindo as

rotinas para detecção de erros ortográficos, embora a base lexical que suporta o

corretor ortográfico tenha sido compilada para o projeto de correção gramatical.

O ReGra é constituído por três módulos principais:

i) o módulo estatístico – realiza uma série de cálculos, fornecendo parâmetros

físicos de um texto sob análise, com o número total de parágrafos, de sentenças, de

palavras, de caracteres, etc.

O componente mais importante desse módulo, entretanto, é o que

fornece o “índice de legibilidade”, uma indicação do grau de

dificuldade da leitura do texto. O conceito de índice de legibilidade

surgiu a partir do trabalho de Flesch, de 1948, para a língua inglesa

e busca uma correlação entre tamanhos médios de palavras e

sentenças e a facilidade de leitura. Não inclui aspectos de

compreensão do texto, que requereriam tratamento de mecanismos

complexos de natureza lingüística, cognitiva e pragmática. O índice

Flesch, assim como outros similares, tem sido empregado para uma

grande variedade de línguas, mas o trabalho do NILC foi o primeiro

para o português. Através de um estudo comparativo de textos

originais em inglês e traduzidos para o português, verificou-se que a

equação que fornece o índice Flesch precisaria ter seus parâmetros

adaptados para o português, pois as palavras desta língua são em

média mais longas, em termos de número de sílabas, do que em

inglês. (artigo supra)

ii) o módulo mecânico – detecta erros facilmente identificáveis que não são

percebidos por um corretor ortográfico, como, por exemplo, palavras e símbolos de

pontuação repetidos; presença de símbolos de pontuação isolados; uso não

balanceado de símbolos delimitadores, como parênteses e aspas; capitalização

inadequada, como o início da sentença com letra minúscula; e ausência de

pontuação no final da sentença.

iii) o módulo gramatical – contém mais de dez mil regras de correção, realiza

inclusive a análise sintática automática das sentenças. As regras foram testadas em

textos reais não corrigidos, como cartas comerciais, redações de vestibulares e

teses, e em textos editados, como os de livros e revistas. O banco de textos

empregado nestes testes contém mais de 37 milhões de palavras. A última versão

(não se pode saber com certeza qual é, pois não há sua datação) conta ainda com

uma minigramática eletrônica, disponível ao usuário através de hipertexto, que

explica as principais regras gramaticais da língua portuguesa. Possui também um

dicionário de sinônimos e antônimos.

Dizem os pesquisadores do NILC que o primeiro passo para a elaboração do

módulo gramatical foi o levantamento de erros (ou inadequações) mais comuns

entre usuários de nível médio, como secretárias e profissionais de escritório em

geral, e alunos cursando o ensino médio ou ingressando na universidade. O termo

“erro”, aqui, frisam eles, refere-se ao que os gramáticos normativos consideram

como forma desviante da norma culta.

Cita o artigo que

Nas primeiras versões do ReGra, os erros eram detectados através

de regras heurísticas implementadas na forma de redes de

transição estendidas (augmented transition networks), numa

abordagem que se poderia chamar de “error-driven”. As primeiras

versões do ReGra apresentavam vários benefícios do ponto de

vista da implementação computacional: agilidade, especificidade,

rapidez, portabilidade, e disponibilidade de memória. Entretanto,

seu escopo de atuação era muito limitado: problemas envolvendo

itens lexicais não contíguos e estruturas recursivas não podem ser

atingidos pelas estratégias heurísticas normalmente desenhadas

por abordagens error-driven. Para prover a essas insuficiências,

optou-se por analisar sintaticamente as sentenças do usuário, antes

de operar a revisão propriamente dita. Isso permite aplicar regras

que apontam desvios nas relações entre núcleos e adjuntos, entre

núcleos e modificadores, entre regentes e regidos. A realização de

análise sintática automática obviamente requer que todos os itens

lexicais estejam categorizados apropriadamente. Para tanto,

realizou-se em paralelo a construção do léxico, que envolveu a

compilação exaustiva das palavras da língua portuguesa e a

hierarquização das categorias dos itens lexicais morfologicamente

ambíguos. Uma vez que alguns erros em contextos lingüísticos

específicos ocorrem independentemente de desvios sintáticos, na

versão atual do ReGra convivem as duas abordagens mencionadas

acima. Ou seja, além de realizar análise sintática automática,

muitas das regras heurísticas da primeira versão foram mantidas,

como as de correção de erros de crase.

Mas a professora Maria das Graças Volpe Nunes faz questão de lembrar que,

devido às ambigüidades semânticas e sintáticas da língua portuguesa, o software

nunca estará completo: “Uma única palavra pode apresentar distintos significados,

pertencendo ou não à mesma classe gramatical. Para conhecer a função e posição

gramatical correta, é necessário saber o que determinada palavra significa em cada

situação”.

Até aqui, trabalhamos com os dados do material que mencionamos como o

primeiro em mãos. A partir de agora, completaremos esses dados com o trabalho

disponibilizado pelo NILC – Núcleo Interinstitucional de Lingüística Computacional

de São Carlos -, encontrado no site www.dc.ufscar.br. , que foi escrito pelos próprios

pesquisadores do ReGra e apresentado em um encontro de Estudos Lingüísticos

em São Paulo, 2002.

Segundo eles, a construção de revisores gramaticais automáticos, embora

seja uma área bem consolidada na Lingüística Computacional atualmente, é uma

tarefa complexa, “dependente de restrições severas de robustez (para contemplar

tarefas em tempo real) e abrangência (para servir a qualquer tipo de requisição)”. As

principais razões dessa complexidade provêm, na fala dos autores:

a) da necessidade de se representar eletronicamente grandes

repositórios de informações lingüísticas (léxicas, sintáticas,

semânticas e/ou pragmáticas) e b) da incorporação de processos

computacionais que dêem conta, sistemática e eficientemente, das

principais características do problema em foco. Considerando-se,

em particular, o contexto de processamento automático do

português, ela se reveste de importância maior, devido à escassez

de ferramentas computacionais

Ressalvam, ainda, que o ReGra tem algumas premissas fundamentais,

transcritas aqui:

a) seus usuários-alvo são indivíduos com suposta proficiência no português

em nível secundário ou superior;

b) seu objeto de análise são textos prosaicos com predomínio da função

referencial da linguagem; e

c) seu objetivo é a identificação de desvios à disciplina gramatical da língua

portuguesa, ainda que esses desvios possam vir a representar hipóteses

significativas do usuário em relação à linguagem e possam constituir, na

variedade lingüística do usuário, estruturas admissíveis.

Quanto à arquitetura do ReGra, atualmente (a. 2002 (?)) ele dispõe dos

seguintes recursos operacionais, conforme disponibilizado no artigo em questão:

1) um léxico, com mais de um milhão e meio de formas do português;

2) um conjunto de regras de desambigüização lexical;

3) um verificador mecânico, constituído de um conjunto de regras para

identificação de problemas de digitação (excesso de espaços em branco,

balanceamento de delimitadores, etc.) e de seu correspondente

aconselhador mecânico;

4) um verificador ortográfico, constituído dos correspondentes conjunto de

regras e aconselhador, o qual sugere as formas lexicalizadas próximas

daquelas não constantes do léxico;

5) um verificador gramatical, constituído de: a) uma gramática com mais de

600 regras de reescrita que contemplam a maior parte das possibilidades

sintáticas de períodos simples do português; b) um parser, ou analisador

sintático automático, capaz de derivar representações

arbóreas(hierárquicas) a partir de listas de palavras do português,

segundo as estruturas previstas na gramática; c) um conjunto de regras

de verificação gramatical, subdivididas em distribucionais (com a

consideração dos contextos mínimos, à esquerda e à direita) e estruturais

(dependentes da identificação das funções sintáticas); d) um

aconselhador gramatical, capaz de sugerir correspondentes corretos para

formas ou estruturas consideradas inadequadas e e) um conjunto de

mensagens de revisão, associada aos padrões derivados da verificação

gramatical;

6) uma minigramática, indexada como hipertexto às mensagens de revisão,

para consulta.

Relativamente ao léxico do ReGra, os pesquisadores dizem ser ele um

“repositório de formas lexicais válidas para o português contemporâneo, acrescidas

de informações morfossintáticas e de formas canônicas”. Apresenta-se esse léxico

como “um recurso à revisão gramatical, servindo também de apoio ao módulo

ortográfico, para validar ou rejeitar as construções vocabulares dos usuários”.

Em relação à sua estruturação, o aspecto organizacional para o acesso

automático é que recebe ênfase, não o aspecto morfológico.

Dizem os autores que isso implica o arquivamento exaustivo das formas do

português,

Sem considerar, p.ex., o aproveitamento de sufixos flexionáveis e

derivacionais da língua. Essa organização resultou também no

armazenamento das lexias simples, i.e., das formas de radical único

(p.ex., pé) ou das formas hifenizadas (p.ex., pé-de-moleque),

decisão determinada por questões de compactação do léxico,

operação que, ao menos, por enquanto, rejeita o tratamento de

lexias complexas, tais como as locuções (p.ex., ‘na medida em que’,

‘à distância’) ou palavras compostas (p.ex., ‘boca de urna’, ‘estado

civil’). (...) A definição lexical exaustiva tem, ainda, a desvantagem

de multiplicar as formas homônimas, resultando em extrema

redundância formal do sistema. (...) Por exemplo, informações

gramaticais distintas para uma mesma forma implicam entradas

lexicais diversas (canto¹ [verbo], canto ² [substantivo]).

É preocupação constante do NILC refinar a constituição do léxico do ReGra,

em virtude - para citar uma das razões dessa preocupação - do surgimento de

muitos problemas de registros lexicais serem gerados pela inserção automática de

palavras, “cuja resolução exige um grande esforço humano, altamente

especializado”. Outra razão relevante é o problema da ambigüidade lexical, pois

interfere na eficiência e robustez do ReGra.

As alterações de representação lexical citadas implicam profunda

alteração do modelo representacional adotado, principalmente se

considerarmos a necessidade de associar às palavras sua

caracterização semântica, por si só uma tarefa já altamente

complexa na lingüística computacional e, especialmente, no

contexto de revisão gramatical irrestrita, como é o caso do ReGra.

(...) a revisão do analisador sintático se faz obrigatória.

Quanto à gramática do ReGra, o processo de revisão gramatical se subdivide

em três etapas: a) o pré-processamento da cadeia de entrada, com a etiquetação

dos itens lexicais e a conseqüente desambigüização da informação lexical; b) o

processamento gramatical propriamente dito, com a verificação da correção das

escolhas gramaticais feitas pelo usuário; e c) o pós-processamento sintático, com a

aplicação de procedimentos de aconselhamento gramatical para readequação da

cadeia de entrada aos padrões perseguidos pela ferramenta.

Os resultados de testes comparativos de desempenho do ReGra obtidos pelo

NILC são, segundo os próprios pesquisadores, bastante animadores, haja vista que,

“numa avaliação global, testes de ambos os tipos demonstraram que qualquer

versão do ReGra apresenta um desempenho geral superior aos dos seus

concorrentes.

Conforme informações do NILC, para efeito de análise a atuação do ReGra

foi dividida em quatro categorias de intervenção: verdadeiros negativos (a

ferramenta não deveria intervir e não intervém), verdadeiros positivos (deveria

intervir e intervém), falsos negativos (deveria intervir e não intervém) e falsos

positivos (não deveria intervir mas intervém). Estes testes determinaram que:

a) a revisão gramatical e ortográfica automática é não apenas

possível, mas viável e útil, já que a ferramenta identifica 60,52% dos

problemas praticados pelo usuário (na situação de teste) e se omite

em apenas 17,84% dos casos; b) o preço pago para a identificação

de mais da metade das inadequações praticadas pelo usuário ainda

é alto (o número de falsos positivos ainda é maior do que o número

de verdadeiros positivos) e que as estratégias utilizadas para

reduzir o comportamento inadequado da ferramenta não têm

produzido os efeitos esperados, já que as diferenças entre as várias

versões são bem pouco significativas, se considerado o conjunto de

sentenças que compõem o corpus de teste. Estabelece-se,

portanto, como diretriz futura, mais do que a ampliação do escopo

de atuação da ferramenta (para o incremento de número de erros

identificados), uma revisão mais radical nas regras já existentes,

para que se reduza o número, ainda excessivo, de falsos

positivos. (grifo nosso)

Quanto aos textos, eles são revisados pelo ReGra à taxa de,

aproximadamente, 200 palavras por segundo, o que, segundo seus criadores,

comprova o eficiente desempenho de seu analisador sintático e seus recursos

lingüísticos, disponíveis eletronicamente e muito importantes para o processamento

do português de um modo geral. Contudo,

seu aprimoramento consiste num grande desafio, do ponto de vista

de modelagem, de manipulação automática de informações

lingüísticas e de auxílio a tarefas que o usuário realiza no ambiente

computacional. (...) Basta notar que, em suas últimas cinco versões,

o ReGra avançou apenas 1,04% na redução de intervenções

indevidas e apenas 3,27% na ampliação das intervenções devidas.

(...)o público-alvo do revisor, constituído por usuários do português

brasileiro com nível de escolaridade médio, tem-se revelado

insatisfeito com a restrição do escopo de intervenção do ReGra aos

problemas ortográfico-sintáticos, exigindo a consideração de

problemas de natureza semântico-pragmática, quase sempre

relacionados a níveis maiores do que a oração. É necessário, p.ex.,

que tratemos problemas de estilo, muito mais vinculados ao

propósito da eficácia comunicativa do que ao da adequação à

norma gramatical.

Para uma melhor compreensão de como foi pensado para funcionar o revisor

gramatical, e para complementar as informações disponibilizadas neste subcapítulo,

optamos por reproduzir parte do artigo do NILC que descreve a gramática do

ReGra, o qual dispomos na seção Anexos. Isso se deve ao receio que temos de, ao

tentar explicar o processo por nós mesmos, não conseguirmos fazê-lo corretamente,

visto ser conteúdo completamente novo e complexo para nós.

2.3.2 Como funciona o revisor gramatical do Word

O Word exibe linhas onduladas vermelhas abaixo das palavras que não

constam no dicionário do corretor ortográfico, e linhas verdes abaixo de sentenças

que o corretor considera fora de concordância gramatical ou que tenha duplo

sentido em uma frase. Este estudo somente trabalhará com as linhas onduladas

verdes, uma vez que pesquisará as regras de concordância nominal constantes do

programa.

Para verificar a gramática em um documento, quando se deparar com uma

estrutura frasal sublinhada em verde, o usuário deve selecionar a referida estrutura

e clicar em menu Ferramentas item “Ortografia e gramática” ou, mais rapidamente,

pressionar o atalho da tecla F7.

Exemplo: Os professor não querem dar aula hoje.

Ao se deparar com a tela acima, o usuário tem a oportunidade de verificar

onde ocorreu o erro apontado pelo revisor e proceder à correção sugerida por ele.

Caso haja dúvidas sobre a coerência da(s) sugestão(ões), ou o usuário queira

explicação gramatical para ela(s), deve clicar no botão “Explicar”, e o revisor

oferecerá dicas e regras de concordância consideradas corretas. E a tela

apareceria assim:

Se o usuário clicar em “Alterar”, o programa automaticamente fará a correção

da estrutura frasal de acordo com a sugestão que estiver em destaque (na cor azul).

Por isso, é aconselhável que se preste atenção à qual forma, singular ou plural

(quando aparecerem as duas juntas), que se pretende efetivamente utilizar.

Gostaríamos de chamar a atenção aqui para a tela impressa acima. Apesar

de termos propositalmente concordado “Os professor”, o revisor nos mostra uma

tela não de concordância nominal, mas sim de concordância verbal, com as

explicações dadas para o verbo “querer”, não fazendo menção alguma sobre o

artigo “Os” estar no plural e o substantivo “professor”, no singular. Naturalmente que

alguém, a esta altura, poderia questionar: “E daí? A sugestão de correção está

correta, pouco importa, então, se vêm explicações de concordância verbal ou

nominal.”. Concordamos com a afirmação, porém isso nem sempre ocorre. A

sugestão correta, queremos dizer. Ademais, não podemos nos esquecer daqueles

que não são tão proficientes em gramática e sobre os quais falamos anteriormente.

Naturalmente que eles não perderão tempo com regras gramaticais exibidas por um

revisor gramatical eletrônico – e sabemos que eles não perderiam esse tempo muito

menos com uma gramática impressa -, mas, como já falamos, nem sempre a

sugestão vem de forma correta, ou não vem, pois o corretor não detecta a

incorreção. Se o usuário simplesmente confiar no revisor, pode permanecer no erro,

o que poderá prejudicá-lo seriamente dependendo de para quem se destina seu

texto escrito.

Por exemplo, numa carta, o candidato a um cargo em uma empresa, pode

querer usar como um dos argumentos para ser aceito como funcionário, uma oração

do tipo: “Vim para esta cidade a dois anos e moro há cinco quadras da empresa.”. O

revisor aponta incorreção no primeiro período, e sugere a utilização de “há” no lugar

de “a”, mas não vê nada de errado com o segundo período. Pois bem, a gramática

prescreve que se deve utilizar, com referência a distância, a preposição “a”, e não

“há”. Caso quem vá ler a carta seja um tanto ou quanto rigoroso em relação à

ortografia, pode baixar alguns pontos na avaliação do candidato.

É claro que este exemplo é simplório, mas serve para mostrar que, como já

dito anteriormente, conhecer regras gramaticais básicas para dar conta de uma

situação lingüística é imprescindível. Por isso, é aconselhável não se tornar

totalmente dependente da ajuda nem sempre confiável do revisor.

Vejamos, ainda, o funcionamento do revisor gramatical quando se trata de

parágrafos.

Adoramos quando ele aponta nossos deslizes na escrita, mas ficamos

irritados quando insiste em substituir nossa digitação por outra palavra que não

desejamos, supostamente mais apropriada segundo sua lógica fria. Esse ritmo

calculista dos revisores automáticos também acaba criticado sob a alegação de que

não detectam uma série de problemas de texto que um revisor humano localizaria

facilmente. Antes de dar razão aos críticos, é preciso saber o alcance desses

programas.

(MANOSSO, Radamés. O Software que nos corrige. In: revista Discutindo Língua

Portuguesa. Ano 1, nº 3, 2006.)

A pontuação é algo apontado constantemente pelo revisor eletrônico. Na

maior parte das estruturas com que temos nos deparado, há uma porcentagem

relativamente alta de acertos do revisor, porém quando se trata de um caso como o

exposto na tela acima, a colocação de uma expressão apositiva, fica mais difícil ele

aconselhar corretamente.

Outro exemplo:

No século 19, a questão se tornou bastante popular, e multiplicaram-se

“soluções” que poderíamos chamar de ingênuas, para não dizer inverossímeis.

Todas elas propunham sempre uma origem muito simples para a linguagem

humana e, por nunca considerarem a sua alta complexidade, nada diziam sobre o

mais importante – isto é, como se deu o grande salto do muito simples para o

altamente complexo.

(FARACO, Carlos Alberto. No rastro da fala. In: revista revista Discutindo Língua

Portuguesa. Ano 1, nº 3, 2006.)

Esses exemplos, dentre inúmeros outros, são para demonstrar as limitações

que os revisores ainda carregam. Como dissemos anteriormente, para aqueles que

dominam melhor a escrita, a solução é simplesmente ignorar o revisor quando este

apresenta sugestões incongruentes, mas a preocupação é com aqueles que

confiam no que ele ordena. Uns, por mera insegurança no próprio conhecimento

das regras aprendidas na escola (ou fora dela) e um pouco de resistência em

pesquisar em gramáticas; outros, por ignorância mesmo dessas regras.

Pelo que vimos até agora por meio de testes simples, podemos arriscar,

então, duas hipóteses: primeira, a programação embutida nos revisores eletrônicos

se baseia na gramática normativa tradicional, uma vez que o que eles fazem é o

mesmo que um gramático normativo típico faria diante de um texto; segunda (em

decorrência da primeira), então, os revisores eletrônicos são úteis para revisar

textos escritos segundo a variante culta, mas não são completamente eficientes

para realizar esse trabalho. Muito ainda precisa ser melhorado quanto às regras

contidas nele. Sabemos que a Informática, apesar de seu dinamismo, não consegue

dar conta integralmente da vastidão e dinamismo das línguas naturais.

Capítulo III – A concordância nominal

Conhecer as regras de concordância do padrão culto serve, entre outros fins, como meio de

adequação e interação social.

Cereja & Magalhães

Em Português a concordância consiste em se adaptar a palavra determinante

ao gênero, número e pessoa da palavra determinada. (Bechara, 1999: 543).

A concordância pode ser nominal ou verbal. A concordância nominal é a que

se verifica em gênero e número entre o adjetivo e o pronome (adjetivo), o artigo, o

numeral ou o particípio (palavras determinantes) e o substantivo ou pronome

(palavras determinadas) a que se referem. Já a concordância verbal é a que se

verifica em número e pessoa entre o sujeito (e às vezes o predicativo) e o verbo da

oração.

A concordância pode ser estabelecida de palavra para palavra ou de palavra

para sentido. A concordância de palavra para palavra será total ou parcial (também

chamada atrativa), conforme se leve em conta a totalidade ou o mais próximo das

palavras determinadas numa série de coordenação.

A concordância de palavra para sentido se diz ainda concordância “ad

sensum” ou silepse, ou mais modernamente, concordância ideológica.

No capítulo destinado às Concordâncias Nominal e Verbal, Bechara adverte o

falante para estar atento à liberdade de concordância que a língua portuguesa

muitas vezes oferece. Essa liberdade deve ser cuidadosamente aproveitada para

não prejudicar a clareza da mensagem e a harmonia do estilo.

Na língua oral, em que o fluxo do pensamento corre mais rápido

que a formulação e estruturação da oração, é muito comum

enunciar primeiro o verbo – elemento fulcral da atividade

comunicativa – para depois se seguirem os outros termos

oracionais. Nestas circunstâncias, o falante costuma enunciar o

verbo no singular, porque ainda não pensou no sujeito a quem

atribuirá a função predicativa contida no verbo ; se o sujeito, neste

momento, for pensado como pluralidade, os casos de discordância

serão aí freqüentes. O mesmo ocorre com a concordância nominal,

do particípio. (Bechara, 1999:544).

A língua escrita, formalmente mais elaborada, tem meios de evitar estas

discordâncias.

Cereja & Magalhães (1999:345) afirmam que a concordância nominal (assim

como a verbal) está relacionada com os princípios lógicos da língua e que concordar

adequadamente é demonstrar domínio dos mecanismos básicos de funcionamento

da língua, defendidos pelo padrão culto. Mas alertam que

Se não observamos esses mecanismos durante a interlocução,

ainda assim é possível haver comunicação. Porém, dependendo de

quem é nosso interlocutor, da expectativa que ele tem em relação a

nós ou da impressão que desejamos passar a ele, o desvio das

normas do padrão culto pode frustrar a finalidade da comunicação.

Em certas situações de interação verbal – por exemplo, numa

entrevista para se conseguir um emprego, no preenchimento de

uma ficha, numa carta ou num artigo enviados a um jornal, numa

palestra, etc. -, o desvio reiterado das regras de concordância pode

causar a impressão de baixo nível cultural, pouca leitura, desleixo

em relação à língua e até ser fonte de preconceito.

Conhecer as regras de concordância do padrão culto serve, entre

outros fins, como meio de adequação e interação social.

Segundo Lucchesi (2006:21), “O pecado mortal lingüístico é a falta de

concordância. E isso tem uma única razão: ela é a grande marca da linguagem

popular”.

Para o autor acima, a falta de concordância na fala popular tem razões

históricas, uma vez que, durante os primeiros séculos de sua colonização, o Brasil

foi um país rural, de pequenas cidades costeiras pouco influentes sobre o restante

do território. “Nesses incipientes núcleos urbanos, a elite procurava falar como se

fazia na metrópole portuguesa” (idem:22). Mesmo após a independência do país, o

Português teve que conviver com as variedades da língua tupi faladas pelos povos

indígenas do litoral brasileiro no século XVI. Como se sabe, o tupi, adotado pelos

colonos portugueses e pelos jesuítas na catequese, tornou-se o idioma mais falado

na província de São Paulo até o século 18.

Depois, vieram os escravos africanos, falando centenas de línguas. “Abria-se,

assim, um imenso fosso entre uma elite que se esmerava em reproduzir os padrões

conservadores de Portugal e a língua falada pelo povo: um Português mestiço e

alterado pelo contato entre diferentes línguas” (Lucchesi, 2006:22).

Mas um dos aspectos mais universais das situações de contato

maciço entre línguas é justamente o que mais causa preconceito: a

perda das regras da concordância. Em todas as regiões do planeta

onde ocorreram esses fenômenos (América, África, Ásia ou

Oceania), a língua européia imposta perdeu em algum nível as suas

regras de concordância. (idem)

A partir do final do século 19, com a vinda de aproximadamente 3 milhões de

imigrantes italianos, alemães e japoneses e, posteriormente, com a urbanização da

sociedade brasileira – conseqüência do processo de industrialização do país -, e

com o movimento modernista propondo um resgate radical da cultura popular

brasileira, passa a haver uma valorização da linguagem brasileira com suas

variantes coloquiais.

Apesar de a tradição gramatical brasileira continuar a impingir sobre a

sociedade o modelo do Português europeu, o que gera ainda um forte sentimento

de insegurança lingüística, principalmente nos segmentos escolarizados, “a fala

popular aos poucos vem incorporando – ao contrário do que acontecia – estruturas

da fala culta, em razão da crescente influência dos centros urbanos sobre as demais

regiões do país” (Lucchesi:23).

As opiniões de Lucchesi servem de apoio à análise que pretendemos efetivar

quando falarmos sobre que nível gramatical privilegia o revisor eletrônico do Word.

Ou seja, até que ponto o usuário/redator de um texto no computador encontra

dificuldades por não dominar as regras de concordância contidas na gramática

eletrônica.

Por ser o objeto de estudo deste trabalho, disponibilizamos, a seguir, as

regras de concordância nominal constantes das gramáticas de Napoleão Mendes de

Almeida, Evanildo Bechara e Maria Helena Moura Neves, que foram copiadas,

redigitadas, por nós com o intuito explicado na parte introdutória desta dissertação.

3.1 GRAMÁTICA METÓDICA DA LÍNGUA PORTUGUESA

Napoleão Mendes de Almeida

CONCORDÂNCIA NOMINAL

CONCORDÂNCIA DO ADJETIVO COM O SUBSTANTIVO

REGRA GERAL: O adjetivo, quer adjunto adnominal quer predicativo, quer

anteposto quer posposto, concorda em gênero e número com o substantivo a que

se refere.

Ex.: “Via recolhidas no santuário as tábuas de bronze”.

“Hei de fazer públicos os seus desaforos”.

REGRAS ESPECIAIS

* Se o adjetivo se refere a vários substantivos do singular e do mesmo gênero,

e vem:

1) Posposto – vai, indiferentemente, para o plural e para o gênero dos substantivos

ou fica no singular:

Ex.: “Nessa leitura e escrita tão arrepiadas de dificuldades”.

“Rugido, grito, gemido conglobados num só hiato”.

“... a consciência e a dignidade humanas”.

“Coragem e disciplina digna de granadeiros”

“... rudeza e pusilanimidade alheia”.

Nota – Será de obrigação o singular, quando o adjetivo só se referir ao último

substantivo:

Ex.: “O casaco e o chapéu redondo eram o meu alvará”.

2) Anteposto – concorda com o substantivo mais próximo:

Ex.: “... cujo trajo e gesto indicavam...”

“... notando o estrangeiro modo e uso”

“Chegada a hora e a ocasião”.

Notas: 1ª - Os exemplos de construção no plural não devem ser imitados:

Ex.: “ Desbotadas a cor e a frescura da infância ”

“ A mão cujos índice e polegar ”

2ª - Somente quando predicativo do objeto é que o adjetivo pode ir para o

plural:

Ex.: “ Eu julgava satisfeitos o pai e o filho ”

“ ... entretinham vivas a idéia e a saudade “

3ª - Se aos substantivos precederem títulos ou pronomes de tratamento, a

concordância se efetuará no plural:

Ex.: “ Os apóstolos Barnabé e Paulo “

“ Os irmãos Joaquim e José ”

“ Os Sres. Silva e Cia ” (sic)

* Se o adjetivo se refere a vários substantivos no singular e de gênero diferente,

e vem:

1) Posposto – vai para o plural masculino:

Ex.: “Nariz, face e boca monstruosos”

“...comércio e navegação costeiros”

“Uma posse e um domínio incompletos”

Notas: 1ª - Pode também concordar com o substantivo mais próximo se o sentido o

exige, ou o queremos:

Ex.: “Manda-me livro e fruta madura”

“Talento e habilidade rara” (ou raros)

“Ali dei a tradução em língua e estilo moderno”

“... o retrato de Maria com túnica e escapulário branco”

2ª - Se os substantivos forem sinônimos, o adjetivo concordará com o mais

Ex.: “As maldições se cumpriam no povo e gente hebréia”.

2) Anteposto – concorda com o mais próximo ou, indiferentemente, vai para o

plural masculino:

Ex.: “Pasmado Diogo e a multidão”

“...atentos o juízo e generosidade”

“Demais disso, sua mãe e irmão eram ricos”

“Perdida a cor e o alento”

“...tinha tornado inúteis a inteligência e o braço”

“...declarou criminosa a ré e o réu”

“Verão os homens ensangüentados o sol e a lua”.

* O adjetivo que se refere a substantivo do plural e de gêneros diversos vai,

geralmente, para o plural e para o gênero do substantivo mais próximo:

Ex.: “ As armas e os barões assinalados” ou: Os barões e as

armas assinaladas

“ ... carícias e bens paternos “

“ ...mordomos e confrarias festeiras”

“...casas e corações abertos”

“...atos e fórmulas religiosas”

Nota: Há em bons escritores nossos o emprego exclusivo do plural masculino:

Ex.: “ Os recursos e as tropas desproporcionados”

“ Pais e mães carregados de família”

“...enviando os breves e cartas destinados a protegê-los”

“ Pagos as rendas, foros e impostos”.

* Se o adjetivo se refere a substantivo do mesmo gênero e de números

diferentes, e vem:

1) Anteposto – concorda com o substantivo mais próximo:

Ex.: “ Os seus filhos e marido são meus hóspedes”

“ Sua astúcia e tiranias”

“ Sua mulher e filhas”.

2) Posposto – vai para o plural de igual gênero dos substantivos:

Ex.: “ ...com as colônias e com a civilização romanas”

“ Se os recursos e o tempo absorvidos...”

“ Vês aqui as mãos e a língua delinqüentes”.

* Se os substantivos forem sinônimos ou formarem gradação nas idéias

enunciadas, a concordância do adjetivo se efetuará com o mais próximo, quer

venha antes quer depois:

Ex.: “ ...depreender-se de uma idéia e pensamento falso”.

“ ingratidão na fraqueza e temor natural”

“...para servirem ao interesse e gosto alheio”.

“...a fé e a amizade declarada”.

* Mais de um adjetivo qualifica ou determina o mesmo substantivo – Podem ser

dadas à frase várias formas:

Ex.: O primeiro batalhão e o segundo;

O primeiro e o segundo batalhão;

O primeiro e segundo batalhão.

Gramáticos há que permitem a construção: “O primeiro e o segundo

batalhões” – levando-se para o plural o substantivo ao qual se referem vários

adjetivos no singular. Aceitam essa concordância Constâncio, Pacheco Júnior,

Soares Barbosa, Rui Barbosa e Mário Barreto, aos quais apóiam exemplos dos

melhores manejadores do idioma. Conceitua Epifânio Dias que se pode dizer: “Os

dois poderes, temporal e espiritual”, “Os dois poderes, o temporal e o espiritual”

(Observe-se a vírgula no primeiro exemplo e a repetição do artigo no segundo).

Reconheço casos em que o plural do substantivo se impõe pelo uso (“Nos

dias 24 e 29 de junho”), mas o mais seguro é evitar, sempre que possível, a flexão

do substantivo, porque, seja como for, o adjetivo é que concorda com o substantivo

e não este com aquele.

EXEMPLOS DIVERSOS: “As expressões que se empregam na lei prussiana e na

francesa”

“ ...na terrível peleja do bom e do mau princípio”

“ As personagens são as do velho e do novo testamento”

“ A primeira e a segunda ameia”

* Se o substantivo vem antecedido de alguma coisa, qualquer coisa, vai para o

feminino se não intervém a preposição de (“Alguma coisa consoladora”) e para o

masculino com a presença dessa partícula (“Alguma coisa de consolador”).

* Em expressões como “pobre do homem”, “desgraçado de ti”, a interposição da

preposição de não impede a concordância do adjetivo: “Desgraçadas das mulheres”

– “Coitados dos que foram para a guerra”.

* O adjetivo antecedido de nada de, algo de, muito de, um quê de, um quid de, o

que quer que seja de, um não sei quê de concorda com o sujeito conforme pelo

sentido estiver em relação com ele ou com o nome de significação geral e indefinida

que aquelas palavras e expressões encerram:

Ex.: “ Este escritores têm o que quer que seja de ímpios e ateus”.

“ Têm muito de garridas e romeiras essas raparigas”.

“ Mostraram eles na linguagem muito de duro e áspero” (ou de

duros e ásperos)

“ Possuem elas um não se quê de esquisito”.

* O substantivo aposto concorda com seu fundamental em gênero e número

sempre que possível:

Ex.: “ O ódio, filho do orgulho”

“ A esperança, filha da fé”

“ Estes instrumentos, produtos de nossa fabricação”

CONCORDÂNCIA DO PREDICATIVO COM O SUJEITO

REGRA GERAL: O predicativo, quando constituído de adjetivo ou de pronome,

concorda com o sujeito em gênero e número:

Ex.: “ Pedro é generoso”

“ Maria parece bondosa”

“ É você o procurador da casa? - Sou-o” (O pronome está

concordando com procurador)

REGRAS ESPECIAIS

* Quando o predicativo é constituído de substantivo abstrato ou de substantivo

de uma só forma genérica, deixa de concordar com o sujeito, ficando invariável:

Ex.: “ As propriedades não são natureza”.

“ As lágrimas do aflito não são crime”.

“ As cores que no camaleão são gala, no polvo são malícia”.

“ Ele é a esperança da família”.

* Há casos curiosos de discordâncias do predicativo com o sujeito quando este, sem

nenhuma determinação, é expresso em sua generalidade abstrata:

Ex.: “Cerveja não é bom para a saúde”.

“Pimenta é bom para estimular”.

“É necessário paciência”.

“É proibido entrada”.

“Não é necessário mulheres na fábrica”.

Os predicativos bom, necessário, proibido assumem a forma aparentemente

masculina, mas realmente neutra, visto que os substantivos a que se referem,

tomados em sua generalidade abstrata, assumem sentido vago, no qual como

que se oblitera o conceito genérico.

OUTROS EXEMPLOS: “É bom toda a cautela” - “É necessário prudência

nos negócios” – “É preciso mais areia” – “Não é preciso margem” – “É feio blusa em

criança” – “Uma caixa de sapato seria bom para guardar os brinquedos”.

É este um dos vestígios interessantes do gênero neutro em português. Logo,

porém, que esses sujeitos recebam uma determinação positiva, despojam-se do

caráter neutro, e o predicativo assume a flexão genérica correspondente:

Ex.: “Esta cerveja não é boa para a saúde”.

“Aquelas pimentas são boas para estimular”.

“É necessária a paciência”.

“É proibida a entrada”.

* Quanto à concordância do predicativo, devemos observar o seguinte:

1) Referindo-se a nome tomado em sentido determinado (antecedido de

artigo), varia em gênero e número: “Sois a mãe desta criança? Sou-a” – “Sois a

professora desta escola? Sou-a” (Este a é pronome articular, e não pronome

pessoal).

2) Referindo-se a nome tomado em sentido vago, indeterminado (não

antecedido de artigo, e equivalente, então, a isto, isso, aquilo) ou referindo-se a

adjetivo, fica invariável na sua forma masculina, ou antes, neutra: “Sois mãe? Sou-

o” (=Sou isso) – “Sua mãe era vã como o são todas” – “Se Henrique fora ambicioso

não o era menos sua mulher” – “Se jamais houve condição para inveja, aquela o foi

sem nenhuma falta”.

CONCORDÂNCIA DO PRONOME

REGRA GERAL: Quando flexível, o pronome concorda em gênero e número com o

nome a que se refere:

Ex.: “Para isso é preciso mais esforço que para defrontar a morte, mas

tu o terás; inspirar- to-ão o meu exemplo e a santa memória de

nossos pais”.

“Quero tê-lo, Vasco, porque tu o desejas”.

REGRAS ESPECIAIS

* Os pronomes oblíquos o, a, os, as, referindo-se a substantivos de gêneros

diversos, tomam no plural a flexão masculina:

Ex.: Porque essas honras vãs, esse ouro puro

Verdadeiro valor não dão à gente:

Melhor é merecê-los sem os ter

Que possuí-los sem os merecer.

* Referindo-se a um substantivo modificado por outro regido da preposição de

companhia com, pode o pronome ir para o plural, como acontece com o verbo:

Ex.: “Passava um dia de inverno o arcebispo com sua comitiva a serra

de Gerez... salteou-os uma chuva fria e importuna”.

CONCORDÂNCIA IRREGULAR OU FIGURADA (p.416)

SILEPSE

Concordância irregular, também chamada concordância figurada, é a que opera não

com o termo expresso, mas com outro termo latente, isto é, oculto, mentalmente

subentendido.

Outros nomes tem* ainda semelhante concordância: semiótica, lógica,

latente, anormal, mental, nomes que denotam operar-se a concordância não com a

letra, mas com o espírito, com a idéia da frase.

Tal tipo de concordância se denomina silepse. Etimologicamente (do grego syn =

com, mais lépsis, do verbo lambánô = tomar, prender), silepse é sinônimo de

compreensão.

A silepse pode ser de gênero, de número e de pessoa.

A silepse de GÊNERO opera-se:

1 - Com os nomes próprios de rios e de cidades, concordando o adjetivo não com o

substantivo próprio em si, expresso na frase, mas com o apelativo dessas classes (

rio, cidade):

masc. fem.

“Cartago foi destruídA” (cidade).

“O Paraíba é tortuosO” (rio).

Nota – Sabemos já que constituem exceções alguns nomes de cidades: “O Porto

está cheiO de visitantes” – “O Rio de Janeiro é festivO”.

2 - Nas expressões de tratamento (vossa senhoria, vossa mercê, vossa alteza, sua

excelência, sua majestade, etc.), em que a concordância se opera não com o

gênero dessas expressões, mas com o sexo ou com a natureza do cargo da pessoa

a que essas expressões são dirigidas: “Vossa majestade é poderosO” (rei) – “Vossa

alteza é bondosO” (príncipe) – “Vossa senhoria foi indicadO” (homem) – “Você está

enganadA” (mulher).

3 – Com os artigos o e um, quando, em certas frases já consagradas, constituem

atributivos de nomes femininos que se referem a pessoa de sexo masculino:

“Pedro é um criança” “O besta do Antônio” “Antônio é um banana”

4 – Em outros casos em que o pronome concorda não com o gênero da palavra

expressa, mas com o sexo da pessoa a que a palavra se refere: “Conheci uma

criança... mimos e castigos podiam com ele; mas em lhe falando na mãe e no que

custara para lhe dar a vida, o infeliz, que nunca a vira, enternecia-se” - “Só nove

crianças de 6 até 8 anos e tais que é lástima vê-los”.

5 – Como preencher, numa ficha em que se discriminam os dados identificadores

de uma pessoa, o que pede a nacionalidade? Se homem, como escrever na frente

da palavra nacionalidade: brasileiro ou brasileira? Se de homem se tratar, brasileiro

é que se deverá consignar. Brasileira, tão só quando de mulher forem os dados.

Não haja nisso admiração. À pergunta “Qual o estado civil?” ninguém se

aventuraria a declarar “casado”, quando de mulher se tratasse. “Estado” está na

ficha, mas “casada” se põe, porque não o estado mas a mulher é que se qualifica.

A silepse de NÚMERO opera-se:

1 – Com o adjetivo no singular em função predicativa aos sujeitos nós (empregado

em lugar de eu), vós (quando empregado em lugar de tu): “Antes sejamos breve que

prolixo” – “Vós estais enganado” – “Amigo atento e obrigado somos” – “Estamos

persuadido disso”.

Nota: a) Ao emprego de nós com valor de eu, e de vós, com valor de tu já tivemos

ocasião de referir-nos no § 342, 1. Nós é empregado em lugar de eu pelos reis,

pelos papas e prelados (plural majestático). O verbo irá para o plural, mas o

adjetivo, como dissemos, concordará silepticamente.

b) Emprega-o ainda o escritor ou o orador, para efeito retórico, mas não

poderá empregar ora eu, ora nós; ou sempre uma, ou sempre outra forma, notando-

se ainda que as formas pronominais oblíquas e os possessivos devem ser

uniformes com a escolha: Nós julgamos... foi-nos relatado... nossa opinião.

c) Vós emprega-se em lugar de tu quando se trata o interlocutor com

deferência especial. Curioso é notar a não existência de tal emprego em latim: o

interlocutor, fosse quem fosse – superior jerárquico (sic), rei ou o próprio Deus – era

sempre tratado por tu. Vós, nesse idioma, só se empregava quando realmente

plural.

2 – Quando, sendo o sujeito coletivo de forma singular, vai, entretanto o verbo para

o plural, conformando-se com a pluralidade lógica do coletivo: “Estavam pegados*

com ele uma infinidade de homens” – “A máxima parte dos homens morrem antes

dos cinqüenta” – “Abalou o colégio quase todo em procissão pelas ruas de Coimbra,

capitaneados pelo seu reitor”.

Note-se, nesses casos, uma destas particularidades: 1 – a pluralidade lógica

contida no coletivo; 2 – a distância geralmente existente entre o sujeito e o verbo; 3

– a presença de um genitivo plural.

Nota – 90% dos homens viajaram – No plural ou no singular o verbo?

Discriminemos estes casos:

a) Quando o predicado é constituído de verbo de ligação ou de locução verbal

passiva, o verbo e o predicativo (ou o particípio nas locuções passivas) deixam-se

influenciar pelo número e pelo gênero do partitivo: “90% das MULHERES SÃO

analfabetAS” – “30% da nossa PRODUÇÃO é exportadA” – “20% da POPULAÇÃO

ESTAVA acamadA” – “50% das PROFESSORAS DEVEM ser nomeadAS por

merecimento”.

b) Quando o número porcentual vem antecedido ou seguido de adjunto no

plural, é melhor aceitar o plural: “BONS 30% DÃO conta das obrigações” – ESSES

5% da boiada MORRERAM” – “90% DOS HOMENS VIAJARAM”. E assim: “Duas

terças partes da população são aliadófilas” – “Duas terças partes do país foram

devastadas”.

c) Afora esses casos o singular é empregado: “90% da imprensa DEFENDE” –

“80% do eleitorado COMPARECEU” – “90% da borracha latino-americana ainda

PROVÉM de árvores nativas” – exatamente como diz o inglês, cioso do s final da

terceira pessoa do singular do indicativo presente: “Ninety percent of Latin American

rubber still COMES from wild jungle trees”.

d) Quanto a “parte de”, “metade de”, “a maior parte de” , “a maioria de”, veja o §

711.

e) Quanto à idéia de quantidade, veja o § 713.

A silepse de PESSOA consiste em operar-se a concordância do verbo não com a

pessoa do aposto claro, mas com a pessoa do fundamental oculto: “Dizem que os

cariocas somos pouco dados a jardins públicos” – isto é: “...que nós, os cariocas,

somos...” (O verbo concorda com o fundamental oculto nós, e não com o aposto

claro “os cariocas”).

OUTROS EXEMPLOS: “Ali ficamos alguns amigos” – “Os dois íamos ali por visita” –

“Os portugueses fazemos este nome particular” – “Os quatro que escapamos, nos

lançamos ao mar” - “Todos os filhos de Adão padecemos nossas mutilações e

fealdades” – “Uns esperando andais noturnas horas, outros subis telhados e

paredes” – “Os outros saltamos para testemunhar a catástrofe”.

3.2 MODERNA GRAMÁTICA PORTUGUESA

Evanildo Bechara

CONCORDÂNCIA NOMINAL

Considerações gerais – Em Português a concordância consiste em se adaptar a

palavra determinante ao gênero, número e pessoa da palavra determinada.

A concordância pode ser nominal ou verbal – Diz-se concordância nominal a que

se verifica em gênero e número entre o adjetivo e o pronome (adjetivo), o artigo, o

numeral ou o particípio (palavras determinantes) e o substantivo ou pronome

(palavras determinados (sic)) a que se referem. Diz-se concordância verbal a que se

verifica em número e pessoa entre o sujeito (e às vezes o predicativo) e o verbo da

oração.

A concordância pode ser estabelecida de palavra para palavra ou de palavra para

sentido. A concordância de palavra para palavra será total ou parcial (também

chamada atrativa), conforme se leve em conta a totalidade ou o mais próximo das

palavras determinadas numa série de coordenação:

“Repeli-a, porque se me ofereciam vida e honra a troco de perpétua infâmia”

[AH.1, 147].

“ porque entre ele e Suintila... está o céu e o inferno” [AH.2, 124].

“...via-se em todas as faces pintado o espantoso e o terror” [AH.2, 124].

“Quando a educação, os livros, e o sentir daqueles que nos odeiam, apagou

em nossa alma o selo da cruz” [AH.2, 143].

A concordância de palavra para sentido se diz ainda concordância “ad sensum” ou

silepse:

“ A plebe vociferava as mais afrontosas injúrias contra D. Leonor: e se

chegassem a entrar no paço, ela sem dúvida seria feita pedaços pelo tropel furioso”

[AH.2, 41].

É preciso estar atento a que a liberdade de concordância que a língua

portuguesa muitas vezes oferece, deve ser cuidadosamente aproveitada para não

prejudicar a clareza da mensagem e a harmonia do estilo.

Na língua oral, em que o fluxo do pensamento corre mais rápido que a

formulação e estruturação da oração, é muito comum enunciar primeiro o verbo –

elemento fulcral da atividade comunicativa – para depois se seguirem os outros

termos oracionais. Nestas circunstâncias, o falante costuma enunciar o verbo no

singular, porque ainda não pensou no sujeito a quem atribuirá a função predicativa

contida no verbo ; se o sujeito, neste momento, for pensado como pluralidade, os

casos de discordância serão aí freqüentes. O mesmo ocorre com a concordância

nominal, do particípio.

A língua escrita, formalmente mais elaborada, tem meios de evitar estas

discordâncias.

Concordância nominal

A – Concordância de palavra para palavra

1) Há uma só palavra determinada.

A palavra determinante irá para o gênero e número da palavra

determinada:

“Aflige-nos a glória alheia contestada com a nossa insignificância” [MM].

“Os bons exemplos dos pais são as melhores lições e a melhor herança

para os filhos” [MM].

“Eu amo a noite solitária e muda” [GD. 3, I, 314].

Eu estou quite. Nós estamos quites.

2) Há mais de uma palavra determinada.

Observar-se-ão os seguintes casos:

1º) Se as palavras determinadas forem do mesmo gênero, a palavra determinante

irá para o plural e para o gênero comum, ou poderá concordar, principalmente se

vier anteposta, em gênero e número com a mais próxima:

A língua e (a) literatura portuguesas ou A língua e (a) literatura portuguesa.

“Amava no estribeiro-mor as virtudes e a lealdade nunca desmentidas” [RS.1,

124].

“O tom e gesto caricioso, com que ela dizia isto, não moveu medianamente o

esposo” [CBr. 1, 158].

“e os nossos Basílio e Durão, bem assim o Sr. Magalhães...” [OM, 72].

OBSERVAÇÕES:

1º) Se as palavras determinadas se referirem a uma só pessoa ou coisa, impõe-se o

singular do determinante: seu fiel amigo e servidor

2º) É injusta a crítica do gramático E. Carlos Pereira aos seguintes exemplos: “ ...a

mão esquerda, entre cujos índice e polegar pendia o pergaminho...” [AH.5, II, 24] e

“...pelas exigências cada vez maiores destas devoradoras e insaciáveis fome e sede

de leitura” [AC.1, 315].

3º) Precedendo um substantivo (título ou prenome), ocorre o plural: os irmãos Pedro

e Paulo. Os apóstolos Barnabé e Paulo.

4º) Um determinante (adjetivo) no plural pode estar aposto a um sujeito no singular

que venha colocado depois, quando este sujeito é algum dos pronomes cada um,

cada qual, ninguém, nenhum, referidos a pessoas ou coisas já mencionadas:

sobressaltados com esta vista, procurava cada um pôr-se a salvo [ED].

2º) Se as palavras determinadas forem de gêneros diferentes, a palavra

determinante irá para o plural masculino ou concordará em gênero e número com a

mais próxima:

“Vinha todo coberto de negro: negros o elmo, a couraça e o saio” [AH.1, 107].

“como se um grande incêndio devorasse as brenhas e os carvalhais antigos”

[AH.1, 86].

“Calada a natureza, a terra e os homens” [GD.3, I, 315].

com boa coragem e zelo, com coragem e zelo bom (ou bons), com bons

coragem e zelo

toda sua luta e sacrifícios.

todos seus sacrifícios e luta.

OBSERVAÇÕES:

1º) Por uma questão de agrado auditivo (eufonia), prefere-se que numa série de

palavras determinadas de gêneros diferentes seguida de palavra determinante no

masculino plural, venha a determinada masculina em último lugar.

2º) Se, neste caso, se tratar de pronome possessivo posposto, a concordância deste

se fará com o último substantivo: “Este velho desterrado por gosto e eleição sua...”

[RS.1, 16].

3º) Quando há idéia de reciprocidade, torna-se obrigatório o emprego do plural: “Ele

entrou prazenteiro... e encontrou padrinho e afilhada empenhados em uma

discussão sobre autoridade” [LBa apud SS.1 § 257 obs.].

3º) Há uma só palavra determinada e mais de um determinante.

A palavra determinada irá para o plural ou ficará no singular, sendo, neste

último caso, facultativa a repetição do artigo. Em geral, isto ocorre com adjetivos de

nacionalidade: As literaturas brasileira e portuguesa ou A literatura brasileira e

portuguesa (maneira de dizer menos freqüente e, com exagero de lógica gramatical,

considerada errônea por muitos autores) ou A literatura brasileira e a portuguesa.

“e os cronistas tudense e toledano fazem a luta dos dous reis depois daquele

consórcio” [AH.6, III, 86].

“Li um anúncio, convidando mestra de línguas inglesa e francesa para o

colégio” [CBr. 1, 128].

“O pequeno reino sucessivamente perlustrou as costas ocidental e oriental da

África...” (C. de Laet, I, 211)

as séries quarta e quinta a quarta e quinta série (ou séries)

B – Concordância de palavra para sentido

A palavra determinante pode deixar de concordar em gênero e número com a

forma da palavra determinada para levar em consideração, apenas, o sentido em

que esta se aplica: o (vinho) champanha, o (rio) Amazonas.

Entre os diversos casos desta concordância pelo sentido aparecem os

seguintes:

1) As expressões de tratamento do tipo de V. Exª., V. Sª., etc.:

atencioso (referindo-se a homem)

V. Exª. é

atenciosa (referindo-se a mulher)

OBSERVAÇÃO: Quando se junta um adjetivo a tais formas de tratamento, tal

adjetivo fica no gênero da forma de tratamento:

Sua Majestade fidelíssima foi contrariado pelos representantes diplomáticos.

2) A expressão a gente aplicada a uma ou mais pessoas com inclusão da que fala:

“Pergunta a gente a si próprio (refere-se a pessoa do sexo masculino) quanto

levaria o solicitador ao seu cliente por ter sonhado com o seu negócio” [PC apud

MBa. 2, 413]

3) O termo determinado é um coletivo seguido de determinante em gênero ou

número (ou ambos) diferentes:

“Acocorada em torno, nus, a negralhada miúda, de dois a oito anos” [HC.2, 84].

4) A palavra determinada aparece no singular e mais adiante o determinante no

plural em virtude de se subentender aquela no plural:

“Não compres livro somente pelo título: ainda que pareçam bons, são muitas

vezes péssimos” [JR.1, 321].

“Mas não nos constou em que ano começou nem quantos esteve com ele” [LS

apud JR.1]

C - Outros casos de concordância nominal

1) Um e outro, nem um nem outro – Com um e outro, põe-se no singular o

determinado (substantivo), e no singular ou no plural o verbo da oração, quando

estas expressões aparecem como sujeito:

“Alceu Amoroso Lima (...) teve a boa idéia de caracterizar e diferençar o

ensaio e a crônica, dizendo que um e outro gênero se afirmam pelo estilo”.

“Parou um momento e, olhando para um e outro lado, endireitou a carreira...”

[AH. 1, 107].

“Mas uma e outra cousa duraram apenas rápido instante” [AH.1, 218].

Com nem um nem outro é de rigor o singular para o substantivo e verbo:

Nem um nem outro livro merece ser lido.

Com um ou outro o substantivo também fica no singular e invariavelmente no

singular aparece o verbo de que a expressão serve de sujeito:

“Um ou outro soldado, indisciplinadamente, revidava, disparando à toa, a

arma para os ares” [EC, 2ªed., 428].

Se as expressões um e outro, nem um nem outro se aplicarem a nomes de gêneros

diferentes, é mais comum o emprego das formas masculinas:

“Tornou a vê-la, foi visto por ela, e acabaram namorados um do outro” [MA.

12, 1ª. ed., 39)

“Ali teve el-rei escondido algum tempo, e lá começaram os seus amores com a

rainha, que tão fatais foram para um e outro” [Ah.2, 35].

“Repousavam bem perto um do outro a matéria e o espírito” [AH.1, 44].

Não raro pode aparecer a concordância com o termo referido:

“...vivia o casal venturoso de um certo Izraim persa letrado e da sua esposa

Proftásia que um e outra cultivavam para deleite do espírito a filosofia grega” [JR.2,

15].

2) Mesmo, próprio, só – Concordam com a palavra determinada em gênero e

número:

Ele mesmo disse a verdade. Ela mesma disse a verdade.

Elas próprias foram ao local.

Nós não estamos sós.

“Eles sós se encaminham para essa parte...” [AH.1, 153].

Em língua literária ocorre o adjetivo só variável onde no colóquio se prefere usar do

advérbio só, portanto invariável:

“Com sós 27 anos de idade... já a palidez da morte se via lutar no seu rosto

com as rosas da mocidade [AC.10].

Mesmo, além de se empregar na idéia de identidade (= em pessoa), aparece ainda

como sinônimo de próprio, até:

“ao mesmo demônio se deve fazer justiça, quando ele a tiver [AV apud

Ed.2, §86,a].

Este último sentido e mais o emprego adverbial junto de aqui, já, agora (aqui

mesmo, já mesmo, agora mesmo) facilitaram o aparecimento moderno da palavra

como advérbio, modo de dizer que os puristas condenam, mas que vem ganhando a

simpatia geral:

“...vaidosos de seus apelidos, mas inofensivos, e virtuosos mesmo por

vaidade de imitarem seus avoengos” [CBr.6,219].

É preciso atenção para não fazer a concordância de menos com o substantivo

seguinte:

Mais amores e menos confiança (e não menas!).

Vale a mesma observação para somenos (= de menor valor):

“Há neles coisas boas e coisas más ou somenos” [MB.2, 239].

3) Leso – É adjetivo, e não forma do verbo lesar, em construções de tipo: crime de

lesa-pátria, crime de leso-patriotismo. Por isso há de concordar com o seu

determinado em gênero e número:

“Como se a substância não fosse já um crime de leso-gosto e lesa-seriedade, ainda

por cima as pernas saíam sobre as botas” [CBr.1, 83].

4) Anexo, apenso e incluso – Anexo, apenso e incluso, como adjetivo, concordam

com a palavra determinada em gênero e número:

Correm anexos (inclusos, apensos) aos processos vários documentos.

Vai anexa (inclusa, apensa) a declaração solicitada.

OBSERVAÇÃO: Usa-se invariável em anexo, em apenso: Vai em anexo (em

apenso) a declaração. Vão em anexo (em apenso) as declarações.

5) Dado e visto – Usados adjetivamente, concordam em gênero e número com o

substantivo determinado:

Dado (Visto) o problema que se nos apresentou, resolvemos desistir do

contrato.

Dadas (Vistas) as circunstâncias, foram-se embora.

6) Meio – Com o valor de “metade”, usado adjetivamente, concorda em gênero e

número com o termo determinado, claro ou oculto:

“Para aquilatar a importância do tropeiro, basta lembrar que o Brasil tem

cerca de oito e meio milhões de quilômetros quadrados de superfície...” [AAr.2, 102].

Era meio-dia e meia (i.é: e meia hora).

7) Pseudo e todo – Usados em termos compostos ficam invariáveis.

A pseudo-sabedoria dos tolos é bem grande.

A fé todo-poderosa que nos guia é nossa salvação.

8) Tal e qual – Tal, como todo determinante, concorda em gênero e número com o

determinado:

Tal opinião é absurda.

Tais razões não me movem.

Em correlação, tal qual também procedem à mesma concordância:

Ele não era tal quais seus primos.

Os filhos são tais qual o pai.

Os boatos são tais quais as notícias.

OBSERVAÇÕES:

1ª) em lugar de tal qual, podem aparecer: tal e qual, tal ou qual.

2ª) Não confundir tal qual flexionáveis com tal qual, tal qual como invariáveis que

valem “como”:

“Descerra uns sorrisos discretos, sem mostrar os dentes, tal qual como as inglesas

de primeiro sangue” [CBr apud CJ.1, 32].

9) Possível – Com o mais possível, o menos possível, o melhor possível, o pior

possível, quanto possível, o adjetivo possível fica invariável, ainda que se afaste da

palavra mais:

Paisagens o mais possível belas

Paisagens o mais belas possível

Paisagens quanto possível belas

Com o plural os mais, os menos, os piores, os melhores, o adjetivo possível vai para

o plural:

Paisagens as mais belas possíveis.

Estão erradas concordâncias como:

Paisagens as mais belas possível.

Fora destes giros, a concordância de possível se processa normalmente:

“As alturas e o abismo são as fronteiras dele: no meio estão todos os universos

possíveis” [AH.2, 160].

10) A olhos vistos – É tradicional o emprego da expressão a olhos vistos no

sentido de claramente, visivelmente, em referência a nomes femininos ou

masculinos:

“...padecia calada e definhava a olhos vistos” [MA.5, 13 apud

Tradições Clássicas, 370].

Mais rara, porém correta, é a concordância de visto com a pessoa ou coisa que se

vê:

“As minhas forças medravam a olhos vistas de dia para dia” [AC apud

CR.1, 554].

“O barão desmedrara a olhos visto” [CBr apud PDo.2, 32].

11) É necessário paciência – Com as expressões do tipo é necessário, é bom, é

preciso, significando ‘é necessário’, o adjetivo pode ficar invariável, qualquer que

seja o gênero e o número do termo determinado, quando se deseja fazer uma

referência de modo vago ou geral. Poder-se-á também se fazer normalmente a

concordância:

É necessário paciência.

É necessária muita paciência.

“O fato de ter sido precisa a explicação (...) [AP.1, 424, nº. 25].

“Eram precisos outros três homens” [AM.1 apud RBa.1,33].

É possível ainda, em tais casos, aparecer no singular o próprio verbo da oração:

“É doce ao velho

Sons d’argentina voz” [GD apud SS.1, 254].

Como acentua Barbadinho, a flexão de necessária(s) é mais freqüente que a de

precisa.

12) Adjetivo composto – Nos adjetivos compostos de dois ou mais elementos

referidos a nacionalidades, a concordância em gênero e número com o determinado

só ocorrerá no último adjetivo do composto:

Acordo luso-brasileiro

Amizade luso-brasileira

Lideranças luso-brasileiras

13) Alguma coisa boa ou alguma coisa de bom – Em alguma coisa boa o adjetivo

concorda com o termo determinado:

“Quem tivesse reparado em Fr. Vasco perceberia facilmente que na sua alma

se passava também alguma cousa extraordinária” [AH apud MBa.7, 144].

Em alguma coisa de bom, o adjetivo não concorda com coisa, sendo

empregado neutralmente (como algo de novo, nada de extraordinário, nada de

trágico, etc.).

Por atração pode-se fazer a concordância do adjetivo com o termo

determinado que funciona como sujeito da oração:

“Que tinha pois, Ricardina, de sedutora!” [CBr apud MBa.7, 146].

“Amor próprio do vilão; que a infâmia nada tinha de engenhosa” [Id., ibid.].

Se os homens não tivessem alguma coisa de loucos seriam incapazes de

heroísmo [MM]. (ver sugestão do corretor eletrônico, abaixo)

A vida nada tem de trágica.

14) Um pouco de luz e uma pouca de luz – Ao lado da construção normal um

pouco de luz pode ocorrer a concordância atrativa uma pouca de luz, por se

haverem fundido numa só expressão as duas seguintes maneiras de dizer: pouco

de luz + pouca luz (Dá-se ao fenômeno o nome de contaminação ou cruzamento

sintático. Cf. pág.596.).

“e aos pés deles os fiéis que obtinham para última jazida uma pouca

de terra...” [AH.1,154].

15) Concordância do pronome – O pronome, como palavra determinante,

concorda em gênero e número com a palavra determinada.

Emprega-se o pronome oblíquo os em referência a nomes de diferentes

gêneros:

“A generosidade, o esforço e o amor ensinaste-os tu em toda a sua

sublimidade” [AH.1, 25].

16) Nós por eu, vós por tu – Empregando-se vós em referência a uma só pessoa,

põe-se no singular o adjetivo:

“Sois injusto comigo” [AH apud ED.2, § 14,b].

Ao se empregar, em idênticas condições, o pronome nós, o adjetivo pode ficar no

singular ou ir para o plural:

Antes sejamos breve que prolixo.

“Entre o desejo de alimentar a curiosidade do leitor e o receio de faltar à

exação histórica, hesitávamos perplexos” [AH apud ED.2, §14,b].

17) Alternância entre adjetivo e advérbio – Há casos em que a língua permite

usar ora o advérbio (invariável) ora o adjetivo (variável):

“Vamos a falar sérios” [CBr apud MBa.1, 265].

Vamos a falar sério.

“Os momentos custam caros” [RS apud MBa.1, 265].

Os momentos custam caro.

A vida custa tão cara aos velhos quanto é barata para os moços [MM].

“Era esta a herança dos miseráveis, que ele sabia não escassearem na

quase solitária e meia arruinada Cartéia” [AH.1, 12].

A voz sumiu-se-lhe, toda trêmula [EQ.3, 647].

A distinção entre adjetivos e advérbios só se dá claramente quando a palavra

determinada está no feminino ou no plural caso em que a flexão nos leva a melhor

interpretar o termo como adjetivo. Na língua padrão atual, a tendência é para nestes

casos proceder dentro da estrita regra da gramática e usais tais termos sem flexão,

adverbialmente.

Entram nesta possibilidade de flexão as construções de tanto mais, quanto

menos, pouco mais, muito mais, em que o primeiro elemento pode concordar ou

não com o substantivo:

Com quanto mais razão, muito mais honra.

Com quanta mais razão, muita mais honra.

Poucas mais palavras trocamos [CBr apud MBa.4, 21].

Notemos, por fim, que alerta é rigorosamente um advérbio e, assim, não

aparece flexionado:

Estamos todos alerta.

Há uma tendência para se usar desta palavra como adjetivo, mas a língua

padrão recomenda se evite tal prática. Junto de substantivo alerta adquire

significado e função de adjetivo:

“A moça aguardava com inteligência curta, os sentidos alertas” [CLi apud RBa.2,

14].

Em sentido contrário, aparece o engano de não se flexionar o adjetivo quite.

Deve-se dizer:

Estou quite. Estamos quites.

18) Particípios que passaram a preposição e advérbios – Alguns particípios

passaram a ter emprego equivalente a preposição e advérbio (como, por exemplo,

exceto, salvo, mediante, não obstante, tirante, etc.) e, como tais, normalmente

devem aparecer invariáveis. Entretanto, não se perdeu de todo a consciência de seu

antigo valor, e muitos escritores procedem à concordância necessária:

“Os tribunais, salvas exceções honrosas, reproduziam... todos os defeitos do

sistema” [RS2, IV, 67].

“A razão desta diferença é que a mulher (salva a hipótese do cap. CI e

outras) entrega-se por amor...” [MA.1, 327].

Como bem pondera Epifânio Dias, flexionar tais termos “é expressar-se na

verdade com correção gramatical, mas de modo desusado” [ED.2, §220, a].

Deste modo, a língua moderna dá preferência a dizer “salvo exceções”,

“salvo a hipótese”.

19) A concordância com numerais – Quando se empregam os cardinais pelos

ordinais, não ocorre a flexão:

Página um. Figura vinte e um.

OBSERVAÇÕES:

1ª) Na linguagem jurídica diz-se: A folhas vinte e uma. A folhas quarenta e duas.

2ª) Embora se tenha usado o substantivo no singular precedido de numeral

combinado com um, uma, a preferência atual é pô-lo no plural: vinte e um dias, as

mil e uma noites, etc.

3ª) Milhar é masculino e portanto não admite seus adjuntos postos no feminino a

concordar com o núcleo substantivo feminino:

Os milhares de pessoas ( e não: as milhares de pessoas).

20) A concordância com os adjetivos designativos de nomes de cores –

Surgem as incertezas quando o nome de cor é constituído de dois adjetivos. Neste

caso, a prática mais comum é deixar o primeiro invariável na forma do masculino e

fazer a concordância do segundo com o substantivo determinado, embora não

deixem de aparecer exemplos em bons autores em que estejam flexionados os dois

adjetivos:

olhos verde-claros, ondas verde-azuladas.

3.3 GRAMÁTICA DE USOS DO PORTUGUÊS

Maria Helena Moura Neves

Concordância Nominal

5.2. Questões de concordância (p.117)

a) Quando um substantivo no plural é determinado ou qualificado

distributivamente por dois ou mais adjuntos coordenados, esses adjuntos são

usados no singular:

Se somarmos os pontos dos segundo e terceiro LUGARES, que não são

nossos concorrentes diretos, constataremos que ainda continuamos sendo

o primeiro lugar. (FSP)

Vitrúvio, nos seus seis princípios, dedicou-se praticamente à estética do projeto

arquitetônico, não se referindo a ela somente na primeira e na sexta

CATEGORIAS. (AQT)

Os bancos dão uma guinada nos rumos da política de financiamento, liberando

financiamento para projetos de desenvolvimento apenas quando

acompanhados de políticas sensíveis aos IMPACTOS social e ambiental.

(AMN)

b) Recomenda a gramática tradicional normativa que se use no singular o

substantivo determinado pela expressão um e outro:

João de Oliveira deixou-se ficar num botequim próximo a conversar com um e

outro INDIVÍDUO. (MP)

De uma e de outra MARGEM, o mato se mostrava tão fechado que só se podia

mesmo ir sempre em frente. (ALE)

Santo Tirso intercalava uma e outra FRASE de louvor para desviar-se do

ramerrão do texto. (PFV)

Entretanto, o plural é bastante usado:

Um e outro INSTRUMENTOS podem, isoladamente, praticá-la, como está

representado nas Figs. 13 & 14 e é o preceito dos tocólogos alemães. (OBS)

É sempre imprecisa a fronteira que separa um e outro DELITOS. (VEJ)

Grades artesanais de ferro torcido foram recortadas e adaptadas para portas,

janelas e CORRIMÃOS. (FSP)

Às 10h30m, começa a prova para JUNIORES, aspirantes e principais, com 70

quilômetros de percurso. (GAZ)

O curso é dirigido a operadores SENIORES, coordenadores, supervisores e

empresários. (FSP)

8.5 Nomes próprios de pessoas (tanto nomes como sobrenomes) se pluralizam

normalmente, como os substantivos comuns: (p.172)

E minha mãe era FERREIRA, dos FERREIRAS de Viana do Castelo. (VPB)

Os PEREIRAS constituíam numerosa e patriarcal família. (DEN)

Ah, que não suscitaram os MENESES em matéria de invenção! (CCA)

Somente não tocava nos RIBEIROS, porquanto o assunto devia constrangê-la.

(FR)

Aprecio sinceramente a coragem dos MELCHIORES e dos ROBÉRIOS que

talvez não saibam distinguir a realidade da miragem. (VP)

# Entretanto, é comum que, especialmente no caso dos sobrenomes, a pluralização

seja feita apenas pelo determinante:

Lembrei-me instantaneamente que os LAMBETH eram proprietários da

residência de Renata. (L)

Os BATTAGLIA e os MANFREDE desconversavam. (VN)

De algumas donas e donzelas gabava-se francamente a beleza, a distinção.

Dona Heloísa, Dona Berta, AS MOURA, AS FRANCO, AS OLIVEIRAS, AS

ROSSO. (CF)

i) Com substantivos concretos: os adjetivos indicam dimensão ou medida (p.190)

Agora já não éramos PEQUENO rebanho a escorregar num declive:

constituíamos boiada NUMEROSA. (MEC)

5.7 Um adjetivo pode referir-se a dois ou mais substantivos coordenados:

(p.218)

Se o adjetivo em função adnominal estiver posposto, o mais comum é que a

concordância de gênero se faça com a soma dos gêneros dos substantivos

(masculino + masculino = masculino; feminino + feminino = feminino; masculino +

feminino = masculino), embora ocorra também a concordância com o gênero e o

número do substantivo mais próximo:

[Paris Match] dedicara um número às favelas do Rio, com estatísticas e

fotografias CLAMOROSAS. (BH)

No rosto dela ainda a emoção e ansiedade GERADAS pelo sonho. (ARA)

Fontenelle é tido como o mais legítimo dos que governaram o Território, com a

conta de quarenta anos de convivência com a terra e o povo ACREANOS. (CRU)

Todos são homens e mulheres TRISTÍSSIMOS. (NOF)

- Impossível – disse o rei, com suco de véspera correndo pela pauta e o jargão

REAL. (AUB)

Durante as refeições, não sou mais a “presença” que rouba a naturalidade e o

bom humor GERAL. (A)

Se o adjetivo (em função adnominal ou predicativa) estiver anteposto, o mais

comum é que a concordância de gênero e número seja feita com o substantivo

mais próximo, mas também ocorre concordância com o conjuntivo dos

substantivos:

Fica bem CLARA a natureza e posição dos grupos e pessoas que encaram a

ordem. (DIR)

Acho muito BONITO o realismo e a precisão dos retratos daquela época.

(VEJ)

Tão PARECIDOS são o tom e o delírio. (VEJ)

No próximo capítulo, as normas de concordância nominal constantes na

gramática eletrônica do revisor do Word, acompanhadas dos resultados contrastivos

que obtivemos entre elas e as dos gramáticos acima.

Capítulo IV – O (des)compasso entre as normas de Concordância Nominal

constantes das três gramáticas e no revisor eletrônico.

Após a apresentação das regras de concordância nominal, encontradas nas

obras dos gramáticos com os quais trabalhamos, disponibilizamos, neste capítulo,

as regras de concordância nominal que conseguimos retirar do programa do revisor

gramatical do Word, para tentarmos responder à nossa principal pergunta de

pesquisa. Estão enumeradas apenas por praticidade didática.

Conseguimos elencar quinze regras apresentadas pelo revisor gramatical

quando da submissão de sentenças que ele sublinhava em verde. Muitas sentenças,

mais de quarenta pelos nossos cálculos, foram submetidas. Por isso, se houver

outras regras além das apresentadas aqui, acreditamos que as descobriremos por

puro golpe de sorte, pois não descobrimos outro meio de obtê-las a não ser expondo

sentenças e pedindo explicações sobre o apontamento em verde feito pelo revisor, o

que se caracteriza em um trabalho exaustivo e, muitas vezes, frustrante.

Quanto ao levantamento que fizemos, nos capítulos dedicados à Concordância

Nominal, em Napoleão Mendes de Almeida o computador detectou mais problemas

de concordância verbal. Dos 6 apontamentos feitos em verde pelo revisor, quando da

digitação do texto, 4 eram de concordância verbal, 1 sobre o uso do particípio

passado e apenas 1 de concordância nominal, apresentando a primeira regra

disposta aqui: O predicativo do sujeito concorda em número e gênero com o sujeito

da sentença. (Vide tela na página 61)

Em Bechara, de todos os exemplos de regras de concordância nominal

expostos ao revisor, apenas 7 foram apontados como erros, em sua maioria nas

concordâncias consideradas ‘especiais’. (Páginas 68, 69, 72, 74, 75, 76 e 77)

Já em Moura Neves não houve um capítulo digitado, uma vez que ela

apresenta tópicos gramaticais de uma maneira diferente da tradicionalmente

conhecida, elencada em partes separadas. Tentamos, porém, digitar e apresentar ao

revisor tudo o que considerávamos relevante para a concordância nominal e, dentro

do que apresentamos, 9 problemas foram detectados. Todos eles referentes também

aos casos de concordâncias especiais. (Páginas 78, 79, 80, 81 e 82)

Por não querermos repetir as telas, relativas a cada regra, já dispostas nos

capítulos de concordância nominal pertencentes a Napoleão, Bechara e Moura

Neves, decidimos, em vista do farto material coletado, dispor, nesta parte, algumas

com as quais nos deparamos durante a escritura do texto do nosso trabalho. Exceção

feita nos exemplos das regras de nº 3, 6 e 9 porque o computador com o qual

trabalhamos não detectou os mesmos problemas encontrados nos exemplos dos

autores citados acima e, por conseguinte, não nos foi possível obter as mesmas

regras.

4.1 Regras de Concordância Nominal da gramática eletrônica do Word

1. O predicativo do sujeito concorda em número e gênero com o sujeito da

sentença.

Mas ele reconhece como concordâncias corretas as frases abaixo:

3. Chuva é necessário para a agricultura.

4. Aspirina é bom para dor de cabeça.

E para corretas, acima, sugere correto.

2. Os apostos de natureza adjetiva devem concordar em gênero e número com

as palavras a que se apõem.

3. Os adjetivos precedidos da preposição “de” constituem locuções adjetivas de

valor genérico e, por isso, conservam o gênero masculino e o número singular.

(Evanildo Bechara)

4. No português, os modificadores de núcleos nominais (como o predicativo do

objeto direto ou os adjuntos adnominais) devem concordar em gênero e

número com as palavras que eles modificam.

5. O artigo, o pronome, o numeral e o adjetivo, quando determinantes, devem

sempre concordar em gênero e número com o substantivo a que se referem.

6. Adjetivos como “quite” devem concordar com o sujeito dos verbos de ligação

(ser, estar, permanecer, ficar, continuar, parecer, permanecer (sic), andar,

viver, tornar-se...) em gênero e número, mesmo que este sujeito esteja oculto.

(Moura Neves)

7. O artigo nas contrações deve concordar em gênero e número com o

substantivo que o segue.

8. O predicativo do objeto direto concorda em número e gênero com o objeto

direto.

9. O pronome, o numeral e o adjetivo, quando adjuntos adnominais, devem

sempre concordar em gênero e número com o substantivo a que se referem.

(Moura Neves)

10. No português, os modificadores do substantivo devem concordar com o

substantivo que eles modificam.

11. O pronome, o adjetivo e o numeral, quando adjuntos adnominais a um núcleo

composto, devem sempre concordar com o substantivo mais próximo ou com o

gênero e o número comuns ao conjunto dos substantivos modificados.

13. O predicativo do sujeito concorda em número e gênero com o sujeito, mesmo

que posposto.

14. Os apostos devem concordar com as palavras a que se apõem.

15. O verbo “ser” e a palavra “necessário” devem concordar em gênero e número

com a palavra que aparece em seguida.

Mas, o revisor aponta concordância incorreta na própria regra que dita:

16. O substantivo e o adjetivo “meia” não devem ser confundidos com o advérbio

“meio”, que é invariável.

Achamos interessante, mais uma vez, mostrar o que, às vezes, vem

sublinhado em verde pelo revisor gramatical. Copiamos, redigitando, o que o próprio

revisor oferece como regra de concordância nominal, e ele mesmo não a reconhece

como escrita correta.

4.2 Respostas às perguntas de pesquisa

Comecemos relembrando as questões. Primeiro, as auxiliares: Por que a

descrição gramatical do revisor eletrônico não diz respeito à verificação de grande

parte das estruturas usuais do português do Brasil em relação às regras de

Concordância Nominal? Que gramática subjaz ao revisor gramatical eletrônico?

Trata-se de uma gramática casuística, composta de um elenco de frases, que

considera caso a caso? Trata-se de uma gramática que vê a língua como um

conjunto de enunciados pré-estabelecidos? E, depois, a principal: Que normas

constam da memória da gramática eletrônica em relação à Concordância Nominal?

Seguem o modelo tradicional ou não?

Quanto à principal questão, além de dispormos, no subcapítulo anterior, das

normas que conseguimos retirar da gramática eletrônica, da maneira como nos foram

ofertadas pelas telas de aconselhamento do revisor, quando acionado, temos a

complementar que, após contrastar as informações obtidas, percebemos que a

maioria das regras de concordância nominal inseridas no programa que criou o

revisor gramatical são regras das gramáticas normativas, tradicionais. O fato de os

problemas que foram detectados serem, preferencialmente, da área de

concordâncias especiais, leva-nos a (re)considerar os critérios para a formação do

parser do programa que desenvolve o revisor.

Acreditamos, então, que é por esse motivo – o de ter sido programada

seguindo um modelo tradicional - que a gramática eletrônica não dá conta de grande

parte das estruturas usuais do português do Brasil quando em situações lingüísticas

que apresentem uma escritura não tão culta quanto à da gramática que serviu de

base à inserção de regras gramaticais no momento da criação do ReGra. Pois, como

se pôde perceber, o revisor eletrônico contempla o nível de linguagem culto,

recomendado pela Academia de Letras e pelas gramáticas normativas, no qual a

linguagem se mantém estática, em que as ousadias, as inovações, as criações não

têm lugar.

As sentenças reconhecidas como gramaticalmente corretas, quando

submetidas ao revisor, são aquelas que têm suas regras contempladas no banco de

dados da gramática eletrônica que, como já dissemos, insere-se muito mais na

abordagem tradicional e parece se caracterizar como um feixe de sentenças finitas,

fechadas, sem muita liberdade de outras combinações nos seus elementos.

Ou seja, o não reconhecimento de sentenças tidas como gramaticalmente

corretas, usuais, é por conta da gramática programada para o revisor, com número

finito de regras e sem muita mobilidade para escrita em estilo diferente do que o

proposto por essa gramática eletrônica. O grupo do NILC - Núcleo Interinstitucional

de Lingüística Computacional - , que criou o ReGra, deixa claro as dificuldades

encontradas pela limitação do programa. “O parser apresenta uma única

possibilidade de estruturação sintática: a mais provável, segundo as escolhas

gramaticais realizadas também com base na prioridade de freqüência (de suas

regras)”.

Isso nos remete ao modelo de análise distribucional, criado por Z.S. Harris, o

qual tem como princípio básico a observação de que as partes de uma língua se

compõem e não se distribuem caoticamente, mas fazem parte de um sistema e, por

isso, se situam em posições bem determinadas, umas em relação às outras. Esses

elementos se deixam agrupar em classes e essas classes ocorrem em certas

posições dentro de um contexto, mas não ocorrem em outras posições dentro desse

mesmo contexto. Assim, a soma dos contextos em que dada classe de elementos

pode aparecer, contrastada com a soma dos contextos em que tal classe não pode

ocorrer, define a distribuição de quaisquer elementos da língua. Este tipo de

distribuição é limitado a fundamentar suas observações em contextos típicos, não

em qualquer contexto.

Para Greimas (s/d:132),

a análise distribucional, de caráter indutivo e descritivo, aplica-se

essencialmente em descobrir distribuições, ou seja, o conjunto dos

contextos nos quais uma dada unidade lingüística se pode

encontrar. Esse procedimento, que, em princípio, evita qualquer

recurso ao sentido como critério, está fundamentado na co-

ocorrência que, discernindo relações de compatibilidade ou de

incompatibilidade no eixo sintagmático entre os elementos, permite

o estabelecimento de classes distribucionais, levadas em conta as

combinações e as restrições reconhecidas. Este tipo de abordagem,

de natureza taxonômica, conduz a uma segmentação da frase e vai

dar na análise em constituintes imediatos que serviu de ponto de

partida à gramática gerativa.

Assim, de acordo com alguns testes que fizemos, se há inversão de lugares

de termos essenciais ou integrantes, ou intercalação de termos acessórios, na

frase/oração, fatos bastante recorrentes na escrita do português brasileiro, em

muitos casos encontramos a limitação da gramática do revisor em reconhecer e

aceitar como corretos esses tipos de sentenças. Isto acontece, segundo o NILC,

100

porque “A atuação do revisor gramatical restringe-se à oração simples, isolando

para processamento, sempre que possível, as coordenações e subordinações”.

Cabe aqui, agora, uma observação que julgamos relevante. Quando nos

deparamos com o sublinhado verde e com a tela de concordância nominal, durante

a digitação deste trabalho e em outras situações, de todas as ocorrências a que se

repete com mais freqüência é a que contempla a regra de nº 4: No português, os

modificadores de núcleos nominais (como o predicativo do objeto direto ou os

adjuntos adnominais) devem concordar em gênero e número com as palavras que

eles modificam. Em seguida vêm as regras que numeramos em 5, 9 e 10 e as

relativas ao uso de apostos.

Outro ponto importante destacado pelos criadores do revisor eletrônico, e já

dito anteriormente, é que: “O formalismo gramatical, definido para reconhecer

sentenças bem-formadas, segue uma gramática livre de contexto”. Gramáticas

livres de contexto são muito úteis no que tange à descrição de gramáticas em

linguagem natural e, em geral, são mais poderosas que as regulares, já que

permitem a representação de linguagens com um certo grau de complexidade. No

entanto, a dificuldade em expressar dependências simples, como por exemplo a

concordância entre verbo e sintagma nominal, constitui um dos maiores problemas

para sua utilização no tratamento da língua natural. E, concluem, “(...) abordagens

puramente livres de contexto não são suficientemente poderosas para captar a

descrição adequada deste gênero de linguagem”.

No próximo capítulo, a conclusão deste trabalho.

Capítulo V - Conclusão

A escrita permite fixar o pensamento e fazê-lo atravessar o espaço e o tempo.

Francis Vanoye

Dentre as características incontestáveis da língua escrita, encontra-se a

importância que a mesma tem quando se percebe que é sobre a “conservação do

escrito que se funda nossa civilização, que, pouco a pouco, substitui a lei oral pela

lei escrita” (Vanoye, 1998:72).

Mas, continua Vanoye (idem:71), a escrita fixa a linguagem articulada, e, ao

fazê-lo, transforma essa linguagem, pela passagem da fonia à grafia, numa nova

linguagem, que possui uma existência independente da primeira. Por ser muito

menos móvel que a língua falada, as transformações da língua escrita são muito

lentas e muito pouco numerosas.

Por isso mesmo permite fixar o pensamento e fazê-lo atravessar o

espaço e o tempo. É graças à escrita que o homem pode efetuar

uma reflexão, uma análise de seu próprio pensamento. A linguagem

articulada possui uma função essencialmente concreta, utilitária;

serve primeiro para comunicar. A linguagem escrita vai além dessa

função de comunicação (idem).

Relativamente à concordância nominal no português escrito, esta possui

algumas particularidades interessantes – para alguns, de difícil aprendizado formal.

A regra geral, do acordo de gênero que ocorre entre o substantivo e o

adjetivo, é bem conhecida e parece não preocupar os nativos de língua portuguesa,

que se esforçam, quando a situação assim o exige, em lembrar-se de associar

masculino com masculino, feminino com feminino. A concordância de gênero, com

exceção de alguns dialetos, é uma regra categórica do português. O mesmo já não

ocorre com a de número, por isso vemos, em situações de fala corriqueiras, na

maioria orais, a não concordância considerada correta pela gramática normativa.

Mas, a escritura de um texto começa a se tornar complicada quando não se

têm interiorizadas, de maneira formal, as outras regras ditadas pela norma da

língua. Como concordar corretamente na escrita, por exemplo, seqüências de

substantivos adjetivadas por um só atributo? E os adjetivos compostos, hifenizados?

E nos casos de concordância em que a regra só é válida para adjetivos que

funcionam como adjuntos adnominais, mas não para os que funcionam como

predicativos? Se não se tiver uma gramática à mão, torna-se uma tarefa “dolorosa”,

102

impossível para alguns, que acabam por desistir. Afinal, “o que é mesmo adjunto

adnominal? E predicativo? Nem sei o que é isso, como vou distinguir um do outro?

O que tem a ver concordância atrativa com eles? E o que é concordância atrativa?”.

E isso é opinião corrente da maioria dos brasileiros que dizem não saber

português. Na verdade, entendemos que eles estão se referindo, mesmo que não

conscientemente, à própria insegurança, ou ignorância, na escrita desse português,

já que a fala “tudo aceita, desde que a mensagem seja entendida”. O

desconhecimento - por não aprendizagem efetiva - das normas prescritas pela

gramática tradicional sempre foi um problema para a maioria dos falantes do

português brasileiro.

Não cabem aqui discussões sobre a eficiência do ensino/não-ensino desse

tipo de gramática nas escolas. Os exemplos acima buscam mostrar algo de que

falamos anteriormente: a dificuldade de uma imensa parcela da população brasileira

na produção de textos escritos com um mínimo de correção gramatical.

Quanto à realidade atual, todos têm a percepção clara de que os

computadores invadiram o dia-a-dia de milhares de usuários, e isto se deu porque

sua velocidade e potência aumentaram, seu tamanho e preço diminuíram. Essa

revolução na computação começa a se dar ainda nas décadas de 1980 e 1990.

Microcomputadores surgem em escritórios, casas e escolas, com programas

acessíveis aos novos usuários. Poderosos bancos de dados possibilitaram às

organizações armazenar e processar imensas quantidades de informação, enquanto

as redes interligavam as máquinas, permitindo o compartilhamento de dados e

programas.

Então poderíamos pensar que, com a facilidade oriunda do uso cada vez

mais “popular” dos computadores, isto é, por um número crescente de pessoas se

valendo, hoje em dia, de computadores para escrever seus textos e desenvolver

seus trabalhos, o fato de haver um revisor ortográfico e um gramatical como

ferramenta de auxílio à correção desses textos, seria a “salvação da lavoura” para

os que não têm um domínio adequado da gramática da língua. E isso, em parte, é

verdadeiro, uma vez que os revisores mais atualizados demonstram um

desempenho já bastante satisfatório.

Todavia, continua preocupante o fato de que uma máquina não consegue

fazer escolhas porque simplesmente desconhece o contexto ou a intenção

lingüística/comunicativa de quem a está utilizando num dado momento. Explicamos

103

melhor: quando o revisor se manifesta com seu sublinhado vermelho e faz sugestão

de reescritura de grafia de uma palavra, ele oferece o que tem em seu dicionário. O

usuário, por sua vez, se não tiver um vocabulário bom, pode aceitar uma das

sugestões sem perceber que aquela palavra escolhida não cabe no contexto no

qual pretende inseri-la.

Portanto, uma das armadilhas dos corretores ortográficos está na leitura de

uma determinada palavra dentro de um contexto. O computador não pode encontrar

um erro ortográfico se a palavra estiver correta para um outro contexto (por

exemplo, viagem e viajem), principalmente porque o revisor tem dificuldades em

apontar as homógrafas imperfeitas para conferência de sua correção.

Relativamente ao léxico do ReGra, seus criadores dizem ser ele um

“repositório de formas lexicais válidas para o português contemporâneo, acrescidas

de informações morfossintáticas e de formas canônicas”. Apresenta-se esse léxico

como “um recurso à revisão gramatical, servindo também de apoio ao módulo

ortográfico, para validar ou rejeitar as construções vocabulares dos usuários”. (grifo

nosso)

Devido às ambigüidades semânticas e sintáticas da língua portuguesa, o

software nunca estará completo, afirmam os pesquisadores do NILC: “Uma única

palavra pode apresentar distintos significados, pertencendo ou não à mesma classe

gramatical. Para conhecer a função e posição gramatical correta, é necessário

saber o que determinada palavra significa em cada situação”.

O mesmo se dá com o sublinhado verde, mais complexo porque trabalha com

regras gramaticais, esquecidas ou desconhecidas por muitos dos usuários. Assim,

podemos voltar aos exemplos dispostos acima. Se eu, como usuário, tenho a

possibilidade de aceitar ou rejeitar as sugestões, somente poderei fazer isso se

entender o que o revisor está me dizendo. (grifo nosso)

Os próprios criadores do revisor gramatical eletrônico do Word admitem que

“o problema de decidir se uma sentença pertence a uma gramática sensível ao

contexto é uma função exponencial sobre o tamanho da sentença, o que torna a

implementação do procedimento de verificação uma questão complexa, do ponto de

vista computacional”. (grifo nosso)

Ainda há o fato de a gramática criada para um computador poder gerar

também sentenças claramente agramaticais, principalmente se algumas palavras

forem expandidas para outra categoria. Por isso, dizem os especialistas que é

104

preciso adicionar alguns recursos às regras sintagmáticas e trabalhar com a

descrição e classificação do léxico para implementar o tipo de gramática na

linguagem Prolog.

Dizem os pesquisadores do NILC que o primeiro passo para a elaboração do

módulo gramatical foi o levantamento de erros (ou inadequações) mais comuns

entre usuários de nível médio, como secretárias e profissionais de escritório em

geral, e alunos cursando o ensino médio ou ingressando na universidade. O termo

“erro”, aqui, frisam eles, refere-se ao que os gramáticos normativos consideram

como forma desviante da norma culta. (grifo nosso)

Ressalvam, ainda, que o ReGra tem algumas premissas fundamentais,

transcritas aqui:

a) seus usuários-alvo são indivíduos com suposta proficiência no português

em nível secundário ou superior;

b) seu objeto de análise são textos prosaicos com predomínio da função

referencial da linguagem; e

c) seu objetivo é a identificação de desvios à disciplina gramatical da língua

portuguesa, ainda que esses desvios possam vir a representar hipóteses

significativas do usuário em relação à linguagem e possam constituir, na

variedade lingüística do usuário, estruturas admissíveis.

Pelo que vimos até agora, por meio de testes simples que fizemos, podemos

arriscar, então, duas hipóteses: primeira, a programação embutida nos revisores

eletrônicos se baseia na gramática normativa tradicional, uma vez que o que eles

fazem é o mesmo que um gramático normativo típico faria diante de um texto, ou

seja, o revisor trabalha com a definição de erro; segunda (em decorrência da

primeira), então, os revisores eletrônicos são úteis para revisar textos escritos

segundo a variante culta, mas não são completamente eficientes para realizar esse

trabalho. O revisor gramatical eletrônico do Word trabalha com uma concepção

homogênea de linguagem: só existe uma língua correta.

Desse modo, voltamos ao conhecimento de que a Gramática Tradicional

desenvolveu uma sintaxe baseada na análise de frases bem formadas dadas a

priori. Ou seja, parte de uma frase gramatical e aceitável e dela faz a análise para

ilustrar a teoria sintática. Apesar de não haver nada de errado com esse método –

haja vista a riqueza e sucesso da sintaxe tradicional -, deparamo-nos

105

freqüentemente com uma das limitações desse método analítico: uma quantidade

grande de regras não é explicitada, de vez que estudamos a possibilidade de frase

e não todas as possibilidades similares do modelo escolhido.

Se quisermos uma descrição mais exaustiva das regras sintáticas da língua,

podemos recorrer ao método dedutivo, também utilizado pela Gramática Gerativo-

Transformacional. Essa gramática é dedutiva no sentido de que não parte de

exemplos de frases bem formadas, mas de regras que devem gerar frases bem

formadas. O método dedutivo faz o caminho inverso do método analítico da

Gramática Tradicional, que vai da frase dada para a sua estrutura sintática,

enquanto aquele obtém frases a partir da estrutura sintática dada.

O método utilizado pela Gramática Gerativo-Transformacional está presente na

criação da gramática eletrônica, conforme vimos na parte de sintaxe computacional

neste trabalho. No entanto, percebemos falhas na sua proposta. Basta analisar as

telas de aconselhamento oferecidas pela gramática do Word. Claro que a definição

de todas as regras necessárias à geração de um determinado tipo de frase exige

que se leve em conta um volume muito grande de variáveis, por isso temos que

questionar a possibilidade de se criar esse conjunto de regras tão completo e

eficiente que gera todas as frases possíveis da língua.

Parece-nos, esse, um ato impossível de se efetivar, principalmente no que

tange a um programa de computador. Uma sintaxe que gera frases gramaticais e

aceitáveis exige que se estabeleçam regras semânticas, além das sintáticas. E no

estabelecimento das regras semânticas de geração a situação se complica

consideravelmente. A inclusão de regras semânticas no modelo computacional

certamente daria mais poder à teoria gramatical embutida nele, mas requereria um

esforço de descrição que ultrapassaria os recursos de produção e programação

atuais.

Segundo Lucchesi (2007:18-21), quando aprendemos que o homo sapiens é

uma espécie que se distingue dos demais primatas por possuir um poderoso

dispositivo mental que lhe permite organizar de forma bem complexa suas

percepções do mundo e expressar seus pensamentos em frases, com um poder

criativo potencialmente ilimitado, compreendemos, também, que todo homem é

dotado desse dispositivo. Dispositivo que é constituído por um complexo sistema de

regras, que nem o mais sofisticado programa computacional até hoje produzido

possui, e o qual todo ser humano possui como capacidade mental.

106

Portanto, não há uma frase sequer que seja falada sem o acionamento desse

complexo mecanismo, desse dispositivo mental de regras que gera frases e que

chamamos tecnicamente de gramática. “O livro a que chamamos “gramática” é

apenas uma tentativa aproximada de representar esse sistema mental,

fundamentada em alguma teoria sobre a linguagem humana “ (idem:19).

O que existe, então, são gramáticas diferentes, ou melhor dizendo, distintas

programações lingüísticas mentais, entre o oral e o escrito.

Por isso, a habilidade da mente humana em analisar e reconhecer

corretamente falas, estilos e gramática não é reproduzida satisfatoriamente pelos

computadores, porque mentes e computadores trabalham diferentemente.

Muito ainda precisa ser melhorado quanto às regras contidas no revisor

gramatical eletrônico. Sabemos que a Informática, apesar de seu dinamismo, não

consegue dar conta integralmente da vastidão e dinamismo da língua portuguesa. A

gramática oferecida pelo programa parece, então, realmente tratar-se de uma

gramática que vê a língua como um conjunto de enunciados pré-estabelecidos,

onde não cabem estruturas mais “inovadoras”, mais “soltas”, mais próximas à

modalidade brasileira da língua portuguesa, cotidiana, tão rica em seus usos

lingüísticos, em suas inversões, em sua forma de dizer o pensamento e o

sentimento dos brasileiros.

A nós importa termos tentado conhecer e dar a conhecer o que o revisor

realmente tem a oferecer aos seus usuários, neste momento histórico,

naturalmente.

Por isso, alertamos: os usuários de computador que, ao digitarem textos no

software Word, confiarem demais no seu revisor poderão incorrer em sérios erros,

podendo até mesmo passar por algum tipo de constrangimento causado por sua

ignorância de estruturas eminentemente usuais da língua que está utilizando, as

quais não são apontadas pelo revisor.

Como dissemos anteriormente, para aqueles que dominam melhor a escrita,

a solução é simplesmente ignorar o revisor quando este apresenta sugestões

incongruentes, mas a preocupação é com aqueles que confiam no que ele

apresenta. Acreditamos que essa confiança da parte de algumas - talvez, inúmeras

- pessoas se deva à mera insegurança no próprio conhecimento das regras

aprendidas na escola (ou fora dela) e um pouco de resistência em complementar

107

suas pesquisas por meio de outras fontes; em outras, por ignorância mesmo dessas

regras.

Até que ponto o usuário/redator comum de um texto no computador encontra

dificuldades por não dominar as regras de concordância contidas na gramática

eletrônica não saberemos dizer, mas temos a certeza de que, para quem deseja

escrever um bom texto, com propriedade, é imprescindível o conhecimento do nível

gramatical privilegiado no revisor eletrônico do Word. Isto é, o nível culto da

modalidade escrita da língua, em conformidade com a gramática normativa em suas

regras de concordância nominal prescritas para a linguagem culta contemporânea.

Como todo instrumento criado pelo homem, sempre haverá acusadores e

defensores da existência dos computadores e de sua influência na vida de cada

indivíduo. Todavia, não podemos deixar de reafirmar nosso alerta: o revisor

gramatical eletrônico demonstra ter problemas lingüísticos, e não tecnológicos. E

isso acontece porque sabemos que da linguagem artificial o computador dá conta;

da linguagem natural, não.

Tudo isso não impede que continue havendo questionamentos como: O que

se deve fazer para que o computador “compreenda” uma língua natural? Como

fazer para que uma máquina consiga produzir textos ou falas em uma língua

natural? Chegará o dia em que uma máquina poderá ser capaz de dominar a

sintaxe, o sistema fonológico, as nuanças semânticas e o uso pragmático, entre

outros conhecimentos, de uma língua natural?

Os estudiosos da área da lingüística computacional, como os autores com os

quais trabalhamos (dentre inúmeros outros), acreditam que, algum dia, os

computadores serão capazes, sim, de dominar a linguagem natural de maneira

satisfatória e, assim, interagir de tal modo com os humanos, em uma determinada

língua natural, que não se conseguirá distinguir as respostas da máquina das de um

outro ser humano.

Nesse início do século XXI, temos essa certeza: a informática revolucionou o

pensamento da nossa civilização e, provavelmente, a expressão Assim caminha a

humanidade adquiriu uma nova significação.

Nós... ficaremos à espera do futuro. Ou não.

REFERÊNCIAS BIBLIOGRÁFICAS

ALMEIDA, Napoleão Mendes. Gramática metódica da língua portuguesa: curso

único e completo. 25 ed. São Paulo: Saraiva, 1975.

BECHARA, Evanildo. Moderna gramática portuguesa. 37 ed. Rio de Janeiro:

Lucerna, 1999.

________. Lições de português pela análise sintática. Rio de Janeiro: Lucerna,

2001.

BERBER-SARDINHA, Tony. (org.) A língua portuguesa no computador. (Série As

Faces da Lingüística Aplicada). Campinas-SP: Mercado de Letras/EDUC/FAPESP,

2005.

________. (2000b) Lingüística de corpus: histórico e problemática, in Revista

D.E.L.T.A., vol. 16, n.2 [ www.scielo.br/delta].

________.(2000c) O que é um corpusè representativo?. São Paulo: LAEL PUCSP

[lael.pucsp.br/direct].

CEREJA, William R. & MAGALHÃES, Thereza C. Gramática reflexiva: texto,

semântica e interação. São Paulo: Atual Editora, 1999.

CHOMSKY, Noam. Linguagem e mente. Brasília: Universidade de Brasília, 1998.

CONSOLARO, Hélio. Revisor do Word. Disponível em

www.portrasdasletras.com.br. Acessado em 21/02/2006.

COSCARELLI, Carla Viana e MARTINS, Else. Viciados em F7? Nossa resposta ao

JB (27/09/2001). In Jornal do Brasil. BH, out de 2001.

COSERIU, Eugênio. Teoria da linguagem e lingüística geral. Trad. Agostinho Dias

Carneiro. Rio de Janeiro: Presença/editora da USP, 1979.

ENCICLOPÉDIA SELEÇÕES. [trad. Stela Maris Gandour...et al.]. Tradução e

adaptação de Facts at your fingertips. Rio de Janeiro: Reader’s Digest, 2004.

KURY, Adriano Gama. Novas lições de análise sintática. 9 ed. São Paulo: Ática,

1999.

GENOUVRIER, Emile & PEYTARD, Jean. Lingüística e ensino do português. Trad.

Rodolfo Ilari. Coimbra: Livraria Almedina, 1973.

GREIMAS, A.J. & COURTÉS, J. Dicionário de semiótica. São Paulo: Cultrix, s/d.

JORNAL DO BRASIL. Viciados em F7. Quinta-feira, 27 de setembro de 2001. (s/a)

109

LOBATO, Lúcia M. P. Sintaxe gerativa do português: da teoria padrão à teoria da

regência e ligação. Belo Horizonte: Vigília, 1986.

LOPES, Edward. Fundamentos da lingüística contemporânea. São Paulo: Cultrix,

1993.

LUCCHESI, Dante. Espelho de contrastes. In revista Discutindo Língua Portuguesa,

nº 5, ano 1. São Paulo: Escala Educacional, 2006, p.20-23.

________. As forças da língua. In revista Discutindo Língua Portuguesa, nº 6, ano 1.

São Paulo:Escala Educacional,.2007, p. 18-21.

MANOSSO, Radamés. O software que nos corrige. In: revista Discutindo Língua

Portuguesa. Ano I, nº 3, 2006, pp.24-27.

CÂMARA Jr., J Mattoso. Estrutura da língua portuguesa. Petrópolis: Vozes, 1970.

________. Princípios de lingüística geral. Rio de Janeiro: Acadêmica, 1970.

________. História e Estrutura da Língua Portuguesa. Rio de Janeiro: Padrão, 1975.

NEVES, Maria Helena de Moura. Gramática de usos do português. São Paulo:

Editora UNESP, 2000.

OTHERO, Gabriel de Ávila & MENUZZI, Sérgio de Moura. Lingüística

computacional: teoria e prática. São Paulo: Parábola Editorial, 2005.

PERINI, Mário. Para uma nova gramática do português. São Paulo: Ática, 1985.

RICH, Elaine. & KNIGHT, Kevin. Inteligência Artificial. São Paulo: Makron Books,

1993.

RHINO, L. H. M., DI FELIPPO, Ariani, PINHEIRO, Gisele M., MARTINS, Ronaldo T.,

FILLIÉ, Vanessa M., HASEGAWA, Ricardo, NUNES. M.G.V. Aspectos da

construção de um revisor gramatical automático para o português. Estudos

Lingüísticos. São Paulo, 2002.

SAUSSURE, Ferdinand de. Curso de lingüística geral. 3.ed. São Paulo: Cultrix,

1971.

VANOYE, Francis. Usos da Linguagem: problemas e técnicas na produção oral e

escrita. 11.ed. São Paulo: Martins Fontes, 1998.

VIEIRA, R. Lingüística computacional: fazendo uso do conhecimento da língua.

Entrelinhas, ano 2, n.4, São Leopoldo: Unisinos, 2002.

http://www1.uol.com.br/vestibuol. Acessado em 20/11/2005.

http://www.forcesystem.com

. Acessado em 28/9/2005.

110

http://labbi.uesc.br/apostilas. Acessado em 16/2/2006. .

http://www.amigomouse.com.br/produtos. Acessado em 16/2/2006.

http://www.inf.ufrgs.br. Acessado em 8/3/2006.

http://www.prohpor.ufba.br/projetogram. Acessado em 23/5/2006.

http://inventabrasilnet.t5.com.br/revgram.htm. Acessado em 28/6/2006.

http://intervox.nce.ufrj.br/~edpaes/historia.htm. Acessado em 21/7/2006.

http://www.dc.usfcar.br. Acessado em 1º/9/2006.

http://www.faced.ufba.br. Acessado em 5/10/2006.

http://www.portugues.com.br. Acessado em 19/10/2005.

ANEXO A

Informática: símbolos digitais e glossários

112

Símbolos digitais

Todos os computadores utilizam números binários – o código de máquinas -

para representar letras, números e símbolos escritos. Esses “códigos” de

computador foram padronizados primeiro com o American Standard Code for

Information Interchange (ASCII), em 1963.

O ASCII é, hoje, utilizado por todos os computadores pessoais nos países

que se valem do alfabeto romano e emprega uma seqüência de oito dígitos binários

(ou “bits”) para representar 128 caracteres.

É o que basta para codificar letras minúsculas e maiúsculas,

numerais, sinais de pontuação e 32 “caracteres de controle”

especiais que governam as funções do computador – com mais 128

caracteres “estendidos”, como letras acentuadas e não-latinas e

símbolos gráficos. (Enciclopédia Seleções, 2004:453)

Funciona mais ou menos assim, transcrevendo aqui o exemplo fornecido pela

obra citada acima:

Número binário Decimal equivalente Caractere codificado

00010010 36 S

01000001 65 A

01101011 107 k

10100100 164 ñ

Dessa maneira, quando se aperta a tecla “k”, isso gera o código de

máquina 107, que é convertido no número binário equivalente

(01101011). O sinal de código binário pode então ser processado

pelo computador, e a letra “k” aparece na tela diante do usuário – e

tudo isso se passa em microssegundos. Línguas como chinês e

japonês, porém, possuem muito mais caracteres distintos que

precisam ser representados por 16 dígitos binários. (idem)

Um brevíssimo Glossário

Apresentamos, agora, alguns termos-chave do universo computacional, a

título de ilustração e também de informação aos que ainda não os sabem.

Transcreveremos o que traz a Enciclopédia, às páginas 448-453, na qual estamos

nos baseando para compor este início de capítulo.

• Binário – Sistema baseado nos algarismos 0 e 1.

113

• BIOS – Chip que controla as funções básicas do computador. Armazena

dados vitais mesmo quando o computador está desligado. Inclui instruções

para dar “boot” (partida) no computador.

• Bit – Dígito binário. Menor unidade de informação.

• Buffer – Memória temporária que contém dados prontos para uso.

• Bus – Fiação principal na placa-mãe.

• Byte – Grupo de oito bits; representa – em binário – um número de 0 a 250

ou um símbolo.

• CD-ROM – CD que armazena dados ou programa. Um único CD-ROM pode

armazenar 112 milhões de palavras de texto digital – cerca de duas vezes a

Enciclopédia Britânica.

• Chips controladores – Chips especiais executam funções como gráficos e

controlam componentes como os drives de disco rígido.

• CPU (Unidade central de processamento) – Chip microprocessador,

responsável pela maior parte do trabalho da máquina, processando dados e

coordenando os dispositivos de entrada, saída e armazenamento.

• Drives (acionadores) de disco flexível, CD-ROM e/ou DVD-ROM – Vários

tipos de dispositivos de armazenamento de dados que usam discos

removíveis – variando em capacidade de 1,4 megabytes num disco flexível a

vários milhares de megabytes num DVD-ROM.

• Drive de disco rígido – Local principal e permanente de armazenamento de

dados e programas. Armazena dados como sinais magnéticos em código

binário em discos de metal. Os dados são “lidos” e “escritos” nos discos por

pequenas cabeças magnéticas.

• DVD – Disco de capacidade dados ou programas.

• Arquivo – Código ou dados mantidos juntos numa unidade.

• Hardware – Componentes físicos do computador.

• Microprocessador – É o “cérebro” do computador, o microchip que processa

dados em alta velocidade, segundo instruções programadas.

• Microchips – Componentes elétricos em miniatura interligados numa placa

de circuito.

• Modem – Aparelho que liga o computador à linha telefônica.

114

• Placa-mãe – Placa com circuito impresso, que contém os principais

microchips do computador.

• Rede – Dois ou mais computadores conectados.

• RAM – Memória de computador que pode ser alterada. Composta de

microchips que armazenam dados e programas em uso. Os dados da RAM

se perdem quando o computador é desligado.

• ROM – Memória que não pode ser apagada.

• Software – Instrução ou programa que diz a um computador o que fazer. Há

quatro tipos de software:

* Sistema Operacional (SO) – Controla o computador efetuando

tarefas do dia-a-dia, como receber dados do teclado, exibir informação

na tela ou armazená-la num disco rígido. Funciona sempre que o

computador está ligado. Os usuários em geral interagem com o SO

através de uma interface gráfica (GUI) e do teclado.

* Aplicativos – Programas criados para executar tarefas específicas.

Incluem processadores de texto (WP); controle de banco de dados

(para armazenar detalhes de estoque e clientes, por exemplo);

editoração eletrônica (DTP); e planilhas para cálculos e orçamentos.

* Software de periféricos – Os scanners, câmeras digitais,

impressoras e outros aparelhos precisam de software para ligá-los ao

computador.

* Utilitários – Fazem a tarefa de “manutenção da casa”, como verificar

arquivos de dados em busca de vírus, reparar danos ao disco rígido e

assegurar uma armazenagem eficiente de dados.

• Vírus – Programa nocivo que se reproduz.

Glossário “internético”

Alguns termos-chave da Internet, encontrados na Enciclopédia Seleções

(2004:456-457):

• E-mail Correio Eletrônico – usa a Internet para transmitir mensagens

entre usuários.

115

• GIF – Graphic Interchange Format – formato comprimido para

transmissão de gráficos.

• Hipertexto – sistema de texto clicável, surgido em 1965 e posteriormente

usado para ligar páginas da Web.

• HTML – Hyper Text Markup Language – linguagem de programação

usada para criar páginas da Web.

• HTTP – sistema para envio de arquivos de hipertexto (páginas da Web)

pela Internet.

• ISP – Internet Service Provider – organização que conecta os assinantes

à Internet.

• JPEG – Joint Photographic Experts Group – formato comprimido, usado

para transmissão de gráficos.

• Logo on/off – senha digital para conectar-se ou desconectar-se da

Internet ou de um determinado servidor da rede.

• Modem – Modulador-Demodulador – dispositivo para converter dados

digitais em analógicos e vice-versa, permitindo ao computador usar linhas

telefônicas.

• MPEG – Moving Pictures Experts Group – formato comprimido, usado

para transmitir arquivos de vídeo.

• MP3 – formato comprimido de arquivo de música.

• POP - Point of Presence – um número de telefone do qual o usuário pode

discar para um sistema ISP e assim conectar-se à Internet.

• Servidor – computador ou programa que oferece serviços (como acesso

ou armazenamento de arquivos da rede, ou encaminhamento de e-mails).

• TCP/IP – Transmission Control Protocol/Internet Protocol – sistema que

movimenta dados pela Internet, criado por Vint Cerf e Robert E. Kahn.

• URL - Uniform Resource Locator - nome do endereço de uma página da

rede. O termo foi criado por Tim Berners-Lee quando este criou a World

Wide Web (WWW) e sua URL, padrões HTML e http.

• WAP - Wireless Application Protocol – método para acessar páginas da

rede em celulares.

Fonte: ENCICLOPÉDIA SELEÇÕES. [trad. Stela Maris Gandour...et al.]. Tradução e

adaptação de Facts at your fingertips. Rio de Janeiro: Reader’s Digest, 2004.

Anexo B

ReGra: Revisor Gramatical do Word

117

Transcrição de parte do artigo publicado pelo Núcleo Interinstitucional de Lingüística

Computacional – NILC

RHINO, L. H. M., DI FELIPPO, Ariani, PINHEIRO, Gisele M., MARTINS, Ronaldo T., FILLIÉ,

Vanessa M., HASEGAWA, Ricardo, NUNES. M.G.V. Aspectos da construção de um revisor

gramatical automático para o português. Estudos Lingüísticos. São Paulo, 2002.

“A desambigüização lexical (caso “a”) torna-se pertinente porquanto, como já

foi referido, a homografia em língua portuguesa não é fenômeno raro, induzindo

freqüentemente a erros de diagnóstico uma ferramenta que, diferentemente do ser

humano, e na ausência de estratégias de representação da estrutura semântico-

pragmática dos enunciados lingüísticos, não pode contar senão com a forma, com a

freqüência de ocorrência e com a distribuição das palavras nas sentenças para

proceder ao processamento. A freqüência de ocorrência aparece, no ReGra, como

principal mecanismo de desambigüização lexical, apesar de, em muitos casos, a

ferramenta pouco aproveitar a prioridade de classificação, por não serem

exatamente nítidas as diferenças entre as probabilidades de ocorrências de

itens lexicais muito utilizados em mais de uma acepção gramatical. Neste caso,

é necessária a consideração de critérios distribucionais de diferenciação entre o uso

das palavras, com a delimitação dos contextos de ocorrência dos itens lexicais,

principalmente na situação da vizinhança imediata que se estabelece no

intervalo de um a cinco tokens. (...) No entanto, é forçoso considerar que os

etiquetadores concorrentes partem de um pressuposto estranho e inverso ao do

ReGra: supõem serem corretas as sentenças de entrada. Por este motivo, a

margem de indefinição do revisor é consideravelmente mais expressiva do que a

verificada em outros contextos do PLN, sendo muitas decisões lexicais adiadas

para o processamento sintático, nem sempre hábil o suficiente para capturar a

correta categorização gramatical das palavras. Para evitar a explosão

combinatória devida à indefinição lexical, restringimos o escopo de atuação do

revisor à oração simples, isolando para processamento, sempre que possível,

as coordenações e subordinações. Com a inevitável perda das relações de

dependência entre as várias orações de um período composto, o espectro de

problemas a serem resolvidos também foi restrito. Entretanto, na análise do

desempenho final, essa contingência revelou-se preferível à proliferação das

intervenções indevidas, com riscos à credibilidade do ReGra.

118

A etapa de processamento gramatical, propriamente dita (caso “b”), diretamente

relacionada à verificação da adequação gramatical da sentença de entrada, está

subdividida em três subcomponentes: a verificação de boa-formação sintática da

sentença, a etiquetação sintática de seus itens lexicais durante o parsing e a

verificação da consistência das relações de dependência entre os mesmos, com

correspondente aconselhamento ao usuário. O formalismo gramatical definido

para reconhecer sentenças bem-formadas, segue uma gramática livre de

contexto, cujo conjunto de regras de produção torna-se diretamente operacional

com as redes sintáticas (ATNs), responsáveis por derivar a sentença de entrada,

processo realizado de forma top-down, da esquerda para a direita, a partir do

símbolo inicial da gramática, com o auxílio de uma janela de geração de dimensão

variada, para evitar ciladas sintáticas freqüentes, particularmente devidas aos

problemas de desambigüização lexical. O parser apresenta como resultado uma

única possibilidade de estruturação sintática: a mais provável, segundo escolhas

gramaticais realizadas também com base na prioridade de freqüência (de suas

regras), definida a partir da análise de fragmento expressivo do corpus do NILC.

Há dois subconjuntos de regras de revisão: as pontuais, que acompanham

padrões fixos de distribuição sintática, pouco ou nada dependentes do parsing, e as

genéricas, que operam diretamente sobre a saída do parser. As primeiras,

numericamente expressivas, são extremamente eficientes, mas possuem alcance

limitado, pois se restringem a problemas de adequação lexical e ao uso de

padrões lingüísticos já registrados nas gramáticas normativas do português

(p.ex., uso de crase diante de palavras masculinas). As segundas, muito menos

numerosas e muito mais abrangentes que as anteriores, investigam as

relações de concordância e regência entre os itens lexicais etiquetados

sintaticamente. Como a saída do parser é falível, devido a indeterminações

lexicais ou a outros acidentes de processamento, o conjunto dessas regras induz

freqüentemente a ferramenta a erro.

O pós-processamento gramatical (caso “c”) consiste na identificação

precisa do desvio da norma, para o aconselhamento correspondente.

Constatada, por meio de qualquer um dos tipos de regras de revisão, a má

formação de alguma estrutura utilizada pelo usuário, dispara-se

imediatamente a medida de revisão correspondente, que indicará a existência

do problema e proporá nova estrutura, a ser aceita ou rejeitada pelo usuário,

119

para que se possa persistir na verificação da sentença. Diferentemente do

aconselhamento ortográfico, que é feito pela combinação sistemática dos caracteres

da palavra não-encontrada no dicionário, o aconselhamento gramatical depende

profundamente do processamento nos níveis anteriores, razão pela qual o

aconselhador retroalimenta a revisão gramatical.”