total ausência de um programa de construção de gramáticas de línguas particulares.
1
(GROSS, 1979, p. 871, tradução nossa).
A afirmação de Gross evidencia a necessidade de descobrir uma teoria sobre como os
indivíduos geram estruturas lingüísticas, mas considera que é necessária a construção de
gramáticas das várias línguas que possam confirmar a aplicação desses princípios, ou seja, é
necessário realizar um trabalho “concreto” a partir das línguas naturais, para que se possam
construir gramáticas mais fidedignas dessas línguas.
Para tanto, é necessário realizar levantamento e sistematização de dados, realçando a
preocupação com a exaustividade (tanto quanto possível). Esse tipo de procedimento traz
como conseqüência a não escolha de dados por conveniência, evitando-se, assim, a seleção de
evidência, voluntária ou involuntária.
Perini (2008) afirma que
o pesquisador, na preocupação de encontrar evidência que corrobore sua teoria,
seleciona dados favoráveis com muito mais energia do que a que utiliza na procura
de dados desfavoráveis, apresentando, dessa maneira, uma imagem deformada da
realidade lingüística em estudo. O resultado é, muitas vezes, o paradoxo de análises
que parecem, ao serem lidas, solidamente fundamentadas, mas que, ao enfrentarem
oposição real, mostram uma fragilidade inesperada. (PERINI, 2008, p. 14).
Neste trabalho, cujo tema é a descrição das estruturas de gerúndio na língua
portuguesa do Brasil, o ponto de partida será o levantamento, tão exaustivo quanto possível,
incluindo ocorrências que muitas gramáticas desconsideram por serem justamente aquelas que
não se enquadram em seu modelo teórico e que, se analisadas em profundidade, podem
alterar, inclusive, conceitos que até então vêm sendo utilizados de modo consensual (como o
conceito de sujeito, por exemplo).
Percebe-se, portanto, que a não seleção de dados está relacionada à exaustividade, o
que ocasiona a ênfase no uso de corpus. É interessante notar que a lingüística compõe a
minoria das ciências que necessitam explicitar que a análise a ser feita deve basear-se em
dados, o que é óbvio para outras áreas. Segundo Perini (2008),
a pesquisa lingüística precisa ser muito mais baseada em dados do que tem sido nos
últimos tempos; [...] faltam dados que dêem apoio à maioria das análises e teorias;
[...] o trabalho de levantamento de tais dados é algo que se deve encorajar tanto ou
mais do que o de elaboração de novos modelos e teorias. Em outras palavras: sem
desprezar a explicação, falta descrição. (PERINI, 2008, p. 14).
1
There is a fundamental behavioral inconsistency between (a) the idea that the G(enerative) G(rammar) provides
the basis upon which to discover a theory of language and (b) the total lack of a program for constructing
grammars of particular languages.