71
modelo de ordenação, aumentando a qualidade dos
clusters
criados. No entanto, a
redução do volume de informações tenderá a ser menos significativo, o que reduzirá a
eficácia do processo de clusterização. Por outro lado, utilizando um valor menor, a
ordem se inverterá, pois se ganha em eficácia e perde-se em qualidade dos
clusters
.
Assim, a melhor alternativa seria utilizar um valor intermediário para a correlação,
privilegiando tanto a qualidade, como a eficácia do método de clusterização.
Com os resultados obtidos neste trabalho pode-se verificar uma melhoria na
gerência das informações necessárias para a manutenção do modelo de ordenação
proposto por DETERS (2003). Porém, este estudo representa uma pequena parte do que
é necessário para implantar o modelo em qualquer ferramenta de busca, visto as
características de cada sistema de Recuperação de Informação Web. No entanto, isto
não impossibilita que se chegue a algumas conclusões sobre a possibilidade da
implantação do modelo nestas ferramentas. Por exemplo, para um metabuscador, tal
como o utilizado neste trabalho, é viável sua utilização. Isto porque a única base de
dados a ser gerenciada pelo sistema é a própria na qual estão armazenadas as
informações pertinentes ao modelo, além do mais, como apresentado neste trabalho, o
método de clusterização consegue minimizar o crescimento desta base de dados. Já para
os diretórios e mecanismos de busca sua utilização torna-se mais complexa, pois, além
da base de índices, estas ferramentas teriam que gerenciar a base de dados do modelo,
que, possivelmente, seria tão volumosa quanto a primeira, sendo necessário, por isto,
novos estudos para viabilizar a utilização deste modelo de ordenação, sem comprometer
a velocidade da recuperação.
Outro ponto importante refere-se aos problemas existentes para se obter o tempo
de permanência do usuário nos documentos Web, assim como para obter o tempo
esperado para a leitura de um determinado documento. A primeira situação seria um
problema comum para todas as classes de ferramentas de busca. Já a segunda, seria um
problema maior para as ferramentas que não indexam os documentos Web (como, por
exemplo, metabuscadores ou diretórios), visto que esta tarefa já é parcialmente realizada
pelos mecanismos de busca, no momento que os mesmos constroem a representação
destes documentos. Por causa destes problemas, além do excesso de informações a ser
gerenciada, outra possibilidade para a utilização do modelo de ordenação proposto por