Details

Interpretação automatizada de textos: processamento de anáforas

by Andrade de, Sérgio Antônio

Abstract (Summary)
Esta tese apresenta uma solução para a interpretação de anáforas nominais definidas.Considere o seguinte texto:(1) a. Mariana comprou um carro novo.b. O motor veio dani_cado.A frase (1a) apresenta duas entidades: Mariana e um carro novo. Já a frase (1.2b) tem apenas uma entidade o motor. No processo de interpretação, humano ou computacional, a utilização do artigo definido ?o? é um indicativo de que a entidade já havia sido introduzida no discurso, i.e. apresenta um caráter anafórico. Resolver uma anáfora é, a priori, identificar a quem ou a que se refere esta anáfora. Mas no caso acima é mais do que isto: sem dúvida o motor existe no texto por causa da existência de um carro, porém a interpretação do motor deve ir além disto e identificar como este motor está ligado com aquele carro. Isto é uma anáfora nominal definida. A interpretação das anáforas nominais definidas ou de qualquer fenômeno anafórico pode ser generalizada como um processo que atribui valores aos itens da seguinte equação:R(A, T ) (2)onde: A denota a entidade introduzida pela interpretação fora de contexto de um pronome, de uma elipse ou de um sintagma nominal de_nido, T denota o seu antecedente e R é a relação existente entre A e T . O processo de resolução da equação, que é propriamente o processo de resolução de anáforas, consiste em descobrir T e R dado A. Nesta tese é proposta uma metodologia computacional que interpreta as anáforasnominais definidas cuja relação R é uma dentre: parte de, membro de, subcategorizado por e coreferência. A obtenção das relações é feita por um conjunto de regras pragmáticas [Freitas, Lopes e Menezes 2004, Filho e Freitas 2003] (cap. 3). Caso seja constatado que A não seja anafórica então ela é acomodada no contexto.A metodologia computacional é construída sobre um ambiente de programação em lógica [Damásio, Nejdl e Pereira 1994] que permite raciocinar abdutivamente [Kakas, Kowalski e Toni 1992] sobre a representação semântica dotexto [Kamp e Reyle 1993]. A partir da interpretação das entidades é construída a estrutura nominal do discurso [Lopes e Freitas 1994] (cap. 4), a qual permite: (1) fazer o acompanhamento das entidades mais salientes em cada frase [Freitas e Lopes 1994], (2) limitar o universo de escolha de possíveis antecedentes[Freitas e Lopes 1996] e (3) prover um resumo das entidades do discurso.O resultado é uma metodologia que permite, de forma integrada, resolver anáforas e elipses, sendo que a estrutura nominal do discurso pode ser usada na busca de informações.
Bibliographical Information:

Advisor:Jose´Gabriel Pereira Lopes; Rosa Maria Viccari; Berilhes Borges Garcia; Davidson Cury; Orivaldo de Lira Tavares; Credine Silva de Menezes

School:Universidade Federal do Espírito Santo

School Location:Brazil

Source Type:Master's Thesis

Keywords:processamento da linguagem natural computação de textos anáfora linguística algoritmos computador engenharia eletrica

ISBN:

Date of Publication:04/11/2005

© 2009 OpenThesis.org. All Rights Reserved.