Se encuentra usted aquí

Desarrollo de un sistema de representación semántico-conceptual y su implementación en un algoritmo de enlace bidireccional sintaxis-semántica (FFI2011-29798-C02-01)

Este Proyecto es continuación de las últimas investigaciones realizadas en el Modelo Léxico Construccional (MLC), formulado por Mairal y Ruiz de Mendoza, y su posterior implementación para el procesamiento del lenguaje natural a través de FunGramKB. El MLC es un modelo de construcción del significado que aporta una descripción exhaustiva de todos los niveles necesarios para la construcción del significado, incluso de aquellos que van más allá de los aspectos puramente gramaticales, a saber, incorpora aspectos centrales de la teorías de la implicatura conversacional en el nivel 2 o nivel pragmático, describe los parámetros esenciales del significado ilocutivo en el nivel 3 y los principios analíticos que gobiernan el significado discursivo en el nivel 4. El MLC propone las nociones de plantillas léxicas y construccionales. Las primeras codifican conocimiento enciclopédico ligado a una estructura lógica basada en distinciones de Aktionsart. Las segundas constituyen o bien estructuras argumentales, como las descritas en los modelos de Gramáticas de Construcciones, o bien configuraciones de corte más idiomático con elementos variables y fijos (lexicalizados). El MLC especifica en qué condiciones se pueden incorporar representaciones de unos niveles de análisis en los superiores y cómo interaccionan las construcciones de un mismo nivel: por ejemplo, las plantillas léxicas se fusionan con plantillas construccionales mediante un proceso regido por principios como la subsunción que está, a su vez, regulada por un inventario de restricciones internas y externas. En esencia, el MLC ha desarrollado las herramientas para realizar una rica y exhaustiva caracterización de las construcciones, sus relaciones, su organización, así como los modos de interacción entre ellas y los predicados verbales.

Todo este robusto marco de representación construccional posee una versión computacional, el Gramaticón de FunGramKB (www.fungramkb.com), que es una base de conocimiento multilingüe y multipropósito que comprende dos niveles principales de conocimiento, a saber, el nivel lingüístico – que incluye los módulos léxico, morfológico y gramatical -  y el nivel conceptual – que consta de  una ontología (conocimiento semántico), un cognicón (conocimiento procedimental) y un onomasticón (conocimiento episódico), cada uno de estos módulos son independientes aunque claramente interrelacionados. En este contexto, un paso ulterior es explorar cómo estos dos niveles de representación, y sus correspondientes módulos, interactúan con el fin de lograr un metalenguaje de representación semántica para el análisis de textos en inglés y español.

Por consiguiente, a la luz de los resultados obtenidos en tres proyectos previos (HUM2005-02870/FILO, FFI2008-05035-C02-01 y FFI2008-05035-C02-02, donde hemos elaborado un inventario de plantillas léxicas y construccionales a la vez que hemos trazado la arquitectura básica de FunGramKB, tenemos como objetivo desarrollar un algoritmo que, a modo de interfaz, enlace los componentes lingüístico y conceptual que conforman la referida base de conocimiento con el fin de obtener un sistema formal de representación, denominado estructura lógico conceptual, que nos permita construir la representación semántica de un texto a partir de su representación sintáctica. Sostenemos que los resultados de este proyecto tienen una gran resonancia científica en un contexto lingüístico pues, de un lado, supone el desarrollo de un algoritmo que, como parte de una interfaz lingüístico-conceptual, nos proprociona una representación semántica de un texto, y, de otro lado, en el marco del procesamiento del lenguaje natural los resultados de este proyecto proporcionan herramientas poderosas para el desarrollo de sistemas de recuperación y extracción de la información.