Proyecto Fin de Carrera Ingeniería en Informática Sistema de Resolución de la Ambigüedad Semántica Basada en el Conocimiento Alumno: D. Álvaro Acebedo.

1 Proyecto Fin de Carrera Ingeniería en Informática Siste...
Author: Xavier Crespo Ortíz
0 downloads 0 Views

1 Proyecto Fin de Carrera Ingeniería en Informática Sistema de Resolución de la Ambigüedad Semántica Basada en el Conocimiento Alumno: D. Álvaro Acebedo Director: D. Germán Rigau Septiembre 2007 - FISS

2 Índice Introducción Objetivos del Proyecto SSI Pruebas Gestión Conclusiones Demo

3 Introducción  Este proyecto se enmarca en el área de la Inteligencia Artificial, en concreto en lo referido al Procesamiento del Lenguaje Natural.  La WSD consiste en decidir el sentido apropiado de una palabra dependiendo de su contexto.  Para llevarlo a cabo nos valdremos de Bases de Conocimiento.

4 Introducción – Ejemplo  Ejemplo de base de Conocimiento: MAMÍFER O ANIMA L PELAJ E AGU A vive en es un tiene es un

5 Introducción  WordNet 2.0 115.424 nodos, 337.984 relaciones en total.  MCR Desarrollado por el grupo Meaning. Aglutina diferentes versiones de WordNet y diferentes idiomas.

6 Introducción – Adquirir conocimiento  ¿Es posible enriquecer las Bases de Conocimiento con los mismos métodos de desambiguación que se valen de ellas? Desambiguación de Glosas (Senseval)

7 Introducción – WSD orientado a las Glosas  Ballena: Mamífero Cetáceo de hasta quince metros de longitud y enormes aletas. MAMÍFERO 1 ALETA 1 2 CETÁCEO 1 METRO 1 3 2 MAMÍFERO 1 CETÁCEO 1 ALETA 2 METRO 3

8 Objetivos del Proyecto  Objetivos Primarios: Idear, diseñar, implementar y evaluar algoritmos WSD basándonos en SSI.  Objetivos Secundarios: Añadir funcionalidad al MCRQuery. Crear procedimientos almacenados. Añadir visualización de los grafos.

9 Esquema de Descomposición del Proyecto

10 DOP – Casos de Uso  El desarrollo de este proyecto sólo implica la realización de un caso de uso sencillo.

11 SSI  Mecanismo iterativo para la desambiguación basada en el conocimiento.  Crea especificaciones estructurales de los posibles sentidos de cada palabra en un contexto y selecciona la mejor hipótesis de las posibles, describiendo relaciones entre las especificaciones de los sentidos mencionados.

12 SSI. Mecanismo PEZ 1 3 2 MAMÍFERO 1 GATO 1 2 MAMÍFERO 1

13 SSI. Mecanismo MAMÍFERO 1 GATO 1 MAMÍFERO 1 GATO 2 0,1 6 0,8 3

14 SSI. Mecanismo PEZ 1 3 2 GATO 1 2 MAMÍFERO 1 GATO 2

15 SSI. Mecanismo MAMÍFERO 1 PEZ 1 GATO 2 PEZ 1 MAMÍFERO 1 PEZ 2 GATO 2 PEZ 2 MAMÍFERO 1 PEZ 3 GATO 2 PEZ 3 ++ + 0,7 8 0,2 1 0,1 3

16 SSI. Mecanismo PEZ 1 3 2 MAMÍFERO 1 GATO 2 PEZ 1

17 SSI – versión 3 de st. 3 2 2 2 2 2 2 2 2 1 11 ori g.

18 SSI – versión 3 de st. 3 2 2 2 2 2 2 2 2 1 11 ori g.

19 SSI – versión 4  Utiliza el algoritmo de Dijkstra para la obtención de caminos mínimos. $g->dijkstra_shortest_path($s, $t);  Se usa una estructura total de la base de conocimiento para aplicar el algoritmo.

20 SSI – versión 4b  Construye grafos simplificados para el cálculo de los caminos.  También tiene en cuenta la distancia máxima.  Procesa los caminos valiéndose de pilas que almacenan el proceso.

21 SSI – versión 4b de st. 2 2 1 2 1 ori g.

22 SSI – versión 4b de st. 2 2 1 2 1 3 2 2 2 2 2 1 ori g.

23 SSI – versión 5  Crea 'nubes' alrededor de los nodos fuente y destino.  Analiza la similitud entre las 'nubes' para encontrar caminos.  La distancia máxima a la que se encuentran caminos duplica la distancia máxima de las 'nubes'.

24 SSI – versión 5 o ri g. d e st. 1 11 1 1 1 2 2 2 2 2 2 2 2 2 2

25 SSI – versión 5 o ri g. d e st. e e c c a a d d b b

26 SSI – versión 5 de st. e c a d b ori g.

27 Pruebas  Se han realizado dos juegos de pruebas: Pruebas sencillas. Ejecutamos los algoritmos con un juego de términos determinado y observamos resultados. Senseval-3. Taller Internacional de Desambiguación de Glosas basado en eXtended WordNet. Incluye mecanismos de calificación propios.

28 Pruebas - Iniciales  Juego de Pruebas Uno: flight, scheduled, trip, plane, designated, airport  Juego de Pruebas Dos: port, place, seaport, airport, people, merchandise, enter, leave, country

29 Pruebas – Senseval (WN2.0)  Sólo fue posible procesar dos de los cuatro algoritmos ideados.

30 Pruebas – Senseval (WN2.0+XWN2.0)  Los resultados mejoraron ampliando la base de conocimiento con eXtended WordNet.

31 Pruebas Senseval - Comparativa

32 Gestión

33 Balance de Éxito  Objetivos Primarios: Idear, diseñar, implementar y evaluar algoritmos WSD basándonos en SSI.  Objetivos Secundarios: Añadir funcionalidad al MCRQuery. Crear procedimientos almacenados. Añadir visualización de los grafos.

34 Conclusiones finales  Un factor muy influyente en la ejecución es la distancia a la que se buscan relaciones entre conceptos.  Las limitaciones de procesamiento de la máquina y el tiempo de la ejecución son un obstáculo importante.  Las herramientas con licencia 'open- source' han resultado muy efectivas.

35 Demo

36 ¡Gracias por su atención! ¿Preguntas?