Capacidad provada de tratar restricciones sintácticas complejas
XDG: nodos y arcos
Un análisis más simple
Grafo dirigido y etiquetado de
un conjunto de nodos de palabras y
un único nodo central asociado con la puntuación del fin de oración
Un conjunto de rasgos para cada nodo
XDG: dimensiones (1)
Dimensiones múltiples, cada una que corresponde a un nivel de abstracción gramática
Un análisis es un multigrafo
Algunas dimensiones
Sintaxis: Precedencia Lineal, Dominio Inmediato
Semántica: Predicado-Argumento, Ámbito
XDG: dimensiones (2)
XDG: dimensiones (3)
Dimensión de interfaz: relaciona dos dimensiones, no tiene sus mismos arcos
XDG: dimensiones de interfaz (2)
XDG: principios
Un análisis gramatical de una oración es uno que se conforma a un conjunto de restricciones
Cada restricción se genera por medio de un principio
Cada dimensión tiene su propio conjunto de principios
Los principios se definen de una manera específica de la lengua
Algunos principios
Principio de Árbol: constreñe la estructura del grafo
e.g., un nodo tiene exactamente un node padre (arco entrante)
Principio de Valencia: constreñe las etiquetas de los arcos entrando en y saliendo de nodos
e.g., un verbo inglés debe tener un arco saliente con etiqueta 'sujeto'
Principio de Concordancia: constreñe valores de nodos relacionados por arcos con etiquetas
específicas
e.g., un verbo español debe tener el mismo del valor de persona que su sujeto
Principio de Valores de Concordancia (Arg): constreñe los posibles valores de los rasgos de un nodo
e.g., el valor del rasgo persona del verbo curaba debe ser 1 o 3
Principio de Orden: constreñe el orden de los nodos
e.g., el sujeto del verbo inglés debe preceder el verbo
Principios de Vinculación: constreñen la manera de que los arcos en dos dimensiones se asocian
e.g., el sujeto (en el Sintaxis) del verbo curar corresponde al agente (arg1; en la Semántica)
XDG: resumen
Los elementos de un análisis: (nodos), arcos, etiquetas, rasgos
Una gramática: basada en restricciones sobre los arcos y sus etiquetas y los rasgos
¿Dónde y cómo se declaran las restricciones?
¿Cómo se utilizan las restricciones? ¿Cómo se lleva a cabo el procesamiento de una oración?
XDG: gramática y léxico
Una gramática XDG
Un conjunto de dimensiones, cada una con sus principios característicos y sus etiquetas de arcos posibles
Un léxico
Todas las restricciones gramáticales específicas se almacenan en unidades al nivel de la palabra
Léxico
Un conjunto de entradas léxicas organizado en una jerarquía de herencia
Lexemas o clases léxicas de las que la unidad hereda sus propiedades
Una o más especificaciones de restricciones gramaticales,
cada una invocando un principio para un dimensión
XDG: entradas léxicas
Verbo transitivo de la cláusula principal: Dimension de Sintaxis, Principio de Valencia
Lexema gustar: Dimension de interfaz entre Sintaxis y Semántica, Principio de Vinculación
La léxico/gramática como jerarquía de herencia
La léxico/gramática se organiza en una jerarquía de entradas léxicas
Cada entrada hereda sus restricciones de sus antepasados (superclases) en
la jerarquía
Un concepto familiar en la inteligencia artificial, la programación orientada a objetos,
algunas teorías lingüísticas (HPSG, etc.)
XDG: procesamiento (1)
El sistema busca uno o más análisis a través de la satisfacción de restricciones
Un conjunto de variables con posibles valores
Un conjunto de restricciones sobre las variables
Un solución: un solo valor para cada variable (una asignación)
Aplicaciones y investigaciones en IA
XDG: procesamiento (2)
Representación de analisis XDG a través de variables
Cada nodo n tiene una variable de hijos cuyo valor es el conjunto de
índices de los nodos hijos de n
Variables de concordancia, valencia, orden
XDG: procesamiento (3)
(Análisis morfológico)
Lexicalización
Creación de variables
Instanciación de restricciones que constreñen (y relacionan) variables
Satisfacción de restricciones
Conversión de asignación de variables a análisis
(Generación morfológica)
XDG: ejemplo de análisis (1)
Se analizan morfológicamente las palabras de la oración
XDG: ejemplo de análisis (2)
Se buscan entradas léxicas que se emparejan con cada palabra en la oración
Puede haber ambigüedad: más que una entrada puede emparejarse con una palabra
Se crea una variable para cada nodo cuyo valor es el conjunto de entradas que satisfacen
todas las restricciones
XDG: ejemplo de análisis (3)
Se copian los rasgos en las entradas léxicas (y sus superclases)
XDG: ejemplo de análisis (4)
Se invocan principios citados en las entradas léxicas encontradas (y sus superclases)
Creación de variables
Instanciación de restricciones que relacionan variables
XDG: ejemplo de análisis (5)
Se satisfacen las restricciones
Si finaliza con éxito, retorna todas las asignaciones de variables completas;
cada una corresponde a un solo análisis que se conforma a la gramática
(un multigrafo que conecta todo los nodos)
La XDG multilingual (1)
Warmiqa chhulliwanmi kashan. 'La mujer tiene gripe.'
Warmi:qa
chhulli:wan:mi
ka:sha:n
mujer:TOP
gripe:ACOMP:ASRT
estar:asp=cont:sb=3s
'Mujer está con-gripe.'
La XDG multilingual (2)
Una oración y su traducción a una o más lenguas:
nada más que un multigrafo que conecta los nodos de la oración sobre todas dimensiones
La XDG multilingual (3)
La semántica como lengua
Las relaciones entre otras lenguas y la semántica como relaciones entre
entradas léxicas
La XDG multilingual (4)
Enlaces incluyen restricciones en la dimensión de interfaz entre las lenguas
La XDG multilingual (5)
Una gran gramática con
Dimensiones sintácticas para cada lengua
Una semántica (una o mas otras dimensiones)
Dimensiones de interfaz que relacionan cada lengua a la semántica
Enlaces entre entradas léxicas en la semántica y las otras lenguas
con restricciones de la interfaz
Paradigmas de la TABR
La traducción en XDG multilingual
Análisis + generación
Enlaces entre lenguas funcionan como enlaces de herencia en las léxico-gramáticas
Satisfacción de restricciones normal
Pasos adicionales para la generación (lengua meta)
Ordenación de palabras de la salida
Generación morfológica
Ejemplo de traducción (1)
Lexicalización (1)
Se atravesan también los enlaces interlingüísticos desde las entradas encontradas
Ejemplo de traducción (2)
Lexicalization (2)
Las restricciones también se heredan de las entradas en otras lenguas
Las raices lexicales se heredan de las entradas de la lengua meta
Ejemplo de traducción (2)
Satisfacción de restricciones
Ordenación de palabras en la oración de salida
Los nodos tienen variables para su posición en la oración de salida
Estas variables obtenen valores durante la satisfacción de restricciones
Ejemplo de traducción (3)
Generación morfológico
Las formas de superficie de las palabras de la oración de salida se generan a través
de un generador morfológico, basadas en los rasgos que resultaron durante la satisfacción
de restricciones
Estado del proyecto
Implementación de XDG (escrita en Python)
Analizadores/generadores morfológicos de amárico, oromo, tigriña, quechua, guaraní y español
(Gasser, 2009)
Gramatiquitas XDG para ingles, español, quechua, amárico, semántica más enlaces interlingüísticos