Translate

jueves, 15 de noviembre de 2018

Inteligencia Artificial. Eliza: Dialogo con una máquina


Nota del T: Sigo traduciendo el libro de Peter Norvig. Son complicadas algunas funciones, le aconsejo que las vaya construyendo a medida que lee. Si hay problemas con alguna traducción les ruego me avisen.

Acá dejo el programa completo: ELIZA.lisp

Este capítulo y el resto de la parte 1 examina tres programas más de IA bien conocidos de la década de 1960. Eliza mantiene una conversación con el usuario en la que es simulada una psicóloga. STUDENT resuelve problemas de los que son encontrados en los libros de álgebra, y MACSYMA resuelve una variedad de problemas matemáticos, incluyendo cálculo diferencial e integral. Desarrollaremos versiones de los primeros dos programas que duplican la mayoría de las características esenciales, pero para el tercero implementaremos solo una pequeña parte de las capacidades del programa original.
Los tres programas usan una técnica llamada “coincidencia de patrones”. La parte 1 sirve para mostrar la versatilidad –y también las limitaciones- de esta técnica.
De los tres programas, los primeros dos procesos introducen un Español plano, y los últimos dos resuelven problemas no triviales de matemática, de esta manera hay algunas bases para describirlos como “inteligentes”. Por otro lado, veremos que esta inteligencia es por lejos una ilusión, y que Eliza en particular fue diseñada para demostrar esta ilusión, no para ser un programa “serio” de IA.
ELIZA fue uno de los primeros programas que tenía al idioma Inglés como salida tanto así como en la entrada. El programa fue llamado después la heroína de Pygmalion, que fue enseñada para hablar Inglés correctamente a través de un dedicado profesor. El principal desarrollador de ELIZA fue el profesor Joseph Weizenbaum del MIT, publicada en el documento sobre ELIZA en Enero del 1966 para el problema de la comunicación entre máquinas de cómputo. La introducción a ese documento es reproducida enteramente aquí:

Se dice que explicar algo es explicarlo en profundidad. Esta máxima está aquí para mostrar como es el área de programación de ordenadores, especialmente en lo que se concierne a programación heurística e inteligencia artificial. En estos dominios las maquinas son hechas para comportarse de maneras maravillosas, obteniendo suficiente para deslumbrar incluso a la mayoría de los observadores experimentados. Pero una vez que un programa particular es desenmascarado, una vez que el trabajo interno es explicado en un lenguaje suficientemente plano para inducir a la comprensión, su magia se desmorona, su puesto es revelado como una mera colección de procedimientos, cada uno de los cuales es comprensible. El observador se dice a si mismo, “Yo podría haber escrito eso”. Con ese pensamiento el mueve el programa en cuestión del estante marcado como “inteligente”, al de las curiosidades, encajando en la discusión solo con personas menos ilustradas que él.

El objeto de este documento es causar solo una re-evaluación del programa a ser “explicado”. Pocos programas necesitan eso.
Déjeme explicar el punto sobre que el objeto principal de este libro es causar que el lector se diga a sí mismo, “yo podría haber escrito eso”. Esta será la esperanza en algunos casos debido a que el lector haya ganado algo, y no solamente porque el programa en cuestión haya perdido su habilidad para deslumbrar.
Empecemos nuestra investigación sobre ELIZA mirando un ejemplo de diálogo desde el artículo de Weizenbaum. ELIZA fue diseñada para ser instruida por una variedad de guiones, o patrones de interacción. En efecto tiene varios guiones, incluyendo algunos en alemán y galés. Pero el único guión que fue usado para cualquier extensión fue en inglés, y esto hace ELIZA emular un psicoanalista Rogeriano. Los Rogerianos no tienen “directivas” – ellos intentan dejar al paciente que se revele a sí mismo. Este es un guion sencillo de seguir para ELIZA, porque este encierra el hecho de estar pasivo y reaccionar, antes que voluntariamente generar nueva información. En el listado siguiente, la entrada del usuario está en oraciones, tanto en mayúsculas como minúsculas, y ELIZA responde solo en mayúsculas:

Los hombres son todos iguales.
EN QUE SENTIDO
Ellos están siempre fastidiándonos sobre una cosa u otra.
PUEDES SER MAS ESPECIFICA
Bueno, mi novio me hizo venir aquí.
TU NOVIO TE HIZO VENIR AQUÍ
El me dice que estoy deprimida a menudo.
ME APENA ESCUCHAR QUE ESTES DEPRIMIDA
Es verdad. No soy feliz.
PIENSAS VENIR AQUÍ PARA QUE TE AYUDE A SER FELIZ.
Necesito alguna ayuda, eso me parece.
QUE PASARIA SI TE OFREZCO ALGUNA AYUDA
Tal vez aprendería a llevarme bien con mi madre.
HABLAME MAS ACERCA DE TU FAMILIA

Esto parece impresionante; el programa está respondiendo razonablemente a una variedad de entradas y muestra una verdadera “comprensión”. Pero, como explica Weizenbaum, esta apariencia es una ilusión, y el programa ha reducido la difícil tarea de comprender a través de un cuidadoso reconocimiento, transformando, y haciendo eco de las piezas de entrada. El procedimiento es observar patrones específicos, basados en una palabra clave o palabras en la entrada. Por ejemplo, siempre que el programa aparece la palabra “iguales” o “mismo”, esta escribe un mensaje en pantalla respondiendo sobre cosas que son semejantes, en este caso “EN QUE SENTIDO”. Otros patrones son más complicados. Cerca del último intercambio, ELIZA arroja lejos todo lo que esta después de la coma, y luego usa un patrón que mira las entradas de la forma “necesito X” y lo transforma en la salida “Que pasaría si te ofrezco X”, donde X es la frase “alguna ayuda” en este caso. La gran ventaja de este enfoque es que la respuesta se hará en base a una variedad de entradas: “necesito vacaciones” y se obtendrá “Que pasaría si te ofrezco vacaciones”. Esto ocurrirá automáticamente, sin tener que decirle al programa la diferencia entre “alguna ayuda” y “vacaciones”. La desventaja es que el programa algunas veces hará respuestas tontas: “necesito esto como un agujero en la cabeza” será respondido con “Que pasaría si te ofrezco esto como un agujero en la cabeza”. En efecto, el programa solo construye cualquier sentido en todo caso si recibe entradas desde alguien que construye sentido –y alguien que interpreta sus respuestas caritativamente. Cuando se le da “necesito gibble pliz zzq”, ELIZA replicaría “Que pasaría si te ofrezto gibble plix zzq”, sin ningún indicio de que algo está mal. Otro ejemplo del programa original ELIZA cuando mantiene una comunicación con otro programa PARRY, que fue escrito por el Dr. Kenneth Colby para simular un comportamiento paranoico. Parte de esa conversación sigue a continuación, con ELIZA nuevamente solo en mayúsculas y PARRY en oraciones, tanto en mayúsculas como minúsculas:

No entiendo tus motivaciones.
¿QUE NO ENTIENDES DE MIS MOTIVACIONES?
¿No debería ser yo?
¿POR QUE DICES ESO AHORA?
Así es la manera.
SUPONGA QUE LA MANERA NO FUERA ASI.
¿Así?
NO ESTOY SEGURA DE ENTENDERTE COMPLETAMENTE.
Insistes demasiado en las mismas preguntas.
¿QUE TE SUGIERE ESA SEMEJANZA?
No te entiendo.
¿QUE ES LO QUE DESEAS ENTENDER?

Esto sugiere que PARRY el vecino de ELIZA, tiene una comprensión profunda del diálogo. Cuando hay un humano que tiene la mayoría de la carga para llevar adelante la conversación, estos programas pueden ser convincentes, pero cuando el humano está fuera de la conversación, las debilidades del programa son reveladas.

Describiendo y especificando ELIZA


Ahora que tenemos una idea de lo que es ELIZA, podemos comenzar la descripción y especificación del programa, y eventualmente movernos hacia la implementación y el debugging. El algoritmo de ELIZA puede ser descrito simplemente como: (1) leer una entrada, (2) buscar un patrón que coincida con la entrada, (3) transformar la entrada en una respuesta, y (4) mostrar en pantalla la respuesta. Estos cuatro pasos son repetidos para cada entrada.
La especificación e implementación de los pasos (1) y (4) son triviales: para (1), usa la función interna read para leer una lista de palabras, y para (4) usa print para mostrar en pantalla la lista de palabras en la respuesta.
Por supuesto, hay algunos inconvenientes para esta especificación. El usuario tendrá que escribir una lista real –usando paréntesis- y el usuario no puede usar caracteres especiales para leer, tales como comillas, comas y períodos. Así nuestra entrada no puede estar sin restricciones tal como el dialogo del ejemplo, pero ese es un pequeño precio a pagar para la conveniencia de tener la mitad del problema resuelto.

Coincidencia de patrones


La parte difícil está en los pasos (2) y (3) –esta noción de coincidencia de patrones y transformación. Hay cuatro cosas relacionadas: un patrón general y la respuesta, y una entrada específica y la transformación de esa entrada. Desde que accedimos a representar las entradas como una lista, esto permite tratar a otros componentes como listas también. Por ejemplo, podemos tener:

Patrón: (necesito X)
Respuesta: (¿Qué pasaría si te ofrezco X?)
Entrada: (necesito vacaciones)
Transformación: (¿Qué pasaría si te ofrezco vacaciones?)

El programa de coincidencia de patrones debe hacer coincidir los literales i con i, necesito con necesito, y a con a, como así también hacer coincidir la variable X con vacaciones. Esto presupone que hay algunas maneras de decidir que X sea una variable y que necesito no lo es. Debemos arreglar el sustituto vacaciones para X con la respuesta, para obtener la transformación final.
Ignorando por un momento el problema de transformar el patrón en la respuesta,  podemos ver que esta noción de coincidencia de patrones es solo una generalización de la función Lisp equal. Primero mostramos la función simple-equal, que es como la función interna equal, y la función patron-coincide que es definida para manejar variables de coincidencia de patrones:

(defun simple-equal (x y)
  "¿Son x e y iguales? (No hace revision dentro de cadenas.)"
  (if (or (atom x) (atom y))
      (eql x y)
    (and (simple-equal (first x) (first y))
                 (simple-equal (rest x) (rest y)))))

(defun patron-coincide (patron entrada)
  "¿Hay coincidencia entre patron y entrada? Cualquier variable puede coincidir con cualquier cosa."
  (if (variable-p patron)
      t
    (if (or (atom patron) (atom entrada))
                (eql patron entrada)
      (and (patron-coincide (first patron) (first entrada))
                   (patron-coincide (rest patron) (rest entrada))))))


Antes de que podamos avanzar, necesitamos decidir sobre una implementación para las variables de patron-coincide. Podríamos, por instancia, decir que solo un cierto conjunto de símbolos, tales como {X,Y,Z} son variables. Alternativamente, podríamos definir una estructura de tipo de variable, pero entonces no tendríamos que escribir algo como (make-variable :name ‘X) cada vez que buscamos una. Otra opción podría ser el uso de símbolos, pero para distinguir variables de constantes por el nombre del símbolo.  Por ejemplo, en Prolog, las variables comienzan con letras mayúsculas y las constantes con minúsculas. Pero Common Lisp no es sensible al contexto, así que esto no funcionará. En lugar de ello, hay una tradición en los programas de IA basados en Lisp donde las variables son símbolos que comienzan el carácter de pregunta. Hasta aquí hemos repartido símbolos como átomos –objetos sin estructura interna. Pero las cosas son siempre más complicadas de lo que aparentan al principio y, tanto en Lisp así como en física, lo que provoca que incluso los átomos tengan componentes. En partículas, los símbolos tienen nombres, que son cadenas de caracteres y son accesibles a través de la función symbol-name. Las cadenas en cambio tienen elementos que son caracteres, accesibles a través de la función char. El carácter ‘7’ es denotado por la secuencia de auto-evaluación #\? De esta manera el predicado variable-p puede ser definido como sigue a continuación, y ahora tenemos un programa completo de patrón de coincidencias:

(defun variable-p (x)
  "¿x es una variable? (un simbolo que comienza con '?')"
  (and (symbolp x) (equal (char (symbol-name x) 0) #\?)))

> (patron-coincide '(necesito ?X) '(necesito vacaciones))
T
> (patron-coincide '(necesito ?X) '(realmente necesito vacaciones))
NIL

En cada caso obtenemos la respuesta correcta, pero no obtenemos ninguna indicación de lo que es  ?X, de esta manera no podríamos sustituirla dentro de la respuesta. Necesitamos modificar patron-coincide para que devuelva algún tipo de tabla de variables y sus correspondientes valores. En la construcción de esta opción, el programador experimentado en Common Lisp puede ganar algo de tiempo siendo oportunista: reconocer cuando hay una función existente que hará una gran parte de la tarea. Lo que buscamos es sustituir valores para variables a través de la respuesta. El programador atento haría referencia al índice de este libro o de un manual de referencia de Common Lisp y buscará las funciones substitute, subst y sublis. Todas estas sustituyen algunas expresiones nuevas por unas anteriores con una expresión. Sublis en cambio es la más apropiada porque es la única que nos permite hacer varias sustituciones al mismo tiempo. Sublis toma dos argumentos, el primero es una lista de pares anterior-nuevo, y el segundo es una expresión en la que hace las sustituciones. Para cada uno de los pares, el car es reemplazado por el cdr. En otras palabras, formaríamos cada par con algo como (cons anterior nuevo). (Así como una lista de pares es conocida como una lista de asociación, o a-list, debido a que esta asocia claves con valores. En términos del ejemplo abajo, usaríamos:

> (sublis '((?X . vacaciones))
                '(Que pasaría si te ofrezco  ?X ?))
(QUE PASARIA SI TE OFREZCO VACACIONES ?)

Nota: Quisiera poner el signo de pregunta ¿ de apertura, pero algunos interpretes no los tienen.

Ahora necesitamos arreglar nuestro patron-coincide para que devuelva una a-lisp, mejor que solo T para un resultado exitoso. Aquí tenemos un primer intento:

(defun patron-coincide (patron entrada)
  "¿Coincide el patron con la entrada? CUIDADO: versión con errores."
  (if (variable-p patron)
      (list (cons patron entrada))
    (if (or (atom patron) (atom entrada))
                (eql patron entrada)
      (append (patron-coincide (first patron) (first entrada))
                      (patron-coincide (rest patron) (rest entrada))))))

Esta implementación luce razonable: devuelve una a-list de un elemento si el patrón es una variable, y une las a-list si el patrón y la entrada son listas. Sin embargo, hay varios problemas. Primero, la verificación (eql patron entrada) puede devolver T, que no es una lista, de esta manera append se quejará. Segundo, el mismo test debe devolver nil, lo que indicaría una falla, pero este será tratado como una lista, y será unido al resto de la respuesta. Tercero, no podemos distinguir entre el caso donde el patron falla –y devuelve nil- contra el caso donde todo coincide, pero no hay variables, devolviendo una a-lista nula. (Este es el problema del semipredicado). Cuarto, queremos las uniones de variables para acceder –si ?X es usado dos veces en el patrón, no queremos hacer coincidir dos valores distintos en la entrada. Finalmente, patron-coincide es ineficiente para verificar tanto el primero como el resto de las listas, incluso cuando la primera parte correspondiente no coincide. (¿No es increíble que haya cinco errores en una función de siete líneas?)
Podemos resolver estos problemas aceptando dos convenciones. Primero, es más conveniente hacer que patron-coincide sea un verdadero predicado, de esta manera aceptamos que devuelve nil solo para indicar falla. Lo que ocurre es que necesitaremos un valor nil-anonimo para representar la lista vacía. Segundo, si estamos yendo hacia una consistencia de los valores de las variables, entonces el first tendrá que saber cuál es el rest. Podemos lograr esto pasando la lista de uniones como un tercer argumento para patron-coincide. Lo haremos como un argumento opcional, porque queremos poder decir simplemente (patron-coincide a b).
Para abstraer más allá de estas decisiones de implementación, definiremos las constantes falla y sin-uniones para representar los dos valores devueltos con problemas. La forma especial defconstant es usada para indicar que estos valores no cambiarán. (Es opcional tener nombres de variables que comienzan y terminan con asteriscos, pero esta convención usualmente no se usa para las constantes). El motivo es que los asteriscos gritan, “Cuidado! Puedo ser cambiado por algo fuera de este alcance léxico”. Las constantes, por supuesto, no pueden ser cambiadas.

(defconstant falla nil "Indica que patron-coincide falla")
(defconstant sin-uniones '((t . t))
  "Indica el éxito de patron-coincide, sin variables.")

Luego, abstraemos más alla con el uso de assoc, introduciendo las siguientes cuatro funciones:

(defun obtener-union(var uniones)
  "Busca un par (variable . valor) en una lista de uniones."
(assoc var uniones))

(defun union-val(union)
  "Obtiene el valor de una union."
  (cdr union))

(defun buscar(var uniones)
  "Obtiene el valor (para var) de una lista de uniones."
  (union-val (obtener-union var uniones)))

(defun extender-uniones (var valor uniones)
  "Agrega un par (var . valor) a una lista de uniones."
  (cons (cons var valor) uniones))

Ahora que las variables y las uniones están definidas, patron-coincide es fácil. Este consiste de cinco casos. Primero, si la lista de uniones es falla, entonces la coincidencia falla (debido a que algunas coincidencias previas deben haber fallado). Si el patrón es una sola variable, entonces la coincidencia devuelve lo que sea que coincida con la variable; ya sea la lista de uniones existente, una extendida, o falla. Luego, tanto el patron como la entrada son listas, primero llamaremos a patron-coincide recursivamente sobre el primer elemento de cada lista. Este devuelve una lista de uniones (o falla), la que usaremos para hacer coincidir con el resto de las listas. Este es el único caso que invoca a una función no trivial, asi que es una buena idea probar informalmente que la función terminará: cada una de las dos llamadas recursivas redice el tamaño tanto del patron como de la entrada, y patron-coincide verifica el caso de patrones atómicos y entradas, de esta manera la función como un todo debe devolver eventualmente una respuesta (a menos que patrón y entrada tengan un tamaño infinito). Si ninguno de estos cuatro casos ocurre, entonces la coincidencia falla.

(defun patron-coincide (patron entrada &optional (uniones sin-uniones))
  "Coincidencia de patrones preparando la entrada en el contexto de las uniones"
  (cond ((eq uniones falla) falla)
                ((variable-p patron)
                 (coincidir-variable patron entrada uniones))
                ((eql patron entrada) uniones)
                ((and (consp patron) (consp entrada))
                 (patron-coincide (rest patron) (rest entrada)
                                                 (patron-coincide (first patron) (first entrada)
                                                                                 uniones)))
                (t falla)))
 
(defun coincidir-variable (var entrada uniones)
  "Coincide VAR con entrada? Usa (o actualiza) y devuelve las uniones."
  (let ((union (obtener-union var uniones)))
    (cond ((not union) (extender-uniones var entrada uniones))
                  ((equal entrada (union-val union)) uniones)
                  (t falla))))

Ahora podemos probar patron-coincide y ver cómo trabaja:

> (patron-coincide '(necesito ?X) '(necesito vacaciones))
((?X . VACACIONES) (T . T))

La respuesta es una lista de uniones de variable que esta dotadas de notación de pares; cada elemento de la lista es una par (variable . valor). (T . T) es un residuo de sin-uniones. Esto no hace daño realmente, pero podemos eliminarlo haciendo extender-uniones un poco más complicada:

(defun extender-uniones(var valor uniones)
  "Agrega un par (var . value) a la lista de uniones."
  (cons (cons var valor)
                ;; Una ver que agregamos una union "real",
                ;; podemos eliminar el tonto sin-uniones
                (if (eq uniones sin-uniones)
                    nil
                  uniones)))

> (sublis (patron-coincide '(necesito ?X) '(necesito vacaciones))
'(que pasaria si te ofrezco ?X ?))
(QUE PASARIA SI TE OFREZCO VACACIONES ?)
> (patron-coincide '(necesito ?X) '(realmente necesito vacaciones))
NIL
> (patron-coincide '(esto es facil) '(esto es facil) )
((T. T))
> (patron-coincide '(?X es ?X) '((2 + 2) es 4))
NIL
> (patron-coincide '(?X es ?X) '((2 + 2) es (2 + 2)))
((?X 2 + 2))
> (patron-coincide '(?P necesito . ?X)  '(yo necesito unas largas vacaciones))
((?X UNAS LARGAS VACACIONES) (?P . YO))

Nota del T: El problema con el español es que las conjugaciones del verbo dependen de persona y numero.

Note la distinción entre NIL y ( (T . T) ). El último tratamiento es exitoso, pero no hubieron uniones para devolver. Recuerde también que (?X 2 + 2) es lo mismo que (?X . (2 + 2)).
Una implementación más poderosa de patron-coincide se da en el capítulo 6. Otra implementación es dada más adelante. Es más eficiente pero más incómoda de usar.

Coincidencia de Segmentos  Patrones


En el patrón (?P necesito . ?X), la variable ?X coincide con el rest de la lista de entrada, sin importar cuál es su longitud. Esto está en contraste con ?P, que puede solo coincidir con un solo elemento, llamado, el primer elemento de la entrada. Para muchas aplicaciones de coincidencia de patrones, esto está bien; buscamos solamente hacer coincidir los elementos correspondientes. Sin embargo, ELIZA es algo diferente en que necesita llevar una cuenta para variables en cualquier posición que coincida una secuencia de ítems en la entrada. Llamaremos a tales variables de segmento. Necesitaremos una notación para diferenciar variables de segmento de las variables normales. Las posibilidades caen en dos clases: ya sea que usemos átomos para representar variables de segmento y distinguirlas por alguna convención ortográfica (como hicimos para distinguir variables de constantes) o que usemos construcciones no atómicas. Elegiremos la última, usando una lista de la forma (?* variable) para denotar variables de segmento.
El símbolo ?* es elegido porque combina la noción de variable con la notación de estrella de Kleene. De esta manera, el comportamiento que buscamos para patron-coincide es ahora:

> (patron-coincide  '((?* ?p) necesitamos (?* ?X))
                                    '(El Sr Perez y yo necesitamos vacaciones))
((?P EL SR PEREZ Y YO) (?X VACACIONES))

En otras palabras, cuando el patrón y la entrada son listas y el primer elemento del patrón es una variable de segmento, la variable hará coincidir la parte inicial de la entrada, y el resto del patrón  se intentará coincidir con el resto. Podemos actualizar patron-coincide para llevar una cuenta para esto agregando una simple cláusula cond. Definir el predicado para verificar las variables de segmento es fácil también:

(defun patron-coincide (patron entrada &optional (uniones sin-uniones))
  "Coincidencia de patrones preparando la entrada en el contexto de las uniones"
  (cond ((eq uniones falla) falla)
                ((variable-p patron)
                 (coincidir-variable patron entrada uniones))
                ((eql patron entrada) uniones)
                ((segmento-patron-p patron)                       ;***
                 (segmento-coincide patron entrada uniones))      ;***
                ((and (consp patron) (consp entrada))
                 (patron-coincide (rest patron) (rest entrada)
                                                  (patron-coincide (first patron) (first entrada)
                                                                                  uniones)))
                (t falla)))

(defun segmento-patron-p (patron)
  "Es este un segmento patron: (?* var) . pat)"
  (and (consp patron)
       (comienza-con (first patron) '?*)))

(defun comienza-con (list x)
  "Es esta una lista cuyo primer elemento es x?"
  (and (consp list) (eql (first list) x)))

Para escribir segmento-coincide, la pregunta importante es cuánto de la entrada va a coincidir con el segmento. Una respuesta es mirar el próximo elemento del patrón (el que está después de la variable de segmento) y ver que en esa posición eso ocurre en la entrada. Si no ocurre, el patrón total nunca puede coincidir, y debería fallar. Si eso ocurre, pasa a su posición. Si queremos hacer coincidir la variable preparando la parte inicial de la entrada, pasa por arriba. Pero primero tenemos que ver si el resto del patrón coincide con el resto de la entrada. Si esto es así se hace una llamada recursiva a patron-coincide. El resultado de esta llamada recursiva es llamado b2. Si b2 es exitoso, entonces vamos hacia adelante y hacemos coincidir la variable de segmento preparando la subsecuencia inicial.
El truco es que b2 falla. No queremos darlo completamente, porque puede ser que si la variable de segmento coincide con una subsecuencia más larga de la entrada, entonces el resto del patrón coincidiría con el resto de la entrada. De esta manera queremos intentar nuevamente la función segmento-coincide, pero forzándola a considerar una coincidencia más larga para la variable. Esto se hace introduciendo un parámetro opcional, inicio, que es inicialmente 0 y se incrementa con cada falla. Observe que esta política deja afuera la posibilidad de cualquier tipo de variable siguiendo  una variable de segmento. (Luego de remover esta restricción).

(defun segmento-coincide(patron entrada uniones &optional (inicio 0))
  "Coincide el segmento patron ((?* var) . pat) preparando la entrada."
  (let ((var (second (first patron)))
                (pat (rest patron)))
    (if (null pat)
                (coincidir-variable var entrada uniones)
      ;; Asumimos que pat comienza con una constante
      ;; En otras palabras, un patron no puede tener 2 vars consecutivas
      (let ((pos (position (first pat) entrada
                                                  :start inicio :test #'equal )))
                (if (null pos)
                    falla
                  (let ((b2 (patron-coincide pat (subseq entrada pos) uniones)))
                    ;;Si esta coincidencia falla, intenta otra mas larga
                    ;;Si esto funciona, verifica que las variables coincidan
                    (if (eq b2 falla)
                               (segmento-coincide patron entrada uniones (+ pos 1))
                      (coincidir-variable var (subseq entrada 0 pos) b2))))))))

Vemos algunos ejemplos de coincidencia de patrones:

> (patron-coincide '((?* ?p) necesitamos (?* ?x))
                                  '(El Sr Gomez y yo necesitamos vacaciones))
((?P EL SR GOMEZ Y YO) (?X VACACIONES))

> (patron-coincide '((?* ?x) es un (?* ?y)) '(que el es es un tonto))
((?X QUE EL ES) (?Y TONTO))

El primero de estos ejemplos muestra un caso bastante simple: ?P coincide con todo lo necesario, y ?X coincide con el resto. El siguiente ejemplo encierra el caso más complicado. Primero ?X coincide con todo lo que esta primero (esta es la posición 2, con la cuenta comenzando en 0 en Common Lisp). Pero luego el patrón falla al coincidir la entrada, de esta manera segmento-coincide intenta nuevamente iniciar con la posición 3. Esta vez todo funciona; es coincide con es, un coincide con un, y (?* ?Y) coincide con tonto.
Desafortunadamente, esta versión de segmento-coincide no hace coincidir todo como debería.
Considere el siguiente ejemplo:

> (patron-coincide '((?* ?x) a b (?* ?x)) '(1 2 a b a b 1 2 a b)) => NIL

Esto falla porque ?x coincide con la subsecuencia (1 2), y luego el resto del patrón coincide exitosamente con el resto de la entrada, pero al final la llamada coincidir-variable falla, porque ?X tiene dos valores diferentes. La solución es llamar a coincidir-variable antes de verificar que b2 falle, así nos aseguraremos intentar segmento-coincide nuevamente con una coincidencia larga sin importar cuál sea la causa de la falla.

(defun segmento-coincide (patron entrada uniones &optional (inicio 0))
  "Coincide el segmento patron (?* var) . pat) preparando la entrada."
  (let ((var (second (first patron)))
                (pat (rest patron)))
    (if (null pat)
                (coincidir-variable var entrada uniones)
      ;;Asumimos que pat comienza con una constante
      ;;En otras palabras, un patron no puede tener 2 vars consecutivas
      (let ((pos (position (first pat) entrada
                                                  :start inicio :test #'equal)))
                (if (null pos)
                    falaa
                  (let ((b2 (patron-coincide
                                    pat (subseq entrada pos)
                                    (coincidir-variable var (subseq entrada 0 pos)
                                                                               uniones))))
                    ;; Si esta coincidencia falla, intenta otra mas larga
                    (if (eq b2 falla)
                               (segmento-coincide patron entrada uniones (+ pos 1))
                      b2)))))))

Ahora vemos que la coincidencia ocurre:

> (patron-coincide '((?* ?x) a b (?* ?x)) '(1 2 a b a b 1 2 a b))
((?X 1 2 A B))

Observe que esta versión de segmento-coincide intenta hacer coincidir primero lo más corto posible. Podría también ser posible intentar hacer coincidir primero lo mas largo.

El programa ELIZA: Un traductor basado en reglas


Ahora que tenemos una coincidencia de patrones funcionando, necesitamos algunos patrones para hacer coincidir. Algo más, queremos que el patrón esté asociado con respuestas. Podemos hacer esto inventando una estructura de datos llamada regla, que consisten de un patrón y una o más respuestas asociadas. Hay reglas en el sentido en que ellas afirman, “Si tú ves A, entonces responde B o C, seleccionadas al azar.” Elegiremos la implementación más simple posible para las reglas: como listas, donde el primer elemento es el patrón y el resto es una lista de respuestas:

(defun regla-patron (regla) (first regla))
(defun regla-respuesta (regla) (rest regla))

Aquí un ejemplo de una regla:

(((?* ?x) quiero (?* ?y))
(que pasaria si te ofrezco ?y)
(por que quieres ?y)
(suponga que obtiene ?y pronto)

Nota del T: En español tenemos que usar verbos distintos para decir cosas distintas, en cambio en ingles un verbo tiene distintos significados. Por ejemplo  want en ingles puede decir varias cosas (querer, necesitar, desear). Pero en español debemos usar verbos distintos para decir “quiero” “necesito” “deseo”. También está el tema, no menor, del uso de las distintas conjugaciones de los verbos según la persona y el número.
Cuando es aplicada en la entrada (yo quiero verificar este programa), esta regla (cuando es interpretada por el programa ELIZA) debería replicar una respuesta aleatoria, sustituyendo en el valor de ?y, y respondiendo con (por que quieres verificar este programa). Ahora que sabemos lo que hará una regla individual, necesitamos decidir cómo manejar un conjunto de reglas. Si ELIZA está hecha para cualquier contexto, tendrá que tener una variedad de respuestas. Así varias reglas pueden ser aplicables a la misma entrada. Una posibilidad podría ser elegir una regla al azar desde un montón de reglas teniendo patrones que coinciden con la entrada.
Otra posibilidad es solo aceptar la primera regla que coincida. Esto implica que las reglas están en una lista ordenada, antes que un conjunto desordenado. La regla inteligente de ELIZA puede tomar ventaja de este ordenamiento y arreglo para la mayoría de las reglas específicas  come first, mientras más reglas vagas están cerca del fin de la lista.
El ELIZA original tiene un sistema donde cada regla tiene un número de prioridad asociado con ella. La regla de coincidencia con la más alta prioridad fue elegida. Observe que poniendo las reglas en orden logra el mismo efecto que tener un número de prioridad en cada regla: la primer regla implícita tiene la más alta prioridad, la segunda regla es la próxima más alta, y así sucesivamente. Hay una lista corta de reglas, seleccionadas del artículo original de Weizenbaum, pero con la forma de las reglas actualizadas a la forma que nosotros estamos usando. La respuesta al ejercicio 5.19 contiene una larga lista de reglas.

(defparameter *reglas-eliza*
'((((?* ?x) hola (?* ?y))
(Como estas. Por favor cuentame tu problema.))
(((?* ?x) quiero (?* ?y))
(que pasaria si te ofrezco ?y)
(por que quieres ?y) (suponga que obtienes ?y pronto))
(((?* ?x) si (?* ?y))
(realmente piensas que es probable que ?y) (deseas que ?y)
(que piensas sobre ?y) (realmente si ?y))
(((?* ?x) no (?* ?y))
(por que no?) (estas siendo un poco negativo)
(estas diciendo "NO" solo para ser negativo?))
(((?* ?x) era (?* ?y))
(eras tu realmente?) (tal vez ya sabia que tu eras ?y)
(por que me dices que tu eras ?y ahora?))
(((?* ?x) siento (?* ?y))
(te sientes a menudo ?y ?))
(((?* ?x) senti (?* ?y))
(que otros sentimientos tienes?))))

Finalmente estamos listos para definir a ELIZA apropiadamente. Como dijimos antes, el programa principal debería ser un bucle que lee entradas, las transforma, e imprime en pantalla el resultado. La transformación es hecha primariamente buscando alguna regla tal que su patrón coincida con la entrada, y luego sustituir las variables dentro de la respuesta de la regla. El programa es resumido a continuación en una tabla.
Hay unas complicaciones menores. Imprimiremos en pantalla un prompt para decirle al usuario que escriba algo. Usaremos la función aplanar para asegurarnos que la salida no tiene embebidas listas después de la sustitución de la variable. Un truco importante es alterar la entrada intercambiando “tu” por “mi” y así sucesivamente, ya que estos términos son relativos al que habla.

Funciones de alto nivel
eliza
Responde a la entrada del usuario usando reglas de coincidencia de patrones.
Variables Globales
*reglas-eliza*
Una lista de reglas de transformación.
Tipos de dato
regla
Una asociación de un patrón con una lista de respuestas.
Funciones
eliza
Responde a la entrada del usuario usando reglas de coincidencia de patrones.
usar-reglas-eliza
Busca alguna regla con la cual transformar la entrada.
cambiar-puntodevista
Cambia yo por tu y viceversa, y asi sucesivamente.
aplanar
Une juntos elementos (o listas) en la lista.
Funciones de Common-Lisp
sublis
Sustituye elementos dentro de un árbol.
Funciones definidas previamente
random-elt
Recoge un elemento aleatorio de una lista.
patron-coincide
Coincide un patrón con una entrada.
mappend
Aplica una función a cada elemento de la lista y une los resultados.

Aquí está el programa completo:

(defun eliza ()
  "Responde a la entrada del usuario usando reglas de coincidencia de patrones."
  (loop
   (print 'eliza>)
   (write (aplanar (usar-reglas-eliza (read))) :pretty t)))

(defun usar-reglas-eliza (entrada)
  "Busca alguna regla con la cual transformar la entrada."
  (some #'(lambda (regla)
                    (let ((resultado (patron-coincide (regla-patron regla) entrada)))
                      (if (not (eq resultado falla))
                                 (sublis (cambiar-puntodevista resultado)
                                                 (random-elt (regla-respuesta regla))))))
                *reglas-eliza*))

(defun cambiar-puntodevista (palabras)
  "Cambia yo por tu y viceversa, y asi sucesivamente."
  (sublis '((yo . tu) (tu . yo) (mi . ti) (soy . eres))
                  palabras))

(defun aplanar (la-lista)
  "Une juntos elementos (o listas) en la lista."
  (mappend #'mklist la-lista))

(defun mklist (x)
  "Devuelve x si este es una lista, en otro caso devuelve (x)."
  (if (listp x)
      x
    (list x)))

(defun mappend (funcion la-lista)
  "Aplica funcion a cada elemento de la lista y une los resultados."
  (apply #'append (mapcar funcion la-lista)))

(defun random-elt (opciones)
  "Recoge un elemento de una lista al azar."
  (elt opciones (random (length opciones))))

Observe el uso de write con la palabra clave :pretty. Este dará una mejor salida formateada en algunos casos. El programa hace uso de la función previamente definida random-elt, y aplanar, que son definidas aquí usando mappend y mklist, una función que es definida en el dialecto InterLisp pero no en Common Lisp.
El programa ELIZA actual tiene algunas complicaciones que no se muestran en esta versión. Primero, había un método alias para asociar varias palabras con el mismo patrón; tanto “madre” como “padre” podría ser asociado con el patrón “familia”.  Había también un mecanismo de sinónimo que podría tratar las palabras que signifiquen lo mismo. En el caso de entradas con varias frases separadas con coma, cada frase fue procesada en forma separada, y la respuesta con la prioridad más alta fue seleccionada. Adicionalmente, el ELIZA original tiene un mecanismo de  “memoria”. Cuando no coincide un patrón de entrada, esta dice algo como “Háblame más sobre X”, donde X es alguna entrada anteriormente dada. Finalmente, nuestra versión tiene pocas reglas. A pesar delos defectos de nuestra versión, esta puede ocasionalmente mantener una conversación como se muestra aquí:

> (eliza)
ELIZA> (hola)
(COMO ESTAS. POR FAVOR CUENTAME TU PROBLEMA.)
ELIZA> (quiero verificar este programa)
(QUE PASARIA SI TE OFREZCO VERIFICAR ESTE PROGRAMA)
ELIZA> (podria ver si funciona)
(REALMENTE PIENSAS QUE ES PROBABLE QUE FUNCIONA)
ELIZA> (no realmente)
(ESTAS DICIENDO "NO" SOLO PARA SER NEGATIVO?)
ELIZA> (no)
(ESTAS SIENDO UN POCO NEGATIVO)
ELIZA> (olvida eso estoy asombrado por el funcionamiento del programa)
(POR QUE ME DICES QUE TU ESTAS ASOMBRADO POR EL FUNCIONAMIENTO DEL PROGRAMA
 AHORA?)
ELIZA> (senti eso)
(QUE OTROS SENTIMIENTOS TIENES?)
ELIZA> (siento que ya es suficiente)
(TE SIENTES A MENUDO QUE YA ES SUFICIENTE ?)
ELIZA> :q
> 

Al final, lo que importa es la técnica, no el programa. ELIZA ha sido “explicada en profundidad” y podría legítimamente ser movida a la repisa de curiosidades. La coincidencia de patrones en general permanece como una técnica importante, y la veremos nuevamente en capítulos siguientes. La noción de un traductor basado en reglas  es importante también. El problema de entender español (y otros lenguajes) si siendo una parte importante en la IA. Claramente, el problema de entender español no fue resuelto por ELIZA. En la parte V, veremos el problema nuevamente, usando técnicas más sofisticadas.
Dejo un link con el eliza modificado; con mas reglas, agregue mas reglas si lo desea: Eliza2.lisp

Historia y Referencias



Como se mencionó antes, el artículo original describiendo ELIZA está en Weizenbaum 1966. Y otros sistemas de dialogo que usan técnicas similares a la coincidencia de patrones está en el PARRY de Kennth Colby (1975). Este programa simula la conversación de una persona paranoica de manera demasiado elemental para varios psicólogos profesionales. Aunque la técnica de coincidencia de patrones fue simple, el modelo es mantenido por sistemas mucho más sofisticados que ELIZA. Colby ha sugerido que los programas de dialogo como ELIZA, es aumentado con algunos modelos como PARRY, podrían ser herramientas útiles en el tratamiento de enfermedades mentales de personas. De acuerdo a Colby, podría ser barato y efectivo tener conversaciones con pacientes con un programa especialmente diseñado, que podría manejar casos simples y alertar a los doctores sobre los pacientes que necesitan más ayuda. El libro Poded de Ordenadores y Razones Humanas de Weizenbaum (1976) habla sobre ELIZA y PARRY y toma una visión muy crítica sobre la sugerencia de Colby. Otro trabajo interesante sobre modelos de sistemas de diálogo esta reportado por Allan Collins (1978) y Jamie Carbonell (1981).

1 comentario: