2.4 APRENDIZAJE ASOCIATIVO

2.4.4 Red Instar: Hasta ahora se han considerado solamente reglas de asociación entre entradas y salidas escalares. Si se examina la red de la figura 2.4.4, se nota como esta neurona esta enfrentada a un problema de reconocimiento de patrones cuya entrada es de tipo vectorial; esta neurona es el tipo de red más simple capaz de resolver esta clase de problemas y es llamada red Instar.

Figura 2.4.4 Red Instar

Puede notarse la similitud entre la red Instar y la red Perceptrón de la figura 2.1.6, o incluso a la red Adaline de la figura 2.2 3. Estas redes han tenido diferentes nombres, debido a razones históricas y a que su desempeño ha sido analizado en diferentes ambientes. Para la Instar no se considerará directamente su característica de decisión, concepto que fue bastante importante para el Perceptrón, en lugar de ello se analizará la capacidad de la Instar para reconocimiento de patrones a través de asociaciones y aprendizaje no supervisado.

La ecuación para determinar la entrada/salida de la Instar es:

a= hardlims (wTp+b) (2.4.16)

La red Instar se activará si el producto punto entre el vector de pesos (fila de la matriz de pesos) y la entrada sea mayor o igual a b

(2.4.17)

Los vectores w y p son de longitud constante, por lo tanto el mayor producto punto se presentará cuando los dos vectores apunten en la misma dirección; dicho de otra forma cuando el ángulo entre w y p sea , esto permite observar que la red instar de la figura 2.4.4 se activará cuando p y w estén muy cercanos, escogiendo un apropiado valor para la ganancia b se puede determinar que tan cerca deben estar p y w para que la instar se active, si se fija

(2.4.18)

la instar se activará solamente cuando p apunte exactamente en la misma dirección de w, de esta forma b se puede incrementar a valores ligeramente mayores a , el mayor valor de b se presentará cuando la Instar esté activa. Es importante recalcar que este análisis asume que todos los vectores tienen la misma longitud.

Uno de los inconvenientes de la regla de Hebb con rata de olvido, es que requiere que los estímulos se presenten de forma repetitiva o de lo contrario se perderá la asociación, se desea encontrar una regla alternativa que habilite el término con olvido solo cuando la Instar es activa , de esta forma los valores de los pesos seguirán siendo limitados, pero el porcentaje de olvido será minimizado. Para obtener los beneficios del término de peso con rata de olvido, se adiciona un nuevo término proporcional a ai(q).

(2.4.19)

El nuevo término de peso se hace proporcional a la salida escalar ai(q), ya que se desea controlar esta salida para que reproduzca el estímulo no condicionado; si se considera que la rata a la cual la red aprende nuevos pesos es igual a la rata de olvido, la ecuación (2.4.18) puede simplificarse a:

(2.4.20)

Esta ecuación es la llamada regla de Instar, que en forma vectorial teniendo en cuenta el caso en que la instar esta activa (ai=1), se convierte en:

w(q)= w(q-1) +(p(q) - w(q-1))

= (1-) w(q-1)+ p(q) (2.4.21)

Esta operación se muestra en la figura 2.4.5

Figura 2.4.5 Representación gráfica de la regla de Instar

Cuando la instar es activa, el vector de pesos se mueve hacia el vector de entrada a lo largo de una línea entre el vector de pesos anterior y el vector de entrada. La distancia a la que se mueve el vector depende del valor de la rata de aprendizaje . Cuando =0, el nuevo vector de pesos es igual al vector de pesos anterior. Cuando =1, el nuevo vector de pesos es igual al vector de entrada. Si =0.5 el nuevo vector de pesos será la mitad entre el vector de pesos anterior y el vector de entrada.

Una característica útil de la regla Instar es que si los vectores de entrada son normalizados, entonces w será también normalizado una vez la red haya aprendido un vector particular p, esta regla no solamente minimiza la rata de olvido, también normaliza los vectores de peso si el vector de entrada es normalizado.

Se aplicará la regla de Instar para solucionar el problema de la figura 2.4.6, similar al problema del asociador para una fruta; este nuevo caso cuenta con dos entradas, una indicando si la fruta ha sido visualizada o no (estímulo no condicionado) y otra consistente en un vector de tres medidas pertenecientes a la fruta (estímulo condicionado).

Figura 2.4.6 Reconocimiento de una fruta por medio de una Instar

La salida de la red, está determinada por

a = hardlim(w0p0+Wp+b)

Los elementos de entrada a la red serán valores de 1 o –1, las tres propiedades que se medirán de la fruta son: forma, textura y peso, de esta manera la salida del sensor de forma será 1 si la fruta es aproximadamente redonda o –1 si la fruta es elíptica, la salida del sensor de textura será 1 si la superficie de la fruta es suave y será –1 si es rugosa y la salida del sensor de peso será 1 si la fruta pesa más de una libra o –1 si el peso de la fruta es menor de esta medida.

En este caso la elección del estímulo condicionado y el no condicionado ya no es aleatoria, pues como se dijo en análisis anteriores, el estímulo no condicionado se convierte la mayoría de las veces en la salida deseada de la red que es tipo de escalar para una red Instar, por lo tanto el sensor que representa la visualización de la red será el estímulo no condicionado y el vector de medidas de la fruta será el estímulo condicionado.

Con las dimensiones consideradas p es un vector normalizado con = . La definición de p0 y p es:

El valor de la ganancia se asumirá como b = -2, un valor ligeramente más positivo que -2 = -3. Lo ideal es que la red tenga una asociación constante, entre la visualización de la fruta y su respuesta, para que w0 sea mayor queb.

Inicialmente la red no responderá a ninguna combinación de medidas de la fruta, puesto que la fruta no ha sido detectada visualmente, así que los pesos iniciales serán cero

w0=3, W(0) = 1wT(0) = [0 0 0] (2.4.22)

Usando la regla Instar con una rata de aprendizaje , los pesos actualizados se encontrarán de la siguiente forma:

w(q) = w (q -1) + a(q) (p(q) - w(q-1)) (2.4.23)

La secuencia de entrenamiento consistirá en repetidas presentaciones de la fruta, los sensores estarán actuando todo el tiempo sin embargo, en orden a observar la operación de la regla Instar se asumirá que el sensor que visualiza la fruta actuará intermitentemente, simulando así una falla en su construcción

(2.4.24)

Como la matriz W inicialmente contiene ceros, la Instar no responderá a los sensores de la fruta en la primera iteración

a(1)=hardlim(w 0 p 0(1) + Wp (1) - 2)

(2.4.25)

Como la neurona no respondió, sus pesos no serán actualizados por la regla Instar

w(0) = w(0)+ a (1)(p(1)-w (0))

(2.4.26)

En la segunda iteración, cuando la fruta haya sido detectada visualmente, la neurona responderá

a(2) = hardlim (w0p0(2)+Wp (2)-2)

(2.4.27)

El resultado es que la red aprendió a asociar el vector de medidas de la fruta con su respuesta. El vector de pesos de la red, se convierte en una copia del vector de medidas de la fruta.

w(2) = w(1)+ a (2)(p(2)-w (1))

(2.4.28)

La red puede ahora reconocer la fruta por sus medidas; la neurona respondió en la tercera iteración, aún cuando el sistema de detección visual falló, por lo tanto la red realizará una asociación entre la presencia de la fruta y el vector de estímulos condicionados, sin importar si el sensor de visualización (estímulo no condiconado) opera adecuadamente.

a(3) = hardlim (w0p0(3)+Wp (3) - 2)

(2.4.29)

Cuando las medidas de la fruta han sido detectadas completamente, los pesos dejan de cambiar y se estabilizan.

w(3) = w(2)+ a (3)(p(3)-w (2))

(2.4.30)