2.4 APRENDIZAJE ASOCIATIVO
2.4.4 Red Instar: Hasta ahora se han considerado solamente reglas de asociación entre entradas y salidas escalares. Si se examina la red de la figura 2.4.4, se nota como esta neurona esta enfrentada a un problema de reconocimiento de patrones cuya entrada es de tipo vectorial; esta neurona es el tipo de red más simple capaz de resolver esta clase de problemas y es llamada red Instar.

Figura 2.4.4 Red Instar
Puede notarse la similitud entre la red Instar y la red Perceptrón de la figura 2.1.6, o incluso a la red Adaline de la figura 2.2 3. Estas redes han tenido diferentes nombres, debido a razones históricas y a que su desempeño ha sido analizado en diferentes ambientes. Para la Instar no se considerará directamente su característica de decisión, concepto que fue bastante importante para el Perceptrón, en lugar de ello se analizará la capacidad de la Instar para reconocimiento de patrones a través de asociaciones y aprendizaje no supervisado.
La ecuación para determinar la entrada/salida de la Instar es:
a= hardlims (wTp+b) (2.4.16)
La red Instar se activará si el producto punto entre el vector de pesos (fila de la matriz de pesos) y la entrada sea mayor o igual a –b
(2.4.17)
Los vectores
w y
p son
de longitud constante, por lo tanto el mayor producto punto se presentará
cuando los dos vectores apunten en la misma dirección; dicho de otra
forma cuando el ángulo entre w
y p
sea
,
esto permite observar que la red instar de la figura 2.4.4 se activará
cuando p
y w
estén muy cercanos, escogiendo un apropiado
valor para la ganancia b
se puede determinar que tan cerca deben estar p
y w
para que la instar se active, si se fija
(2.4.18)
la instar se activará solamente
cuando p
apunte exactamente en la misma dirección
de w,
de esta forma b
se puede incrementar a valores ligeramente
mayores a
, el mayor valor
de b
se presentará cuando la Instar esté
activa. Es importante recalcar que este análisis asume que todos los
vectores tienen la misma longitud.
Uno de los inconvenientes de la
regla de Hebb con rata de olvido, es que requiere que los estímulos se
presenten de forma repetitiva o de lo contrario se perderá la asociación,
se desea encontrar una regla alternativa que habilite el término con
olvido solo cuando la Instar es activa
,
de esta forma los valores de los pesos seguirán siendo limitados, pero
el porcentaje de olvido será minimizado. Para obtener los beneficios
del término de peso con rata de olvido, se adiciona un nuevo término
proporcional a ai(q).
(2.4.19)
El nuevo término de peso se
hace proporcional a la salida escalar
ai(q), ya
que se desea controlar esta salida para que reproduzca el estímulo no
condicionado; si se considera que la rata a la cual la red aprende nuevos pesos
es igual a la rata de olvido
,
la ecuación (2.4.18) puede simplificarse a:
(2.4.20)
Esta ecuación es la llamada regla de Instar, que en forma vectorial teniendo en cuenta el caso en que la instar esta activa (ai=1), se convierte en:
w(q)=
w(q-1) +
(p(q)
- w(q-1))
= (1-
)
w(q-1)+
p(q) (2.4.21)
Esta operación se muestra en la figura 2.4.5

Figura 2.4.5 Representación gráfica de la regla de Instar
Cuando la instar es activa, el vector de pesos se mueve hacia
el vector de entrada a lo largo de una línea entre el vector de pesos
anterior y el vector de entrada. La distancia a la que se mueve el vector depende
del valor de la rata de aprendizaje
.
Cuando
=0, el nuevo vector de
pesos es igual al vector de pesos anterior. Cuando
=1,
el nuevo vector de pesos es igual al vector de entrada. Si
=0.5
el nuevo vector de pesos será la mitad entre el vector de pesos anterior
y el vector de entrada.
Una característica útil de la regla Instar es que si los vectores de entrada son normalizados, entonces w será también normalizado una vez la red haya aprendido un vector particular p, esta regla no solamente minimiza la rata de olvido, también normaliza los vectores de peso si el vector de entrada es normalizado.
Se aplicará la regla de Instar para solucionar el problema de la figura 2.4.6, similar al problema del asociador para una fruta; este nuevo caso cuenta con dos entradas, una indicando si la fruta ha sido visualizada o no (estímulo no condicionado) y otra consistente en un vector de tres medidas pertenecientes a la fruta (estímulo condicionado).

Figura 2.4.6 Reconocimiento de una fruta por medio de una Instar
La salida de la red, está determinada por
a = hardlim(w0p0+Wp+b)
Los elementos de entrada a la red serán valores de 1 o –1, las tres propiedades que se medirán de la fruta son: forma, textura y peso, de esta manera la salida del sensor de forma será 1 si la fruta es aproximadamente redonda o –1 si la fruta es elíptica, la salida del sensor de textura será 1 si la superficie de la fruta es suave y será –1 si es rugosa y la salida del sensor de peso será 1 si la fruta pesa más de una libra o –1 si el peso de la fruta es menor de esta medida.
En este caso la elección del estímulo condicionado y el no condicionado ya no es aleatoria, pues como se dijo en análisis anteriores, el estímulo no condicionado se convierte la mayoría de las veces en la salida deseada de la red que es tipo de escalar para una red Instar, por lo tanto el sensor que representa la visualización de la red será el estímulo no condicionado y el vector de medidas de la fruta será el estímulo condicionado.
Con las dimensiones consideradas
p es
un vector normalizado con
=
.
La definición de
p0
y p
es:

El valor de la ganancia se asumirá
como b
= -2, un valor ligeramente más positivo
que -
2
= -3. Lo ideal es que la red tenga una asociación
constante, entre la visualización de la fruta y su respuesta, para que
w0 sea
mayor que – b.
Inicialmente la red no responderá a ninguna combinación de medidas de la fruta, puesto que la fruta no ha sido detectada visualmente, así que los pesos iniciales serán cero
w0=3, W(0) = 1wT(0) = [0 0 0] (2.4.22)
Usando la regla Instar con una rata de aprendizaje
,
los pesos actualizados se encontrarán de la siguiente forma:
w(q) = w (q -1) + a(q) (p(q) - w(q-1)) (2.4.23)
La secuencia de entrenamiento consistirá en repetidas presentaciones de la fruta, los sensores estarán actuando todo el tiempo sin embargo, en orden a observar la operación de la regla Instar se asumirá que el sensor que visualiza la fruta actuará intermitentemente, simulando así una falla en su construcción
(2.4.24)
Como la matriz W inicialmente contiene ceros, la Instar no responderá a los sensores de la fruta en la primera iteración
a(1)=hardlim(w 0 p 0(1) + Wp (1) - 2)
(2.4.25)
Como la neurona no respondió, sus pesos no serán actualizados por la regla Instar
w(0) = w(0)+ a (1)(p(1)-w (0))
(2.4.26)
En la segunda iteración, cuando la fruta haya sido detectada visualmente, la neurona responderá
a(2) = hardlim (w0p0(2)+Wp (2)-2)
(2.4.27)
El resultado es que la red aprendió a asociar el vector de medidas de la fruta con su respuesta. El vector de pesos de la red, se convierte en una copia del vector de medidas de la fruta.
w(2) = w(1)+ a (2)(p(2)-w (1))
(2.4.28)
La red puede ahora reconocer la fruta por sus medidas; la neurona respondió en la tercera iteración, aún cuando el sistema de detección visual falló, por lo tanto la red realizará una asociación entre la presencia de la fruta y el vector de estímulos condicionados, sin importar si el sensor de visualización (estímulo no condiconado) opera adecuadamente.
a(3) = hardlim (w0p0(3)+Wp (3) - 2)
(2.4.29)
Cuando las medidas de la fruta han sido detectadas completamente, los pesos dejan de cambiar y se estabilizan.
w(3) = w(2)+ a (3)(p(3)-w (2))
(2.4.30)