2.4 APRENDIZAJE ASOCIATIVO
2.4.3 Regla de Hebb: Esta regla puede interpretarse matemáticamente teniendo en cuenta que si dos neuronas en cualquier lado de la sinápsis son activadas simultáneamente, la longitud de la sinápsis se incrementará. Si se revisa la figura 2.4.3 correspondiente a un asociador lineal, se ve como la salida a, es determinada por el vector de entrada p.

Figura 2.4.3 Asociador Lineal
(2.4.4)
Puede notarse como la conexión (sinápsis) entre la entrada pj y la salida ai es el peso wij. De esta forma el postulado de Hebb implica que si un valor positivo pj produce un valor positivo ai, el valor de wij debe incrementarse,
(2.4.5)
Donde :
pjq
:j-ésimo
elemento del q-ésimo
vector de entrada pq
aiq :i-ésimo
elemento de salida de la red, cuando el q-ésimo
vector de entrada es presentado
:es la rata de aprendizaje, la cual es un
valor positivo constante
La regla de Hebb dice que el cambio en el peso wij es proporcional al producto de las funciones de activación en cualquier lado de la sinápsis. Así, los pesos serán incrementados cuando pj y ai sean positivos, pero también lo harán cuando ambos parámetros sean negativos, en contraposición los pesos se decrementarán cuando pj y aijtengan signos contrarios.
Si se retorna a la discusión de los estímulos en animales y seres humanos, debe decirse que ambos tienden a asociar eventos que ocurren simultáneamente. Parafraseando el postulado de Hebb: "Si el estímulo del olor de la fruta, ocurre simultáneamente con la respuesta del concepto de esa fruta, (activada por algún otro estímulo como la forma de la fruta), la red debe alargar la conexión entre ellos para que después, la red active el concepto de esa fruta en respuesta a su olor solamente."
La regla de aprendizaje de Hebb determina que el incremento del peso wij entre la entrada pj de una neurona y su salida ai en la q-ésima iteración es:
(2.4.6)
La rata de aprendizaje
determina
cuantas veces un estímulo y su respuesta deben
ocurrir juntos antes de que la asociación sea hecha. En la red de la
figura 2.4.2, una asociación será hecha cuando w
> -b =
0.5, entonces para una
entrada p=1
se producirá una salida
a=1, sin
importar el valor de p0
Para comprender el funcionamiento de la regla de Hebb, ésta se aplicará a la solución del asociador de la fruta resuelto en el numeral anterior. El asociador será inicializado con los valores determinados anteriormente
w 0=1, w (0) = 0 (2.4.7)
El asociador será repetidamente expuesto a la fruta; sin embargo mientras el sensor de olor trabajará en forma siempre confiable (estímulo condicionado), el sensor de la forma operará intermitentemente (estímulo no condicionado). Así la secuencia de entrenamiento consiste en la repetición de la siguiente secuencia de valores de entrada:
{p0(1) = 0, p(1) = 1}, {p 0(2) = 1, p(2) = 1}.... (2.4.8)
Usando una rata de aprendizaje
,
y empleando la regla de Hebb, serán actualizados
los pesos w
correspondientes al estímulo condicionado,
ya que como se dijo anteriormente, los pesos correspondientes al estímulo
no condicionado se mantendrán constantes.
La salida para la primera iteración (q=1) es:
a(1) = hardlim(w 0 p 0 (1)+ w(0) p (1) - 0.5)
= hardlim (1*0 + 0*1- 0.5) = 0 No hay respuesta (2.4.9)
El olor solamente no ha generado una respuesta esto es, no hubo una asociación entre el olor de la fruta y el concepto de la fruta como tal, sin una respuesta la regla de Hebb, no altera el valor de w
w(1)=w(0)+a(1) p(1) = 0 + 0*1=0 (2.4.10)
En la segunda iteración, son detectados tanto la forma como el olor de la fruta y la red responderá correctamente identificando la fruta
a(2) = hardlim (w0p0 (2) + w(1) p(2) - 0.5) (2.4.11)
= hardlim(1*1 + 0*1- 0.5) = 1 La fruta ha sido detectada
Como el estímulo del olor y la respuesta de la red ocurrieron simultáneamente la regla de Hebb, incrementa los pesos entre ellos.
w(2)= w(1) + a(2) p(2) = 0 + 1*1 =1 (2.4.12)
En la tercera iteración a pesar de que el sensor de la forma falla nuevamente, la red responde correctamente. La red ha realizado una asociación útil entre el olor de la fruta y su respuesta.
a(3)=hardlim(w 0p0(3)+w(2) p(3) - 0.5) (2.4.13)
=hardlim(1*0+1*1-0.5) =1 La fruta ha sido detectada
w(3) = w(2)+a(3) p(3) = 1+1*1 = 2 (2.4.14)
Ahora la red es capaz de identificar la fruta por medio de su olor o de su forma; incluso si los dos sensores tienen fallas intermitentes, la red responderá correctamente la mayoría de las veces.
Una forma de mejorar la regla de Hebb, es adicionar un término que controle el crecimiento de la matriz de peso, a esta modificación se le da el nombre de regla de Hebb con rata de olvido.
(2.4.15)
Donde
es la
rata de olvido, la cual es una constante positiva menor que 1; cuando
se aproxima a cero la ley de aprendizaje se convierte en la ley de Hebb estándar;
cuando
se aproxima a 1, la
rata de aprendizaje olvida rápidamente las entradas anteriores y recuerda
solamente los patrones más recientes. El efecto de esta nueva constante,
es controlar que el crecimiento de la matriz de pesos no se realice sin límites
y así darle un mejor aprovechamiento a la capacidad de memoria de la
red.