Comportement du chien
et du chat, neuroscience

Conditionnement opérant : lois

« Les lois claires en théorie sont souvent un chaos à l'application. »

Napoléon Bonaparte

Sommaire ( / )

Comme pour le conditionnement classique ( infos), un certain nombre de lois régissent le conditionnement opérant : certaines sont communes aux deux formes.

L'apprentissage opérant permet de relier une réponse à une situation.

Loi de l'effet

thorndikeLa loi de l'effet a été formulée par Edward Thorndike (1874-1949).

La connexion entre le stimulus et la réponse est soit renforcée, soit affaiblie en fonction de ses conséquences.

« Par état de chose satisfaisant, on entend un état que l'animal ne fait rien pour éviter et fait parfois en sorte d'atteindre ou de préserver. » Thorndike

« Par état de chose déplaisant ou désagréable, on entend un état que l'animal généralement évite ou abandonne. » Thorndike


On peut considérer que
:

Loi de la répétition et oubli

Enoncé de la loi

Ces lois sont identiques pour le conditionnement opérant et pour le conditionnement classique.

La réponse est d'autant mieux mémorisée que le nombre d'associations entre le renforçateur et la réponse est élevée, en cours de conditionnement et après conditionnement.

Cette loi est remise en cause par l'école de la Gestalt dans des situations spécifiques ( infos).


Si la réponse apprise n'est pas répétée suffisamment, l'oubli peut se produire.

L'oubli est l'affaiblissement d'une réponse apprise dû au temps qui passe sans pratiquer cette réponse.

Courbe d'oubli

La courbe de l'oubli est très caractéristique.

On observe :

C'est ce qu'on a vu en conditionnement classique où le réapprentissage est beaucoup plus rapide ( infos).

Relation entre apprentissages successifs

Cette courbe peut être modifiée en fonction des apprentissages successifs.

Les conséquences positives - transfert - ou négatives - interférences - ( infos) peuvent être caractérisées de :

Loi de la contiguïté temporelle

dans le conditionnement opérant

La loi de la contiguïté temporelle s'applique au conditionnement opérant, mais d'une autre manière que dans le conditionnement classique ( infos).


En effet, lorsqu'on considère le délai séparant la réponse du renforcement, il faut distinguer entre
:

Installation du comportement : renforcement immédiat


Pour installer un comportement, il est préférable d'administrer le renforcement immédiatement après la réponse correcte.


S'il y a un délai, une ou plusieurs réponses totalement différentes de celle qu'on veut installer peuvent se produire entre-temps et tout se passera comme si c'était elles qui étaient renforcées. Elles ont reçu le nom de comportement superstitieux.

Huit pigeons sont placés dans une cage de Skinner ( infos). Régulièrement, toutes les quinze secondes, on leur apporte du grain de manière automatique, quel que soit le comportement qu'ils effectuent.


Il y a donc renforcement du dernier comportement.

 

Dans beaucoup de cas cependant, l'animal peut distinguer entre les réponses ayant un effet réel et celles qui n'en ont pas et il lie le conditionnement à la corrélation entre deux événements.

Il ne faut pas confondre un comportement superstitieux avec une activité de déplacement qui peut survenir notamment dans un programme de renforcement intermittent ( infos).

Maintien du comportement : renforcement différé


S'il s'agit de maintenir une réponse installée, un délai peut s'écouler entre la réponse et le renforcement qui est alors appelé renforcement différé.

Le renforcement différé est différent du renforcement intermittent à intervalle fixe ou variable ( infos) qui, comme lui, rend la réponse plus résistante à l'extinction.

Par renforcement différé, un chien apprend à rester assis pendant des temps de plus en plus longs, même lorsque son maître est hors de son champ de vision.

dans le conditionnement classique ( infos)

Loi de l'extinction

La loi d'extinction est identique à celle formulée pour le conditionnement classique ( infos) .

Enoncé de la loi

Le conditionnement disparaît si on omet de fournir le stimulus renforçateur après qu'un certain nombre de réponses correctes ont été apportées.

Dans le cas de l'expérience du rat dans la cage de Skinner ( infos), le fait que la pression sur le levier ne soit plus suivie par la présentation de croquettes, provoque la diminution, puis la disparition complète de l'action.


L'extinction diffère de l'oubli ( infos) dans lequel la réponse n'est pas pratiquée.

 

Extinction L'extinction est un conditionnement inhibiteur actif : un nouvel apprentissage de la même réponse sera plus difficile.


Quand une réponse n'est plus renforcée, on assiste souvent, dans un premier temps, à une augmentation paradoxale de la fréquence de son apparition. Ensuite seulement, cette fréquence diminue.

Un chien a appris que, quand ses maîtres sont à table, s'il donne la patte, il reçoit un peu de nourriture.

Après extinction, on peut observer, comme en conditionnement classique, une récupération spontanée, observée principalement lorsque le conditionnement est bien établi.

Dans le cas de l'expérience du rat dans la cage de Skinner ( infos), si, après extinction, le fait de presser sur le levier est de nouveau suivi par la présentation de croquettes, la réponse sera plus rapidement installée que la première fois.

Variations en fonction du renforcement

Plus sensibles à l'extinction

1. Le conditionnement par renforcement positif est plus sensible à l'extinction que le conditionnement par renforcement négatif.

2. Une réponse qui demande un effort musculaire important est plus sensible à l'extinction qu'une réponse demandant un moins grand effort.

Chez l'homme, dans la vie quotidienne, la forme d'extinction la plus fréquente est le fait d'ignorer un comportement qui a été précédemment renforcé par de l'attention. Par exemple, pour un professeur, le fait d'ignorer un élève chahuteur peut éteindre cette réponse.

Plus résistantes à l'extinction

1. Les réponses installées par un renforcement impératif sont plus difficiles à éteindre que celles installées par un renforcement de faible valeur.

2. Les réponses maintenues par renforcement intermittent sont très résistantes à l'extinction.

3. Les réponses maintenues par renforcement différé sont très résistantes à l'extinction.

Loi de la généralisation

La loi de la généralisation est identique à celle énoncée en conditionnement classique ( infos).


Une réponse à un certain stimulus apparaît aussi suite à un stimulus similaire, mais non identique
.

 

Un chien peut apprendre à répondre correctement au commandement « Assis ! », que celui-ci soit donné à voix normale, soit chuchoté ou provienne d'une autre personne que son maître.

On peut apprendre à des pigeons à picorer un disque de matière plastique transparente suite à la présentation d'une image représentant un être humain, enfant ou adulte, assis, debout ou couché, habillé ou non, vu en totalité ou en partie, ...


Cela présente une valeur adaptative car la plupart des stimuli rencontrés dans la nature, en particulier les stimuli présentant un danger, ne sont pas rigoureusement constants.

Du point de vue mémoriel, l'apprentissage est rapide car il a été déjà effectué avec des stimuli approchants : on parle de transfert positif ( infos).

Loi de la discrimination

La loi de la discrimination est semblable ( infos).


Une RC à un certain stimulus n'apparaît pas suite à un stimulus similaire mais non identique
.

Un chien de défense apprend à répondre aux ordres verbaux de son conducteur et à ne pas répondre à des ordres identiques émis par d'autres personnes.

Un chien apprend à aboyer quand la sonnette de la porte retentit et à ne pas aboyer lorsqu'il s'agit de la sonnerie du téléphone, parce que, dans le premier cas, une personne étrangère est proche de la maison.

Un chien se couche sur un vieux fauteuil usé situé dans le coin de la cuisine. Il y trouve confort et chaleur : son maître ne réagit pas quand il y est.

Un pigeon apprend à picorer un disque quand ce dernier est illuminé par une lumière dont la longueur d'onde est de 550 mµ.


La généralisation et la discrimination en conditionnement opérant présentent les mêmes caractères de complémentarité et d'adaptation à l'environnement qu'en conditionnement classique.

Le phénomène de discrimination est un outil précieux utilisé pour étudier les aptitudes des organes des sens des animaux.

Conditionnement opérantLoisRenforcementsPunitions Dangers
Bibliographie
  • Giffroy J.M. (Prof. Université de Namur, Belgique) - L'apprentissage et ses applications - 3ème cycle professionnel des écoles nationales vétérinaires, Toulouse, 2000