Renforcements
Vue d'ensemble

Citation

« La seule façon de renforcer notre intelligence est de n'avoir d'idées arrêtées sur rien, de laisser l'esprit accueillir toutes les pensées. »

John Keats

Sommaire


Le renforcement ou renforçateur est un stimulus qui apparaît ou disparaît suite à l'exécution d'une réponse, entraînant une augmentation de l'intensité, de la fréquence ou de la probabilité d'apparition de cette réponse
.


Renforcements primairesLes renforcements vont donc permettent d'installer ou de favoriser un comportement, contrairement aux punitions.


La quantité et la qualité du renforcement apporté va, d'une manière générale - ce n'est que partiellement exact pour la réponse d'évitement -, influencer proportionnellement la probabilité de réapparition de la réponse ou la force de celle-ci.

Un rat apprend plus vite à pousser sur un levier s'il reçoit cinq grammes de nourriture à chaque bonne réponse que s'il ne reçoit qu'un gramme.

Un rat court plus vite dans un labyrinthe s'il reçoit de l'eau saturée en glucose que de l'eau pure. Le même phénomène se produit s'il reçoit de la viande fraîche au lieu d'un plat d'aliment industriel.

Bien comprendre les différences entre renforcements et punitions

Avec les renforcements, les réponses comportementales augmentent en fréquence et en intensité.

Avec les punitions, les réponses comportementales diminuent en fréquence et en intensité.


Les termes positif et négatif, valables pour les renforcements et les punitions, n'ont donc rien à voir avec les actions (agréables ou désagréables) sur l'animal.



Du point de vue de l'apprentissage, les renforcements ont une efficacité supérieure aux punitions.

Pour bien comprendre, prenons l'exemple de l'apprentissage du « Assis ! » où les deux types de renforcements et les deux types de punitions peuvent être utilisés.

Suite au stimulus discriminatif qu'est le commandement « Assis ! » :


le chien s'assied, produisant donc une réponse correcte. A ce moment,


le chien se couche, produisant donc une réponse incorrecte. A ce moment,


Dans certaines conditions, le même stimulus peut servir de renforcement et de punition, les deux procédures étant alors combinées.

Cela peut entraîner des confusions lorsqu'on tente d'identifier le mécanisme mis en oeuvre dans une méthode d'apprentissage. Un chien qui marche correctement en laisse doit régler son allure pour se trouver en tout temps avec la tête exactement à la hauteur du genou gauche de son conducteur.

  • Lors de l'installation de ce comportement, quand le chien accélère son allure et que la laisse se tend, le maître dit « Au pied ! » et effectue une brusque traction sur la laisse. Le chien cesse alors de tirer : c'est une punition.
  • Si, suite à l'ordre « Au pied ! », le chien ralentit pour rester à la bonne position, il évite la traction : c'est un renforcement négatif.

Renforcements primaires


Un renforcement primaire, ou renforcement non conditionné, correspond à un besoin vital de l'animal.

  • Un renforcement primaire est suffisant, par lui-même, pour produire la réponse.
  • La nourriture, la boisson, la chaleur, le repos, la suppression de la douleur ou la diminution de l'inconfort, l'enrichissement de l'environnement après privation sensorielle sont des renforcements primaires.


La solution la plus couramment utilisée est la nourriture.


Outre ses inconvénients d'ordre pratique et diététique, elle a aussi l'inconvénient d'être soumise à la réaction de satiété.

  • Le renforcement peut donc perdre rapidement sa signification au cours d'une même séance par atténuation.
  • Il faut donner des récompenses très appétentes (friandises, foie…) pour éviter ce genre de situation.


Par exemple, pour éduquer un chiot, je propose aux propriétaires de déposer la quantité globale journalière de nourriture dans un récipient.

  • Ils en mettent une poignée dans la poche pour pouvoir récompenser le chien dès qu'il effectue un " bon " acte.
  • Ceci permet de n'avoir que des contacts positifs avec son chien.

Renforcements secondaires


Un renforcement secondaire, ou renforcement conditionné, est un élément qui n'a, à priori, pas de valeur " satisfaisante " pour l'espèce et qui va l'acquérir par association avec un renforcement primaire.


Un renforcement secondaire n'est pas un renforcement au départ et ne produit pas d'emblée la réponse : il acquiert cette capacité par
conditionnement classique.

Cet apprentissage par conditionnement classique peut se faire :

  • pour un stimulus qui a valeur de renforcement : en présentant systématiquement un certain nombre de fois le renforcement secondaire avant un renforcement primaire, il se trouve associé à ce dernier et peut ainsi se substituer à lui.

Chez le chien, des renforcements secondaires fréquemment utilisés sont les félicitations : « Il est gentil ! , Bon chien ! ... » parce qu'elles ont été associées à des caresses ou des friandises.

La présence de la mère est un renforcement secondaire pour le jeune animal parce qu'elle a été associée à la chaleur et à la nourriture.

Chez l'Homme, l'argent est un renforcement généralisé.

  • pour un stimulus servant de stimulus discriminatif : on parle donc aussi de stimulus discriminatif primaire et de stimulus discriminatif secondaire.

Lorsqu'un chien a appris à répondre à un ordre verbal, il est possible de le faire répondre aussi suite à un coup de sifflet ou à un geste du bras.


Le mot " secondaire " utilisé dans ce contexte n'exprime pas une gradation dans la force de la stimulation, mais trouve son appellation dans la chronologie du conditionnement.



L'usage du renforcement secondaire est plus commode que celui du renforcement primaire.

  • Le renforcement peut perdre rapidement sa signification au cours d'une même séance par atténuation, surtout lors de réactions de satiété.
  • Enfin, certaines stimulations aversives peuvent perturber les animaux.

Renforcements impératifs et renforcements atténués


Un renforcement impératif est celui qui est pourvu d'une signification importante pour l'animal : son utilisation permet un apprentissage rapide.


Un renforcement peut être très impératif dans certaines conditions et moins impératif dans d'autres circonstances, notamment en fonction de la motivation du sujet.

Un jeûne de 24 heures donne une signification impérative à la nourriture. Au fur et à mesure que celle-ci est consommée, elle constitue un stimulus de plus en plus atténué.

Trouver un endroit adéquat pour uriner ou déféquer constitue un renforcement seulement quand la vessie ou le rectum sont remplis.

L'opportunité de se promener est un renforcement pour un chien alors que pour un autre, plus âgé, ce n'en est pas un.


Un renforcement impératif peut subir une atténuation ou estompage, - en anglais, fading - s'il diminue quantitativement.

Cette atténuation, si elle est effectuée progressivement, peut ne pas avoir d'influence sur l'apprentissage en cours.

Certains renforcements ne subissent pas d'atténuation.


Chez beaucoup de chiens, les renforcements sociaux tels que félicitations, caresses, contacts physiques avec le maître... ne subissent pas d'atténuation. Ils peuvent d'ailleurs être plus impératifs que les renforcements alimentaires.

Renforcements par un autre comportement


Un comportement que l'individu effectue fréquemment peut constituer le renforcement d'un autre comportement.


Le principe de Premack, découvert en 1965, peut être formulé de la manière suivante : tout comportement émis régulièrement à une fréquence élevée peut être lui-même utilisé comme renforçateur pour un autre comportement.


Le " principe de Premack " consiste à associer une activité intéressante à une activité moins intéressante.

Certains l'appelle la " loi de grand-maman " : « Les enfants, vous pourrez aller jouer lorsque vous aurez fini vos devoirs ! »

En terme plus scientifique :

  • La fréquence de la seconde réponse augmente si elle est suivie de la possibilité d'effectuer la première.
  • Cette probabilité varie suivant divers facteurs : l'individu, le moment de la journée, ce que l'animal a fait au cours des heures qui précèdent, ... en bref, elle dépend de la motivation.

Pour le chien comme pour l'enfant, le jeu constitue un exemple type de réponse renforçante : c'est ainsi que le jeu peut être un bon moyen de renforcer une activité, a fortiori lorsque celle-ci est très contraignante. C'est le principe qui est utilisé pour dresser des chiens à rechercher les stupéfiants.

ApprentissageDifférentes formes d'apprentissageConditionnement classique
Conditionnement opérantLois du CORenforcementsRenforcements positifs
Renforcements négatifsRenforcements involontairesPunitionsDangers
HabituationSensibilisationImprégnationApprentissage par imitation
Apprentissage par observationApprentissage latentApprentissage par intuition
Apprentissages complexes

Bibliographie
  • Giffroy J.M. (Prof. Université de Namur, Belgique) - L'apprentissage et ses applications - 3ème cycle professionnel des écoles nationales vétérinaires, Toulouse, 2000