Sommaire ( / )
Le renforcement ou renforçateur est un stimulus qui apparaît ou disparaît suite à l'exécution d'une réponse, entraînant une augmentation de l'intensité, de la fréquence ou de la probabilité d'apparition de cette réponse.
![]()
Les renforcements vont donc permettent d'installer ou de favoriser un comportement,
contrairement aux punitions (
infos).
La quantité et la qualité du renforcement apporté va, d'une manière générale - ce n'est que partiellement exact pour la réponse d'évitement -, influencer proportionnellement la probabilité de réapparition de la réponse ou la force de celle-ci.
Un
rat apprend plus vite à pousser sur un levier s'il reçoit
cinq grammes de nourriture à chaque bonne réponse que s'il
ne reçoit qu'un gramme.
Un rat court plus vite dans un labyrinthe s'il reçoit de l'eau saturée en glucose que de l'eau pure. Le même phénomène se produit s'il reçoit de la viande fraîche au lieu d'un plat d'aliment industriel.
Avec les renforcements, les réponses comportementales augmentent.
Avec les punitions, les réponses comportementales diminuent.
![]()
Du point de vue apprentissage, les renforcements ont une efficacité
supérieure aux punitions.
Pour bien comprendre, prenons l'exemple de l'apprentissage du « Assis ! » où les deux types de renforcements et les deux types de punitions peuvent être utilisés.
Suite au stimulus discriminatif qu'est le commandement « Assis ! » :
![]()
le chien s'assied, produisant donc une réponse correcte. A ce moment,
![]()
le chien se couche, produisant donc une réponse incorrecte. A ce
moment,
![]()
Dans certaines conditions, le même stimulus peut servir de renforcement
et de punition, les deux procédures étant alors combinées.
Cela peut entraîner des confusions lorsqu'on tente d'identifier le
mécanisme mis en oeuvre dans une méthode d'apprentissage.
Un chien qui marche correctement en laisse doit régler son allure pour se trouver en tout temps avec la tête exactement à la hauteur du genou gauche de son conducteur.
Un renforcement primaire, ou renforcement non conditionné, correspond à un besoin vital de l'animal.
La solution la plus couramment utilisée est la nourriture.
Outre ses inconvénients d'ordre pratique et diététique, elle a aussi l'inconvénient d'être soumise à la réaction de satiété.
Par exemple, pour éduquer un chiot, je propose aux propriétaires
de déposer la quantité globale journalière de nourriture
dans un récipient. Ils en mettent une poignée dans la poche
pour pouvoir récompenser le chien dès qu'il effectue un " bon
" acte. Ceci permet de n'avoir que des contacts positifs avec son chien.
Un renforcement secondaire, ou renforcement conditionné, est un élément qui n'a, à priori, pas de valeur " satisfaisante " pour l'espèce et qui va l'acquérir par association avec un renforcement primaire.
![]()
Un renforcement secondaire n'est pas un renforcement au départ et
ne produit pas d'emblée la réponse : il acquiert cette
capacité par conditionnement
classique.
Cet apprentissage par conditionnement classique peut se faire :
Chez le chien, des renforcements secondaires fréquemment utilisés sont les félicitations : « Il est gentil ! , Bon chien ! ... » parce qu'elles ont été associées à des caresses ou des friandises.
La présence de la mère est un renforcement secondaire pour le jeune animal parce qu'elle a été associée à la chaleur et à la nourriture.
Chez l'Homme, l'argent est un renforcement généralisé.
Lorsqu'un chien a appris à répondre à un ordre verbal, il est possible de le faire répondre aussi suite à un coup de sifflet ou à un geste du bras.
![]()
Le mot " secondaire " utilisé dans ce contexte
n'exprime pas une gradation dans la force de la stimulation, mais trouve
son appellation dans la chronologie du conditionnement.
![]()
L'usage du renforcement secondaire est plus commode que celui du renforcement
primaire.
Un renforcement impératif est celui qui est pourvu d'une signification importante pour l'animal : son utilisation permet un apprentissage rapide.
Un renforcement peut être très impératif dans certaines conditions et moins impératif dans d'autres circonstances, notamment en fonction de la motivation du sujet.
Un jeûne de 24 heures donne une signification impérative à la nourriture. Au fur et à mesure que celle-ci est consommée, elle constitue un stimulus de plus en plus atténué.
Trouver un endroit adéquat pour uriner ou déféquer constitue un renforcement seulement quand la vessie ou le rectum sont remplis.
L'opportunité de se promener est un renforcement pour un chien alors que pour un autre, plus âgé, ce n'en est pas un.
Un renforcement impératif peut subir une atténuation ou estompage, - en anglais, fading - s'il diminue quantitativement.
Cette atténuation, si elle est effectuée progressivement, peut ne pas avoir d'influence sur l'apprentissage en cours.
Certains renforcements ne subissent pas d'atténuation.
Chez beaucoup de chiens, les renforcements sociaux tels que félicitations,
caresses, contacts physiques avec le maître... ne subissent pas d'atténuation.
Ils peuvent d'ailleurs être plus impératifs que les renforcements
alimentaires.
Un comportement que l'individu effectue fréquemment peut constituer le renforcement d'un autre comportement.
Le
principe de Premack, découvert en 1965, peut être formulé
de la manière suivante :
tout comportement émis régulièrement à une fréquence élevée peut être lui-même utilisé comme renforçateur pour un autre comportement.
Le " principe de Premack " consiste à associer une activité
intéressante à une activité moins intéressante.
Certains l'appelle la " loi de grand-maman " : « Les enfants, vous pourrez aller jouer lorsque vous aurez fini vos devoirs ! »
En terme plus scientifique :
Pour le chien comme pour l'enfant, le jeu constitue un exemple type de réponse renforçante : c'est ainsi que le jeu peut être un bon moyen de renforcer une activité, a fortiori lorsque celle-ci est très contraignante. C'est le principe qui est utilisé pour dresser des chiens à rechercher les stupéfiants.
| Conditionnement
opérant |
![]() |
Bibliographie
|