Jacques Van Rillaer (avatar)

Jacques Van Rillaer

Professeur émérite de psychologie à l'université de Louvain

Abonné·e de Mediapart

180 Billets

0 Édition

Billet de blog 29 octobre 2025

Jacques Van Rillaer (avatar)

Jacques Van Rillaer

Professeur émérite de psychologie à l'université de Louvain

Abonné·e de Mediapart

Récompenses et punitions en psychologie comportementale

Jacques Van Rillaer (avatar)

Jacques Van Rillaer

Professeur émérite de psychologie à l'université de Louvain

Abonné·e de Mediapart

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.

La psychologie peut se définir comme un ensemble d’observations et d’explications de comportements. Des théories sont apparues depuis l’antiquité sous forme de sens commun et de philosophies. La psychologie scientifique, soucieuse d’observations précises et de vérifications objectives, est née en Allemagne au XIXe siècle. Elle a été alors définie comme la « science de l’âme » (Seelenkunde), l’étude d’une entité immatérielle dont les expressions sont des comportements observables. La méthode était l’introspection, définie comme l’auto-observation d’états de conscience provoqués par diverses situations.

Vers 1910, des psychologues — principalement américains — ont développé une façon de faire de la psychologie appelée « behaviorism » (en français : « comportementalisme »). Le leitmotiv est d’étudier le comportement et non l’âme ou l’esprit. Le principal motif du changement est le refus de pseudo-explications « mentalistes », des explications à portée de main par des « besoins », des « instincts », des « pulsions », « l’Inconscient » conçu comme une entité. Ces explications par des entités internes invisibles arrêtent les investigations. Expliquer l’agressivité par une « pulsion d’agression » ne mène pas loin. En fait, tout comportement — agressif ou autre — résulte toujours de plusieurs facteurs. Pour l'expliquer, il convient d'examiner la situation dans laquelle il se produit, la manière dont la personne perçoit et interprète cette situation, les affects qui découlent de l'état physiologique et de processus cognitifs générés, le répertoire des actions de la personne, l'anticipation d'effets de conduites possibles, les conditionnements subis par le passé (les modèles observés, les punitions et les récompenses qui ont suivi des actions).

Le principal représentant du comportementalisme est Burrhus Skinner (1904-1990), professeur à l’université Harvard. Contrairement aux premiers behavioristes, il a étudié des comportements entendus au sens large : toute forme d'activité, directement ou indirectement observable, présentant une composante cognitive, affective et motrice. Il a montré à quel point les comportements sont modelés par des conséquences de comportements vécues antérieurement, observées ou imaginées. Ses nombreuses expériences ont précisé les effets de conséquences en fonction de leur fréquence, de leur degré de probabilité, de leur délai d’apparition et de leur explication causale. Des collaborateurs ont utilisé ses observations pour développer l’Applied Behavior Analysis (ABA), l’Analyse appliquée du comportement (AAC), dont les applications les plus marquantes sont l’éducation dans des institutions et l’éducation des personnes avec autisme. Les principes s’appliquent toutefois dans de nombreux domaines, notamment l’éducation en général.

Quatre types de conséquences du comportement

Skinner distinguait quatre types de conséquences : deux récompenses et deux punitions. Au terme « récompense », il a préféré « renforçateur », qu’il a défini comme une conséquence d’un comportement qui « fortifie » le comportement, c’est-à-dire rend sa répétition davantage probable dans une situation similaire. Ce processus est appelé « renforcement ». Des récompenses, par exemple des friandises non appréciées, n’ont pas cet effet.

Renforcements positifs et négatifs

Le renforcement est appelé « positif » lorsqu’il se produit par l’apparition d’une stimulation après le comportement. Le mot « positif » ne signifie pas ici bon ou utile. Conformément à l'étymologie latine — positus, posé —, il indique la présence de quelque chose, comme dans l'expression « le test sida est positif », le virus est présent.

Le renforcement est dit « négatif » si une stimulation désagréable est réduite ou supprimée à la suite du comportement. « Négatif » ne signifie pas ici mauvais. Conformément à l'étymologie — negativus, nié, reconnu absent —, il indique l'absence de quelque chose, comme dans l'expression « la cuti est négative » pour dire que le bacille est absent.

Les animaux et les humains font beaucoup de choses pour éviter des situations pénibles. Ainsi, les addictions commencent généralement à la suite de renforçateurs positifs (on apprend à fumer pour faire partie d’un groupe, vivre un rite de passage, etc.), mais une fois l’habitude prise et la dépendance à la nicotine installée, la personne fume moins par plaisir que pour éviter les pénibles sensations de l’état de manque. Au bout d’une certain temps, l’arrêt du tabagisme devient douloureux, très difficile.

Punitions positives et négatives

Le mot « punition » désigne une stimulation désagréable ou pénible qui suit un comportement et qui réduit la fréquence de ce comportement ou le fait abandonner. Si un élève continue à perturber les cours après avoir dû recopier des textes, le recopiage n’est pas une punition au sens technique utilisé ici.

La punition est dite « positive » lorsqu’une situation désagréable ou pénible apparaît à la suite du comportement. Par exemple, devoir accomplir une tâche déplaisante.

La punition est appelée « négative » lorsqu’une ou des stimulations agréables sont réduites ou disparaissent suite au comportement. Un exemple de « punition négative » est la « pénalisation » (« response cost ») : le retrait d’une chose obtenue, par exemple un jouet, un bon point, de l’argent de poche. Un autre exemple, qui a fait couler beaucoup d’encre récemment, est la « mise à l’écart » (« time out ») : la perte d’accès, pendant une période déterminée, à une situation ou des stimuli qui sont « renforçants ».

Nous présentons brièvement la position des associations de praticiens de l’Analyse appliquée du comportement (« AAC ») (en anglais Applied Behavior Analysis, « ABA »), telle qu’elle se trouve dans le manuel le plus prestigieux de l’AAC [1].

La mise à l’écart peut s’appliquer à un enfant qui a une conduite perturbante (cris, colère, bouffonnerie pour capter l’attention du groupe), antisociale (pousser ou frapper un autre enfant) ou potentiellement dangereuse, pour lui ou pour d’autres.

La procédure classique est le placement de l’enfant dans une autre pièce : un endroit « sûr », suffisamment chauffé et ventilé, non verrouillé. Il est exclu de placer l’enfant dans l’obscurité.

En cas de colère, l’enfant peut y continuer sa colère, mais n’a plus l’attention qu’il obtenait.

La mise à l’écart n’implique pas un changement de local. Par exemple, le parent interrompt une émission de télévision si l’enfant hurle ; durant un jeu collectif, l’enseignant envoie l’enfant s’asseoir sur un banc, éventuellement le dos tourné au jeu.

La procédure n’est considérée comme efficace que si la fréquence du comportement, qui la déclenche, finit par diminuer.

La recommandation sur la durée est la suivante : « Les périodes de mise à l’écart devraient être aussi brèves que possible tout en maintenant l'efficacité. Des durées de mise à l’écart de 2 à 5 minutes sont souvent efficaces pour réduire le comportement, bien que cette courte durée puisse être inefficace au départ si une personne a eu des antécédents de mise à l’écart plus longues. En règle générale, les périodes de mise à l’écart supérieures à 15 minutes ne sont pas efficaces » (p. 392).

Il importe de coupler la mise à l’écart avec le renforcement de comportements désirables. Par exemple, l’enfant est récompensé lorsqu’il est frustré mais ne se met pas en colère.

Priorité aux renforcements positifs

Dès 1938, Skinner a démontré le pouvoir de renforcements positifs bien « programmés ». Devant ses étudiants de Harvard, il faisait venir un pigeon qui n’avait guère été conditionné et lui faisait apprendre à se déplacer de façon inhabituelle, par exemple en décrivant des « 8 » sur le sol de la cage.

Skinner disposait d'un appareil permettant de fournir de la nourriture au pigeon qui avait faim. Il ne pouvait attendre que le comportement visé survienne pour le renforcer.  Dès lors, il renforçait tout comportement qui pouvait acheminer, si peu que ce soit, à la réaction souhaitée, par exemple tout déplacement dans le sens des aiguilles d'une montre ou toute rotation de la tête vers la droite. La réaction, si fragmentée soit-elle par rapport au but, se répétait rapidement. Skinner exigeait alors un mouvement plus marqué dans la même direction, puis un tour entier. Il procédait ensuite à un apprentissage analogue du déplacement dans l'autre direction, le premier étant provisoirement laissé de côté. Une fois obtenu ce nouveau comportement, le premier était à nouveau renforcé.  Lorsque le pigeon adoptait les deux réactions l'une après l'autre, il était particulièrement renforcé. Le comportement-cible se répétait alors rapidement. Cet apprentissage se réalisait le plus souvent en une dizaine de minutes [2].

Ce genre d’expérience montre qu’on ne peut pas affirmer l’incapacité de certains comportements si l’on ne précise pas les « programmes » essayés. Il y a évidemment des contraintes constitutionnelles. Ainsi, il n’est pas possible d’apprendre à un pigeon de donner un coup de bec pour éviter un choc électrique. Sa réaction naturelle d’évitement comporte le rejet de la tête vers l’arrière [3].

Il y a bien sûr d’énormes différences de complexité dans les répertoires comportementaux des hommes et des animaux, mais il y a des lois d’apprentissage analogues, comme il y a des lois du fonctionnement physiologique, qui ont permis la mise au point de médicaments pour les humains à partir d’expériences animales.

L’apprentissage que nous venons d’illustrer s’appelle « renforcement par approximations successives », « façonnement » (« shaping ») ou, plus simplement, apprentissage par petits pas. Il s’est avéré extrêmement utile pour l’éducation d’enfants atteints d’autisme [4]. Un témoignage très émouvant a été donné par l’acteur Francis Perrin et sa femme dans le livre Louis, pas à pas [5]. À l’âge de trois ans, Louis avait été diagnostiqué autiste sévère. Un psychiatre avait tranché : « Vous devez faire le deuil de votre enfant ». Un autre avait expliqué : « Madame, vous êtes une mauvaise mère, Monsieur, vous êtes un père trop vieux ! » Gersende et Francis découvrent alors l’Analyse appliquée du comportement. Louis évolue dès les premiers jours grâce à des renforcements méthodiques de comportements. Il communique peu à peu avec ses frères et commence à acquérir une véritable autonomie. Ses progrès sont spectaculaires : il devient pas à pas « un enfant presque comme les autres ».

Inconvénients des punitions

Pour un parent, un enseignent ou un éducateur, il semble difficile, voire impossible, de se passer de punitions. Celles-ci peuvent apprendre à mieux reconnaître des conduites inadéquates, elles peuvent dissuader de conduites dangereuses comme jouer avec des prises électriques, fumer au lit, agresser un enfant plus petit. Il importe toutefois qu’elles apparaissent justes (trop faibles, elles sont inefficaces ; disproportionnées, elles suscitent des réactions regrettables). Il est souhaitable qu’elles suivent rapidement le comportement indésirable et qu’elles portent sur les premiers éléments de la séquence comportementale.

La plupart des punitions présentent des inconvénients, surtout si l’on peut s’en passer grâce au renforcement de comportements alternatifs. C’est un fil rouge du comportementalisme. Dès son cours à Harvard en 1948 — publié sous forme de livre en 1953 — Skinner insistait sur les inconvénients des punitions : « À long terme, la punition — contrairement au renforcement — opère au détriment à la fois de l'individu puni et de l'agent de punition. Les stimuli aversifs, qui sont alors nécessaires, génèrent des émotions prédisposant à la fuite ou à la vengeance, ainsi que des anxiétés débilitantes » [6]. Deux ans avant sa mort, il répète : « Les stimuli aversifs ne se justifient que si aucune autre mesure ne peut être utilisée. Accepter trop facilement les mesures aversives, c'est entraver le progrès dans des voies meilleures » [7].

Les punitions suscitent peu de comportements élaborés. Par elles, il est impossible d’apprendre à un pigeon à se déplacer en décrivant des « 8 » sur le sol, pas plus qu’on ne peut apprendre à un enfant atteint d’autisme à acquérir un degré d’autonomie convenable.

Les punitions induisent l’imitation : le punisseur sert de modèle pour la réduction de frustrations, il apprend au puni à réagir comme lui à l’égard d’autres personnes. De nombreuses recherches ont montré une nette corrélation entre les punitions physiques excessives infligées aux enfants et leurs conduites violentes [8].

Des troubles psychologiques peuvent se développer à l’occasion de punitions physiques ou psychologiques. La psychothérapie sert souvent à résoudre des problèmes nés de contrôles aversifs, grâce à des explications déculpabilisantes.

L’importance de la proportion des renforcements et des punitions

Betty Hart et Todd Risley (Université du Kansas) ont examiné le vocabulaire et le quotient intellectuel d’enfants à 3 ans, puis à 9-10 ans. Les enfants qui ont réalisé le plus de progrès dans ces deux domaines avaient des parents qui leur parlaient davantage et les félicitaient plus souvent. Le « ton de rétroaction » (« feedback tone ») parental qui a entraîné le plus de progrès était d'environ 5 félicitations ou approbations pour une critique ou réprimande [9].

À la même époque, John Gottman (University of Washington, Seattle), célèbre investigateur des facteurs de satisfaction et de séparation conjugales, a observé dans son « love lab » les échanges verbaux de plusieurs centaines de couples au cours de discussions sur leurs conflits. Résultat : chez les couples stables le rapport des interactions positives aux négatives était de 5/1 ; chez les couples qui divorceront 0,8/1 [10].

Bien sûr, on ne retrouve pas toujours le même rapport, mais d’autres recherches montrent sans équivoque les bénéfices d’un montant nettement plus élevé de remarques positives que de critiques [11].

Ces observations ont servi de recommandations à des éducateurs et des enseignants. Ainsi, des psychologues en formation à l’Analyse appliquée du comportement ont été invités à noter systématiquement leurs remarques approbatrices et désapprobatrices pendant plusieurs jours d’affilée. Ils ont été étonnés par leur peu de compliments et la fréquence de leurs reproches. Ils se sont ensuite entraînés à augmenter les félicitations informatives ou affectueuses [12].

Autre exemple. Dans six classes d’enseignement général, les enseignants ont été invités à adresser, environ toutes les 5 minutes, des félicitations, des approbations et des gestes positifs à des élèves. La comparaison avec d’autres classes a montré que les élèves présentaient moins de comportements perturbateurs et un temps d'engagement scolaire plus élevé [13].

Des marques subtiles de renforçateurs pour des approximations successives vers un objectif sont souvent suffisantes. Il importe toutefois de ne pas « saturer » les enfants d’éloges. Certains — en particulier des adolescents délinquants — réagissent négativement à l’abondance des renforçateurs [14]. Les renforçateurs externes sont évidemment inutiles si l’activité est intrinsèquement renforçante (par exemple si l’enfant trouve du plaisir à résoudre des problèmes).

La plupart des êtres humains critiquent spontanément. Ils punissent volontiers car cette réaction facile a souvent un effet immédiat ou à court terme. Réagir d’une façon positive est moins évident, mais cela se développe. Il en résulte des relations plus heureuses et des conduites plus solides à long terme. Complimenter n’est pas compliqué, c’est efficace et gratuit.

Illustration 1

———————

[1] Cooper JO., Heron TE.  & Heward WL (2022) Analyse Appliquée du Comportement. Trad. de la 3e éd. américaine, Éditions ABA Online SAS, 980 p.

Présentation : https://www.afis.org/Analyse-appliquee-du-comportement

[2] Skinner, B. (1968) La révolution scientifique de l'enseignement. Trad., Mardaga, p. 80.

[3] Smith et al. (1972) Incompatibility between the pigeon’s unconditioned response to shock and the conditioned keypeck response. Journal of the Experimental Analysis of Behavior, 18:147-153.

[4] Voir le chapitre 22 “Façonnement”, dans J.O. Cooper, Op. cit., p. 597-614.

[5] Perrin, G. & F. (2012) Louis, pas à pas. JL Lattès, 230p. Le Livre de Poche, 2023, 216 p.

[6] Skinner B.F. (1953) Science and human behavior. The Macmillan Company, p. 183.

[7] Skinner B.F. (1988) The operant side of behavior therapy. Journal of Behavior Therapy and Experimental Psychiatry. Rééd. in Recent issues in the analysis of behavior. Merrill, 1989, p. 80.

[8] Sprague J.R. & Walker, H. (2000) Early identification and intervention for youth with antisocial and violent behavior. Exceptional Children, 66:367-379.

[9] Hart, B. & Risley T.R. (1995) Meaningful Differences. Baltimore, MD: Paul H Brookes.

[10] Gottman, J.M. (1994) What predict divorce? Lawrence Erlbaum.

[11] Sabey, C. V. et al. (2018) The “Magic” Positive-to-Negative Interaction Ratio: Benefits, Applications, Cautions, and Recommendations. Journal of Emotional and Behavioral Disorders, 27: 154-164.

[12] Flora, S. R. (2000) Praise’s magic reinforcement ratio: five to one gets the job done. The Behavior Analyst Today, 1: 64-69.

[13] Cook, C. R. et al. (2016) Evaluating the Impact of Increasing General Education Teachers’ Ratio of Positive-to-Negative Interactions on Students’ Classroom Behavior. Journal of Positive Behavior Interventions, 19: 67-77.

[14] Patterson, G. (1969) Behavioral techniques based upon social learning. In C.M. Franks (Ed.) Behavior therapy: appraisal and status. Mac Graw-Hill, p. 323-374.

Ce blog est personnel, la rédaction n’est pas à l’origine de ses contenus.