Comme les gens, les chiens sont motivés par le gain et pour éviter la douleur. Par conséquent, pour former un chien, des renforts ou des punitions peuvent être utilisés.
Alors, quels sont les renforts et les punitions?
Les renforts sont tout ce qui augmente la probabilité qu'un chien répète un comportement particulier. De même, les punitions sont tout ce qui diminue la probabilité qu'un comportement se répète.
Ce qui n’est peut-être pas très clair, c’est qu’il existe 2 types de renforts et, de même, 2 types de punitions. Voici pourquoi…
Les 4 quadrants du conditionnement opérant
Pour renforcer un chien pour un comportement particulier, vous pouvez lui donner quelque chose qu'il aime (par exemple une friandise) ou emporter quelque chose qu'il n'aime pas (par exemple un aversif). Dans les deux sens, le chien est récompensé pour répéter le comportement. Le premier est appelé renforcement positif (R +) et le second renforcement négatif (R-).
Et pour punir un chien pour son mauvais comportement afin de réduire la probabilité qu’il répète ce comportement, vous pouvez lui administrer quelque chose que le chien n’aime pas (par exemple, une punition physique) ou tout simplement lui retirer quelque chose qu’il aime (par exemple, un retrait de privilège). la forme d'un temps mort). Le premier dans ce cas est appelé punition positive (P +) et le second punition négative (P-).
Comme le montrent les exemples ci-dessus, le mot positif et négatif est simplement utilisé pour indiquer si quelque chose est en train d'être administré ou enlevé. Et parce que vous pouvez renforcer ou punir un chien en ajoutant ou en enlevant des objets, nous nous retrouvons avec 2 types distincts de renforts et de punitions, ou, en bref, les 4 quadrants de conditionnement opérant.
Exemples de 4 quadrants utilisés dans la formation de chien
Voici des exemples courants des quatre quadrants en action lors de la formation d'un chien:
Renforcement positif (R +): Demander à un chien de s'asseoir et lui donner un festin lorsqu'il est assis
Renforcement négatif (R-): Lorsque vous apprenez à un chien à récupérer, pincer l'oreille du chien (aversif) et le relâcher (enlever l'aversif) uniquement lorsque le chien récupère l'objet.
Positif Punishment (P +): utiliser une laisse en laisse pour corriger un chien pour un comportement indésirable.
Châtiment négatif (P-): Lorsqu'un chien joue avec un autre chien avec plaisir, il est temps d'instaurer un temps mort en le prenant dans un coin ennuyeux (en enlevant le temps de jeu) dès qu'il devient trop rugueux ou agressif (comportement indésirable)
Les dresseurs de chiens de compulsion Clicker Vs et comment ils utilisent les 4 quadrants
Clicker et un autre formateur basé sur les récompenses positives appliquent généralement beaucoup de R + dans leur formation. Dans de rares cas où une punition est requise, ils administrent généralement P-. Lors de l'entraînement au clicker, les chiens sont souvent configurés pour réussir, ce qui donne aux formateurs la possibilité de marquer, récompenser et renforcer les comportements souhaités. Une telle formation est donc généralement qualifiée de plus humaine et plus adaptée aux chiens.
À l'inverse, les formateurs en contrainte se concentrent beaucoup sur l'utilisation de P + et de R- pour faire le travail. Les chiens sont parfois délibérément disposés à commettre des erreurs, ce qui permet au dresseur de corriger le chien. D'où le terme correction et compulsion sont couramment associés à une telle forme de dressage de chien.