拉布拉多犬训练飞盘

塑造是由美国斯金纳博士首创于20世纪30年代
哪些行为是适合用塑造 。强化对提高行为反应的频率起着十分重要的作用,但是要运用它进行行为训练,目标行为反应至少要偶尔出现过 。也就是说,当犬无法达到或者无法直接出现某个行为,则该行为的出现频率无法被增加,无法被强化 。因此,遇到这种情况,就需要用别的方法使这种行为发生,行为塑造就是这样的一种方法 。
一、塑造的含义

拉布拉多犬训练飞盘

文章插图
塑造是由美国斯金纳博士首创于20世纪30年代 。塑造是用来培养犬目前还未作出目标行为的手段,定义为使犬行为不断接近目标行为而最终做出这种目标行为的逐步强化过程 。
拉布拉多犬训练飞盘

文章插图
塑造法又称连续逼近法,是对目前所没有的目标行为的一系列连续趋近,动作不断强化,直到犬最终能经常的做出目标行为 。
行为塑造的列子在犬中应用比较多,比如犬学飞盘就是一个塑造过程,先是对玩具产生兴趣,比如球,绳结等,然后会去追逐玩具,然后会将玩具带回来,然后开始培养飞盘,先学会滚盘,然后近距离飞盘,最后在接远距离翻盘 。在这一系列过程中,形成了一连串的反应 。同时训犬师对犬接飞盘过程中的每一阶段的进步感到开心并及时给予反应,这种反应就是强化,这样犬就能在飞盘在空中的时候就可以接到 。这一过程是循序渐进的,是逐步强化的 。
二、塑造法的特点
(一)关联的阶段性
由于行为塑造多是对比较复杂的行为进行训练,只靠一个步骤是很难一步到位,因此在行为塑造的过程中,常把最后目标行为分解成一个个相互联系的阶段性的目标行为 。如犬学会装死的过程可以细化为以下阶段性的目标行为,依次为:“来到我身边→在我身边坐下→在我身边卧下→在我身边侧躺→在我身边完全躺下→在我身边躺下能保持一段时间”到最后为我离开了犬依旧躺下保持不动 。在阶段性的目标行为中,第一阶段目标行为也是初始行为,是一种最简单的行为训练阶段,是犬很容易就能获得的行为 。“我离开了犬依旧躺下保持不动”是最后的目标行为,因此最后一个阶段的目标行为也叫终点目标行为,是塑造结果最终要达到的目标行为 。
(二)逐步渐进性
行为塑造过程中每一阶段的目标行为都是相互联系的,是一种连续的趋近行为,只有在前一行为完成的基础上,才能进入下一个目标行为,这样就形成了一系列的逐步向前推进的运行程序 。训练犬捡回球 。将犬带到一个安静的房间,在房间里某个地方放上一个球 。这个训练塑造过程逐渐渐进的运行程序就是:“看向球的方向→移动接近球→触碰到球→嘴巴碰球→嘴巴叼起球→球在嘴巴里保持不掉→叼着球往回走→将球吐在人的手上 。”犬只有“看向球的方向”后才有可能去“接近球”,犬只有在有了“接近球”的行为动作后,才有可能去“触碰球”,以此类推,最终逐步到达终点目标行为 。行为塑造的过程实际上就是从最简单,最易被犬获得的动作开始,一步一步地朝着最后的目标行为行进的过程 。
(三)兼用强化与消退策略
在行为塑造过程中,每个阶段的趋近目标行为实际上都是一种新行为 。犬每到达一个预定的阶段性目标,训练师都要给予强化:即每当犬表现出新行为时,训练师应当及时给予强化 。当强化到一定程度时候,训练师就会停止强化,这往往会导致行为的消失,实际上这一过程就是行为消退的过程 。当然,停止强化的主要目的是为了进入下一阶段性目标行为 。比如,当犬第一次主动去触碰飞盘时,主人会非常开心的抱紧犬,吻她以及给予食物,这实际上就是对犬的一种强化,得到强化信息的犬会继续表现出类似的行为 。最初几次,训犬师会继续给予及时的回应来强化 。当训犬师觉得不在需要在对单纯的触碰飞盘进行强化时,如果犬还继续出现只是触碰飞盘,训犬师就不在回应了,因为如果在继续强化下去,犬只会做出那种单纯的触碰飞盘行为,不再会发生叼起飞盘或带着飞盘回到主人身边行为 。同时训犬师要用一些方法教会犬学会叼起飞盘行为(比如模仿学习,在学习犬面前强化其他犬叼起飞盘的行为 。)当犬做出几次单纯触碰飞盘都得到不训犬师的回应时,犬就会失去继续做出这种触碰行为的兴趣 。同时也会试图学习其他犬如何叼起飞盘,以得到训犬师积极的回应 。这样就会为下一个行为叼起飞盘行为做好了准备 。当训犬师看到犬叼起了飞盘时,又会及时的积极回应,对犬出现叼飞盘新行为给予强化 。以此类推 。