关于何时该奖励、何时不该奖励动物,就有成千上万的科学研究报告。例如我们要狗狗学会坐下这个指令,那么第1次做到有奖励,第4次、第12次、第17次、第20次分别也有奖励。把5次奖励变化地分配到20次正确回应中,而不是平均的进行分配。 再比如要狗狗学会安静等待,我们可能要在等待5秒、等待20秒、等待13秒、等待34秒的时候给予奖励,而不是每次达到15秒时给予奖励。
奖励狗狗要使用变化机制 当你用奖励诱导狗狗进行训练时,可以从一开始就使用变化的机制。 如果狗狗一开始就做对了,然后你要尽快开始降低奖励的比率,要求它做出两次正确的行为才给予一次奖励。 有一点非常重要,不要让狗狗每次做出同样的行为都必然获得奖励。如果这样做,它确实会学得很快,但也会忘记得很快。如果奖励的时机是偶然和随机的,它会学得很快,也会记得更牢固,会更努力争取好的表现。 狗狗通过你变化机制的训练,它知道会有奖励,但不知道什么时候有。当没有奖励的时候,它不放弃也不埋怨,只会继续努力的表现。总有一些时候你手边刚好没零食,这时你并不需要着急担心,因为你平时的训练已经打下良好基础,它仍然会有正确的反应。 奖励狗狗要让狗狗持续进步 比如你训练狗狗去捡球,10次捡球,第3次反应快,第4次等待特别有耐心,第12次特别专注又愉快,这都是我们可以加强奖励的时机,让狗狗知道它有越好的表现,会得到越及时、强烈的奖励,最优秀的一次表现甚至可以获得超级大奖。 比如你训练狗狗去捡球,10次捡球,第3次反应快,第4次等待特别有耐心,第12次特别专注又愉快,这都是我们可以加强奖励的时机,让狗狗知道它有越好的表现,会得到越及时、强烈的奖励,最优秀的一次表现甚至可以获得超级大奖。