文章轉貼處:
http://tw.myblog.yahoo.com/jw!Nr_d8iiFEx9YSoi5srgw/article?mid=219&prev=235&next=210&l=a&fid=12

什麼是『處罰』?

作者:黃薇菁(Vicki)

參考資料:《Excel-erated Learning》,作者為Pamela J. Reid博士

  一般以為「處罰」就是施予打、罵等手段,使對方皮肉受苦或心理受創,其實以學習理論(Learning Theory,請查詢心理學資訊可獲更多解釋)來看,這種定義太過狹隘,以下簡略解釋一點兒。

  操作制約是由行為後果(consequence)主宰的學習方式,無論這個後果是好是壞,簡而言之,如果某行為將來發生的可能性增加了,這種操作制約學習便是「增強」(Reinforcement),反之,如果某行為將來發生的可能性減少了,這種操作制約學習便是「處罰」(punishment)。

  所以,狗坐下後你就給牠一塊狗餅乾,想當然爾,你「以為」這樣即可「增強」坐下的行為,不對!言之過早,你必須接下來觀察牠,如果牠變得較常坐下,這時你才可以說你增強了牠坐下的行為,因為牠的行為很可能沒有改變(沒有產生學習),或甚至更少坐下來(表示坐下的行為受到了處罰),端看那塊狗餅乾對狗代表什麼意義。

  「增強」和「處罰」又有正負之分,這裡的「正」與「負」不代表「好」跟「壞」,而是分別代表「出現/施予」和「消失/移除」,四個學習原理如下:

   『正增強』(positive reinforcement)

   『負增強』(negative reinforcement)

   『正處罰』(positive punishment)

   『負處罰』(negative punishment)



『正增強』(positive reinforcement)

  行為出現後,出現動物喜見的事物,於是行為變得較常發生。例:狗狗趴下來,即出現一塊牛排可以吃,牠變得常常趴下。

『負增強』(negative reinforcement)

  動物不喜見的事物一直持續,直到行為出現才消失,於是行為變得較常發生。例:狗狗想睡覺,你一直戳牠煩牠,於是牠鑽到你沒法搆到牠的牀底下,以後牠常常會鑽到牀底下睡覺。

『正處罰』(positive punishment)

  行為出現後,出現動物不喜見的事物,於是行為變得較少發生。例:狗狗趴下來,有人便飛踢牠一腳去撞牆,以後牠幾乎不趴下了(或者一旁有人時不會趴下來)。

『負處罰』(negative punishment)

  行為出現後,動物喜見的事物即消失,於是行為變得較少發生。例:兩隻幼犬咬著玩,其中一隻咬得過猛弄痛了另一隻,牠哀叫一聲後就不玩了,以後咬痛對方的這隻幼犬不再咬得太過份。

  很多時候,兩項原理同時作用,同時作用於不同行為:

  例一:你下口令要狗坐下,但牠仍一直站著,於是你一直猛扯項圈直到牠坐下,重覆幾次之後,牠越來越會聽口令坐下。

「站著」的行為受到了正處罰,「坐下」的行為受到了負增強。

  例二:狗狗不斷跳撲在你身上,你轉頭看他處不理牠,直到牠四隻腳落地不再撲在你身上,你轉頭回來注視牠,告訴牠好乖,摸摸牠;重覆幾次,牠漸漸不撲你了。

「跳撲」在你身上的行為受到了負處罰,「四腳落地」的行為受到了正增強。

  如果將這四個學習原理運用得當,它們可以極為有效,以正處罰為例,你必須遵守以下原則,否則效果不彰:

1. 處罰必須一開始就重罰,不能由輕漸重,否則會逐漸習慣

2. 處罰必須符合犯錯行為的嚴重性

3. 處罰必須每次犯錯都施予

4. 處罰必須即時

5. 處罰不可與無法適時出現的特定刺激產生關連性,例如:特定人士或物件

6. 最好配合區辨刺激(請見如果你非得用處罰不可一文)

7. 提供動物出現其他行為的機會

8. 不可介入情緒,作為報復

  可惜一般人通常無法遵守這些原則,只害得動物受苦,正處罰的大問題在於:

1. 雖然依照學習原理,受到正處罰的行為將消失,可是事實上它只受到壓抑,當處罰消失時可能會完全回復;例如:狗狗翻垃圾桶被爸爸當場厲聲責罵,可是等到爸爸出差幾天,狗狗開始垃圾淘金記。

2. 處罰初時看來似乎有效,那是因為動物不明白哪個行為帶來處罰,於是停止了所有行為,可惜多數飼主喜歡這種什麼都不做的「乖」狗,於是它對施予處罰的人具有正增強的作用,使得處罰動物的行為持續(這類例子應該不需我多提,各位回憶一下,諸多親身體驗應該會浮上心頭)。

3. 如果處罰無法即時,與動物的行為無法產生關聯,久而久之動物因無論做什麼都會受罰,將出現沮喪放棄的狀態,軟癱在地,了無生氣,任憑處置,這稱為「習得無助」(Learned Helplessness)。

4. 有些行為即使受到處罰也不會消失,反而會變本加厲,例如:當處罰成為增強出現的前置訊號時(長期被人忽視的狗兒亂吠->飼主揍了牠一頓->雖然被揍,但是總算有人注意到牠了->沒人理就亂吠),或當恐懼引起的行為受到處罰時(害怕的狗俯地求饒,尿尿示意順服->飼主大怒,吊牠起來打一頓->牠越害怕越會尿)。

  注意:即使處罰生效,它只能減少行為發生,無法告訴動物「對」的行為是什麼,它無法增加行為的發生,你必須利用增強原理才能獲得你想要的行為。

  「正處罰」和「負增強」採取施予或移除厭惡刺激(aversives,也就是令動物不快的刺激),所以響片訓練的正統作法完全不採用這兩者,它採用「正增強」和「負處罰」──施予或移除動物喜見的刺激,這是響片訓練不同於其他訓練的重大差異之一,也是響片訓練的動物為何開心快樂的緣故,因為它永遠不會有厭惡刺激帶來的不快聯想。

  如果你一方面使用響片正增強「好」的行為,一方面使用正處罰或負增強對付「不好」的行為,這也是一種訓練方式,但是請別說自己作響片訓練,這種作法絕對不是響片訓練(請見毒害的訊號-為何不能混用響片和處罰)。

  想一想,你的訓練方法應用什麼原理?它是不是真的有效,或者似乎只有效幾次?你為什麼使用這些方法?是習慣使然?還是因為自己使用處罰的行為被增強了?或者,你從沒想過自己是在處罰牠?或者,你為了完成訓練不擇手段,只求有效,畢竟你是主人,牠是畜牲?



  請開始做個用腦思考的訓練者,為自己選擇增進人狗關係的有效方法,你的狗會感謝你,你也會慶幸自己這麼做。




arrow
arrow
    全站熱搜

    ♥小西 發表在 痞客邦 留言(0) 人氣()