引用或轉貼請註明出處,請尊重著作權。
愛碰運氣的狗兒
(Your Gambling Dog)
出處:http://dogcentral.msn.com/article.aspx?cp-documentid=2588025
作者:訓練師凱西.史黛歐(Kathy Sdao)寫於2007年1月22日
譯者:黃薇菁
花點兒時間想想,你這輩子看過訓練最棒的動物是什麼?牠可能是海洋世界跳水表演的海豚、園遊會上彈鋼琴的雞或帶領主人穿越忙碌街口的導盲犬,牠們高度複雜精確的行為表現讓我們嘆為觀止,也讓我們把家中寵物犬拿來比較,為什麼小黃不能如此專注、樂於表現並認真工作呢?
與其怪罪你家狗兒有遺傳缺陷或個性懶惰,考慮一下利用專業訓練師獲得這些驚人成效的技巧,其中一項最必要的工具是「變化性增強法」(variable reinforcement),意思是動物聽令出現正確行為時,牠獲得的增強物將時時變化,它的種類、數量或給予方式每次都可能不同。以刮刮樂為例,結果可能什麼都沒有,免費再刮一張,或者中了終生月領現金的大奬,刮奬者的「正確」行為維持不變──買張刮刮樂來刮,但是每次結果不盡相同。
以這種無可預測的奬勵方式交換投資代價相當低的行為可能建立起持之以恒的習慣,這是賭博使人沈迷的原因,下一張彩卷、下一次拉把或轉下一次輪盤可能就是得大奬的機會,超大回饋雖很罕見,但有可能,而小小回饋也會不時出現,以維持人們保持興趣,鍥而不捨。
你可利用變化性增強法使你家狗兒變得樂於訓練,首先,列出你家狗兒能聽令(依口令或手勢)進行的熟知行為,可能包括坐下、趴下、過來、等待、吠叫、轉圈、甩動身體、乞求或隨側走。
如果你的狗只是偶而對某個指令有反應(例如不到一半成功率),或沒法做出完整動作,這些行為還不能施行變化性增強,它們需要加強基本訓練,利用的是持續性增強法,意思是每次正確反應出現一定會有相同奬勵,這種增強物可以是一點食物、一場遊戲、拍撫、稱讚或任何狗兒喜歡的事物。
當狗兒有了一些相當熟知的行為,你便應該想想如何變化增強方式,以下是一些例子:
奬勵的種類:
食物:乾飼料、巿售狗零食、肉塊、熱狗、花生醬、管狀起司、貓食。
遊戲:丟球、拔河、追逐訓練者、新的怪聲玩具、和別隻狗玩、游泳。
其他:稱讚、拍撫、訓練者幫狗兒搔癢、聞聞動物便便的機會、出現喜愛行為的機會。
奬勵的量:
.少至幾近微量(只是一丁點食物或玩耍幾秒鐘),多至極多(一餐的量、整塊漢堡或玩五分鐘拔河)。
如何給予奬勵:
.作法:手餵、丟到地上、擲入空中或置入中空玩具裡。
.頻率:依狗兒出現行為的次數,變化性地給予奬勵(例如平均起來,只在第三次正確坐下後才給賞),或依上次給賞後所經過的時間給奬勵(例如,平均每隔三秒鐘,狗兒趴著的行為將獲奬勵)。
結合這些和其他作法,隨你創意發明,為你的狗兒設計出至少十種增強物的選擇。
現在你可開始在訓練中增加一些變化,逐漸使奬勵狗兒熟知行為的方式變得意外又隨機,目標是要變得無可預測,當狗兒做到要求的行為時,牠應該無法預測奬勵,當然,你也不應該在牠出現行為之前就亮出奬勵給牠看,例如,不要先在空中揮揮熱狗,然後再叫牠來,這是賄賂,效用恰恰適得其反,造就一隻看到眼前奬勵才會聽話的狗,它也違背了無可預測的目標。
維持無法預測的奬勵時制需要花點功夫,但是優秀訓練師知道這點兒投資回收可大了,它使你去除必須時常給予的食物奬勵,它也培養出一隻「愛碰運氣」的狗兒──即使狗兒看不到立即好處,牠也將持續熱切地出現行為,因為牠相信,只要再聽話「坐下」一次,這次或許就可以享受中頭彩的快感。
留言列表