大多數人認為多巴胺是快樂的化學物質。其實不是 — 或者說,這不是全部的故事。多巴胺主要是期待的化學物質。它最強烈的釋放不是在你獲得獎勵時,而是在你期待獎勵時。如果你想理解習慣是如何形成的,更重要的是,如何改變它們,這一區別非常重要。

多巴胺實際上做了什麼

神經科學家沃爾夫拉姆·舒爾茨在靈長類動物中映射了多巴胺的活動,發現了一些反直覺的東西:當動物獲得意外獎勵時,多巴胺會激增。但當動物學會預測獎勵時,多巴胺的激增從獎勵本身轉移到了預測獎勵的提示上。如果預期的獎勵沒有到來,多巴胺實際上會下降到基準以下 — 這是大腦註冊為厭惡的信號。

這對理解習慣有重要的啟示。大腦不是對你所做的事情作出反應,而是根據你所做之前的提示來預測的反應。

這就是為什麼習慣感覺自動化:它們不是由意識決策驅動的。它們是由環境提示觸發的預測性多巴胺激增驅動的 — 在你有意識地想到要做任何事情之前。當你意識到自己要拿起手機時,多巴胺系統已經啟動,你已經在執行這個習慣的過程中。

習慣循環

行為心理學家以稍微不同的方式描述了習慣結構 — 查爾斯·杜希格的「提示、例行、獎勵」可能是最廣為人知的 — 但其背後的神經科學是一致的:當特定提示與特定行為通過重複的多巴胺強化經驗相關聯時,習慣就形成了。

循環的運作方式如下:

  1. 提示:環境觸發(一天中的某個時間、某個地點、一種情緒狀態、某些人或物體的存在)
  2. 期待:多巴胺對提示作出反應,產生對相關獎勵的渴望
  3. 例行:歷史上在獎勵之前的行為
  4. 獎勵:多巴胺系統評估結果是否符合預期 — 如果符合則為正面,否則為負面

重複足夠次數後,提示和例行之間的聯繫會深深編碼在基底神經節中 — 這是一個專門負責程序記憶的大腦區域。一旦進入那裡,行為可以在最小的前額葉參與下執行。這是高效的 — 這就是技能如何變得自動化 — 但這也意味著「決定」打破習慣是在對抗深深編碼的神經通路,而不是簡單的選擇。

為什麼習慣比建立更難打破

習慣系統中存在一種不對稱性,解釋了許多人類的挫折:習慣是通過強化編碼的,但它們並不是通過非強化來刪除的。它們是被抑制的。

當你停止執行一個習慣時,神經通路並不會消失,而是變得休眠。提示-例行的聯結仍然存在,等待著被正確的觸發重新激活。這就是為什麼在任何行為改變的嘗試中,復發是如此常見——舊的習慣模式依然存在,只需要正確的環境提示就能重新激活。

你並不是打破習慣,而是替換它們。目標是創造一個新的提示-例行-獎勵聯結,滿足與舊習慣相同的基本需求。

Further reading: A practical dopamine reset protocol that actually works

利用這個來建立持久的習慣

將新習慣與現有提示連結

行為改變研究一致發現,「習慣堆疊」——將新行為附加到現有習慣提示上——相比於在隨意的時間嘗試進行行為改變,成功率顯著提高。現有的提示已經有多巴胺的聯結;你是在借用已建立習慣的神經基礎,而不是從零開始建立。

例子:如果你已經有一個穩定的早晨咖啡儀式,那就是一個可靠的每日提示。將五分鐘的寫日記習慣附加到「我倒完咖啡後」上,比「我每天早上寫日記」更有可能持續下去。

讓獎勵立即到位

多巴胺系統對即時獎勵的偏好遠高於延遲獎勵——這被稱為時間折扣。獎勵延遲幾天或幾週的行為,比起即時反饋的行為更難編碼為習慣。

對於有延遲健康益處的習慣(運動、睡眠衛生、營養),這意味著獎勵必須在短期內製造。選項包括:社交責任、進度追蹤、每次完成後的小慶祝,或簡單地將行為與一些立即愉快的事情結合(例如,只在運動時聽特定的播客)。

在提示處減少摩擦,而不是獎勵

在建立習慣時,一個常見的錯誤是試圖讓獎勵更具吸引力。這通常不奏效,因為獎勵敏感性會適應——上週感覺有獎勵的事情,這週就變成了基線。相反,減少提示點的摩擦:通過消除觸發和第一個行動之間的障礙,使行為更容易啟動。

穿著健身服睡覺、把書放在枕頭上、今天準備明天的健康午餐——這些「實施意圖」的作用不是讓習慣更具吸引力,而是消除在提示時刻的決策成本。

實用總結: 要建立一個新習慣,找到一個現有的可靠提示,並將新行為附加到它上面。讓第一個行動盡可能無摩擦。提供立即的獎勵。重複直到聯結被編碼——通常需要60到90天的持續重複,對於中等複雜度的行為。要改變一個現有的習慣,識別提示,保留提示,並用一個能提供類似獎勵的例行來替換。不要試圖消除提示。

自我意識的角色

如果你無法識別自己的習慣循環,這一切都無法奏效。大多數人一天中的大部分時間都是在自動駕駛模式下運行——基底神經節在運行程序,而前額葉皮層則在其他地方。進行有意識的習慣改變的前提是能夠在行為發生前、發生時和發生後觀察自己的行為模式。

這裡的追蹤、記錄,甚至每天幾分鐘的反思,能創造出與紀律或動機無關的優勢。覺察創造了提示與自動反應之間的差距,而這個差距就是選擇存在的地方。

Further reading: Phone anxiety: how your smartphone trains your nervous system to be anxious

變動獎勵計畫和數位習慣

在1950年代,行為主義者B.F. Skinner進行了一系列實驗,這些實驗成為心理學中最常被重複的發現之一。他將老鼠放在一個房間裡,按下杠桿就能獲得食物。當每次按下杠桿都能獲得食物時——這是一個固定比例的計畫——老鼠穩定地按壓,直到吃飽才停止。但當杠桿的食物獎勵不穩定——有時按兩次,有時按二十次——老鼠就會強迫性地按壓,並且對獎勵停止後的消失更具抵抗力,持續按壓的時間更長。

這種效果稱為變動比例增強計畫,產生的行為率是所有增強模式中最高且最持久的。這恰好也是老虎機、社交媒體動態、下拉刷新和推播通知背後的精確機制。

神經化學的解釋直接與Schultz的預測誤差研究相關。當獎勵是可預測的時候,多巴胺系統最終會習慣化——預測變得準確,誤差信號消失,動機驅動減弱。相對而言,不可預測的獎勵則維持著持續的預測誤差。每次檢查手機都可能會帶來一些獎勵:一條訊息、一個讚、一篇有趣的帖子。或者什麼都沒有。這種不確定性使得多巴胺系統保持在高度期待的狀態。

這就是為什麼檢查行為如此難以用簡單的決心來中斷。變動的計畫創造了一個習慣循環,提示(手中拿著手機,任何無聊或過渡的時刻)在行動被有意識地選擇之前就觸發了多巴胺介導的期待。獎勵甚至不需要實現——期待本身就是一種增強。Haynes及其同事的神經影像研究顯示,對不確定獎勵的多巴胺反應實際上比對等值或更高價值的確定獎勵的反應更大。

對數位習慣改變的影響是具體的。因為變動的計畫被內建在大多數社交和訊息平台的設計中,使用這些應用程式需要在一個明確設計來最大化檢查頻率的系統中導航。有效的策略包括將變動獎勵來源轉換為固定來源(例如在設定的時間間隔檢查訊息,而不是對每個通知做出反應)、在可行的情況下完全消除提示(將應用程式從主畫面或手機中移除),以及增加提示與行為之間的摩擦,以便自動反應被中斷,讓有意識的選擇得以參與。

理解變動計畫也重新框架了與手機使用或社交媒體掙扎的經驗。困難並不是性格上的缺陷。這反映了多巴胺系統正如其進化所反應的——尋求不確定但潛在高價值的獎勵——被設計時考慮到相同神經科學的產品系統性地利用。

壓力、皮質醇與習慣回復

在成癮和行為研究中,最一致的發現之一是壓力是回復的主要驅動力。這不僅適用於物質使用障礙,還適用於各種習慣行為:飲食模式、運動逃避、手機使用,以及任何其他被編碼為減壓例行的行為。

這個機制涉及皮質醇(主要的壓力荷爾蒙)與多巴胺獎勵系統之間的互動。在急性壓力下,皮質醇的釋放會調節大腦獎勵中心——伏隔核中的多巴胺傳遞。這種多巴胺的變化增加了與舒緩相關的行為的動機重要性。實際上:壓力使得舊習慣在感覺上比正常情況下更迫切、更具吸引力。

這不是隱喻。神經影像學研究已經證明,壓力暴露會重新激活與先前消失的習慣行為相關的神經迴路——即使在那些成功維持行為改變很長一段時間的個體中也是如此。編碼原始習慣的基底神經節通路並不會消失;壓力會降低其重新激活的閾值。

回復並不是行為改變失敗的標誌。這是表明壓力與習慣之間的連結從未得到充分處理——而舊的神經通路仍然可用的跡象。

麻省理工學院的安·格雷比爾(Ann Graybiel)研究表明,習慣迴路在行為改變後仍然在大腦中保持完整——基本上是被存檔而不是被抹去。壓力作為這些存檔模式的檢索提示。這解釋了為什麼那些在數月或數年內保持顯著生活方式改變的人,在高壓、疾病、睡眠不足或重大生活干擾期間,會發現自己回到舊行為。

因此有幾個實用的結論。首先,壓力管理並不是與習慣改變分開的項目——它是其中不可或缺的一部分。任何不包括高壓時期計劃的行為改變努力都會在結構上易受回復的影響。第二,新習慣實施的時機很重要:在已經壓力很大的時期開始一個挑戰性的行為,會對已經耗竭的系統施加額外的認知和情感需求。當有可能時,重大的習慣改變最好在相對穩定的時期開始。

第三,或許最有用的是,回復應被理解為信息而非失敗。當先前改變的行為在壓力下重新出現時,它識別了被壓力編碼的特定提示-例行關聯——而這個關聯現在成為介入的目標。回復後的問題不是「我為什麼失敗了?」而是「當時的壓力狀態是什麼?提示是什麼?這個習慣滿足了什麼需求?」這種分析為建立一個可以與原有習慣競爭並最終取而代之的替代壓力反應習慣創造了一條路徑。

  • 識別你的壓力提示:注意哪些情況、情緒狀態或環境經常出現在你想改變的習慣行為之前
  • 提前建立替代壓力反應:在壓力時刻之前決定你將使用哪種行為——簡短的身體運動、特定的呼吸模式、一小段散步
  • 在可能的情況下減少基線壓力:睡眠、定期運動和減少可自由支配的皮質醇負擔(過度的新聞消費、持續的通知)都會降低壓力觸發習慣重新激活的閾值
  • 將回復視為數據,而非失敗:一次回歸並不會重置替代習慣的神經通路——它只是激活了存檔的那一條;儘快回到替代行為上

Sources

  1. Schultz, W. (1997). Dopamine neurons and their role in reward mechanisms. Current Opinion in Neurobiology, 7(2), 191–197.
  2. Graybiel, A.M. (2008). Habits, rituals, and the evaluative brain. Annual Review of Neuroscience, 31, 359–387.
  3. Duhigg, C. (2012). The Power of Habit. Random House.
  4. Wood, W., Quinn, J.M., & Kashy, D.A. (2002). Habits in everyday life: Thought, emotion, and action. Journal of Personality and Social Psychology, 83(6), 1281–1297.
  5. Berridge, K.C. (2007). The debate over dopamine's role in reward: The case for incentive salience. Psychopharmacology, 191(3), 391–431.
  6. Skinner, B.F. (1938). The Behavior of Organisms: An Experimental Analysis. Appleton-Century-Crofts.
  7. Sinha, R. (2008). Chronic stress, drug use, and vulnerability to addiction. Annals of the New York Academy of Sciences, 1141, 105–130.

將這付諸實行

Unwire 提供你科學支持的工具,幫助你真正改變 — 目標追蹤、習慣建立,以及 75 個以上的學習模組。