Hầu hết mọi người nghĩ rằng dopamine là hóa chất mang lại cảm giác vui vẻ. Nhưng không phải vậy — hoặc ít nhất, đó không phải là toàn bộ câu chuyện. Dopamine chủ yếu là hóa chất kỳ vọng. Nó hoạt động mạnh nhất không phải khi bạn nhận được phần thưởng, mà là khi bạn mong đợi một phần thưởng. Sự phân biệt này rất quan trọng nếu bạn muốn hiểu tại sao thói quen hình thành và, quan trọng hơn, làm thế nào để thay đổi chúng.
Dopamine thực sự làm gì
Nhà thần kinh học Wolfram Schultz đã nghiên cứu hoạt động của dopamine ở động vật linh trưởng và phát hiện ra điều ngược lại: khi một con vật nhận được phần thưởng bất ngờ, dopamine tăng vọt. Nhưng khi con vật học cách dự đoán phần thưởng, đỉnh dopamine chuyển từ phần thưởng chính nó sang tín hiệu dự đoán phần thưởng. Và nếu phần thưởng mong đợi không đến, dopamine thực sự giảm xuống dưới mức cơ bản — một tín hiệu mà não bộ ghi nhận là khó chịu.
Điều này có những hệ quả quan trọng trong việc hiểu thói quen. Não bộ không phản ứng với những gì bạn làm. Nó phản ứng với những gì nó mong đợi dựa trên các tín hiệu trước khi bạn hành động.
Đó là lý do tại sao thói quen cảm thấy tự động: chúng không được điều khiển bởi quyết định có ý thức. Chúng được điều khiển bởi những đỉnh dopamine dự đoán được kích hoạt bởi các tín hiệu môi trường — trước khi bạn có ý thức nghĩ về việc làm gì cả. Khi bạn nhận ra mình đang với tay lấy điện thoại, hệ thống dopamine đã được kích hoạt, và bạn đã trong quá trình thực hiện thói quen.
Vòng lặp thói quen
Các nhà tâm lý học hành vi đã mô tả cấu trúc thói quen theo nhiều cách khác nhau — "tín hiệu, thói quen, phần thưởng" của Charles Duhigg có lẽ là cách được biết đến nhiều nhất — nhưng khoa học thần kinh cơ bản thì nhất quán: thói quen hình thành khi một tín hiệu cụ thể được liên kết với một hành vi cụ thể thông qua trải nghiệm được củng cố bởi dopamine.
Vòng lặp hoạt động như sau:
- Tín hiệu: một kích thích từ môi trường (thời điểm trong ngày, một địa điểm, trạng thái cảm xúc, sự hiện diện của một số người hoặc đồ vật nhất định)
- Kỳ vọng: dopamine hoạt động phản ứng với tín hiệu, tạo ra một cơn thèm muốn phần thưởng liên quan
- Thói quen: hành vi đã diễn ra trước phần thưởng trong quá khứ
- Phần thưởng: hệ thống dopamine đánh giá xem kết quả có phù hợp với kỳ vọng hay không — tích cực nếu có, tiêu cực nếu không
Khi được lặp lại đủ nhiều lần, mối liên hệ giữa tín hiệu và thói quen trở nên sâu sắc trong hạch nền — một vùng não chuyên biệt cho trí nhớ quy trình. Khi đã ở đó, hành vi có thể thực hiện với sự tham gia tối thiểu của vỏ não trước trán. Điều này rất hiệu quả — đó là cách mà các kỹ năng trở nên tự động — nhưng cũng có nghĩa là "quyết định" để phá vỡ một thói quen đang chống lại các con đường thần kinh đã được mã hóa sâu sắc, không phải chỉ là một lựa chọn đơn giản.
Tại sao thói quen khó phá vỡ hơn là xây dựng
Có một sự không đối xứng trong hệ thống thói quen giải thích nhiều sự thất vọng của con người: thói quen được mã hóa thông qua sự củng cố, nhưng chúng không bị xóa bỏ thông qua việc không củng cố. Chúng bị ức chế.
Khi bạn ngừng thực hiện một thói quen, con đường thần kinh không biến mất. Nó trở nên ngủ yên. Mối liên kết giữa tín hiệu và thói quen vẫn còn đó, chờ được kích hoạt lại bởi một yếu tố phù hợp. Đó là lý do tại sao tái phát lại rất phổ biến trong bất kỳ nỗ lực thay đổi hành vi nào — mẫu thói quen cũ vẫn tồn tại và chỉ cần một tín hiệu môi trường phù hợp để kích hoạt lại.
Bạn không phá vỡ thói quen. Bạn thay thế chúng. Mục tiêu là tạo ra một mối liên kết mới giữa tín hiệu-thói quen-phần thưởng thỏa mãn nhu cầu cơ bản giống như thói quen cũ.
Sử dụng điều này để xây dựng những thói quen bền vững
Gắn thói quen mới vào các tín hiệu hiện có
Nghiên cứu về thay đổi hành vi liên tục chỉ ra rằng "xếp chồng thói quen" — gắn một hành vi mới vào một tín hiệu thói quen hiện có — làm tăng đáng kể tỷ lệ thành công so với việc cố gắng thực hiện các thay đổi hành vi vào những thời điểm tùy ý. Tín hiệu hiện có đã có mối liên hệ với dopamine; bạn đang mượn cơ sở hạ tầng thần kinh của một thói quen đã được thiết lập thay vì xây dựng từ đầu.
Ví dụ: nếu bạn đã có một thói quen uống cà phê vào buổi sáng, đó là một tín hiệu hàng ngày đáng tin cậy. Gắn thói quen viết nhật ký năm phút vào "sau khi tôi rót cà phê" có khả năng tồn tại cao hơn nhiều so với "Tôi sẽ viết nhật ký mỗi sáng."
Làm cho phần thưởng ngay lập tức
Hệ thống dopamine thiên về phần thưởng ngay lập tức hơn là phần thưởng trì hoãn — điều này được gọi là giảm giá theo thời gian. Những hành vi có phần thưởng bị trì hoãn hàng ngày hoặc hàng tuần khó được mã hóa thành thói quen hơn so với những hành vi có phản hồi ngay lập tức.
Đối với những thói quen có lợi ích sức khỏe bị trì hoãn (tập thể dục, vệ sinh giấc ngủ, dinh dưỡng), điều này có nghĩa là phần thưởng phải được tạo ra trong ngắn hạn. Các lựa chọn bao gồm: trách nhiệm xã hội, theo dõi tiến độ, tổ chức những buổi ăn mừng nhỏ sau mỗi lần hoàn thành, hoặc đơn giản là kết hợp hành vi với điều gì đó ngay lập tức dễ chịu (nghe một podcast cụ thể chỉ khi tập thể dục).
Giảm ma sát tại tín hiệu, không phải phần thưởng
Một sai lầm phổ biến trong việc xây dựng thói quen là cố gắng làm cho phần thưởng hấp dẫn hơn. Điều này hiếm khi hiệu quả vì độ nhạy cảm với phần thưởng sẽ thích nghi — điều mà cảm thấy có giá trị tuần trước trở thành cơ sở tuần này. Thay vào đó, giảm ma sát tại điểm tín hiệu: làm cho việc khởi đầu hành vi dễ dàng hơn bằng cách loại bỏ các trở ngại giữa yếu tố kích hoạt và hành động đầu tiên.
Ngủ trong đồ tập gym, để cuốn sách trên gối, chuẩn bị bữa trưa lành mạnh cho ngày mai ngay hôm nay — những "dự định thực hiện" này hoạt động không phải bằng cách làm cho thói quen trở nên hấp dẫn hơn mà bằng cách loại bỏ chi phí quyết định tại thời điểm tín hiệu.
Tóm tắt thực tiễn: Để xây dựng một thói quen mới, hãy tìm một tín hiệu đáng tin cậy hiện có và gắn hành vi mới vào đó. Làm cho hành động đầu tiên càng dễ dàng càng tốt. Cung cấp phần thưởng ngay lập tức. Lặp lại cho đến khi mối liên kết được mã hóa — thường là 60–90 ngày lặp lại liên tục cho những hành vi có độ phức tạp vừa phải. Để thay đổi một thói quen hiện có, xác định tín hiệu, giữ tín hiệu và thay thế thói quen bằng một thói quen mang lại phần thưởng tương tự. Đừng cố gắng loại bỏ tín hiệu.
Vai trò của sự tự nhận thức
Tất cả những điều này đều không hiệu quả nếu bạn không thể xác định các vòng lặp thói quen của chính mình. Hầu hết mọi người hoạt động như một chiếc máy bay không người lái trong phần lớn thời gian trong ngày — hạch nền đang chạy các chương trình trong khi vỏ não trước trán thì ở nơi khác. Điều kiện tiên quyết cho việc thay đổi thói quen có ý thức là khả năng quan sát các mẫu hành vi của chính bạn trước, trong và sau khi chúng xảy ra.
Đây là nơi mà việc theo dõi, ghi chép, hoặc thậm chí chỉ cần vài phút suy ngẫm hàng ngày tạo ra sức mạnh không liên quan gì đến kỷ luật hay động lực. Sự nhận thức tạo ra khoảng cách giữa tín hiệu và phản ứng tự động — và khoảng cách đó chính là nơi mà sự lựa chọn tồn tại.
Lịch trình thưởng biến đổi và thói quen kỹ thuật số
Vào những năm 1950, nhà hành vi học B.F. Skinner đã thực hiện một loạt thí nghiệm trở thành những phát hiện được tái tạo nhiều nhất trong tâm lý học. Ông đã đặt chuột vào các buồng mà ở đó việc nhấn một cần gạt sẽ nhận được thức ăn. Khi cần gạt cung cấp thức ăn mỗi lần nhấn — một lịch trình tỉ lệ cố định — chuột nhấn liên tục và dừng lại khi no. Nhưng khi cần gạt cung cấp thức ăn một cách không thể đoán trước — đôi khi sau hai lần nhấn, đôi khi sau hai mươi lần — chuột nhấn một cách cưỡng bức và kháng cự lại việc ngừng lại, tiếp tục lâu sau khi phần thưởng không còn đến.
Hiệu ứng này, được gọi là lịch trình củng cố tỉ lệ biến đổi, tạo ra tỷ lệ hành vi cao nhất và bền bỉ nhất trong bất kỳ mô hình củng cố nào. Nó cũng chính là cơ chế chính xác đứng sau máy đánh bạc, các nguồn cấp dữ liệu mạng xã hội, kéo để làm mới, và thông báo đẩy.
Giải thích về hóa học thần kinh liên kết trực tiếp với nghiên cứu về lỗi dự đoán của Schultz. Khi phần thưởng có thể đoán trước, hệ thống dopamine cuối cùng sẽ quen với điều đó — dự đoán trở nên chính xác, tín hiệu lỗi biến mất, và động lực giảm đi. Ngược lại, phần thưởng không thể đoán trước duy trì một lỗi dự đoán liên tục. Mỗi lần kiểm tra điện thoại có thể mang lại điều gì đó thú vị: một tin nhắn, một lượt thích, một bài đăng thú vị. Hoặc có thể không có gì cả. Sự không chắc chắn đó giữ cho hệ thống dopamine ở trạng thái mong đợi cao.
Đó là lý do tại sao hành vi kiểm tra lại khó bị ngắt quãng chỉ bằng quyết tâm đơn giản. Lịch trình biến đổi đã tạo ra một vòng lặp thói quen nơi tín hiệu (điện thoại trong tay, bất kỳ khoảnh khắc chán chường hay chuyển tiếp nào) kích hoạt một sự mong đợi do dopamine điều khiển trước khi hành động được lựa chọn một cách có ý thức. Phần thưởng thậm chí không cần phải xuất hiện — chính sự mong đợi đã củng cố. Nghiên cứu của Haynes và các đồng nghiệp sử dụng hình ảnh thần kinh đã chỉ ra rằng phản ứng dopamine đối với phần thưởng không chắc chắn thực sự lớn hơn phản ứng đối với phần thưởng chắc chắn có giá trị tương đương hoặc lớn hơn.
Những hệ quả cho việc thay đổi thói quen kỹ thuật số là rất rõ ràng. Bởi vì lịch trình biến đổi được tích hợp vào thiết kế của hầu hết các nền tảng mạng xã hội và nhắn tin, việc sử dụng các ứng dụng này yêu cầu điều hướng một hệ thống được thiết kế rõ ràng để tối đa hóa tần suất kiểm tra. Các chiến lược hiệu quả bao gồm chuyển đổi các nguồn thưởng biến đổi thành các nguồn cố định khi có thể (kiểm tra tin nhắn theo khoảng thời gian cố định thay vì phản hồi mọi thông báo), loại bỏ hoàn toàn tín hiệu khi có thể (gỡ bỏ ứng dụng khỏi màn hình chính hoặc điện thoại hoàn toàn), và tăng cường độ khó giữa tín hiệu và hành vi để phản ứng tự động bị ngắt quãng đủ lâu để lựa chọn có ý thức tham gia.
Hiểu biết về lịch trình biến đổi cũng giúp định hình lại trải nghiệm khi gặp khó khăn với việc sử dụng điện thoại hoặc mạng xã hội. Sự khó khăn không phải là một sự thiếu sót về tính cách. Nó phản ánh một hệ thống dopamine phản ứng chính xác như nó đã tiến hóa — tìm kiếm những phần thưởng không chắc chắn nhưng có giá trị cao — bị khai thác một cách có hệ thống bởi các sản phẩm được thiết kế với kiến thức về cùng một khoa học thần kinh đó.
Căng thẳng, cortisol và tái phát thói quen
Một trong những phát hiện nhất quán nhất trong nghiên cứu về nghiện và hành vi là căng thẳng là yếu tố chính dẫn đến tái phát. Điều này không chỉ áp dụng cho các rối loạn sử dụng chất, mà còn cho toàn bộ các hành vi thói quen: thói quen ăn uống, tránh tập thể dục, sử dụng điện thoại, và bất kỳ hành vi nào khác đã được mã hóa như một thói quen giảm căng thẳng.
Cơ chế này liên quan đến sự tương tác giữa cortisol — hormone căng thẳng chính — và hệ thống thưởng dopamine. Dưới áp lực căng thẳng cấp tính, việc giải phóng cortisol điều chỉnh sự truyền dẫn dopamine trong nhân đuôi, trung tâm thưởng chính của não. Sự thay đổi dopaminergic này làm tăng sự hấp dẫn của những hành vi trước đây liên quan đến sự giảm căng thẳng. Nói một cách thực tế: căng thẳng làm cho những thói quen cũ cảm thấy cấp bách và hấp dẫn hơn so với điều kiện bình thường.
Điều này không phải là một phép ẩn dụ. Các nghiên cứu hình ảnh não đã chứng minh rằng việc tiếp xúc với căng thẳng kích hoạt lại các mạch thần kinh liên quan đến những hành vi thói quen trước đây đã bị xóa bỏ — ngay cả ở những cá nhân đã duy trì sự thay đổi hành vi trong thời gian dài. Đường dẫn hạch nền đã mã hóa thói quen ban đầu không biến mất; căng thẳng làm giảm ngưỡng để nó được kích hoạt lại.
Tái phát không phải là dấu hiệu cho thấy sự thay đổi hành vi đã thất bại. Đó là dấu hiệu cho thấy mối liên hệ giữa căng thẳng và thói quen chưa bao giờ được giải quyết đầy đủ — và rằng con đường thần kinh cũ vẫn còn khả dụng.
Nghiên cứu của Ann Graybiel tại MIT đã chỉ ra rằng các mạch thói quen vẫn còn nguyên vẹn trong não lâu sau khi thay đổi hành vi — về cơ bản là được lưu trữ chứ không bị xóa. Căng thẳng hoạt động như một tín hiệu để truy xuất những mẫu đã lưu trữ này. Điều này giải thích tại sao những người đã duy trì những thay đổi lối sống đáng kể trong nhiều tháng hoặc nhiều năm có thể thấy mình quay trở lại những hành vi cũ trong các giai đoạn căng thẳng cao, bệnh tật, thiếu ngủ, hoặc sự gián đoạn lớn trong cuộc sống.
Một số kết luận thực tiễn theo sau. Đầu tiên, quản lý căng thẳng không phải là một dự án riêng biệt với việc thay đổi thói quen — nó là một phần không thể thiếu. Bất kỳ nỗ lực thay đổi hành vi nào không bao gồm kế hoạch cho các giai đoạn căng thẳng cao sẽ dễ bị tái phát. Thứ hai, thời điểm thực hiện thói quen mới là quan trọng: bắt đầu một hành vi mới đầy thách thức trong một giai đoạn đã căng thẳng sẽ đặt thêm yêu cầu về nhận thức và cảm xúc lên một hệ thống đã bị kiệt quệ. Khi có thể, những thay đổi thói quen lớn nên được khởi động trong các giai đoạn tương đối ổn định.
Thứ ba, và có lẽ hữu ích nhất, tái phát nên được hiểu như là thông tin chứ không phải thất bại. Khi một hành vi đã thay đổi trước đó xuất hiện trở lại dưới căng thẳng, nó xác định cụ thể mối liên hệ giữa tín hiệu và thói quen đã được mã hóa bởi căng thẳng — và mối liên hệ đó giờ đây là mục tiêu để can thiệp. Câu hỏi sau khi tái phát không phải là "tại sao tôi lại thất bại?" mà là "trạng thái căng thẳng là gì, tín hiệu là gì, và thói quen đó phục vụ cho nhu cầu nào?" Phân tích đó tạo ra một con đường để xây dựng một thói quen phản ứng với căng thẳng thay thế có thể cạnh tranh và cuối cùng thay thế thói quen ban đầu.
- Xác định các tín hiệu căng thẳng của bạn: ghi chú những tình huống, trạng thái cảm xúc, hoặc môi trường thường xuyên xuất hiện trước hành vi thói quen bạn muốn thay đổi
- Xây dựng các phản ứng thay thế với căng thẳng trước: quyết định trước khoảnh khắc căng thẳng hành vi nào bạn sẽ sử dụng thay thế — một chút vận động thể chất, một mẫu thở cụ thể, một cuộc đi bộ ngắn
- Giảm căng thẳng cơ bản khi có thể: ngủ, tập thể dục thường xuyên, và giảm tải cortisol tùy ý (tiêu thụ tin tức quá mức, thông báo liên tục) đều làm giảm ngưỡng mà ở đó căng thẳng kích hoạt tái phát thói quen
- Xem tái phát như là dữ liệu, không phải thất bại: một lần quay trở lại không đặt lại con đường thần kinh của thói quen thay thế — nó chỉ kích hoạt lại thói quen đã lưu trữ; quay trở lại hành vi thay thế càng nhanh càng tốt
Sources
- Schultz, W. (1997). Dopamine neurons and their role in reward mechanisms. Current Opinion in Neurobiology, 7(2), 191–197.
- Graybiel, A.M. (2008). Habits, rituals, and the evaluative brain. Annual Review of Neuroscience, 31, 359–387.
- Duhigg, C. (2012). The Power of Habit. Random House.
- Wood, W., Quinn, J.M., & Kashy, D.A. (2002). Habits in everyday life: Thought, emotion, and action. Journal of Personality and Social Psychology, 83(6), 1281–1297.
- Berridge, K.C. (2007). The debate over dopamine's role in reward: The case for incentive salience. Psychopharmacology, 191(3), 391–431.
- Skinner, B.F. (1938). The Behavior of Organisms: An Experimental Analysis. Appleton-Century-Crofts.
- Sinha, R. (2008). Chronic stress, drug use, and vulnerability to addiction. Annals of the New York Academy of Sciences, 1141, 105–130.