ज्यादातर लोग सोचते हैं कि डोपामाइन खुशी का रसायन है। यह सच नहीं है — या कम से कम, यह पूरी कहानी नहीं है। डोपामाइन मुख्य रूप से अपेक्षा का रसायन है। यह सबसे मजबूत तब सक्रिय होता है जब आप किसी इनाम की उम्मीद करते हैं, न कि जब आप उसे प्राप्त करते हैं। यह अंतर बहुत महत्वपूर्ण है यदि आप समझना चाहते हैं कि आदतें कैसे बनती हैं और, इससे भी महत्वपूर्ण, उन्हें कैसे बदलें।
डोपामाइन वास्तव में क्या करता है
तंत्रिका वैज्ञानिक वोल्फ्राम शुल्ज़ ने प्राइमेट्स में डोपामाइन गतिविधि का मानचित्रण किया और कुछ अप्रत्याशित पाया: जब किसी जानवर को अप्रत्याशित इनाम मिला, तो डोपामाइन बढ़ गया। लेकिन जब जानवर ने इनाम की भविष्यवाणी करना सीख लिया, तो डोपामाइन की वृद्धि इनाम से हटकर उस संकेत पर चली गई जो इनाम की भविष्यवाणी करता था। और अगर अपेक्षित इनाम नहीं आया, तो डोपामाइन वास्तव में आधार स्तर से नीचे चला गया — यह एक संकेत है जिसे मस्तिष्क नकारात्मक रूप से दर्ज करता है।
इसका आदतों को समझने के लिए महत्वपूर्ण अर्थ है। मस्तिष्क आपके कार्यों पर प्रतिक्रिया नहीं दे रहा है। यह उन संकेतों के आधार पर जो आपसे पहले आते हैं, उसकी अपेक्षाओं पर प्रतिक्रिया दे रहा है।
इसलिए आदतें अपने आप लगती हैं: ये सचेत निर्णय लेने से नहीं चलतीं। ये पर्यावरणीय संकेतों द्वारा प्रेरित भविष्यवाणी करने वाले डोपामाइन के स्पाइक्स द्वारा चलती हैं — इससे पहले कि आपने कुछ करने के बारे में सचेत रूप से सोचा हो। जब तक आप यह महसूस करते हैं कि आप अपने फोन की ओर बढ़ रहे हैं, तब तक डोपामाइन प्रणाली पहले ही सक्रिय हो चुकी होती है, और आप पहले से ही आदत को निभाने की प्रक्रिया में होते हैं।
आदत का चक्र
व्यवहारिक मनोवैज्ञानिकों ने आदत की संरचना को थोड़े अलग तरीकों से वर्णित किया है — चार्ल्स डुहिग का "संकेत, प्रक्रिया, पुरस्कार" शायद सबसे प्रसिद्ध है — लेकिन इसके पीछे का न्यूरोसाइंस समान है: आदतें तब बनती हैं जब एक विशेष संकेत एक विशेष व्यवहार के साथ जुड़ जाता है, जो बार-बार डोपामाइन द्वारा मजबूत अनुभव के माध्यम से होता है।
यह चक्र इस तरह काम करता है:
- संकेत: एक पर्यावरणीय ट्रिगर (दिन का समय, स्थान, एक भावनात्मक स्थिति, कुछ लोगों या वस्तुओं की उपस्थिति)
- अपेक्षा: संकेत के जवाब में डोपामाइन सक्रिय होता है, जो संबंधित पुरस्कार के लिए एक लालसा पैदा करता है
- रूटीन: वह व्यवहार जो ऐतिहासिक रूप से पुरस्कार से पहले होता है
- पुरस्कार: डोपामाइन प्रणाली यह मूल्यांकन करती है कि परिणाम अपेक्षा के अनुसार था या नहीं — यदि हाँ, तो सकारात्मक, यदि नहीं, तो नकारात्मक
यदि इसे पर्याप्त बार दोहराया जाए, तो संकेत और रूटीन के बीच का संबंध बेसल गैंग्लिया में गहराई से अंकित हो जाता है — यह मस्तिष्क का एक क्षेत्र है जो प्रक्रियात्मक स्मृति के लिए विशेषीकृत है। एक बार वहाँ पहुँचने पर, व्यवहार न्यूनतम प्रीफ्रंटल भागीदारी के साथ कार्यान्वित हो सकता है। यह कुशल है — यही कारण है कि कौशल स्वचालित हो जाते हैं — लेकिन इसका मतलब यह भी है कि आदत तोड़ने का "निर्णय" लेना गहराई से अंकित न्यूरल पथों के खिलाफ काम कर रहा है, न कि एक साधारण विकल्प के खिलाफ।
आदतें तोड़ने में बनाने से ज्यादा मुश्किल क्यों होती हैं
आदत प्रणाली में एक असममिति है जो मानव निराशा को बहुत कुछ समझाती है: आदतें पुनः सुदृढ़ीकरण के माध्यम से कोडित होती हैं, लेकिन इन्हें गैर-सुदृढ़ीकरण के माध्यम से हटाया नहीं जाता। इन्हें दबा दिया जाता है।
जब आप किसी आदत को करना बंद करते हैं, तो न्यूरल पाथवे गायब नहीं होता। यह निष्क्रिय हो जाता है। संकेत-रूटीन संबंध अभी भी वहां है, सही ट्रिगर द्वारा फिर से सक्रिय होने की प्रतीक्षा कर रहा है। यही कारण है कि किसी भी व्यवहार परिवर्तन के प्रयास में पुनरावृत्ति इतनी सामान्य है — पुराना आदत पैटर्न बना रहता है और इसे फिर से सक्रिय करने के लिए केवल सही पर्यावरणीय संकेत की आवश्यकता होती है।
आप आदतें तोड़ते नहीं हैं। आप उन्हें बदलते हैं। लक्ष्य एक नया संकेत-रूटीन-इनाम संबंध बनाना है जो पुरानी आदत की तरह ही मूलभूत आवश्यकता को पूरा करता है।
Further reading: A practical dopamine reset protocol that actually works
इसे स्थायी आदतें बनाने के लिए उपयोग करना
नई आदतों को मौजूदा संकेतों से जोड़ें
व्यवहार परिवर्तन अनुसंधान लगातार यह पाता है कि "आदत स्टैकिंग" — एक नए व्यवहार को मौजूदा आदत के संकेत से जोड़ना — मनोबल बढ़ाने की दरों को काफी बढ़ा देता है, जब आप मनमाने समय पर व्यवहार परिवर्तन करने की कोशिश करते हैं। मौजूदा संकेत पहले से ही डोपामाइन से जुड़ा होता है; आप एक स्थापित आदत की तंत्रिका संरचना का उपयोग कर रहे हैं बजाय इसके कि आप सब कुछ नए सिरे से बनाएं।
उदाहरण: यदि आपके पास पहले से ही एक नियमित सुबह की कॉफी की आदत है, तो यह एक विश्वसनीय दैनिक संकेत है। "जब मैं अपनी कॉफी डालूं" के बाद पांच मिनट का जर्नलिंग करने की आदत जोड़ना "मैं हर सुबह जर्नल करूंगा" की तुलना में अधिक समय तक बनी रहने की संभावना है।
इनाम तुरंत मिलना चाहिए
डोपामाइन प्रणाली तुरंत मिलने वाले इनामों की ओर अधिक झुकी हुई है बजाय देर से मिलने वाले इनामों के — इसे समय संबंधी छूट कहा जाता है। जिन व्यवहारों के इनाम दिनों या हफ्तों के लिए देर से मिलते हैं, उन्हें आदतों के रूप में स्थापित करना बहुत कठिन होता है, जबकि तुरंत प्रतिक्रिया वाले व्यवहारों को स्थापित करना आसान होता है।
स्वास्थ्य लाभों के लिए जिन आदतों में देरी होती है (व्यायाम, नींद की स्वच्छता, पोषण), इसका मतलब है कि इनाम को शॉर्ट टर्म में तैयार करना होगा। विकल्पों में शामिल हैं: सामाजिक जिम्मेदारी, प्रगति का ट्रैकिंग, हर पूर्णता के बाद छोटे उत्सव, या बस व्यवहार को तुरंत सुखद चीज़ों के साथ जोड़ना (व्यायाम करते समय केवल एक विशेष पॉडकास्ट सुनना)।
संकेत पर रुकावट कम करें, इनाम पर नहीं
आदत बनाने में एक सामान्य गलती यह है कि इनाम को और आकर्षक बनाने की कोशिश की जाती है। यह अक्सर काम नहीं करता क्योंकि इनाम की संवेदनशीलता अनुकूलित हो जाती है — जो पिछले हफ्ते पुरस्कृत लग रहा था, वह इस हफ्ते सामान्य हो जाता है। इसके बजाय, संकेत बिंदु पर रुकावट कम करें: व्यवहार को शुरू करने के लिए बाधाओं को हटाकर इसे आसान बनाएं।
जिम के कपड़ों में सोना, किताब को तकिए पर छोड़ना, कल का स्वस्थ लंच आज तैयार करना — ये "कार्यन्वयन इरादे" आदत को और आकर्षक बनाने के बजाय संकेत के क्षण में निर्णय की लागत को हटाकर काम करते हैं।
व्यवहारिक सारांश: एक नई आदत बनाने के लिए, एक मौजूदा विश्वसनीय संकेत खोजें और नए व्यवहार को उससे जोड़ें। पहले कदम को जितना संभव हो सके सरल बनाएं। तुरंत इनाम दें। तब तक दोहराएं जब तक कि यह संबंध स्थापित न हो जाए — आमतौर पर मध्यम जटिलता के व्यवहारों के लिए 60-90 दिनों की लगातार पुनरावृत्ति। एक मौजूदा आदत को बदलने के लिए, संकेत की पहचान करें, संकेत को बनाए रखें, और दिनचर्या को एक ऐसी दिनचर्या से बदलें जो समान इनाम देती हो। संकेत को समाप्त करने की कोशिश न करें।
स्वयं की जागरूकता की भूमिका
यदि आप अपनी आदतों के चक्रों की पहचान नहीं कर सकते, तो इनमें से कोई भी काम नहीं करेगा। अधिकांश लोग दिन के अधिकांश समय ऑटोपायलट पर काम करते हैं — बेसल गैंग्लिया कार्यक्रम चला रहा है जबकि प्रीफ्रंटल कॉर्टेक्स कहीं और है। जानबूझकर आदत परिवर्तन के लिए आवश्यक है कि आप अपने व्यवहार पैटर्न को पहले, दौरान और बाद में देख सकें।
यहाँ ट्रैकिंग, जर्नलिंग, या यहां तक कि रोज़ाना कुछ मिनटों की चिंतन करने से एक ऐसा लाभ मिलता है जो अनुशासन या प्रेरणा से संबंधित नहीं है। जागरूकता संकेत और स्वचालित प्रतिक्रिया के बीच का अंतर बनाती है — और वही अंतर चुनाव का स्थान है।
Further reading: Phone anxiety: how your smartphone trains your nervous system to be anxious
परिवर्तनीय पुरस्कार कार्यक्रम और डिजिटल आदतें
1950 के दशक में, व्यवहारवादी बी.एफ. स्किनर ने एक श्रृंखला के प्रयोग किए जो मनोविज्ञान में सबसे अधिक दोहराए गए निष्कर्षों में से कुछ बन गए। उन्होंने चूहों को ऐसे कक्षों में रखा जहाँ एक लीवर दबाने पर भोजन मिलता था। जब लीवर हर दबाने पर भोजन देता था — एक निश्चित अनुपात कार्यक्रम — तो चूहे लगातार दबाते थे और जब वे भरे होते थे तो रुक जाते थे। लेकिन जब लीवर अनियमित रूप से भोजन देता था — कभी दो दबाने के बाद, कभी बीस के बाद — तो चूहे मजबूरी से दबाते थे और समाप्ति के प्रति कहीं अधिक प्रतिरोधी होते थे, पुरस्कार मिलना बंद होने के बाद भी लंबे समय तक जारी रखते थे।
इस प्रभाव को परिवर्तनशील अनुपात पुनर्बलन कार्यक्रम कहा जाता है, जो किसी भी पुनर्बलन पैटर्न में सबसे उच्च और सबसे स्थायी व्यवहार दरें उत्पन्न करता है। यह स्लॉट मशीनों, सोशल मीडिया फीड, पुल-टू-रीफ्रेश, और पुश नोटिफिकेशन के पीछे का सटीक तंत्र भी है।
तंत्रिका रसायन संबंधी व्याख्या सीधे शुल्ज़ के भविष्यवाणी-त्रुटि अनुसंधान से जुड़ी है। जब पुरस्कार पूर्वानुमानित होते हैं, तो डोपामाइन प्रणाली अंततः इसकी आदत बना लेती है — भविष्यवाणी सटीक हो जाती है, त्रुटि संकेत गायब हो जाता है, और प्रेरक ड्राइव कम हो जाती है। इसके विपरीत, अप्रत्याशित पुरस्कार एक निरंतर भविष्यवाणी त्रुटि बनाए रखते हैं। फोन की हर जांच कुछ पुरस्कृत कर सकती है: एक संदेश, एक लाइक, एक दिलचस्प पोस्ट। या यह कुछ भी नहीं दे सकती। यह अनिश्चितता डोपामाइन प्रणाली को उच्च प्रत्याशा की स्थिति में रखती है।
यही कारण है कि जांच करने की आदत को सरल संकल्प से बाधित करना इतना कठिन है। परिवर्तनशील कार्यक्रम ने एक आदत चक्र बनाया है जहां संकेत (हाथ में फोन, बोरियत या संक्रमण का कोई क्षण) एक डोपामाइन-प्रेरित प्रत्याशा को ट्रिगर करता है इससे पहले कि क्रिया को सचेत रूप से चुना जाए। पुरस्कार का वास्तविक रूप लेना भी जरूरी नहीं है — प्रत्याशा स्वयं में पुनर्बलनकारी होती है। हायन्स और सहयोगियों द्वारा किए गए अनुसंधान ने दिखाया है कि अनिश्चित पुरस्कारों के प्रति डोपामाइन प्रतिक्रिया वास्तव में समान या अधिक मूल्य के निश्चित पुरस्कारों के प्रति प्रतिक्रिया से बड़ी होती है।
डिजिटल आदतों में बदलाव के लिए नतीजे स्पष्ट हैं। चूंकि अधिकांश सोशल और मैसेजिंग प्लेटफार्मों के डिज़ाइन में परिवर्तनशील कार्यक्रम शामिल है, इन ऐप्स का उपयोग करना एक ऐसे सिस्टम को नेविगेट करने की आवश्यकता होती है जो जांचने की आवृत्ति को अधिकतम करने के लिए स्पष्ट रूप से तैयार किया गया है। जो रणनीतियाँ काम करती हैं उनमें संभवतः परिवर्तनशील पुरस्कार स्रोतों को निश्चित में बदलना शामिल है (हर नोटिफिकेशन का जवाब देने के बजाय सेट अंतराल पर संदेशों की जांच करना), जहां संभव हो वहां संकेत को पूरी तरह से समाप्त करना (होम स्क्रीन या फोन से ऐप्स को हटाना), और संकेत और व्यवहार के बीच की रुकावट को बढ़ाना ताकि स्वचालित प्रतिक्रिया को पर्याप्त समय के लिए बाधित किया जा सके ताकि जानबूझकर विकल्प में शामिल हो सकें।
परिवर्तनशील कार्यक्रम को समझना फोन के उपयोग या सोशल मीडिया के साथ संघर्ष के अनुभव को भी नए सिरे से परिभाषित करता है। यह कठिनाई किसी चरित्र की कमी नहीं है। यह डोपामाइन प्रणाली को दर्शाती है जो बिल्कुल उसी तरह प्रतिक्रिया करती है जैसे इसका विकास हुआ — अनिश्चित लेकिन संभावित रूप से उच्च-मूल्य के पुरस्कारों की खोज करना — उन उत्पादों द्वारा व्यवस्थित रूप से शोषित किया जा रहा है जो उसी न्यूरोसाइंस के ज्ञान के साथ डिज़ाइन किए गए हैं।
तनाव, कोर्टिसोल, और आदतों की पुनरावृत्ति
व्यसन और व्यवहार संबंधी अनुसंधान में सबसे लगातार निष्कर्षों में से एक यह है कि तनाव पुनरावृत्ति का मुख्य कारण है। यह केवल पदार्थ उपयोग विकारों पर ही लागू नहीं होता, बल्कि आदतों के पूरे दायरे पर लागू होता है: खाने की आदतें, व्यायाम से बचना, फोन का उपयोग, और कोई भी अन्य व्यवहार जो तनाव से राहत पाने की दिनचर्या के रूप में स्थापित किया गया है।
इस प्रक्रिया में कोर्टिसोल — प्राथमिक तनाव हार्मोन — और डोपामाइन पुरस्कार प्रणाली के बीच बातचीत शामिल है। तीव्र तनाव के तहत, कोर्टिसोल का स्राव नाभिक अकंबेंस में डोपामाइन संचरण को प्रभावित करता है, जो मस्तिष्क का केंद्रीय पुरस्कार केंद्र है। यह डोपामिनर्जिक परिवर्तन उन व्यवहारों की प्रेरणादायक महत्वता को बढ़ाता है जो पहले राहत से जुड़े थे। व्यावहारिक रूप से: तनाव पुराने आदतों को सामान्य परिस्थितियों की तुलना में अधिक जरूरी और आकर्षक बना देता है।
यह कोई उपमा नहीं है। न्यूरोइमेजिंग अध्ययन ने दिखाया है कि तनाव का अनुभव उन न्यूरल सर्किट को फिर से सक्रिय करता है जो पहले समाप्त हो चुके आदतों से जुड़े होते हैं — यहां तक कि उन व्यक्तियों में जिन्होंने लंबे समय तक व्यवहार परिवर्तन बनाए रखा है। मूल आदत को कोड करने वाला बेसल गैंग्लिया पथ गायब नहीं होता; तनाव इसकी पुनः सक्रियता के लिए थ्रेशोल्ड को कम कर देता है।
पुनरावृत्ति इस बात का संकेत नहीं है कि व्यवहार परिवर्तन असफल हुआ। यह इस बात का संकेत है कि तनाव-आदत संबंध को कभी पर्याप्त रूप से संबोधित नहीं किया गया — और कि पुराना न्यूरल पथ उपलब्ध है।
MIT में एन ग्रेबीएल के शोध ने दिखाया है कि आदत के सर्किट मस्तिष्क में व्यवहार परिवर्तन के लंबे समय बाद भी बरकरार रहते हैं — मूल रूप से मिटाए जाने के बजाय संग्रहित होते हैं। तनाव इन संग्रहित पैटर्न के लिए एक पुनर्प्राप्ति संकेत के रूप में कार्य करता है। यह समझाता है कि क्यों लोग जो महीनों या वर्षों तक महत्वपूर्ण जीवनशैली परिवर्तनों को बनाए रखते हैं, वे उच्च तनाव, बीमारी, नींद की कमी, या बड़े जीवन व्यवधान के दौरान पुराने व्यवहारों की ओर लौट सकते हैं।
कई व्यावहारिक निष्कर्ष निकलते हैं। पहला, तनाव प्रबंधन आदत परिवर्तन से अलग कोई परियोजना नहीं है — यह इसका अभिन्न हिस्सा है। कोई भी व्यवहार परिवर्तन प्रयास जो उच्च तनाव के समय के लिए योजना शामिल नहीं करता, वह पुनरावृत्ति के लिए संरचनात्मक रूप से कमजोर होगा। दूसरा, नई आदतों को लागू करने का समय महत्वपूर्ण है: पहले से तनावपूर्ण अवधि के दौरान एक चुनौतीपूर्ण नए व्यवहार की शुरुआत करना एक ऐसे सिस्टम पर अतिरिक्त मानसिक और भावनात्मक मांग डालता है जो पहले से ही थका हुआ है। जब संभव हो, बड़े आदत परिवर्तन अपेक्षाकृत स्थिरता के समय में शुरू करना बेहतर होता है।
तीसरा, और शायद सबसे उपयोगी, पुनरावृत्ति को असफलता के बजाय जानकारी के रूप में समझा जाना चाहिए। जब पहले बदला हुआ व्यवहार तनाव के तहत फिर से उभरता है, तो यह उस विशेष संकेत-प्रक्रिया संबंध को पहचानता है जो तनाव के साथ जुड़ा हुआ था — और वह संबंध अब हस्तक्षेप का लक्ष्य है। पुनरावृत्ति के बाद सवाल यह नहीं है "मैं क्यों असफल हुआ?" बल्कि "तनाव की स्थिति क्या थी, संकेत क्या था, और यह आदत किस आवश्यकता को पूरा कर रही थी?" यह विश्लेषण एक वैकल्पिक तनाव-प्रतिक्रिया आदत बनाने का मार्ग तैयार करता है जो मूल आदत के साथ प्रतिस्पर्धा कर सकती है और अंततः उसे बदल सकती है।
- अपने तनाव संकेतों की पहचान करें: उन परिस्थितियों, भावनात्मक स्थितियों, या वातावरणों को नोट करें जो लगातार उस आदत व्यवहार से पहले आते हैं जिसे आप बदलना चाहते हैं
- पहले से वैकल्पिक तनाव प्रतिक्रियाएँ बनाएं: तनावपूर्ण क्षण से पहले तय करें कि आप किस व्यवहार का उपयोग करेंगे — संक्षिप्त शारीरिक गतिविधि, एक विशिष्ट श्वास पैटर्न, एक छोटी सी टहलना
- जहाँ संभव हो, आधारभूत तनाव को कम करें: नींद, नियमित व्यायाम, और विवेकाधीन कोर्टिसोल लोड (अत्यधिक समाचार खपत, लगातार सूचनाएँ) सभी उस स्तर को कम करते हैं जिस पर तनाव आदत को फिर से सक्रिय करता है
- पुनरावृत्ति को डेटा के रूप में मानें, हार के रूप में नहीं: एकल पुनरावृत्ति प्रतिस्थापन आदत के न्यूरल पथ को रीसेट नहीं करती — यह केवल संग्रहित एक को सक्रिय करती है; जितनी जल्दी हो सके प्रतिस्थापन व्यवहार पर लौटें
Sources
- Schultz, W. (1997). Dopamine neurons and their role in reward mechanisms. Current Opinion in Neurobiology, 7(2), 191–197.
- Graybiel, A.M. (2008). Habits, rituals, and the evaluative brain. Annual Review of Neuroscience, 31, 359–387.
- Duhigg, C. (2012). The Power of Habit. Random House.
- Wood, W., Quinn, J.M., & Kashy, D.A. (2002). Habits in everyday life: Thought, emotion, and action. Journal of Personality and Social Psychology, 83(6), 1281–1297.
- Berridge, K.C. (2007). The debate over dopamine's role in reward: The case for incentive salience. Psychopharmacology, 191(3), 391–431.
- Skinner, B.F. (1938). The Behavior of Organisms: An Experimental Analysis. Appleton-Century-Crofts.
- Sinha, R. (2008). Chronic stress, drug use, and vulnerability to addiction. Annals of the New York Academy of Sciences, 1141, 105–130.