Skinner's Operant Conditioning Theory PDF
Document Details
Uploaded by TriumphalJasper1614
Kolhan University Chaibasa
Tags
Summary
This document provides an overview of Skinner's operant conditioning theory and its application in learning and teaching. It explains the theory and describes some experiments conducted. Key terms include reinforcement and operant behaviors.
Full Transcript
## अधिगम और शिक्षण : अधिगम के वक्र, सिद्धान्त और स्थानान्तरण | ### 1. स्किनर का क्रिया प्रसूत अनुबन्धन सिद्धान्त Skinner's Operant Conditioning Theory व्यवहारवाद के क्रिया प्रसूत अनबन्धन सिद्धान्त का प्रतिपादन अमेरिका के हारवर्ड विश्वविद्यालय (Harward University) के प्रोफेसर बुरहस फ्रेडरिक स्किनर...
## अधिगम और शिक्षण : अधिगम के वक्र, सिद्धान्त और स्थानान्तरण | ### 1. स्किनर का क्रिया प्रसूत अनुबन्धन सिद्धान्त Skinner's Operant Conditioning Theory व्यवहारवाद के क्रिया प्रसूत अनबन्धन सिद्धान्त का प्रतिपादन अमेरिका के हारवर्ड विश्वविद्यालय (Harward University) के प्रोफेसर बुरहस फ्रेडरिक स्किनर (Prof. B. F. Skinner) ने सन् 1938 में किया था। इस सिद्धान्त के अनुसार, यदि किसी क्रिया के बाद कोई बल प्रदान करने वाला उद्दीपक (Stimulant) मिलता है तो उस क्रिया की शक्ति में वृद्धि हो जाती है। स्किनर ने सीखने के क्षेत्र में प्रयोग करके यह पता लगाया कि प्रेरणा (Motivation) से उत्पन्न क्रियाशीलता ही सीखने के लिये उत्तरदायी है। ई. एल. थॉर्नडाइक (E. L. Thorndike) का प्रभाव का नियम (Law of effect) इस सिद्धान्त का आधार था। इस प्रभाव के नियम के अनुसार, यदि किसी अनुक्रिया या व्यवहार के बाद सन्तोष या आनन्द की अनुभूति होती है तो प्राणी उस व्यवहार को दोहराना चाहता है और इस प्रकार वह व्यवहार या अनुक्रिया बलवती होती है। इसके विपरीत यदि किसी अनुक्रिया के बाद असन्तोष या दुःख अनुभव होता है तो प्राणी उस व्यवहार को पुनः नहीं करना चाहता और इस प्रकार ऐसे व्यवहार में उत्तेजक एवं अनुक्रिया का बन्धन (S-R. Bond) कमजोर हो जाता है। यही नियम स्किनर के क्रिया प्रसूत अनुबन्धन (Operant conditioning) का आधार बना। स्किनर के इस सिद्धान्त को विभिन्न नामों से जाना जाता है; जैसे-क्रिया प्रसूत अनुबन्धन सिद्धान्त, कार्यात्मक अनुबन्धन सिद्धान्त, नैमित्तिक अनुबन्धन सिद्धान्त, (Instrumental conditioning theory) सक्रिय-अनुकूलित अनुक्रिया सिद्धान्त आदि। स्किनर का यह सिद्धान्त पावलॉव के सम्बद्ध-प्रतिक्रिया सिद्धान्त से भिन्न है। पावलॉव के सिद्धान्त में कुत्ता कोई क्रिया नहीं करता था लेकिन स्किनर के सिद्धान्त में प्रयोज्य क्रिया करते हैं, वे सक्रिय रहते हैं और इसीलिये इस सिद्धान्त को क्रिया प्रसूत अनुबन्धन के नाम से अधिक जाना जाता है क्योंकि यह कुछ क्रियाओं पर आधारित होता है, जो किसी व्यक्ति को करनी होती हैं। स्किनर ने दो प्रकार की क्रियाओं पर प्रकाश डाला- क्रिया-प्रसूत (Operant) तथा उद्दीपन प्रसूत (Stimulus) । जो क्रियाएँ उद्दीपन के द्वारा होती हैं वे उद्दीपन - आधारित होती हैं। क्रिया-प्रसूत का सम्बन्ध उत्तेजना से होता है। ### स्किनर का प्रयोग (Experiment by B. F. Skinner) - स्किनर ने चूहों पर प्रयोग करके यह निष्कर्ष निकाला कि प्राणियों में दो प्रकार के व्यवहार पाये जाते हैं- (1) अनुक्रिया (Respondent) जैसे पिन चुभाने पर हाथ हटाना। (2) क्रिया प्रसूत (Operant) जैसे-पढ़ना, लिखना आदि । अनुक्रिया का सम्बन्ध उत्तेजना से होता है और क्रिया-प्रसूत का सम्बन्ध किसी ज्ञात उद्दीपन से नहीं होता। क्रिया-प्रसूत को केवल अनुक्रिया की दर से मापा जा सकता है। स्किनर ने अपना प्रयोग एक विशेष प्रकार के स्किनर बॉक्स (Skinner box) में किया। स्किनर बॉक्स के एक सिरे पर एक लीवर लगा था। लीवर एक स्विच है, जो भोजन अथवा पानी प्रदान करता है। लीवर को दबाने से चूहे को भोजन अथवा पानी मिलता था। इस बॉक्स को आजकल मानक पर्यावरण कक्ष (Standard environmental chamber) कहते हैं। स्किनर ने एक भूखे चूहे को बॉक्स में रखा। लीवर पर चूहे का पैर पड़ते ही खट् की आवाज होती थी। इस ध्वनि को सुनकर चूहा आगे बढ़ता और उसे प्याले में भोजन मिलता। यह भोजन चूहे के लिये पुनर्बलन (Reinforcement) का कार्य करता है। चूहा भूखा होने पर लीवर को दबाता और भोजन को प्राप्त करता। इस प्रयोग से स्किनर ने निम्नलिखित निष्कर्ष निकाले- - (1) लीवर दबाने की क्रिया चूहे के लिये सरल हो गयी। - (2) लीवर बार-बार दबाया जाता। अतः निरीक्षण सरल हो गया। - (3) लीवर दबाने में अन्य क्रिया निहित नहीं थी। - (4) लीवर दबाने की क्रिया का आभास हो जाता था। इस प्रयोग से स्किनर ने निष्कर्ष निकाला कि यदि किसी क्रिया के बाद कोई बल प्रदान करने वाला उद्दीपक मिलता है तो उस क्रिया की शक्ति में वृद्धि हो जाती है। ### स्किनर ने अपने सिद्धान्त की व्याख्या दो प्रकार के व्यवहारों से की है- - (1) प्रसूत-व्यवहार (Operant or emitted behaviour)। - (2) अनुक्रिया-व्यवहार (Elicted behaviour) | ### 1. प्रसूत-व्यवहार (Operant behaviour) - इस प्रकार के व्यवहार में उद्दीपक की जानकारी नहीं होती। ऐसे व्यवहार को क्रिया-प्रसूत (Operant) व्यवहार कहते हैं। इस प्रकार की अनुक्रियाओं का सम्बन्ध किसी ज्ञात उद्दीपक से नहीं होता। इन्हें निर्गमित अनुक्रिया (Emitted response) भी कहा गया। ### 2. अनुक्रिया-व्यवहार (Elicted behaviour) - इस प्रकार के व्यवहार में उद्दीपक (Stimulus) की जानकारी रहती है। इसे अनुक्रियात्मक (Respondent) या प्रतिबिम्बित व्यवहार कहते हैं अर्थात् ऐसी प्रतिक्रियाएँ ज्ञात उद्दीपक द्वारा उत्पन्न होती हैं तथा इन्हें प्रकाशित अनुक्रिया (Elicited response) भी कहा गया है। स्किनर के सिद्धान्त को क्रिया-प्रसूत (Operant) अथवा साधक (Instrumental) अनुबन्धन कहा गया है। क्रिया-प्रसूत का तात्पर्य उस कार्य या व्यवहार से है, जिसे प्राणी सीखते समय करता है अर्थात् सीखने के लिये प्राणी को वातावरण के प्रति क्रियाशील (Operate) होना पड़ता है। साधक का अर्थ है कि प्राणी को अपनी परिस्थितियों को नियन्त्रित करना होता है। इस प्रकार साधक अनुबन्धन (Instrumental conditioning) के अन्तर्गत अनुकूलित अनुबन्धन (Classical conditioning) की तुलना में अधिक क्रिया अपेक्षित है। जब कोई सुखद परिणाम (पारितोषिक) को प्राप्त करने के लिये अथवा दुःखद परिणाम (दण्ड) से बचने के लिये व्यवहार करता है तो इसे साधक क्रिया (Instrumental action) कहते हैं। जब कोई विशेष अनुक्रिया किसी विशेष परिणाम को जन्म देती है तब साधक अधिगम की परिस्थिति (Instrumental learning situation) पैदा होती है। क्रिया-प्रसूत अनुबन्धन (Operant conditioning) में स्वत: प्रेरित अपेक्षित व्यवहार को पुनर्बलन (Reinforcement) के द्वारा उत्साहित किया जाता है तथा अनापेक्षित स्वतः प्रेरित व्यवहार (Undesirable voluntary behaviour) को हतोत्साहित किया जाता है। ### स्किनर ने पाया कि अनुबन्धन दो प्रकार का होता है 'S' अनुबन्धन (S-Conditioning) तथा 'R' अनुबन्धन (R - Conditioning)। - इसमें उदासीन उत्तेजक (Neutral stimulus) स्वाभाविक उत्तेजक (Natural stimulus) से जुड़ जाता है या उसका स्थान ग्रहण कर लेता है। जैसा कि पावलॉव के अनुकूलित अनुबन्धन में देखा गया, जहाँ घण्टी का बजना (उदासीन उत्तेजक) भोजन (स्वाभाविक उत्तेजक) से जुड़ गया था तथा स्वाभाविक उत्तेजक के समान ही प्रभाव उत्पन्न करने लगा। इस प्रकार के अनुबन्धन को स्किनर ने 'S' अनुबन्धन कहा। दूसरे प्रकार का अनुबन्धन जिसे स्किनर ने खोजा 'R' अनुबन्धन या क्रिया-प्रसूत अनुबन्धन (Operant conditioning) है, जिसमें अनुक्रिया स्वतः प्रेरित (Voluntary or spontaneaous) होती है, जिसके लिये पहले से किसी उत्तेजक की आवश्यकता नहीं होती। इस स्वतः प्रेरित अनुक्रिया को पुनर्बलन (Reinforcement) द्वारा उत्साहित करके दोहराये जाने की परिस्थिति उत्पन्न की जाती है। स्किनर ने अपने सिद्धान्त के द्वारा अधिगम के निम्नलिखित आधार (Basis of learning) बताये - (1) अभिप्रेरणा (Motivation) । (2) प्रणोदन (Drive) । (3) पुनर्बलन (Rein-forcement) । (4) सक्रिय अनुबन्धन (Operant conditioning)। ### पुनर्बलन (Reinforcement) अथवा क्रिया-प्रसूत सिद्धान्त की दशाएँ अथवा आधार (The basis of operant conditioning theory) - पुनर्बलन का तात्पर्य है किसी अनुक्रिया के बार-बार दोहराने की सम्भावना का बढ़ना। सक्रिय अनुबन्धन का प्रमुख आधार पुनर्बलन है। सक्रिय अनुबन्धन में कोई भी उद्दीपन जो किसी प्रकार की अनुक्रिया करता है, वह पुनर्बलन कहलाता है। डब्ल्यू. एफ. हिल (W. F. Hill) के अनुसार- "पुनर्बलन अनुक्रिया का परिणाम है, जिससे भविष्य में उस अनुक्रिया के होने की सम्भावना बढ़ती है।" प्राणी जब स्वतः कोई अपेक्षित व्यवहार करता है तो उस व्यवहार में स्थायित्व लाने के लिये उसे पुनर्बलन दिया जाता है, जिससे प्राणी उस व्यवहार को बार-बार दोहराये। इस दोहराये जाने पर S-R का बन्धन सुदृढ़ होता है और प्राणी के अपेक्षित व्यवहार में स्थायित्व आता है। जिस दिशा में हम व्यवहार को परिवर्तित करना चाहते हैं या परिमार्जित करना चाहते हैं उसी प्रकार के व्यवहार को पुनर्बलित किया जाता है। जिस व्यवहार को दूर करना चाहते हैं या बचना चाहते हैं, ऐसे व्यवहार के प्रति नकारात्मक पुनर्बलन (Negative reinforcement) का प्रयोग करते हैं। यह पुनर्बलन ही आगे के व्यवहारों के लिये उत्तेजक का कार्य करता है। ### क्रिया-प्रसूत व्यवहार (R) बाह्य व्यवहार है, जिसका अवलोकन किया जा सकता है, जबकि 'S' व्यवहार (Respondent behaviour) या प्रतिबिम्बित व्यवहार आन्तरिक तथा व्यक्तिगत (Personal) होता है। - स्किनर के अनुसार, "यदि प्राणा के निर्गमित अनुक्रियाओं (Emitted response) को पुनर्बलित (Reinforced) कर दिया जाये तो वे बलवती हो जाती हैं तथा बार-बार दोहराये जाने पर स्थायी व्यवहारों में परिवर्तित हो जाती हैं अर्थात् प्राणी ऐसे व्यवहारों को सीख जाता है।" ### विभिन्न प्रकार के पुनर्बलन- - एक क्रिया-प्रसूत (Operant) के घटित होने का अनुसरण एक प्रबलन उत्तेजक (Reinforcing stimulus) के प्रस्तुतीकरण के साथ होता है तो शक्ति (S-R Bond) में वृद्धि होती है।" स्किनर ने पुनर्बलनों की व्याख्या इस प्रकार की है- 1. सकारात्मक पुनर्बलन (Positive reinforcement) - ये वे उत्तेजक हैं, जो परिस्थिति से जुड़ने पर सक्रिय अनुक्रिया की सम्भावना को बढ़ा देते हैं; जैसे - भोजन, पानी, धन, दौलत तथा प्रशंसा आदि। पुरस्कार तथा सकारात्मक पुनर्बलन में भी अन्तर है। पुरस्कार (Reward) सदैव पुनर्बलन नहीं होता। पुनर्बलन इतना प्रभावशाली होना चाहिये कि वह व्यवहार या अनुक्रिया को बलवती बना सके। सकारात्मक पुनर्बलन दो प्रकार के होते हैं- - (1) सकारात्मक प्राथमिक पुनर्बलन (Positive primary reinforcement) - ऐसे उत्प्रेरक जो प्राणी की आधारभूत आवश्यकताओं की पूर्ति करें, प्राथमिक सकारात्मक पुनर्बलन कहलाते हैं; जैसे - भोजन, जल आदि। इनको किसी दूसरी वस्तु या घटना से सम्बन्धित करने की आवश्यकता नहीं होती इनमें स्वयं ही पुनर्बलन की क्षमता होती है। - (2) सकारात्मक द्वितीय पुनर्बलन (Positive secondary reinforcement) - ऐसे पुनर्बलन जो दूसरे पुनर्बलन के साथ सम्बन्धित होकर या मिलकर पुनर्बलन की क्षमता ग्रहण करते हैं, द्वितीय पुनर्बलन कहलाते हैं। एकाग्रता, शाब्दिक प्रशंसा, रुपया आदि द्वितीय पुनर्बलन हैं क्योंकि इनको दूसरी वस्तुओं के साथ मिलाने पर इनका महत्त्व होता है। 2. नकारात्मक पुनर्बलन (Negative reinforcement) - ऐसे असन्तोषजनक या कष्टप्रद उत्प्रेरक या अनुभव जिन्हें हम नहीं प्राप्त करना चाहते या जिनको हम दूर करना चाहते हैं नकारात्मक पुनर्बलन हैं; जैसे-सामाजिक अस्वीकृति या तिरस्कार। प्राणी ऐसा कार्य करना चाहता है, जिससे उसको इस प्रकार के अनुभव न मिलें। नकारात्मक पुनर्बलन अनुक्रिया से दूर हटने की प्रवृत्ति को बढ़ाते हैं। प्राणी कुछ ऐसा करता है कि वह ऐसे व्यवहार या अनुभव से अपने को बचा सके। दण्ड (Punish.nent) एवं नकारात्मक पुनर्बलन (Negative reinforcement) में अन्तर है। दण्ड एक दुःखदायी अनुभव है, जो किसी अनुक्रिया के बाद दिया जाता है, जिससे उस अनुक्रिया एवं उत्तेजक का बन्धन टूट जाये तथा प्राणी ऐसा व्यवहार फिर से न दोहराये तथा बुरी आदत छूट जाये। नकारात्मक पुनर्बलन किसी अनुक्रिया के पूर्व ही अपना प्रभाव डाल देते हैं, जबकि दण्ड अनुक्रिया या व्यवहार के बाद दिया जाता है। नकारात्मक पुनर्बलन का उद्देश्य ऐसी अनुक्रिया या व्यवहार को उत्पन्न ही न होने देना है, जबकि दण्ड का उद्देश्य ऐसे व्यवहार को पुनः दोहराने से बचाना है। बिजली का धक्का स्किनर के प्रयोग में चूहे के लिये ऋणात्मक या नकारात्मक पुनर्बलन का कार्य करता है क्योंकि धदका लगने से उसे कष्ट होता है तथा वह उचित मार्ग अपनाने को बाध्य होता है। ### पुनर्बलन की योजना अथवा अनुसूची (Schedule of reinforcement) - सीखने की अधिकतर स्थितियों में सतत् पुनर्बलन का उपयोग किया जाता है अर्थात् अधिगम के प्रत्येक व्यवहार को पुनर्बलित किया जाता है किन्तु जीवन की वास्तविक परिस्थितियों में अधिकतर प्रत्येक व्यवहार को पुनर्बलित नहीं किया जाता अर्थात् सविराम पुनर्बलन (Intermittent reinforcement) का प्रयोग होता है। पुनर्बलन के इसी आकस्मिकता (Contingency) को पुनर्बलन की योजना (Scheduled of reinforcement) कहते हैं। प्राणी को वांछित व्यवहार सिखाने हेतु पुनर्बलन का आयोजन निम्नलिखित प्रकार से किया जा सकता है- - 1. निश्चित अनुपात पुनर्बलन (Fixed ratio (FR) reinforcement) - इस अनुसूची में यह निश्चित करके पुनर्बलन दिया जाता है कि कितनी बार सही अनुक्रिया करने पर पुनर्बलन दिया जाये ? उदाहरण के लिये, FR 10 का अर्थ है कि प्रत्येक 10 अनुक्रियाओं के बाद पुनर्बलन दिया जाये चाहे इन दस अनुक्रियाओं को करने में कितना ही समय लगे ? सीखते समय यदि हम पुनर्बलन के लिये अनुक्रियाओं की संख्याओं को बढ़ाते जायें तो भी पुनर्बलन प्रभावशील रहते हैं। FR (Fixed ratio) योजना बिना किसी संकोच के अनुक्रियाओं की गति को बढ़ा देती हैं। यही कारण है कि कुछ व्यापारी कार्य के कुछ अंशों को पूरा हो जाने पर मजदूरी देने की प्रथा अपनाते हैं, अर्थात् कुछ निश्चित संख्या में कार्य के पूर्ण हो जाने पर मजदूरी देते हैं। यदि अनुपात को धीरे-धीरे बढ़ाया जाये तो तुलनात्मक रूप से कम पुनर्बलन की ही आवश्यकता पड़ती है। FR योजना का एक दूसरा प्रभाव भी पड़ता है। इसके प्रत्येक पुनर्बलन के बाद प्राणी कुछ समय के लिये रुकता है। किसी पुनर्बलन को प्राप्त करने के लिये जितनी अधिक संख्या में अनुक्रिया की आवश्यकता होती है उतनी ही अधिक रुककर प्रतीक्षा करनी पड़ती है। - 2. निश्चित अन्तरल पुनर्बलन (Fixed interval (FI) reinforcement) - इस FI के अन्तर्गत पुनर्बलन एक निश्चित समय के अन्तराल के बाद की प्रथम अनुक्रिया पर दिया जाता है। उदाहरण के लिये, FI-3 का अर्थ है पहले पुनर्बलित अनुक्रिया के बाद 3 मिनट पर होने वाली अनुक्रिया को पुनर्बलित किया जाये। साथ ही जब तक अनुक्रिया न हो पुनर्बलित न किया जाये। यदि 3 मिनट के अन्दर 100 अनुक्रियाएँ हो चुकी होंगी तब उन अनुक्रियाओं पर कोई ध्यान नहीं दिया जाता। निश्चित अन्तराल पुनर्बलन में अनुक्रिया की दर अन्तराल की लम्बाई पर निर्भर करती है। अन्तराल जितना लम्बा होगा, अनुक्रिया की दर उतनी ही निम्न होगी। निम्न दर, प्रत्येक पुनर्बलन के पश्चात् की विश्रान्ति की लम्बाई से भी सम्बन्धित होगी, जो कि निश्चित अन्तराल की लम्बाई से प्रत्यक्ष तौर पर बढ़ती प्रतीत होती है। विद्यालयों तथा महाविद्यालयों में प्रशंसा, अच्छे अंक, छात्रों के स्व सम्मान को बढ़ावा, अध्यापकों द्वारा छात्र की उपलब्धि की स्वीकृति आदि इस प्रकार की पुनर्बलन योजना के अच्छे उदाहरण हैं। इसके प्रभाव स्वरूप छात्रों में अधिक अध्ययन की प्रवृत्ति को बढ़ावा मिलता है। छात्रों द्वारा याद किये पाठ पर अध्यापक द्वारा दिया गया प्रोत्साहन भी इस प्रकार के पुनर्बलन का उदाहरण है। इसी प्रकार नौकर को एक सप्ताह के बाद वेतन देना अथवा निश्चित समय पर भोजन करना निश्चित अन्तराल पुनर्बलन के उदाहरण हैं। - 3. शत-प्रतिशत पुनर्बलन (Hundred percentreinforcement) अथवा सतत्पुनर्बलन (continuous reinforcement) - जब प्रत्येक अनुक्रिया के उपरान्त पुनर्बलन दिया जाता है तो उसे सतत् पुनर्बलन कहते हैं। प्रयोगशाला में अधिगम के अधिकतर शोध कार्यों में सतत् पुनर्बलन का प्रयोग किया जाता है। स्पष्ट है कि सतत् पुनर्बलन के अन्तर्गत प्रत्येक व्यवहार पुनर्बलन की अपेक्षा करता है। पुनर्बलन की यह योजना व्यवहार की बारम्बारता (Frequency) को अधिकतम गति से बढ़ा देती है। इस पुनर्बलन में सीखने वाले की प्रत्यक्ष सही अनुक्रिया या व्यवहार का पुनर्बलन किया जाता है। इस प्रकार के पुनर्बलन से प्राणी किसी अनुक्रिया को अतिशीघ्र सीख लेता है परन्तु पुनर्बलन समाप्त कर देने पर अनुक्रिया भी शीघ्र लुप्त हो जाती है। नये कौशल को सीखने में सतत् पुनर्बलन सबसे अच्छा साधन है किन्तु जैसा कि पहले स्पष्ट किया जा चुका है कि मनोवैज्ञानिक प्रयोगशालाओं से बाहर वास्तविक जीवन में अधिकतर ऐसा नहीं पाया जाता। - 4. सविराम या आंशिक पुनर्बलन (Partial or intermittent reinforcement) - जब सीखने वाले की सभी अनुक्रियाओं को पुनर्बलित नहीं किया जाता अर्थात् कुछ अनुक्रियाओं को तो पुनर्बलित किया जाता है तथा कुछ को नहीं तो इस प्रकार के पुनर्बलन को आंशिक पुनर्बलन कहते हैं। इसमें सही अनुक्रियाओं को भी 100% से कम पुनर्बलित किया जाता है, परिणामस्वरूप नयी आदतें सीखने में सहायता मिलती है। सीखने की प्रारम्भिक अवस्था में तो सभी सही अनुक्रियाओं (100%) को सतत् पुनर्बलन (Continuous reinforcement) दिया जाता है किन्तु जैसे-जैसे सीखने वाला उचित व्यवहार सीखने लगता है धीरे-धीरे पुनर्बलन को कम करते जाते हैं किन्तु इस बात का ध्यान रखना होता है कि पुनर्बलन उसी मात्रा एवं बारम्बारता में करें, जहाँ तक अपेक्षित व्यवहार के प्रतिपादन में कमी न आये। वास्तव में ऐसा भी पाया गया है कि पूर्ण सतत् पुनर्बलन की तुलना में आंशिक पुनर्बलन के फलस्वरूप प्राणी अधिक लगन एवं तीव्रगति से अनुक्रियाएँ करता है। ### पुनर्बलन उद्दीपक के विभिन्न प्रकार Different Kinds of Reinforcing Stimulus छात्रों के अधिगम हेतु अध्यापक अग्रलिखित पुनर्बलन उद्दीपकों का प्रयोग आवश्यकतानुसार कर सकता है- - 1. सामग्री पुनर्बलक (Material reinforcers) - सामग्री पुनर्बलक अथवा मूर्त पुनर्बलक एक वास्तविक वस्तु हैं; जैसे - भोजन, खिलौने आदि। मनोवैज्ञानिकों का यह मानना है कि सामग्री पुनर्बलकों का उपयोग अन्तिम हथियार के रूप में किया जाना चाहिये अर्थात् उपयोगी हो तभी किया जाना चाहिये, जबकि कोई भी पुनर्बलक कार्य न करे। - 2. सामाजिक पुनर्बलक (Social reinforcers) - सामाजिक पुनर्बलक का उपयोग उस समय किया जाता है, जब एक व्यक्ति दूसरे व्यक्ति को सकारात्मक आदर संकेत (Gestures) अथवा चिह्न (Sign) द्वारा सम्प्रेषित, करता है। - 3. गतिविधि पुनर्बलक (Activity reinforces) - इसके प्रतिपादक प्रेमक हैं। उन्होंने यह खोज की कि लोग प्राय: एक गतिविधि निष्पादित करना चाहते हैं। ऐसा करते हुए दूसरी गतिविधि निष्पादित कर सकते हैं। गतिविधि पुनर्बलकों का प्रेमक नियम यह है- सामान्यतः उच्च आवृत्ति अनुक्रिया जब सामान्यतः निम्न आवृत्ति के पश्चात् घटित होगी तब यह निम्न आवृत्ति अनुक्रिया की आवृत्ति बढ़ा देगी। - उच्च आवृत्ति अनुक्रिया वह होती है, जिसे करने में व्यक्ति आनन्द का अनुभव करता है। निम्न आवृत्ति अनुक्रिया वह होती है, जिसे व्यक्ति करना पसन्द नहीं करता। उदाहरणार्थ, छोटे बालक खेलना अथवा टेलीविजन देखना अधिक पसन्द करते हैं अपेक्षाकृत पढ़ायी करने के। यदि उनसे कहा जाये कि पहले तुम तीन घण्टे पढ़ायी कर लो फिर खेलो अथवा टीवी देखो तब वे पहले पढ़ायी कर लेंगे। - 4. आन्तरिक पुनर्बलक (Intrinsic reinforcers) - अनेक स्थितियों में व्यक्ति बाह्य पुनर्बलकों के कारण नहीं अपितु आन्तरिक सुअनुभूति के आन्तरिक पुनर्बलन के कारण अनुक्रियाओं में व्यस्त रहते हैं। किसी कठिन समस्या के सफलतापूर्वक हल करने के पश्चात् की अनुभूति एवं किसी की मूल्यवान सम्पत्ति को उसके स्वामी को लौटाने के बाद का गर्व आदि आन्तरिक पुनर्बलक के उदाहरण हैं। - 5. सकारात्मक प्रतिपोषण (Positive feedback) - यदि किसी कार्य को करने के बाद व्यक्ति को सकारात्मक प्रतिपोषण मिलता है तो व्यक्ति उस कार्य को करने के लिये प्रेरित होता है। ### सक्रिय अनुबन्धन के शैक्षिक निहितार्थ (Educational implications of operant conditioning) - शिक्षा में जितना प्रभाव स्किनर के सक्रिय अनुबन्धन का पड़ा है उतना किसी अन्य का नहीं। शैक्षिक जगत् में अनेक नवाचारों का उदय सक्रिय अनुबन्धन के सिद्धान्त पर ही हुआ है। शिक्षा के क्षेत्र में स्किनर के सक्रिय अनुबन्धन के शैक्षिक निहितार्थ निम्नलिखित प्रकार हैं- - 1. व्यावहारिक उद्देश्य (Behavioural objectives) - सक्रिय अनुबन्धन का उपयोग अनुबन्धन के प्रारम्भ से पूर्व अन्तिम व्यवहार को सुस्पष्ट (Precise) तथा निरीक्षण योग्य शब्दावली में व्यक्त करने के अभ्यास में किया जाता है। इसे व्यावहारिक उद्देश्यों के रूप में लिखा जाता है। आदर्श रूप में व्यावहारिक उद्देश्य के तीन घटक होते हैं। प्रथम, यह कि परिणाम को निरीक्षण एवं मापन योग्य व्यवहार रूप में कहा जाना चाहिये, जिससे विद्यार्थी वर्तमान घटनाओं के प्रति जागरूक होंगे। द्वितीय, व्यावहारिक उद्देश्य की उस स्थिति का विशेष उल्लेख करना चाहिये, जो कि व्यवहार को प्रदर्शित करें। उदाहरणार्थ- बी.एड. के मापन एवं मूल्यांकन के विद्यार्थी सही रूप में परीक्षण-पुनर्परीक्षण विश्वसनीयता की गणना कर सकेंगे। अन्ततः उद्देश्य में स्वीकार करने योग्य व्यवहार निष्पादन के परीक्षण के लिये निष्कर्ष (Criterion) को शामिल किया जाना चाहिये। इस प्रकार के उद्देश्यों का उदाहरण अग्रलिखित हैं- 100 जोड़ने की समस्याएँ दिये जाने पर जिसमें दो एक अंकों की संख्याओं का जोड़ना हो एवं 0 से 9 तक के समस्त सम्भावित संगठन (Combination) शामिल हों, विद्यार्थी इन सभी सम्भावित समस्याओं के हल 5 मिनट में लिख सकेगा। - 2. अभिक्रमित अनुदेशन एवं कम्प्यूटर द्वारा अनुदेशन (Programmed instruction and instruction by computer) - सक्रिय अनुबन्धन के सिद्धान्त का उपयोग अभिक्रमित अधिगम एवं कम्प्यूटर द्वारा अनुदेशन में किया जाता है। इस सिद्धान्त का मानव अध्यापन में उपयोग कर शिक्षण मशीन का निर्माण किया गया। अभिक्रमित अधिगम के मूल सिद्धान्तों का आविर्भाव बी.एफ. स्किनर के प्रयोगों द्वारा हुआ जिनका वर्णन निम्नलिखित रूप में प्रस्तुत है- - (1) लघु सोपानों का सिद्धान्त-इस सिद्धान्त के अनुसार, वह विषय-वस्तु जिसको अभिक्रमित करना है, का भली-भाँति विश्लेषण किया जाता है और उसे सूचनाओं के अर्थपूर्ण भागों में विभाजित किया जाता है। एक समय में सूचनाओं के एक ही भाग को विद्यार्थियों के समक्ष प्रस्तुत किया जाता है। - (2) सक्रिय अनुक्रिया का सिद्धान्त - इस सिद्धान्त के अनुसार, अधिगम तब होगा जबकि विद्यार्थियों द्वारा आवश्यक अनुक्रिया की जाये। इस प्रकार अभिक्रमण विद्यार्थियों को सक्रिय अनुक्रिया का अवसर देता है और उनको अपनी सक्रियता को बनाये रखने की ओर प्रवृत्त करता है। इस समय विद्यार्थी व्यस्त एवं सक्रिय रहता है। एक अच्छे अभिक्रमण के लिये यह आवश्यक है कि पूर्व सूचनाओं को पूर्णतः समझने के पश्चात् ही अगली सूचना पर जाया जाये। - (3) तत्काल पुष्टि का सिद्धान्त - यह सिद्धान्त बताता है कि अधिगमक को उचित परिणाम का ज्ञान कराया जाना चाहिये, जिससे प्रश्न का उत्तर लिखने के पश्चात् उसे यह ज्ञात हो सके कि उसका उत्तर सही है अथवा नहीं। परिणाम की तत्काल सन्तुष्टि महत्त्वपूर्ण है। यह अधिगमक की अभिप्रेरणा भी बनाये रखता है। - (4) स्व-अध्ययन गति का सिद्धान्त - इस नियम के अनुसार, जब अधिगमक किसी अभिक्रम के द्वारा कार्य करता है तब वह अपने स्वयं की गति से सीखता है। उसे उसके सहपाठियों के साथ-साथ सीखने के लिये बाध्य नहीं किया जाता। स्व-अध्ययन गति के द्वारा अभिक्रम निर्माण करने से, व्यक्तिगत भिन्नताओं के सिद्धान्त के अध्ययन का अधिगम प्रक्रिया में समावेश हो गया है। - (5) विद्यार्थी परीक्षण का सिद्धान्त-इस अन्तिम सिद्धान्त के अनुसार, कक्षाध्यापक अपने विद्यार्थियों की प्रगति का मूल्यांकन कर सकता है। वह अभिक्रम की कमजोरियों का पता लगा सकता है तथा अभिक्रम के कमजोर भाग को विद्यार्थियों के निष्पादन के परिप्रेक्ष्य में सुधार सकता है। विद्यार्थी स्वयं अपने निष्पादन का सतत् मूल्यांकन कर सकते हैं। - इसी प्रकार सक्रिय अनुबन्धन के सिद्धान्त का उपयोग कम्प्यूटर द्वारा अनुदेशन में भी किया जाता है।