オペラントコンディショニングの定義、特性および例



オペラントコンディショニング ○インストルメンテーション・コンディショニングは、行動が結果によって制御される一種の学習です.

それは、強化された行動はより多くの機会に現れる傾向がある一方で、罰せられた行動は消滅するという考えに基づいています.

オペラントコンディショニングとクラシックコンディショニングの違いは何ですか?オペラントコンディショニングでは、自発的な反応の後に強化剤が続きます。このようにして、自発的な反応(例えば試験のために勉強すること)は将来起こりやすくなります。それどころか、古典的条件付けでは、刺激は自動的に不本意な反応を活性化します.

オペラントコンディショニングは、ポジティブとネガティブの強化を使用して行動を修正しようと試みるプロセスとして説明することができます。オペラント条件付けを通して、個人は特定の行動と結果の間の関連付けをします。例:

  • 両親は、キャンディーやその他の賞品をもらった子供に成績が良いと評価します。.
  • 教師は、落ち着いて教育を受けている生徒に報酬を与えます。生徒はこのように振舞うことでより多くのポイントを受け取ることに気づく.
  • レバーを押すたびに食べ物が動物に与えられます.

B.F. Skinner(1938)はオペラントコンディショニングという用語を作りました。 Skinnerは、この振る舞いに従うことができる3種類の応答またはオペランドを識別しました。

  • ニュートラル演算子:行動が繰り返される可能性を増減させない、環境からの反応.
  • 補強剤:環境からの反応で、行動の繰り返しの可能性が高まります。強化剤はポジティブでもネガティブでもよい.
  • :環境からの反応で、行動が繰り返される可能性が低くなります。罰は行動を弱める.

オペラント条件付けの前例

Thorndikeは、このコンディショニングには単なる答えと強化剤以上のものが含まれることを認識した最初の人でした。 3つのイベントを考慮して、答えはある刺激の存在下で与えられます:刺激、反応および反応または強化の結果.

この構造は、Thorndikeが効果の法則を定式化するための鍵となった、刺激と反応の間の関連など、さまざまな関連性の発展を促進します。これにより、結果が強化された後に続く答えは、刺激が再出現したときに発生する可能性が高くなることを確認しました.

反対に、否定的な結果を伴う応答は、刺激が再出現したときに発生する可能性が低くなります。それがThorndikeによって命名されたように、効力の法則は手術的なコンディショニングまたは器械的コンディショニングの前例です.

しかし、行動心理学者Skinnerにとって、条件付けは、以前に得られたであろう結果によると、行動の強化であった。.

この行には、2種類の条件付けがあります。

  • 古典的またはパブロフ語:それは無条件刺激と条件付き刺激の関連に基づいています。.
  • オペラント条件付け:結果的または強化的な刺激は、ある行動を起こさせる。 Skinner氏は、行動の後に積極的な強化が続くと、そのような行為が将来発令される可能性が高まると説明しています。それどころか、ある反応に強化剤が続かない場合、またはその強化剤が否定的である場合、将来そのような行動を起こす可能性は低くなります。.

オペラントコンディショニングの基本概念

補強

それは答えの発行、すなわち、それが将来的に大きいか小さいかにかかわらず、それらが起こる確率に責任があります。それは反応が起こった後に起こるので、それは補強と一貫した刺激です.

与えられた強化剤がそれに反応して絶えず提示され、強化剤の結果として行動が変化することが確認されるまで、その行動に影響を与えるかどうかを知ることは不可能です。.

強化には、ポジティブとネガティブの2種類があります。どちらも将来の状況で応答が発行される可能性を高めるという同じ目的を持っています。さらに、Skinnerの強化剤は、観察可能で測定可能な行動によって定義されます。.

積極的な強化

ポジティブ強化は、個人がやりがいのある結果を提供することによって行動を強化します.

負の補強

不快な強化剤の除去はまた行動を強化することができます。これは、動物や人にとって「やりがいのある」有害な刺激の排除であるため、ネガティブ強化として知られています。それが不快な経験を止めるか排除するので、負の強化は行動を強化します.

一次補強剤

そのように機能するために事前条件付けの履歴を必要としないのは、それらすべての基本的な強化剤であろう。いくつかの例は水、食物と性別でしょう.

二次補強剤

無条件刺激との関連付けのおかげで、二次強化剤が以前の条件付けの歴史に基づくものである場合。いくつかの例はお金と資格でしょう.

3学期の偶然性

それはオペラント条件付けの基本モデルであり、3つの構成要素からなる:弁別刺激、反応および強化刺激。.

差別的刺激は、強化剤が利用可能であることを被験者に示すものであり、それは、彼がある行動を実行すれば、彼は前記強化剤を得ることができるだろうことを示す。対照的に、我々は行動がいかなる種類の強化剤を得ることにもつながらないことを示すデルタ刺激または刺激を持っています.

答えは、被験者が実行する行動であり、その実行は強化刺激を得ることにつながるかどうかになります。.

上記のように、刺激的な刺激は、その出現のおかげで、応答を出す可能性が将来増減するので、行動の発散に対して責任があります。.

オペラントコンディショニングについて知っておくべき概念

罰は、被験者の行動に対するその影響によっても測定されます。一方、強化とは異なり、意図されているのは特定の行動の減少または抑制です。.

処罰は後の状況で行動を起こす可能性を減らす。ただし、罰の脅威が減少すると、動作が再表示される可能性があるため、応答は排除されません。.

刑罰には、正の罰と負の罰の2種類があります。.

ポジティブな罰

これはある行動の実行の後に嫌悪的な刺激の提示を含みます。被験者によって与えられた反応に偶発的に与えられる.

否定的な罰

それはある行動の結果としての刺激の排除にある、すなわちそれはある行動の実行の後の肯定的な刺激の撤回からなる.

絶滅

消滅時には、強化剤が出現しなくなったため、反応は停止します。このプロセスは、達成されると予想され、その挙動が経時的に維持される原因となっている対応する強化剤を提供できなかったことに基づいている。.

反応が消滅すると、弁別刺激は消滅刺激となる。このプロセスは忘却と混同してはいけません。忘却は、行動の力がある期間内に発行されなかったときに減少したときに与えられます。.

一般化

特定の状況または刺激に反応して、他の刺激または同様の状況の前に出現する可能性がある反応が調整されます。.

差別

この過程は一般化のそれとは反対であり、刺激と文脈によって異なった反応をする。.

強化プログラム

Skinnerはまた、継続的強化プログラムと断続的強化プログラムを含むいくつかの強化プログラムを設定しました。.

継続的強化プログラム

それらは、提示されるたびに、すなわち対象が所望の行動を実行するたびに、反応の強化が絶えず強化されることに基づいています。.

断続的強化プログラム

対照的に、ここでは、対象は、所望の行動を実行するときに必ずしも強化剤を得ない。これらは与えられた答えの数または答えの間の時間間隔に基づいて定義され、異なる手順を生じさせる.

固定比率プログラム

これらのプログラムでは、被験者が固定および一定の反応を生成するときに強化剤が提供される。例えば、比率10のプログラムでは、刺激が提示されたときに10回の反応をした後に人は強化筋を得ます.

様々な理由のプログラム

これは前のものと同じように構成されていますが、この場合、被験者が強化を得るために与えなければならない応答の数は可変です。.

強化者は、被験者によって発せられた反応の数に依存し続けるが、それには理由があるが、強化者が得られる時期を被験者が予測することを妨げられている。.

定間隔プログラム

インターバルプログラムでは、強化筋を得ることは被験者が与える反応の数には依存しませんが、経過時間によって決定されます。その結果、一定期間経過後に生成された最初の応答が強化されます。.

固定間隔プログラムでは、強化筋と強化筋の間の時間は常に同じです.

可変区間プログラム

これらのプログラムでは、強化剤はしばらくしてから入手されますが、受け取った強化剤ごとに時間は異なります。.

行動の変化

逐次比較または整形

成形は、行動の成形または逐次近似の微分強化による行動の変化から構成されます。.

具体的な行動を形作るために一連のステップが続きます。まず第一に、私たちはあなたがどの行動に到達したいのかを知るために形成することを意図した初期の行動を特定します.

次に、使用される可能性のある強化剤が区切られ、プロセスは最終的な挙動に達するように段階または段階に分けられ、最後のものに達するまで各段階または連続的なアプローチを強化する。.

この動的な手順により、行動とその結果の両方が変化します。この意味で、客観的行動への連続的なアプローチは強化されています.

しかし、それが実行されるためには、彼らが目標に到達するまで彼らの行動を徐々に強化するために、対象が既に行っている以前の行動から始めることが必要である。.

チェーン

それにより、新しい行動がより単純なステップまたはシーケンスへの分解から形成され、被験者の行動レパートリーにおけるより複雑な応答の確立につながるように、各ステップで与えられたそれぞれの応答を強化します。.

応答の長い連鎖は、その確立が特定のスキルの習得と定義につながる機能単位を採用して、条件付き強化剤を使用して形成することができます.

参考文献

  1. オペラントのコンディショニングwikipedia.orgから取得しました
  2. オペラントのコンディショニングe-torredebabel.comから取得.
  3. biblio3.urlから回復しました.
  4. 効力の法則wikipedia.orgから取得しました.
  5. 絶滅wikipedio.orgから取得しました.
  6. Domjan、M。学習と行動の原則。 Paraninfo第5版.