조작적 조건형성의 원리는 특정 반응을 선택적으로 보상함으로써 그 반응이 일어날 확률을 증가시키거나 감소시키는 것으로, 자극보다는 행동의 결과에 중심을 두는 학습 원리이다. 인간을 포함하는 수많은 유기체는 언제나 변화하는 다양한 환경에서 살아간다. 유기체가 다변하는 환경에 대처하는 가장 기본적인 방법은 특정 환경에 적응적인 방향으로 행동을 조절하는 것이다. 행동의 조절은 새로운 행동의 생성과 특정 행동의 증가와 감소 그리고 부적응적인 행동의 소멸을 의미한다. 특정 환경과 적응적인 행동의 연합과 더불어 특정 환경에서 발생한 행동과 그 행동이 초래하는 결과의 연합에 의해 결정된다. 특정 대상, 자극, 환경에서 발생한 행동과 그 행동의 결과가 연합되어 추후의 행동을 증가시키거나 감소시키는 원리를 효과의 법칙이라고 하며, 이러한 효과의 법칙에 의해 행동이 조절되는 형태의 학습을 도구적 또는 조작적 조건형성이라 한다. 조작적 조건형성에 대한 연구는 19세기 후반에 Thorndike가 효과의 법칙을 밝히면서 시작되었다. 그는 미로에 대한 학습 능력과 특정 행동으로 탈출이 가능한 문제 상자에 대한 해결 능력을 반복적으로 측정함으로써 동물의 지능을 연구했으며, 일련의 연구들을 통해 특정 행동의 강도는 그 행동의 결과에 의해 좌우된다는 조작적 조건형성의 기본 개념을 제시했다. Thorndike 이후 조작적 조건형성의 원리는 1930년대 Burrhus Skinner에 의해 확장되어 현재는 인간 행동을 설명하는 가장 중요한 접근 중 하나로 받아들여진다.
강화와 처벌. 조작적 조건형성은 특정 행동의 빈도를 증가시키는 강화와 감소시키거나 소멸시키는 처벌이라는 두 가지 원리에 의해 이루어진다. 먼저 강화는 어떤 행동의 결과가 그 행동의 발생빈도를 증가시킬 때 이와 같은 결과를 의미한다. 강화는 정적 강화와 부적 강화 두 가지 형태로 구분할 수 있다. 정적 강화는 어떤 행동 뒤에 특정 자극이 제시되거나 그 자극의 강도가 강해져서 선행하는 행동의 발생빈도를 증가시키는 강화를 말한다. 이때 제시되는 자극을 정적 강화물이라 하며 일반적으로 정적 강화물은 유기체에게 보상적인 자극이다. 야생 고양이에게 제공하는 먹이, 책 읽는 행동 뒤에 따라오는 사탕과 관심 및 칭찬이 정적 강화물에 해당한다. 이와 유사하게 대형 마트의 장난감 코너에서 떼쓰며 우는 행동은 아이에게 종종 원하는 장난감이라는 정적 강화물을 얻게 하고, 이 강화물은 결과적으로 아이가 원하는 것을 얻기 위한 행동인 떼쓰기와 울기 행동을 강화한다. 강화의 또 다른 형태인 부적 강화는 행동 뒤에 특정 자극이 제거되거나 그 자극의 강도가 감소함으로써 선행하는 행동의 빈도를 증가시키는 형태를 말하며, 도피 행동과 회피행동을 예로 들 수 있다. 도피 행동은 이미 어떤 혐오 자극이 존재할 때 특정 행동을 함으로써 그 혐오자극을 없애는 행동을 말하고, 회피행동은 미리 어떤 행동을 하여 혐오적인 상황이 닥치지 않게 하는 행동이다. 부적 강화에서 제거되거나 감소하는 자극을 부적 강화물이라 하는 데 일반적으로 부적 강화물은 유기체에게 혐오적인 자극이다. 예를 들어, 아이가 자신의 방을 깔끔하게 청소하는 행동은 부적 강화물인 어머니의 잔소리를 없애거나 줄여 준다. 장난감 코너에서 떼쓰고 우는 아이를 둔 엄마는 아이에게 장난감을 사줌으로써 부적 강화물인 아이의 떼쓰기와 울기에서 벗어날 수 있고, 결과적으로 아이를 달래기 위한 행동이 강화된다. 처벌은 어떤 행동의 결과가 선행하는 그 행동의 빈도를 감소시킬 때 그런 결과를 의미하는 것으로, 어떤 행동에 뒤따르는 결과가 그 행동을 다시 야기할 가능성을 감소시킬 때마다 일어난다. 체벌, 전기쇼크, 큰소리 등과 같이 이전의 반응을 감소시키는 자극을 처벌물이라 한다. 처벌은 정적 처벌과 부적 처벌로 구분된다. 정적 처벌은 행동 뒤에 혐오자극이 뒤따를 때 그 행동의 빈도가 감소하는 것을 말하며, 행동 뒤에 특정 자극이 제시되거나 그 자극의 강도가 강해져 선행하는 행동의 빈도를 줄이거나 제거하는 형태를 뜻한다. 부적 처벌은 어떤 행동 뒤에 긍정적 자극을 제거함으로써 그 행동의 빈도가 감소하는 것으로, 행동 뒤에 특정 자극이 제거되거나 그 자극의 강도가 약해져 선행하는 행동을 줄이거나 제거하는 형태를 뜻한다. 예를 들어, 대형 마트 장난감 코너에서 떼쓰며 우는 아이를 둔 어머니는 떼쓰기와 울기를 줄이기 위해 큰 소리로 꾸짖거나 체벌을 하는 등 정적 처벌을 이용할 수도 있고, 어머니의 사랑을 잃었다는 표시로 아이를 무시하거나 캐리어에 타는 것을 금지하는 부적 처벌을 이용할 수도 있다. 또한 일정 기간 동안 모든 긍정적 자극을 제거해 버리는 부적 처벌을 '강화로부터 타임아웃'이라고 한다. 요약하면, 처벌의 원리는 행동 뒤에 혐오자극 제시나 긍정 자극의 제거가 뒤따를 때 그 행동의 빈도가 감소하는 것을 말한다. 요약하면 강화와 처벌의 원리는 모두 선행 행동 뒤에 특정 자극이 제시되거나 제거된다는 점에서 유사하지만, 특정 자극이 제시되는 제거되든 정적 강화와 부적 강화는 선행 행동을 증가시키는데 그 목적이 있다. 반면에 정적 처벌과 부적 처벌은 선행 행동을 줄이거나 제거하는 데 그 목적이 있다.
강화인. 정적 강화 및 부적 강화에서 행동의 빈도를 증가시켜 주는 역할을 하는 강화인에는 여러 가지가 있다. 무조건 강화인이라고도 불리는 일차적 강화인은 유기체가 그 강화인과 어떤 특별한 경험을 하지 않아도 그들의 행동을 증가시키는 역할을 하는 강화인이다. 예를 들면 음식, 물, 공기 등이 여기에 속한다. 일차적 강화인과는 달리 조건화된 강화인이라고도 불리는 이차적 강화인은 행동의 빈도를 증가시키는 효과가 일차적 강화인과 연합됨으로써 생기는 강화인이다. 예를 들면, 돈이라는 것은 돈을 사용해 본 경험이 없는 어린이들에게는 아무런 소용이 없다. 그러나 좀 더 성장한 어린이들에게 돈은 다양한 종류의 일차적 강화인과 관련되어 있기 때문에 강화인으로서 효과가 있다. 돈과같이 다양한 종류의 일차적 강화인과 관련되어 있는 이차적 강화인을 일반화된 강화인이라 한다. 지금까지 언급한 강화인은 주로 환경상의 자극이나 사건 등의 물질적인 것을 의미한다. 그러나 물질적인 것이 아니라도 강화인의 역할을 할 수 있다. Premack은 물질적인 자극이 아닌 어떤 행동이 강화인의 역할을 할 수 있다는 사실을 발견하였다. Premack에 의하면, 발생 확률이 높은 행동은 발생 확률인 낮은 행동을 증가시키기 위한 강화인으로 사용할 수 있다. 예를 들어, 아이들에게 게임할 기회와 공부할 기회를 동시에 준다면 아마도 아이들은 게임하는 것을 더 좋아할 것이다. 여기서 게임하는 것은 발생 확률이 높은 행동이고 공부하는 것은 발생 확률이 낮은 행동이다. 이러한 프리맥의 원리에 따라 아이들로 하여금 공부를 더 하게 하기 위해서는 공부를 어느 정도 하고 난 후에 게임을 하게 해주면 공부하는 행동이 증가할 수 있다.
조작적 조건형성 (1)
2024. 7. 28. 21:59
반응형
반응형