강화계획. 어떤 방식으로 강화할 것인가를 다루는 부분이 강화계획이다. 미래의 반응이 증가할 수만 있다면 무엇이라도 강화물이 될 수 있지만, 강화계획에 따라 행동이 학습되는 속도, 패턴, 지속성 등은 달라진다. 매번 강화가 주어지는 계속적 강화 이외의 강화는 모두 간헐적 강화이다. 강화계획은 어떤 행동이 강화 받는 방식을 체계적으로 정리한 것으로, 적용하는 강화계획에 따라 학습이 다르게 나타난다. 즉, 반응이 일어날 때 일정한 시간 혹은 비율로 그 반응을 강화시키는 규정된 절차를 강화계획이라고 한다. 적절한 반응을 모두 강화하는 계속적 강화계획을 적용하면, 학습은 매우 빠르게 일어나지만 소거과정에 놓이면 그 반응도 빨리 소멸된다. 반면 간헐적 강화계획을 적용할 경우, 학습은 서서히 일어나지만 소거에 대한 저항도 커서 반응이 더 지속적으로 유지되는 경향이 있다. 강화계획에는 계속적 강화계획, 고정간격 강화계획, 고정비율 강화계획, 변동 간격 강화계획, 변동비율 강화계획 등이 있다. 계속적 강화계획이란 피험자가 목표 반응을 할 때마다 강화하는 것이다. 예컨대 착한 일을 할 때마다 매번 용돈을 주는 것은 계속 강화 계획이다. 간헐적 강화계획은 가끔씩만 강화를 제공하는 절차로 부분적 강화계획이라고도 한다. 간헐적 강화계획 중 고정비율 강화계획은 반응이 정해진 횟수만큼 일어난 뒤에 강화가 주어지는 것이다. 이 강화계획을 적용하면, 높은 비율의 반응이 나타나고 강화 바로 다음에는 흔히 반응이 줄어들어 짧게 쉬는 현상이 나타난다. 변동비율 강화계획은 어떤 행동의 평균 매 n번째 수행이 강화를 받지만 정확하게 몇 번째 반응에 대하여 강화가 이루어지는지는 알 수 없도록 설계되어 있다. 고정간격 강화계획이란 동일한 시간 간격 후에 발생한 행동에 강화를 제공하도록 계획한 간헐적 강화의 일종이다. 마지막으로 변동 간격 강화계획은 선행한 강화로부터 어느 정도 시간이 경화한 뒤에 나타나는 반응을 강화하는 것으로, 강화와 강화 간의 시간 간격은 일정하지 않고 임의로 정한 시간 범위 내에서 어떤 평균 시간을 중심으로 변한다. 변동 간격 강화계획에서의 반응학습은 느리면서도 꾸준한 특징을 보인다. 이들 중 학습에 가장 효과적인 것은 변동비율, 고정비율, 변동 가격, 고정간격 강화계획 순이다
혐오 조건형성. 쇼크나 고통스러운 소음과 같은 부적 또는 혐오적 사건들도 조작적 조건형성에서 흔히 사용된다. 처벌 훈련에서는 반응 뒤에 혐오자극 또는 사건이 뒤따르는데, 혐오자극은 이후의 반응을 약화하거나 억압하는 효과를 가진다. 처벌이 바람직하지 않은 반응 후에 일관성 있고 즉각적으로 주어지고 대안적 반응이 보상을 받는다면, 체벌은 바람직하지 않은 반응을 효과적으로 제거할 수 있다. 미로에서 먹이에 도달하기 위해 두 통로 중 가까운 통로를 선택하도록 학습된 쥐가 가까운 통로를 선택할 때 쇼크를 받개 되면 곧바로 먼 통로를 택하게 된다. 처벌이 가져오는 잠정적 억압이 쥐로 하여금 먼 통로를 택하도록 학습할 기회를 제공한다. 이 경우에 처벌은 정보적이기 때문에 행동의 방향을 바꾸는 효과적인 수단이 된다. 한편, 인간의 행동을 교정하기 위해 처벌 훈련을 적용하는 것이 항상 성공적인 것은 아니다. 예컨대, 교통 당국은 사고의 가능성을 위협이나 처벌로 사용함으로써 안전 행동을 증가시키고자 한다. '과속하면 교통사고로 사망할 수도 있다!'라는 경고문을 보자. 여기에서 문제는 여전히 살아 있는 거의 모든 운전자들이 과속하고도 죽지 않은 경험을 가지고 있다는 점이다. 그렇기 때문에 '만일 과속한다면 벌금을 물어야 한다.'로 바꾸지 않는 한, 과속은 조건형성으로 통제하기가 정말 어렵다. 그렇지만 이 경우에도 과속한 많은 운전자들이 경찰에게 잡히지도 않고 벌금도 내지 않는다. 따라서 처벌이 원하지 않는 반응을 억압할 수 있다고 하더라도 몇 가지 단점을 가지고 있다. 첫째, 처벌의 효과는 보상만큼 정보적이지 못하다. 보상은 근본적으로 "네가 한 것을 반복하라."고 알려준다. 반면, 처벌은 "그만두라."고 말하고 있지만 대안을 제시해 주지는 못한다. 따라서 유기체는 처벌받은 반응을 더욱 바람직하지 않은 반응으로 대치할 수도 있다. 둘째, 처벌의 부산물이 불행한 것일 수 있다. 고전적 조건형성을 통해서 처벌은 처벌하는 사람과 상황을 싫어하거나 무서워하게 만들기가 십상이다. 마지막으로 극단적이거나 고통스러운 처벌은 처음의 바람직하지 않은 행동보다도 더 심각한 공격행동을 유발할 수 있다.
도피 행동과 회피행동. 때때로 처벌 훈련이 바람직하지 않은 행동을 억제할 수 있다는 사실을 보았다. 그뿐만 아니라 혐오적 사건은 유기체가 새로운 반응을 학습하는 데에도 사용할 수 있다. 유기체는 진행 중인 혐오적 사건을 종료시키는 반응을 학습할 수 있다. 예컨대, 방에 고통스러운 큰 소음이 있다면 그 방을 나갈 수 있다. 이것을 도피 학습이라고 부른다. 흔히 도피 학습에는 회피학습이 뒤따른다. 즉, 유기체는 혐오적 사건이 시작하는 것 자체를 차단하는 반응을 학습하는 것이다. 예컨대, 특정한 방이 과거에 커다란 소음과 연합되어 있다면, 소음이 존재하지 않아도 그 방에서 도피한다. 동물의 도피 학습과 회피학습을 연구하기 위하여 심리학자들은 왕복 상자라고 부르는 장치를 사용해 왔다. 왕복 상자는 칸막이로 분리된 두 개의 방으로 이루어져 있다. 각 시행에서 동물이 한 방에 있고 어느 시점에서 경고 불빛이 반짝이고는 5초 후에 방바닥에 전류가 흐른다. 동물이 쇼크를 피하기 위해서는 칸막이를 뛰어넘어 다른 방으로 가야 한다. 처음에 쥐는 쇼크가 시작된 후에야 칸막이를 뛰어넘는다. 이것은 도피 학습이다. 도피 학습과 회피학습은 첫 번째 단계에는 고전적 조건형성을 수반한다. 즉, 경고 불빛(CS)과 쇼크(US)의 반복적인 짝짓기를 통해 동물은 불빛이 쇼크를 예언한다는 사실을 학습하고 그래서 불빛에 대한 반응으로 공포 조건 반응(CR) 보인다. 회피학습은 한 가지 수수께끼를 제시하는 것처럼 보인다. 즉, 만일 무조건 자극이 부재한 상태에서 조건 자극만 계속해서 주어지면 조건 반응이 사라진다는 사실을 우리는 알고 있다. 이것이 바로 지금의 경우에 해당하는 것으로 보인다. 일단 동물이 제때에 회피함으로써 쇼크를 사전에 피하는 방법을 학습하면, 더 이상 조건 자극 다음에 무조건 자극이 뒤따르지 않는다. 그렇다면 무엇이 동물로 하여금 칸막이를 뛰어넘도록 강화하는 것인가? 쇼크의 부재라고 말할 수 있겠지만, 이것은 '사건 없음'이다. 어떻게 '사건 없음'이 강화물로 작용할 수 있는 것인가? 이 수수께끼의 한 가지 해결책은 분석의 두 번째 단계가 도구적 조건형성을 수반하는 것을 이해하는 것이다. 동물은 이미 칸막이를 뛰어넘는 것이 혐오적 사건 즉 조건공포 자체를 제거한다는 것을 학습하였다. 따라서 '사건 없음'으로 보인 것이 실제로는 공포이며, 도피 행동은 이러한 공포를 감소시키기 때문에 강화되는 것이다. 이제 낙방과 같은 과거 경험으로 인해서 특정한 공포, 예컨대 시험 불안을 발달시킨 사람을 생각해 보자. 조건 반응은 자명종이 울려도 계속 잔다든가, 아니면 추가시험 날짜를 요청하여 시험 보는 것을 피함으로써 감소될 수 있다. 혐오 자극의 성공적인 감소는 회피행동을 강화하며, 미래에 그 행동을 강하게 만든다. 비록 이것이 일시적인 안도감을 줄 수 있더라도, 이러한 회피행동의 결말은 궁극적으로 폐해적인 것이 명백하다. 그렇다면 시험 불안이 진정한 문제일 때 어떻게 해야 할까? 우리의 분석을 보면 시험에 직면하지 않는 한 이러한 반응은 더 이상 사라지지 않는다는 사실이 명확하다. 시험 불안에 시달리는 학생들에게는 자신의 공포반응이 과거 사건에 대한 학습된 반응이며, 성공적인 시험의 반복적인 경험을 통해 해소될 수 있기 때문에 그렇게 해야만 한다는 사실을 알려주어야 한다.
조작적 조건형성 (2)
2024. 7. 29. 20:12
반응형
반응형