조작적 조건형성이란 무엇인가

조작적 조건형성은 아주 단순한 원리에서 출발합니다.
👉 보상이 뒤따르는 행동은 증가하고, 처벌이 주어지는 행동은 감소한다
끝입니다.
생각보다 인간은 합리적이라기보다, 보상에 충실합니다.
기본 구조: 수반성(Contingency)
조작적 조건형성은 세 가지 요소의 연결 구조로 설명됩니다.
- 자극(Stimulus)
- 행동(Response)
- 결과(Consequence)
이 세 가지가 연결된 구조를 수반성이라고 합니다.
즉,
👉 특정 자극 상황에서 어떤 행동을 하면 어떤 결과가 따른다
이 패턴이 반복되면서 행동이 학습됩니다.
강화: 행동을 증가시키는 힘
강화는 행동을 습득하게 하고 그 빈도를 증가시키는 과정입니다.
강화의 종류
- 정적 강화: 좋아하는 것을 제공
예: 칭찬, 보상, 돈 - 부적 강화: 싫은 것을 제거
예: 공부하면 잔소리 안 듣기
👉 둘 다 행동을 증가시킵니다.
부적 강화는 처벌이 아닙니다. 헷갈리면 시험에서 탈락합니다. [처벌의 개념은 하단에 있습니다]
강화물의 종류
- 일차 강화물: 학습 없이도 효과 있음
예: 음식, 물 - 이차 강화물: 학습을 통해 의미를 가짐
예: 돈 - 사회적 강화물: 타인의 반응
예: 칭찬, 인정
강화 스케줄 (이게 핵심)
강화는 언제 주느냐에 따라 행동 유지력이 달라집니다.
간격 기반
- 고정간격(FI): 일정 시간마다
예: 월급 - 변동간격(VI): 불규칙 시간
예: 문자, 낚시
비율 기반
- 고정비율(FR): 일정 횟수마다
예: 성과급 - 변동비율(VR): 불규칙 횟수
예: 도박
👉 변동비율이 가장 강력합니다
그래서 사람들이 슬롯머신을 못 끊습니다.
부분강화효과
강화를 매번 주는 것보다 가끔 주는 것이 더 강력합니다.
👉 행동이 더 오래 지속됨 (소거가 느림)
인간은 불확실성에 중독됩니다.
처벌: 행동을 감소시키는 힘
처벌은 행동을 제거하거나 빈도를 감소시키는 과정입니다.
부적강화와 처벌 차이는 부적 강화의 경우 싫은 것을 피하기 위해 행동이 ‘증가’하는 것이고, 처벌은 싫은 것을 피하기 위해 행동이 ‘감소’하는 것입니다.
(부적강화 : 엄마의 잔소리를 피하기 위해 방 청소를 함 / 처벌 : 엄마의 잔소리를 피하기 위해 방을 어지르지 않음)
처벌은 효과적으로 쓰려면 조건이 있습니다.
- 최소강제: 과도한 처벌 금지
- 즉시성: 행동 직후 적용
- 일관성: 항상 같은 기준 적용
- 일반화: 다양한 상황에 적용
- 언어적 설명: 왜 처벌받는지 설명
- 대안 행동 제시: 대신 무엇을 해야 하는지 제시
처벌은 쉽지만, 잘못 쓰면 관계가 먼저 망가집니다.
소거
강화가 중단되면 행동은 점차 사라집니다.
👉 강화의 반대 개념
예:
- 관심 받던 행동 → 무시 → 사라짐
그래서 악플러는 무시가 답입니다
변별 자극
보상이 가능함을 암시하는 자극
예:
- 알림음 → 메시지 있음 → 확인 행동 증가
행동조성법 (연속적 접근)
복잡한 행동은 한 번에 학습되지 않습니다.
👉 목표 행동에 가까운 행동을 보일 때마다 강화
결과:
👉 점진적으로 목표 행동 완성
예:
- 공 물어오기 강화 → 공 물어와서 손에 놔주기 강화 → 공 물어와서 손에 놔주고 기다리기 강화
연쇄법
구별되는 여러 행동을 연결해서 그 순서를 학습시키고 하나의 행동 패턴으로 만듭니다.
예:
👉 손 씻기 → 양치 → 세수 → 자기
용암법(Fading)
독립적으로 수행할 수 있도록 도움을 점점 줄여가는 방식
👉 처음엔 도움 → 점점 제거 → 독립 수행
자동조성
고전적 조건형성 상황에서 시작된 반응이
👉 우연히 조작적 조건형성으로 연결됨
즉,
👉 조건반응이 행동으로 확장. [고전적 조건형성에 대해 먼저 알고 싶다면? 👉고전적 조건형성 총정리]
예: 비둘기한테 이렇게 했다고 칩시다:
- 불빛 켜짐 (고전적 조건형성 시작)
- 먹이 자동으로 나옴
- 비둘기는 자연스럽게 고개를 쪼는 반응 (자동 반응)
👉 여기까지는 그냥 조건반응입니다.
근데 문제는 여기서 시작됩니다:
- 비둘기가 우연히 바닥을 쪼는 행동을 함
- 그 타이밍에 먹이가 또 나옴
👉 비둘기 입장:
“아? 내가 쪼니까 먹이가 나오네?”
결과:
👉 쪼는 행동이 강화됨 (조작적 조건형성)
손다이크의 효과의 법칙
고양이 실험으로 유명한데요,
손다이크의 고양이 실험 상황:
고양이를 퍼즐 상자에 넣어둠
상자 밖에는 먹이가 있음
상자를 열려면
👉 특정 레버를 눌러야 함
처음 상태
고양이:
- 긁고
- 울고
- 뛰고
- 발버둥 침
👉 아무 행동이나 다 해봄 (랜덤)
중요한 순간
우연히…
👉 레버를 누름
👉 문 열림
👉 먹이 먹음
🔁 반복 실험
다시 상자에 넣음
처음엔 또 난리침
근데 점점:
- 쓸데없는 행동 ↓
- 레버 누르는 행동 ↑
최종 결과
👉 거의 바로 레버 누름
🧠 핵심 구조
- 우연히 성공한 행동 → 보상 받음
- 보상 받은 행동 → 강화됨
- 다른 행동 → 자연스럽게 사라짐
인간 버전 (더 잔인하게 현실적)
블로그를 생각해봅시다:
- 글 여러 개 씀
- 어떤 글 하나가 터짐
👉 그럼?
👉 그 스타일만 계속 씀
즉,
“성공한 행동만 살아남는다”
회피학습의 2요인이론
Mowrer 이론
- 공포 형성 → 고전적 조건형성
- 공포 유지 → 조작적 조건형성(회피를 통한 부적 강화)
즉,
👉 고전적 조건형성으로 형성된 공포를 회피하는 회피 행동이 부적 강화의 효과로 유지되는 것입니다.
예:
- 비행기 터뷸런스→ 비행기 공포 형성 → 비행기 회피(비행기를 타지 않음) → 공포 감소 → 회피 강화(비행기를 영원히 타지 않음)
Lifetestlab 관점 정리
조작적 조건형성은 이미 우리 일상에 적용되어 있습니다.
- SNS 좋아요 → 계속 업로드
- 엄마 잔소리 피하기 위해서 → 청소 열심히 함
우리는 선택한다고 생각하지만,
사실은 강화 스케줄에 따라 움직입니다.
결론
조작적 조건형성은 행동을 설계하는 가장 강력한 도구입니다.
👉 무엇을 보상하고 무엇을 무시할 것인가
이것만 바꿔도 행동은 바뀝니다.
👉 다음 글에서는 성격장애의 종류에 대해 다뤄보겠습니다.
[coming soon]
- 본 글은 개인적인 경험과 데이터 분석을 바탕으로 작성되었으며, 개개인의 상태와 환경에 따라 체감은 달라질 수 있습니다.