학습과 강화이론.

학습과 강화이론

많은 학습원리는 인간과 동물에게 모두 적용할 수 있는 원리이다(보편성 추구).
1. 학습이란 무엇인가? “경험을 통하여 얻어지는 행동과 지식에서의 비교적 영속적인 변화” 진화론을 바탕으로 학습은 환경에 적응하는 수단이자 동물과 인간을 하나의 연속선상에서 연구하는 것이다. 다윈(Darwin, 1809~1882) 많은 학습원리는 인간과 동물에게 모두 적용할 수 있는 원리이다(보편성 추구). 고전적 조건화 조작적 조건화 5. 학습

2. 고전적 조건화 반응 파블로프(Ivan Petrovich Pavlov, 1849~1936) 자극
개의 소화계 생리에 관한 연구로 1904년에 노벨생리학 상을 수상 고전적 조건화(classical conditioning), 반응 조건화(respondent conditioning), 파블로프 조건화(povlovian conditioning) 고전적 조건화는 처음에 어떤 기능도 하지 않았던 자극(stimulus)이 특정 반응(response)을 유출할 수 있다는 것을 말한다. 파블로프와 그의 실험용 개 자극 반응 연합 5. 학습

2. 고전적 조건화 파블로프의 고전적 조건화 실험 5. 학습

2. 고전적 조건화 1) 조건반응의 형성 고전적 조건화를 시도하기 위해서 반사 반응(reflexive response)을 유출시키는 자극이 필요하다. 무조건 자극(unconditioned stimulus: UCS) 무조건 반응(unconditioned response: UCR) ex) 파블로프의 실험에서 고깃가루: UCS, 타액분비: UCR. 무조건 반응과 중립 자극(neutral stimulus: NS)을 연합하는 과정 조건 자극(conditioned stimulus: CS) 조건 반응(conditioned response: CR) ex) 파블로프의 실험에서 중립자극으로 종소리가 사용되었다. 종소리와 무조건 자극이 여러 차례 짝을 지어 제시된 후, 종소리는 그 자체로서 타액 분비를 일으킬 수 있는 조건 자극(CS)이 되었고 이때 조건 자극에서 나온 타액분비는 조건 반응(CR)이 된다. 5. 학습

2. 고전적 조건화 1) 조건반응의 형성 조건 반응 형성의 실례(지연조건화) 5. 학습

2. 고전적 조건화 1) 조건반응의 형성 조건화 과정의 종류 지연조건형성 흔적조건형성 동시조건형성 후진조건형성 5. 학습 US
① CS ② CS ③ CS ④ CS ⑤ CS 5. 학습

2. 고전적 조건화 2) 고차적 조건화 이차적 조건화(second-order conditioning)
어떤 중립 자극이 고전적 조건화 과정을 통하여 조건 자극이 되었을 때, 이 조건 자극이 또 다른 중립 자극과 반복적으로 연합되면, 이 새로운 중립 자극도 조건반응을 일으키는 또 하나의 조건 자극이 될 수 있다. 이차 이상의 조건화: 고차적 조건화(higher-order conditioning) 5. 학습

2. 고전적 조건화 2) 고차적 조건화 ex) 파블로프의 실험: 조건 자극 - 종소리일 때, 타액 분비
또 다른 중립자극인 빨간 불빛을 종소리와 반복적으로 연합시킨다. 불빛도 타액 분비를 일으키는 조건 자극이 된다(이차적 조건화). 이 과정을 반복하여 빨간 불빛을 또 다른 중립 자극과 연합시키면 삼차적 조건화도 가능하지만 일반적으로 그 이상은 불가능하다. : 삼차적 조건화부터는 소거의 과정이 함께 일어나기 때문이다. 5. 학습

2. 고전적 조건화 3) 소거와 자발적 회복 소거(extinction): 무조건 자극이 조건 자극과 연합되지 않음으로써 조건 자극이 반응을 일으키지 못하는 현상 소거 과정을 통하여 일단 조건 자극이 능력을 상실한 것으로 보이더라도 어느 정도 시간이 지난 후 조건 자극을 제시하면 다시 조건 반응이 일어난다. 소거 후에 이전의 조건 자극을 다시 제시하면 이러한 현상이 일반적으로 나타나는데 이것을 자발적 회복이라고 한다. 5. 학습

2. 고전적 조건화 3) 소거와 자발적 회복 5. 학습

2. 고전적 조건화 4) 자극 일반화와 변별 자극 일반화(stimulus generalization)
어떤 자극이 일단 조건 자극으로서 형성되고 나면, 이 자극과 유사한 다른 자극들도 무조건 자극과 연합된 적이 없음에도 조건 반응을 일으킬 수 있다. ex) 벌에 쏘인 경험, 이로 인해 곤충에 대한 두려움이 생김. “자라보고 놀란 가슴 솥뚜껑보고 놀란다.” 5. 학습

2. 고전적 조건화 4) 자극 일반화와 변별 변별(discrimination)
자극 일반화와 정반대. 자극 일반화 현상은 변별 과정을 통해 없어질 수도 있다. ex) 벌로 인해 다른 곤충에 대한 두려움이 생기지만, 다른 곤충들로 인해서는 고통이 없다는 것을 알게 될 때, 두려움에 대한 다양한 생리적인 반응이 없어지게 된다. 5. 학습

2. 고전적 조건화 5) 실생활에서의 고전적 조건화 현상과 그 적용
고전적 조건화에는 학교 공포증, 미각혐오학습, 체계적 둔감법 등이 있다. 실생활에서의 고전적 조건화의 예(1): 병원에 간 어린아이들은 주사를 맞기도 전에 진찰만 하려 해도 우는 현상 실생활에서의 고전적 조건화의 예(2): 어머니의 손맛인지, 다시다 광고의 효과인지~ 5. 학습

3. 조작적 조건화 스키너에 의해 가장 체계적으로 연구되었고, 여기에는 손다이크의 영향이 많았다.
손다이크(Thorndike, 1874~1949): 도구적 조건화 자극과 반응 연구 중, 행동과 그 결과의 관계성을 연구하였다. 반복적인 시행은 문제상황과 대상이 보인 특정한 반응 간의 연결 또는 연합이 일어난다. 5. 학습

3. 조작적 조건화 효과의 법칙 - 보상이 따르는 자극과 반응 간의 결합은 강해지고, 그렇지 못한 자극과 반응 간의 결합은 약해진다. 연습의 법칙 - 연습이나 사용 횟수가 많을수록 학습은 강화된다(빈도의 법칙). 준비도의 법칙 - 학습할 준비 또는 목표지향적인 행동을 할 준비가 되어 있을 때 학습이 만족스럽게 이루어진다. 5. 학습

손다이크의 도구적 조건화: 문제상자(puzzle box)
(도구를 사용하여 행동이 어떤 결과를 초래) 야~~옹 페달을 밟음 상자에서 탈출 연 합 먹이를 얻음 만족스러운 결과 먹이를 먹는 시간이 단축: 효과의 법칙 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 행동이 그 결과에 의해 증가되거나 약화되는 절차
행동이 환경에 능동적인 조작을 가함. 행동은 결과를 초래 정적 강화(positive reinforcement) 부적 강화(negative reinforcement) 소거(extinction) 처벌(punishment) 5. 학습

Skinner 상자 쥐가 여러 가지 행동을 하다가 지렛대를 누르면(반응) 먹이가 접시로 떨어진다(강화)
이런 과정이 여러 번 반복되면 쥐는 상자에 들어가자마자 바로 지렛대를 누른다(학습). R: 반응 행동 S: 자극 결과 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 Skinner box 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 정적 강화
- 어떤 특정한 행동이 나오고 이 행동 뒤에 즉각적으로 주어지는 자극(좋아하는 것)의 제시에 의해 이후의 특정 행동의 빈도가 증가되는 과정 ex) 어머니의 심부름을 한 어린이에게 과자를 선물로 줌으로써 계속 심부름을 잘하게 한다. 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 부적 강화: 행동의 결과로서 어떤 자극(싫어하는 것)이 없어짐으로 특정 행동의 빈도가 증가하게 되는 과정 도피행동: 이미 어떤 혐오 자극이 존재하고 있을 때 특정 행동으로 혐오자극을 없애는 행동. ex) 방에 냄새가 날 때 창문을 여는 것 2. 회피행동: 미리 어떤 행동을 하여 혐오적인 상황이 닥치지 않게 하는 행동 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 강화인의 종류 무조건 강화인: 일차적 강화인 조건화된 강화인: 이차적 강화인
ex) 음식, 물, 공기 조건화된 강화인: 이차적 강화인 ex) 돈  어린아이들에게 아무런 소용이 없다. 하지만 다양한 종류의 일차적 강화인과 관련되면서 강화인의 효과를 가진다. 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 강화인의 종류 프리맥 효과(Premack, 1962)
아이들에게 만화 볼 기회와 공부할 기회를 동시에 준다.  아이들은 만화를 더 많이 볼 것이다. 2. 따라서 아이들이 공부를 더 하도록(저 확률 행동) 만들기 위해서는 공부를 한 후에 만화를 보게 해 주면(고 확률 행동), 공부하는 행동이 증가한다. 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 강화스케줄 무엇이 강화물이 될 수 있는가?
미래의 반응이 증가할 수만 있다면 무엇이라도 강화물이 될 수 있다. 계속적 강화 이외에도 수없이 많은 종류가 있다. 하지만, 강화스케줄에 따라, 행동이 학습되는 속도, 패턴, 지속성 등은 달라진다. 매번 강화가 주어지는 계속적 강화 이외의 강화는 모두 간헐적 강화(intermittent reinforcement)이다. 5. 학습

계속적 강화: 매번 강화 주어짐(현실에선 불가능)
3. 조작적 조건화 1) 조작적 조건화의 원리 계속적 강화: 매번 강화 주어짐(현실에선 불가능) 시간지연 강화빈도 고정간격 변동간격 고정비율 변동비율 간헐적 강화 강 화 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 네 가지 기본적인 강화 스케줄의 반응 패턴 250 500 750 1000 10
고정간격 반 응 빈 도 250 500 750 1000 10 20 30 40 50 60 70 80 변동비율 고정비율 변동간격 시간(분) 5. 학습

3. 조작적 조건화 강화계획 고정간격 변동간격 고정비율 변동비율 간격강화계획 비율강화계획 계속적 강화 간헐적강화 5. 학습
수학문제 풀 때, 5분 간격으로 고정적으로 강화를 준다.(예 : 주급,월급) 고정간격 변동간격 5분 안에 아무때나 한 번의 강화를 준다.(예 : 낚시) 고정비율 학생이 10문제를 풀 때 마다 한 번의 강화를 준다.(예 : 성과급 보수제도) 변동비율 학생이 2문제를 풀면 한 번, 3문제를 풀면 또 한 번, 이런 식으로 강화를 준다.(예 : 도박) 강화 진행 중 일정 시간간격에 기준을 두고 강화를 준다. 간격강화계획 비율강화계획 강화 진행 중 반응 횟수에 기준을 두고 강화를 준다. 계속적 강화 손들 때마다 지명하여 모든 반응에 강화를 준다. 간헐적강화 손들 때, 가끔씩 지명, 특정한 반응에만 강화를 준다. 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 소거 강화에의 행동의 빈도가 증가된 경우 강화인의 제공이 감소됨에 따라서 그 행동의 빈도가 감소하게 되는 것 조작적 조건화에서 소거란 강화인이 더 이상 나오지 않게 될 때 행동의 빈도가 감소하는 현상이다. ex) 쥐가 지렛대를 눌러도 음식이 나오지 않자, 쥐가 지렛대를 누르는 행동이 점차 감소하여 지렛대를 누르는 행동이 완전히 나타나지 않았다. ※ 이 소거는 이전의 행동이 어떠한 강화 계획에 의해 강화되었는가에 따라 그 속도가 달라진다. 또한 조작적 조건화에서도 자발적 회복 현상이 나타난다. 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 소거 강화 계획 중, 소거가 가장 늦은 강화계획은?
정답 : 변동비율의 강화가 소거가 가장 늦다(도박, 미신적행동). 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 처벌 처벌은 행동의 빈도를 감소시키는 또 하나의 방법이다.
특정 행동에 즉각적으로 뒤따라 나오는 자극의 변화에 의해 이후의 행동의 빈도가 감소하게 되는 과정을 말한다. 행동의 감소를 가져와야만 한다. ex) 혐오적 자극. 정적처벌(매) - 부적처벌(과속 벌금: 반응비용) 5. 학습

3. 조작적 조건화 1) 조작적 조건화의 원리 처벌 처벌 시 고려할 사항 반응이 일어난 후 즉각적으로 주어져야 한다.
반응이 나올 때마다 매번 처벌이 주어져야 한다. 처벌의 강도는 처음부터 아주 강해야 한다. 처벌받는 행동에 대해 대안적 행동이 있을 때 처벌의 효과는 커진다. 처벌받는 행동보다 대안행동을 제시해야 한다. 5. 학습

3. 조작적 조건화 2) 조형 발생빈도가 없다.  강화적용의 기회가 없다.
학습시키고자 하는 최종 목표행동이 현재 발생하지 않기 때문에, 유사한 행동이 나올 때 강화를 한다. 그리고 이 유사행동이 강화되어 빈도가 늘어나면, 강화를 중단하고(소거가 이루어짐), 최종 목표행동에 더 가까운 유사행동에서 다시 강화를 한다. ex) 아이가 ‘엄마’를 발음할 때, 어 엄  엄므  엄마 5. 학습

새로운 행동은 조형과정을 통해 학습되는 것이다.
3. 조작적 조건화 2) 조형 새로운 행동은 조형과정을 통해 학습되는 것이다. 목표행동이 나올 때까지… 테니스 수영 운전학습 5. 학습

3. 조작적 조건화 3) 자극 통제 ‘사전자극’이라고 하는 행동 이전의 자극상황이 행동을 미리 통제하는 현상 5. 학습
20,000 높음 낮음 10,000(S+) 훈련자극(시험자극, Hz) 반 응 비 율 부분적 자극통제 완전한 무자극통제 자극 일반화의 도식적 표현 본래 자극과 유사성이 클수록 자극통제의 정도는 높아지며, 반대로 유사성이 낮을수록 자극통제의 정도가 낮아짐을 알 수 있다. 5. 학습

3. 조작적 조건화 3) 자극 통제 자극 일반화: 본래의 변별 자극과 완전히 동일하지 않더라도 그와 유사한 자극이 행동을 통제하게 되는 현상 사전자극: 불빛의 색깔 자극 일반화 VS 자극 변별화 일반화의 예: 모든 성인 남성을 ‘아빠’라고 부르는 어린아이 변별화의 예: 오직 자신의 아버지만을 ‘아빠’라고 부르는 어린아이 5. 학습

3. 조작적 조건화 4) 규칙 통제 유관 형성 행동: 강화나 처벌과 같은 행동의 결과에 직접적으로 노출됨으로써 통제되는 행동
규칙 통제 행동: 행동과 결과의 관계성에 대한 규칙  행동 형성 ex) 공장의 작업장에 근무하는 신입근로자에게 고압 전선을 손으로 만지지 말아야 하는 행동은 학습을 통해 익힐 수는 없다.  규칙에 의해 행동을 통제한다. 습득이 빠르지만, 완전하지 못하다. 5. 학습

3. 조작적 조건화 5) 조작적 조건화의 응용 사회 – 안전벨트를 매게 하여(피자 스티커 그림책으로 강화) 자동차 사고 부상/사망률 감소 교육 - 학생들의 문제 행동 감소 산업 - 결근율 감소, 생산성 향상, 안전사고 감소 환경 - 쓰레기 재활용 증가 임상 - 정신병원에서의 토큰 이코노미 (token economy) 그 외 - 동물을 훈련시켜 인명 구조에 이용. 금연 시, 술자리나 흡연 구역에 가지 않으면 금연이 쉬워짐. 5. 학습

학습과 강화이론.

Similar presentations

Presentation on theme: "학습과 강화이론."— Presentation transcript:

Similar presentations

About project

지원

로그인

Auth with social network:

학습과 강화이론.

Similar presentations

Presentation on theme: "학습과 강화이론."— Presentation transcript:

Similar presentations

About project

지원