심리평가
강의 개요 및 목표 심리검사의 원리 신뢰도, 타당도, 표준화, 객관성, 타당도일반화 심리검사의 역사, 검사의 형태, 윤리적 문제 검사의 내용 지능검사, 기계적성검사, 감각/운동능력검사, 성격검사, 성실성 검사, 신체능력검사, 다중적성검사집, 컴퓨터를 이용한 검사 검사방법 면접(구조화 면접, 상황적 면접) 평가센터 작업표본과 상황연습 생활사 정보 추천서 약물검사 새로운(논쟁이 되는) 평가방법들 거짓말탐지기, 필적분석, 정서지능검사 종합
예측변인(검사)의 질에 대한 평가: 신뢰도 예측변인: 준거를 예측할 때 사용되는 변인(독립변인) 기본적으로 예측변인은 신뢰도(reliability)와 타당도(validity)가 있어야 함 신뢰도 측정의 일관성/안정성 신뢰도의 유형 (1) 검사-재검사 신뢰도 (2) 동등형 신뢰도 (3) 내적일치 신뢰도 반분신뢰도는 내적일치 신뢰도의 특수한 형태 (4) 평가자간 신뢰도
예측변인의 질에 대한 평가: 신뢰도 검사-재검사 신뢰도(test-retest reliability) 동일집단에 동일 검사 시행 시간 경과에 따른 안정성 반영: 이때의 두 검사 점수 사이의 상관을 안정도 계수(coefficient of stability)라 부름 얼마나 신뢰도 계수가 커야 어떤 검사가 신뢰로운지에 대한 절대적 기준은 없으나 높을수록 좋음 문제: 검사 사이의 시간 간격: 짧을수록 신뢰도 증가, 연습효과, carry-over 효과 동등형 신뢰도(equivalent form reliability): parallel-form, alternative-form이라고도 함 동일한 내용을 측정하는 검사를 두 벌 만들어 측정하는 것 이때 신뢰도 계수를 동등 계수(coefficient of equivalence)라고 부름 문제: 같은 내용을 측정하는 문항들을 더 많이 만들어야 하기 때문에 오염의 가능성 있음(실제로 잘 사용 안됨)
예측변인의 질에 대한 평가 내적일치 신뢰도(internal-consistency reliability): 검사가 얼마나 동질적인 내용을 포함하고 있는지를 측정 반분신뢰도(split-haft reliability): 한 검사를 반으로 나누어서(대개의 경우 홀짝으로) 실시 내적일치 신뢰도의 특수한 경우 문제: 검사의 길이를 반으로 줄였기 때문에 신뢰도가 떨어짐(그림 참조) 일반적으로 다른 조건이 동일하다면 검사의 길이 즉, 문항수가 증가할수록 신뢰도도 증가함
예측변인의 질에 대한 평가 내적일치 신뢰도 평가자간 신뢰도(inter-rater reliability) 문항 하나를 검사 하나로 취급 각 문항간 상관의 평균이 내적일치 신뢰도가 됨 검사가 동질적인지의 여부를 밝힐 수 있음(이질적이라면 서로 다른 요인들이 검사에 포함되어 있는 것 -> 요인분석) KR-20(점수가 이분적일 경우), Cronbach 알파(점수가 이분적이거나 비교적 연속적일 경우에 모두 사용) 평가자간 신뢰도(inter-rater reliability) 평가자들 사이의 일치성 정도 평가 주관적 평가에서 중요시되는 신뢰도(편파나 왜곡 등) 평가자내 신뢰도(inter-rater reliability)와 같이 고려할 것
예측변인의 질에 대한 평가: 타당도 타당도: 측정하고자 하는 내용을 제대로 측정했는가. 즉, 검사 점수로부터 도출되는 추론의 정확성과 적절성에 의해 검사를 평가하는 기준 신뢰도는 측정도구 자체와 관련있으나(즉, 신뢰도는 검사 자체내에서 충족되어야 하는 조건), 타당도는 검사의 사용과 관련되어 있음 어떤 검사는 종업원의 생산성을 예측하는 데는 타당하더라도 종업원의 결근을 예측하는 데는 타당하지 않을 수 있음 구성개념(이론적.추상적)을 얼마나 정확하고 충실하게 실제 측정치로 반영할 수 있는가가 근본적인 문제: 여러 타당도가 있지만 결국 구성타당도의 문제임 타당도의 유형 (1) 구성관련 타당도 (2) 준거관련 타당도 (3) 내용관련 타당도
구성관련 타당도(구성타당도): 구성개념과 실제 검사 사이의 관계 검사가 측정하고자 하는 구성개념을 얼마나 충실하고 정확하게 측정하고 있는지를 나타내는 정도 수렴타당도(convergent validity): 동일한 구성개념을 측정한다고 여겨지는 검사들 사이에는 높은 상관이 있어야 함 예: 지능(구성개념)-지능검사1과 지능검사2….. 변별타당도(discriminant validity or 확산타당도 divergent validity): 관련없는 변인들과는 상관이 낮아야 함 예: 지능(구성개념)-지능검사1과 눈의 색깔
구성관련 타당도(구성타당도): 구성개념과 실제 검사 사이의 관계 그림에서 구성개념1(지능), X(지능검사), 구성개념2(직무수행), Y(상사의 평가) 구성타당도를 나타낸 것은? 연결 2와 연결4 만일 직무수행에 관한 이론을 구성하고자 한다면 어디에 관심을 가져야 하나? 연결 3(하지만 모름->연결 1을 통해 추론) 실제 인사선발과정에서 사용하는 추론 방식은? 연결 5: 예를 들어 g와 수행 항상 실증적 수준인 X와 Y를 다루지만 궁극적으로는 개념적 수준인 구성개념 1과2에 대해 추론하기를 원함-이러한 추론의 정확성을 입증하려는 과정이 구성타당화임
준거관련 타당도: 예측변인과 준거자료의 수집 시점의 문제 준거관련 타당도: 예측변인과 준거자료의 수집 시점의 문제 구성타당도를 나타내는 다른 방식임 예측변인이 준거와 얼마나 관련되는가의 문제 동시타당도(concurrent validity): 예측변인과 준거를 동시에 측정(예: 특정 수행검사-생산성 비교) 이 검사가 준거를 예측할 수 있다는 지식에 근거하여 나중에 이 검사를 사용하기 위함 예언타당도(predictive validity): 예측변인 정보로 미래의 준거를 예측하기 위해 사용(예: 고등학교 성적->대학 성적 예언)
준거관련 타당도: 예측변인과 준거자료의 수집 시점의 문제 따라서 준거관련 타당도는 예측변인점수와 준거점수 모두를 가지고 있는 종업원 표본에 대해 기초하여 이 둘 사이의 관계가 있는지 검토한 후, 어떤 관계가 존재한다면 새로운 지원자들의 준거점수를 모르더라도 예측변인 점수에 기초하여 지원자를 선발할 수 있음 타당도 계수도 높으면 높을수록 좋지만 일반적으로 신뢰도 계수에 비해 낮음-타당도계수가 크지 않더라도 나쁜 것은 아님(많은 변인들이 개입되어 있으므로) 설명력은 r2로 계산 일반적으로 특정 예측변인들은 특정 준거를 예언하는데만 타당
내용관련 타당도: 예측변인의 대표성 구성타당도를 나타내는 또 다른 방식 측정하고자 하는 행동(내용)을 얼마나 잘 대표하는 것으로 구성되어 있는가 역사적으로 학업 성취도 검사와 밀접하게 관련됨 예: 초등수학: 미적분은 내용적으로 타당하지 않음 세계사: 지역, 시대, 주제(경제, 사회, 문화 등) 포함 직무분석과 밀접한 관계가 있음 내용타당도(content validity) 전문가가 판단 상관계수를 사용하지 않음: 내용타당도 비율 = [(Ne-N/2)]/(N/2) 안면타당도(face validity): 일반이의 판단에 기초한 타당도 일반적으로 내용타당도가 더 중요: 그러나 검사 결과를 인정할 지의 문제와 같이 일반인의 판단이 중요할 수 있음(소송 문제)
타당도와 관련된 기타 고려 사항들 타당도 이해의 네 가지 주의점 타당도는 피험자 집단에 사용된 측정도구나 검사에 의하여 얻어진 검사 결과의 해석에 대한 적합성이지 검사 자체와 관련된 것이 아니다. 그러므로 편의상 검사의 타당도라 표현하지만 정확히 말하여 검사 결과로부터 만들어진 해석에 대한 타당성을 말하는 것이다 타당도는 정도의 문제다. 타당도가 있다 혹은 없다로 말하는 것이 아니라 어느 정도, 즉 낮다, 적절하다, 높다 등으로 표현하여야 한다 타당도는 특별한 목적이나 해석에 제한된다. 즉 한 검사가 모든 목적에 부합할 수 없듯이 이 검사는 무엇을 측정하는데 타당하다고 표현하여야 한다 타당도는 단일한 개념이다. 다양한 종류의 근거에 기초한 단일한 개념으로 타당도가 해석되어야 한다(예를 들어, 재판에서 배심원들의 판단은 다양한 종류의 증거에 의존. 즉, 타당도는 모든 증거물의 총합으로 비유 가능)
예측변인의 구분/심리검사와 문항집 예측변인의 구분 결국 예측변인이란 개인의 직무수행 성공여부를 결정하기 위해 개인을 어떻게 평가할 것인가의 문제 예측변인의 차원(1) : 측정하고자 하는 심리적 구성개념을 직접적으로 측정할 것인가 아니면 직무수행의 일부(행동표집)를 측정할 것인가 예: 기계이해력:지필검사(이해 정도는 측정할 수 있지만 기계를 다루는 능력은 직접 측정 못함) 행동표집(“이 기계가 고장난 것 같다. 문제를 찾아 고쳐봐라”): 기계를 다루는 능력은 직접 측정 가능하나 적용범위가 제한적. 또한 개인의 현재 능력만 측정 가능하고 잠재력이나 발전 가능성은 측정 못함
예측변인의 구분/심리검사와 문항집 예측변인의 차원(2): 개인의 현재 상태 혹은 과거 정보의 측정 심리검사와 문항집 현재 상태(채용장면에서 개인이 보이는 행동) 과거 정보(추천서 등) 현재 상태와 과거 정보를 모두 파악할 수 있음 심리검사와 문항집 심리검사(test): 정답이 있음 문항집(inventories): 정답이 없이 해석만 가능 일반적으로 두 종류를 모두 검사 또는 심리검사라 통칭함
심리검사의 역사 Galton: 신체적 특징의 유전적 관련성, 평균으로의 회귀, 최초의 체계적 측정에 대한 과학자 Cattel: mental test 개념 사용. 초기 지능검사(감각변별력, 반응시간 등) 고안 Ebbinghaus: 산수와 문장 완성 검사(아동) Binet: 정신지체아 연구, 지능검사의 효시, 정신연령/실제 연령 개념, 판단, 이해,추론 영역으로 30개의 지능검사 문항 개발, 우리나라 지능검사의 효시(고대-Binet검사에 영향) Terman: IQ (Intelligence Quotient) 사용 초창기는 주로 지능에 관심을 둠. 이후에 적성, 능력, 흥미, 성격 등으로 확장
검사의 형태 속도검사(speed test) vs. 역량검사(power test) 비용과 시간의 문제/ 통제가능성의 문제: 서로 교환적임 지필검사 vs. 수행검사 보통 두 가지 검사를 병행(예: 운전면허검사) 검사에 관한 정보의 출처: 정신측정연감(Mental Measurement Yearbook: MMY)
검사에서의 윤리적 문제 미국 APA에서 정한 윤리강령에 기반 Licensed test user: 산업/조직전문가들은 임상전문가보다 덜 엄격. 그러나 검사 사용 자격 제한 보다 검사 사용에 대한 교육이 중요 Test publisher: 견본 무료 배포 문제(제한을 두고 있음) Privacy(사생활 침해): 검사의 본래 목적과 관련없는 내용을 질문하거나 사적인 질문은 하지 말아야 함 Confidentiality(비밀보장): 피검자가 허락하지 않을 경우 검사 정보는 비공개 되어야 함 정보 접근성/정보의 유지: 컴퓨터에 기록이 있을 때의 문제(비밀보장과 관련하여 예를 들면 과거의 학적부 공개)
검사의 내용: 인사선발 방법 혹은 예측변인들 지능검사 기계적성검사 감각 및 운동능력검사 성격검사 성실성 검사 신체능력검사 검사의 내용: 인사선발 방법 혹은 예측변인들 지능검사 기계적성검사 감각 및 운동능력검사 성격검사 성실성 검사 신체능력검사 다중적성검사 컴퓨터를 이용한 검사 면접 평가센터 작업표본과 상황연습 생활사 정보 추천서 약물검사 거짓말탐지기 필적분석 정서지능검사
지능검사 지능검사 지능의 개념 매우 오래된/그리고 많이 사용되는 검사 그러나 지능을 측정하는 유일한(표준적인) 절차는 없음 일반 지능(g) g(general mental ability): 개인 지적 능력의 일반적 수준-Spearman: 요인분석기법을 이용하여 여러 하위검사들 사이에 공통분모가 있다는 것 발견(이 공통요인이 바로 g) 준거관련타당도(특히 준거 수행 예언력)가 매우 높음(0.40-0.60) Brand(1987): “화학과 탄소와의 관계는 심리학과 g와의 관계와 같다” Hunter(1986): 직무가 복잡할수록 지능의 예측력이 증가함
지능검사 지능의 개념 다중지능(multiple intelligence) 추리, 공간능력, 지각속도, 지각/운동 능력 등 Gardner(1983): 몇 개의 근본적으로 독립적인 지능이 있다고 주장:언어 지능, 논리 수학 지능, 음악 지능, 신체 운동 지능, 공간 지능, 대인 지능 등 Ackerman(1992): 복잡한 정보를 처리하는 과업(예를 들어 항공관제사)에서는 일반 지능보다 다중 지능이 더 예언력을 가짐
지능검사 지능의 개념 Sternberg(1997): 지능의 3원론 학업지능(academic intelligence): 전형적 지능 검사에서 측정하는 것 실용지능(practical intelligence): 명시적으로 교육되지는 않았지만 암묵적으로 습득되는 지능(개인차), 예: 회사 중역의 능력, 체스 전문가의 능력 창의적 지능(creative intelligence): 새로운 방식으로 대처하는 능력
지능검사 지능의 본질이 무엇인지에 대해서는 의견이 많을 수 있음 상황과 과제에 따라 적절한 지능을 측정하는 것이 바람직 최근 연구 결과는 일반지능이 특수지능에 비해 교육 및 직무수행의 성공을 더 정확하게 예측함
기계 적성 검사 피검자가 검사문항에 포함된 기계적 원리들을 얼마나 이해하고 있는지 측정 예: Bennett의 기계이해력 검사 주로 전자-기계부품제조 종업원/차량운전자/수작업,공예 종업원 등
감각 및 운동능력 검사 시력,색감각, 청력 등에 대한 검사 피검자가 검사문항에 포함된 기계적 원리들을 얼마나 이해하고 있는지 측정 예: 표 4.2, Purdue Pegboard, Craw Small Parts Dexterity Test 주로 사무직의 직무성공을 잘 예언
성격 검사 정답이 없음 성격이 직무수행에 밀접한 관계가 있을 것이라는 기본 가정: 그러나 직접 확인할 수 없다는 것이 문제(원래 성격검사는 주로 정상-비정상 구분에 사용되었으니까, 특히 MMPI) 그럼에도 불구하고 성격 측정(특히 직무수행과 관련된 요인들)은 최근 인사선발에서 가장 빠르게 성장하고 있는 분야 중 하나임 성격의 5요인 이론(“Big-5” theory of personality): 5요인 이론은 직무수행 예측과 밀접한 관련있다는 주장이 제기됨 신경증(neuroticism): 정서적 불안정성 외향성(extraversion): 사회성, 적극성->판매, 관리자(리더) 경험에 대한 개방성(openness to experience): 호기심, 상상력,틀에 얽매이지 않음 친밀성(agreeableness, 동조성, 호감성?): 협조적이고, 도움을 주고, 함께 지내기 편한 성향 성실성(conscientiousness, 신중성?): 목적의식 분명, 강한 의지, 계획적, 자제력->거의 모든 직무수행 준거들과 상관이 있음
성격 검사 성격 검사 문제: 성격 검사에서의 거짓반응문제(타당도를 떨어뜨림): 특히 현직자보다 지원자가 심함 성격감사정보와 다른 검사정보를 같이 사용해야 함(Ackerman & Heggestad, 1997): 능력, 성격->직무수행 성공확률, 흥미->수업수행 동기 성격과 지능과의 관계: 물과 기름이냐 아니면 지능의 g요인과 같은 성격의 p요인이 있는가->두 요인의 융합시도(?)
정직성(integrity) 검사 최근 많이 사용(절도나 비생산적 행동 탐지/예측을 위해 고안) 정직성, 성실성을 측정 두 가지 지필검사 외현적 정직성 검사 정직하지 못한 행동에 대한 태도와 절도나 기타 불법행동에 대한 자백 거짓 반응 많음 성격에 기초한 검사 절도 자체에 대해 질문하지는 않음: 주로 성격 5요인 중 성실성, 정서적 안정성(신경증) 등에 대한 것을 우회적으로 질문
정직성 검사 정직성 검사는 타당도가 일반적으로 높음 정직성 검사의 문제 편의점 종업원의 절도, 조직내 상위직급의 횡령/사기(특히 이러한 사람들은 동일 직급의 사람들에 비해 죄책감을 덜 느끼고, 신뢰성이 없으며, 법규나 규범 등을 무시하는 경향), 비생산적 행동(정도, 결근, 법규위반) 등을 효과적으로 예측 남성보다 여성의 정직성 점수가 높음 정직성 검사의 문제 상당히 민감한 문제임-잘 발표 안함 Undetected 체포된 경우는 극소수(2-3%): 통계적 검증력 문제
신체능력 검사 작업수행과 관련된 신체능력 차원들 주로 신체적 노력이 많이 드는 직종에 사용 근력 순발력 전반적 신체조정 능력 체력(stamina) 주로 신체적 노력이 많이 드는 직종에 사용 여성에게 불리(신체능력에 비해 인지능력은 상대적으로 얼마나 중요한가?) 앞으로의 연구 주제들: 주로 법률적(현실적 문제와 결부) 나이와 신체능력 감퇴 신체능력에서 집단간 차이
다중적성검사 여러 검사를 같이 사용(타당도 높아짐) 그러나 비용/시간이 더 소요 예: 군대복무 직업적성검사집(Armed Services Vocational Aptitude Battery, ASVAB) 변별 적성 검사(Differential Aptitude Test: DAT)
컴퓨터를 이용한 검사 컴퓨터를 이용한 검사(computerized adaptive testing: CAT) 기본적으로는 난이도가 다른 문제들을 미리 준비한 후 한 문제씩 제시하다 정답 비율에 따라 다음 질문이 결정되도록 하는 방식 맞춤방식(tailored testing)임 난이도를 조정함으로써 맞힌 문제의 난이도를 통해 피검자의 능력 수준 추론 매우 유연함: 결과저장, 채점(feedback 시간의 단축 및 내용 전달 가능), 시간/비용절감 문제 기본적으로 CAT는 능력과 적성 측정을 위해 고안됨: 성격이나 흥미 검사는 잘 사용 안됨(지금은 많이 바뀌었음) 운용 프로그램 필요(제작 초기에 비용부담) 큰 집단에서는 실시 곤란 아직 정확하게 타당화되지 않음(문항반응이론)
검사의 가치 심리검사가 절대적인 신빙성을 갖는 것은 아님: 무조건적 수용이나 검사에 대한 신비감을 가져서는 안됨 중요한 것은 검사 자체가 질이 낮다기보다는 검사를 부적절하게 사용한다는 것이 문제임(예를 들어보자) 검사의 지나친 남용문제 검사의 횡포: 검사 몇 개로 개인의 인생에서 중요한 의사결정이 이루어짐(예: 수능) 검사의 정답이 오직 하나인 경우: 기본적으로 이것이 바람직. 그러나 현실에서는 그렇지 않을 수 있음(70-10=?) 이에 대한 대안이 상황판단검사(situational judgment test): 피검자에게 문제의 상황을 제시하고 이에 대한 여러 가지 가능한 해결책의 실현가능성이나 적용 가능성을 평정하도록 하는 검사
검사의 가치 타당도 계수가 0.10-0.40 사이로 1.0이 되지 못하는 것에 대해…. 타당도 계수가 0.10-0.40 사이로 1.0이 되지 못하는 것에 대해…. 응용 연구에서 완벽한 상관을 얻기란 불가능하고 또 그것을 추구하는 것은 비현실적 타당도 계수는 신뢰도계수(대개 0.70 이상)에 비해 비교적 낮은데 신뢰도 계수는 단순히 변인들 사이의 관계성 정도만을 반영한다는 점 고려 중요한 점은 어찌되었던 많은 검사가 준거를 타당하게 설명/예언하고 있으며, 타당도 계수는 예측변인과 준거변인 모두에 의해 결정된다는 사실을 염두해 두어야 함 따라서 지금까지 살펴본 것 외에 다양한 예측변인들(예를들어, 면접, 평가센터, 작업표본과 상황연습, 생활사 정보, 추천서, 약물검사, 거짓말탐지기,필적분석, 정서지능검사 등)을 고려하는 것이 중요
면접 실제로 가장 흔히 사용되는 방법(최근 중요성 증가하고 있음 고려사항들 인터뷰의 유형: 구조화된 면접 vs. 비구조화된 면접(중간 형태 선호) 몇 사람이 인터뷰할 것인가? 일대일 vs. 일대다(고급 직종인 경우) 상황적 면접 일반적으로 면접은 지필검사에 비해 역동적임(즉, 서로 영향을 미칠 수 있음: verbal and nonverbal) 구조화 정도 실제 면접 상황에서는 구조화된 면접과 비구조화된 면접을 모두 사용 구조화된 면접에서는 직무지식, 대인관계 및 사회적 시술, 문제해결 능력 등을 주로 측정하고 비구조화된 면접에서는 주로 일반지능, 교육수준, 작업경험, 흥미 등을 측정(Huffcutt 등, 2001) 비조화된 면접이 비구조화된 면접에 비해 타당도가 높음
면접 면접의 구조화를 증진시키는 방법(Campion 등, 1997) 비구조화 면접도 가치가 있음 직무분석에 의거하여 질문 면접자가 답을 재촉하지 않음(또한 지원자로부터 질문을 받지 않음): 이것은 일관성을 유지하기는 하지만 지원자로부터 부정적 반응 유발 각 질문에 대한 답을 평정 한 지원자당 여러 명의 면접자를 사용하는 것 면접이 구조화될수록 소송에서 승소할 가능성 커짐(Williamson, 1997) 비구조화 면접도 가치가 있음 즉, 지원자에 대한 직무 적합성 평정 이외에 면접자는 지원자에게 조직에 대한 정보, 가치, 문화를 전달할 기회를 가짐 또한 조직이 자질있는 지원자를 선발하고자 노력하고 있다는 메시지 전달 효과
면접 상황적 면접 지원자에게 문제 상황을 제시하고 어떻게 대처할지를 묻는 면접 방식 경험에 근거한 질문이거나(그때 어떻게 했습니까), 미래 지향적인 질문(어떻게 하겠습니까) 모두 사용 채점 방식의 예: 일반적으로 정답이 없음(면접자의 판단에 근거) 상황적 면접의 사용빈도는 증가 추세에 있고 특히 관리직에 대한 인사선발에 유용
면접 면접 결과에 영향을 미치는 요인들 정보 유형: 긍정적 정보보다 부정적 정보에 더 민감 정보 위치 대비 효과 예: 학교 다닐 때 장학생이었나 퇴학생이었나 정보 위치 면접에서 첫인상 효과가 매우 중요(초두 효과) 첫인상이 좋으면 주로 회사 자랑, 나쁘면 지원자에 대한 질문 증가 대비 효과 앞사람이 어떤 사람이었나? 예: 시험 답안지 따라서 면접자의 경험이 중요 면접자의 고정 관념 마음에 드는 후보상을 미리 정해 둔 경우
면접 면접에 대한 평가 면접 기법이 많이 사용되는 이유 신뢰도 타당도 일반적으로 타당함 일반적으로 inter-interviewer 신뢰도보다 intra-interviewer 신뢰도가 더 높음 타당도 면접과 함께 다른 인사선발 정보(추전장, 전력 등)를 사용해야 타당도 증가 구조화된 방법이 비구조화된 방법보다 타당도가 더 높음 면접 기법이 많이 사용되는 이유 일반적으로 타당함 “타당도에 대한 착각”: 타당한 결정을 하지 않은 경우에도 자신의 판단이 타당하다고 믿는 경향 -> 더 중요한 것은 이러한 착각이 계속 유지된다는 것(관상?) 일단 해 보는 것이 중요(아무에게나 직장 주지 않음) 면접이 조직과 지원자의 부합 또는 일치성을 평가해볼 수 있는 기회 제공
평가센터 평가센터 구조화되어 있고, 집단으로 진행되는 활동을 통해 평가자가 직무 지원자들을 평가하는 방식 주로 관리자 수준의 지원자를 선발할 때 사용 AT & T에서 처음으로 개발 일종의 인턴제도와 비슷하다고 보면 됨 설치 비용이 문제: 최근 각 기업체는 독자적인 평가센터(예를 들어, 연수시설)를 운영하는 추세 평가센터의 일반적 특징 관리직급의 지원자를 선발하거나 승진/교육을 위해 실시 대개 집단으로 (10-20명) 운영되고 집단내 상대 평가로 결정 다수의 평가자가 평가 다양한 수행 평가 방법이 동원(leaderless discussion, 서류함검사, 투사법, 면접 등)
평가센터 평가센터에서의 평가가 갖는 문제들 평가면접 센터에 의한 평가가 매우 높은 예측력을 가지는 이유 합산치를 이용한 최종 결정: 다양한 평가방법을 사용함에도 불구하고 개별적 능력에 대한 평가가 “묻혀버림” “동종교배”: 평가자나 조직의 관리자가 동일한 고정관념을 갖고 있다면 “자기 입맛”에 맞는 지원자를 선발하게 됨 평가면접 센터에 의한 평가가 매우 높은 예측력을 가지는 이유 실제준거의 오염: 회사는 선발, 승진, 임금인상, 직무수행 평가를 위해 평가센터를 이용. 따라서 조직내 수행평가 준거와 동일-예측력 높은 것은 당연한 일 미묘한 준거오염: 위에서 언급한 동종교배 자기충족적 에언: 응시자 중 누군가는 뽑아야 하고 직장 동료가 될 것임-> 잘 뽑았다고 해야할 것 아닌가? 수행의 일관성: 대개 평가 센터에서 우수한 수행을 보인 사람이 실제 근무에서도 수행이 좋음 관리적 지능: 지적으로 능력있는 사람들은 언어적 기술, 분석적 추리, 잘 짜여진 행동 계획과 같은 능력들을 후천적으로 잘 개발함 -> 실제 직무활동으로 발휘됨 결론적으로 높은 예측력은 결국 일종의 준거 오염에 의한 것일 수 있음: 오염없는 준거를 찾을 수 있는 대안은 무엇인가?
작업표본(Work Samples) 지원자가 직무에서 수행하는 대표적인 작업을 얼마나 능숙하게 처리할 수 있는지 알아보기 위해 실제로 작업을 시켜보는 인사선발 검사 현실성(fidelity)/안면타당도 매우 높음 중요한 것은 직무분석을 철저히 수행한 후에 이를 바탕으로 그 직무와 관련된 과제들을 축소판으로 만들어 실시한 것 예: 기계공의 경우 도구의 사용, 작업의 정확성, 전반적 기계 능력을 알아보는 과제 설계 일반적으로 작업표본은 인사선발의 가장 타당한 방법 중 하나 작업표본의 제한점 주로 육체 노동직에 사용(사무직에는? -> 상황연습) 현재의 능력만 측정할 뿐 잠재 능력은 측정하기 어려움 시간과 비용이 많이 소요
상황연습(Situational Exercise) 지원자에게 문제상황을 제시하고 어떻게 대처할지를 물어서 지원자를 평가하는 방식(일종의 문제해결 과제 제시) 상황연습은 사무직(혹은 관리직, 전문직)에게 사용하는 작업표본이라 할 수 있음 단지 직무의 일부만 반영: “현실성이 낮은 모의상황” 몇 가지 방법 서류함 검사(In-Basket test) 여러 내용이 담긴 서류함을 제시한 후 내용에 따른 적절한 행동(특히, 생산성과 문제 해결 측면에서) 조치 여부를 평가 시간 많이 걸리는 개인검사라는 것이 문제 리더없는 집단 토론(leaderless Discussion Group: LGD) 리더없이 직무와 관련된 내용에 대한 자유 토론 개인의 특출성, 집단목표달성의 촉진여부, 사교성 등 평가 집단내 사람이 많을수록 신뢰도 증가 문제 일반적으로 작업표본에 비해 타당도가 낮음(그럴 수밖에 없음: why?) 좀더 타당한 검사를 설계하기 위해서는 비용이 많이 요구됨 상황연습에서 나온 결과가 성공의 준거라고 정의하기 어려움
전기적 정보(biographical information) 개인의 과거 활동, 흥미, 일상생활에서의 행동에 관한 정보에 기초하여 개인을 평가하는 방식(전기적 정보가 더 정확한 번역임) 과거로부터 미래를 예측할 수 있다는 것이 기본 가정 주로 응시 원서에 포함됨 적용 예: 백인과 흑인 근로자의 이직을 예측하기 위한 생활사 정보의 타당도 검증(Cascio, 1976) 타당도 계수가 두 집단에 대해 각각 .77과 .79였음(타당도가 계수가 매우 높다는 것 외에 더 중요한 발견은 타당도 계수의 크기가 유사하기 때문에 두 집단에 대해 공정하다는 것) 연구 결과들은 전기적(생활사) 정보가 일반적으로 다양한 준거들(직무성공, 승진, 결근, 생산성, 권력만용이나 절도 등)을 타당하게 예측한다는 것을 밝힘 문제 공정성: 예를 들어, 축구 동아리에서의 활동이 미래 직무 수행과 관련된다는 것이 밝혀졌다면 여학생의 경우는 불리 사생활 침해의 가능성: 종교, 결혼 및 이혼 여부, 연애 습관 등 거짓 반응의 문제: 사회적으로 바람직한 방향으로 응답하고자 하는 문제
추천서 가장 널리 사용되지만 타당도가 가장 낮은 방법 거의 긍정적 내용만 포함(그것도 과장해서) 추천서의 내용보다 누가 추천서를 써 주었는지가 더 중요 종종 부정적으로(혹은 그저 평범하게 추천서를 쓴 경우는 장차 직무 수행에서 심각한 문제가 있을 수 있다는 것 암시
약물검사 약물남용은 당사자뿐만 아니라 동료 및 타인 그리고 사회 전반적으로 악영향을 줌 약물검사는 전형적으로 화학적 평가이며 주로 소변검사나 머리카락 샘플 검사를 통해 실시(색출검사와 확인검사) 약물 양성반응자는 결근율과 이직률에서 음성반응자 보다 더 높음(Normand 등, 1990) 일반적으로 약물검사의 신뢰도는 높지만 그 신뢰도가 완벽하지 않아서 검사를 실시하는 실험실에 따라 다른 결과를 도출할 수 있음 타당도는 더 문제: 예를 들어 음식이 약물 성분을 포함하고 있거나 공인된 약제(인삼, 감기약 등)를 복용하고 약물검사에서 이상이 발견될 때 문제점 사생활 침해 소지가 있음 직무에 따라 차등적으로 약물검사를 실시하는 문제 중독과 수행의 문제: 어느 정도 수준이어야 수행에 영향을 미치는가? 검사의 비용문제 약물검사가 종업원의 해고가 목적이 아닌 치료의 목적으로 실시된다면 부정적 반응을 줄일 수 있음
New and Controversial Tests: 거짓말 탐지기 (Lie Detector) 거짓말을 할 때 나타나는 생리적 반응(심장박동, 발한, 뇌파 등)을 이용 주로 채용 전 보다는 채용 후에 더 많이 사용(절도 등) 거짓말탐지기의 정확성은? 일반적으로 정확하다고 할 수 있음 그러나 얼마든지 거짓말탐지기에 대해 “거짓말할 수 있음” 특히 범죄집단의 경우(84.7%) 결백집단 보다(94.7%) 정확성이 더 떨어짐 일반적으로 심리학자들은 거짓말 탐지기 사용에 회의적 레이건 당시 채용검사로서 거짓말탐지기 사용을 금지하는 법안을 통과시키기도 하였음 법정에서 거짓말탐지기 자료가 증거로서 효력이 있는가? (그림참조) 거짓말탐지기의 사용은 점차 증가 추세에 있음(특히 범죄 수사에서)
New and Controversial Tests: 필적분석(graphology) 주로 유럽에서 사용 전문가가 필적으로 분석하여 주로 지원자의 성격을 분석 아직 실증적으로 이 검사의 타당성이 밝혀지지 않았음
New and Controversial Tests: 정서지능검사 정서지능: 사회적 상황에서 정서적 반응을 관리할 수 있는 개인의 능력을 나타내는 구성개념 개인차의 연성적(soft)측면 측정-기분, 감정, 정서 개인차 중요시 주로 유럽에서 사용 정서가 지능의 일부라고 간주 5가지 차원들(Goleman, 1995) 자신의 정서 인식 자신의 정서 관리 자신의 동기 부여 타인의 정서에 대한 인식 타인과 원만한 관계유지 아직 정서 지능에 대한 적용 사례가 별로 없음(앞으로 중요한 연구 주제임) 정서가 성격과 독립적인지의 여부가 중요
예측변인들에 대한 평가 예측변인들의 기준(표를 보라) 타당도(0.20미만, 0.20-0.40, 0.40 이상) 공정성 적용성 비용(지원자당 20불 미만, 20-50불, 50불 이상)