건강근로자 효과를 통제하기 위한 새로운 접근 남정모1), 김진흠2), 강대룡3), 안연순4), 이후연1) Chung mo Nam, Jinheum Kim, Dae Ryong Kang, Yeon-Soon Ahn, Hoo-Yeon Lee 연세대학교 의과대학 예방의학교실1), 수원대학교 통계정보학과2), 연세대학교 보건대학원3), 한국산업안전공단 산업안전보건연구원4) Department of Preventive Medicine and Public Health, Yonsei University, Department of Applied Statistics, University of Suwon, Graduate School of Health Science and Management, Yonsei University, Occupational Safety and Health Research Institute, Korea Occupational Safety and Health Corporation
특정 위험작업에 노출되는 근로자들의 사망률(질병발생률) > 일반인구 사망률 Introduction Objectives Methods Results Conclusion 건강근로자 효과(Healthy Worker Effect ; HWE) 특정 위험작업에 노출되는 근로자들의 사망률(질병발생률) > 일반인구 사망률 원인 (Choi, 1992) : 전문가 9명으로부터 조사 - 10가지 선택치우침, 2가지 정보치우침, 2가지 혼란변수로 야기된 치우침 건강근로자 고용효과 (Healthy Worker Hire Effect : HWHE) 건강근로자 생존효과 (Healthy Worker Survival Effect : HWSE)
Output 1. Figure 1. Basic structure of healthy worker effect Introduction Objectives Methods Results Conclusion Output 1. Figure 1. Basic structure of healthy worker effect Employment status at time t-1 at time t+1 Exposure amount at time t Health status at baseline Death Healthy worker hire effect Healthy worker survival effect
건강근로자 생존효과를 통제하기 위한 분석방법 Introduction Objectives Methods Results Conclusion 건강근로자 생존효과를 통제하기 위한 분석방법 고용 후 생존시간이 긴 사람만을 대상으로 고용상태를 층화하여 분석 (Fox & Collier, 1976) 노출변수에 시간적 차이를 두어 분석 (Gilbert, 1982) 회귀분석 모형을 통해 현재 고용상태를 통제 (Gilbert, Marks, 1979) 고용상태의 변화가 시간의존형 변수인 혼란변수로 작용 (Steenland & Stayner, 1991) 고용상태의 변화가 시간의존형 혼란변수인 동시에 매개(intermediate) 변 수로 작용 - Cox의 시간의존형 모형으로 분석하더라도 치우침이 제거되지 않음 (Robins, 1992) - G-null set, G-algorithm, Structural Nested Failure Time Model (SNFTM) 제안 (1986, 1987, 1992)
건강근로자 효과로 야기되는 치우침을 제거하는 새로운 통계적 방법을 제안 Introduction Objectives Methods Results Conclusion 건강근로자 효과에 대한 이론적인 모형을 구축 건강근로자 효과로 야기되는 치우침을 제거하는 새로운 통계적 방법을 제안 시뮬레이션을 이용하여 새로 제안한 방법의 타당성을 비교
건강근로자 고용효과는 고용시점의 건강상태로 야기되는 혼란효과 Introduction Method Objectives Results Conclusion 건강근로자 고용효과는 고용시점의 건강상태로 야기되는 혼란효과 건강근로자 생존효과는 혼란변수인 동시에 시간의존형 매개변수인 고용상태로 야기된 length bias sampling의 이론적 모형 (Nam & Zelen, 2001)을 통해 치우침을 해결 고용상태의 변화에 대한 이론적 모형 (3가지 이론변수) T0 : 고용상태가 변하지 않는다는 가정하의 생존시간 T1 : 고용상태가 변한 후의 생존시간 W : 고용상태가 변할 때까지의 대기시간 Z = 1 if T0 > W : 고용상태가 변함 0 if T0 ≤ W : 고용상태가 변하지 않음
Length biased sampling의 문제점 Method Introduction Objectives Results Conclusion Length biased sampling의 문제점 상대적으로 생존시간이 긴 근로자의 고용상태가 변할 가능성이 큼 노출정도에 따라 고용상태가 변할 가능성이 차이가 있음 고용상태의 변화에 의해 생존시간이 변함 (left truncation) 노출정도와 사망률(생존시간)의 관련성이 왜곡됨
모형 : Qi(t) = Qio(t) exp{βix(t) + d’s(t) (i=0.1) Method Introduction Objectives Results Conclusion 모형 : Qi(t) = Qio(t) exp{βix(t) + d’s(t) (i=0.1) 가설 : H0 : β0 = β1= 0 vs. H1 : at least βi≠0 관측된 생존시간은 (z, w)에 대해서 조건부 확률로 관찰됨 (T0, T1, δ1, w, x, s)에 대한 likelihood를 유도 스코아 통계량을 유도(Nam et al, 2002)
제안한 통계량의 특성 제안한 통계량의 절차 1단계 : 전체자료 : β0 = 0에 대한 검정 2단계 : 고용상태가 변한 자료 Method Introduction Objectives Results Conclusion 제안한 통계량의 특성 위험집단에 대한 새로운 정의 : β1 = 0에 대한 검정 제안한 통계량의 절차 1단계 : 전체자료 : β0 = 0에 대한 검정 2단계 : 고용상태가 변한 자료
S : 고용당시의 건강상태 (1=healthy, 0=unhealthy) Z : 연구종료시점에서 고용상태 변화여부 Method Introduction Objectives Results Conclusion 시뮬레이션 모형(1) Y(t) : t 시점에서 노출정도 Z(t) : t 시점에서 고용상태 S : 고용당시의 건강상태 (1=healthy, 0=unhealthy) Z : 연구종료시점에서 고용상태 변화여부 Model 독립변수 Cox 모형에 기초 제안한 새로운 방법 I II III IV X(t), S X(t), S, Z X(t), S, Z(t)
Method Introduction Objectives Results Conclusion 시뮬레이션 모형(2) m0h(m0u) : 고용상태의 변화가 없다고 가정한 경우의 healthy (unhealthy)한 근로자의 baseline risk에 대한 평균 생존시간 m1h(m1u) : 고용상태가 변화한 경우의 healthy (unhealthy)한 근로자의 baseline risk에 대한 평균 생존시간 (m0h, m0u, m1h, m1u) 건강근로자 고용효과 건강근로자 생존효과 (2.0, 2.0, 2.0, 2.0) No (2.0, 1.5, 2.0, 1.5) Yes (2.0, 2.0, 1.5, 1.5) (2.0, 1.5, 1.5, 1.0)
Procedure of simulation in the case of no censoring Method Introduction Objectives Results Conclusion Procedure of simulation in the case of no censoring Given (m0h, m0u, m1h, m1u) and (β0, β1) Generate exposure amount x0 and health status S Generate survival time t0 and waiting time W t0 ≤ w ? Iteration 1,000 times Calculate test statistics Calculate empirical level and power for each of test statistics Observed exposure amount at time t : X(t) = x0 Observed employment status at time t : Z(t) = 0 Observed survival time : t = t0 Generate exposure amount x1 after changing of employment status observed exposure amount at time t : X(t) = observed employment status at time t : Z(t) = Generate observed survival time from truncated distribution at time w : t = t1 X0 if t≤ w X1 if t > w 0 if t≤ w 1 if t > w Yes No
Introduction Objectives Methods Results Conclusion Table 1. Empirical 5% significance levels of Wald test based on model (I), (II), (III) and proposed score test (model (IV)) based on model (1)with 1000 simulations % Model m0h, m0u, m1h, m1u Resp. Cens. (I) (II) (III) (IV) Uncensored (2.0, 2.0, 2.0, 2.0) 59.2 0.047 0.987 0.052 0.063 (2.0, 1.5, 2.0, 1.5) 52.1 0.046 0.985 0.054 0.055 (2.0, 2.0, 1.5, 1.5) 0.874 1.000 (2.0, 1.5, 1.5, 1.0) 0.964 0.060 Censored 32.9 58.5 0.754 0.053 29.9 53.9 0.050 0.750 0.059 0.061 55.0 0.543 0.984 50.5 0.727 0.986 0.057
Results Introduction Objectives Methods Conclusion Table 2. Empirical powers of Wald test based on model (III) and proposed score test (model (IV)) with 1000 simulations for (m0h, m0u, m1h, m1u) = (2.0, 2.0, 1.5, 1.5) Uncensored Censored % Model (β0, β1) Resp. (III) (IV) Cens. (0.4, 0.0) 51.9 0.070 0.124 29.9 52.1 0.087 0.091 (0.8, 0.0) 44.4 0.212 0.323 26.6 49.0 0.175 0.230 (1.2, 0.0) 37.1 0.495 0.707 23.2 45.5 0.387 0.492 (1.5, 0.0) 32.2 0.735 0.898 20.7 42.8 0.630 0.729 (0.0, 0.4) 59.3 0.231 0.233 33.0 54.1 0.134 (0.0, 0.8) 0.657 0.714 53.3 0.321 0.371 (0.0, 1.2) 0.959 0.981 52.6 0.599 0.692 (0.0, 1.5) 0.999 1.000 0.787 0.886
Results Introduction Objectives Methods Conclusion Table 3. Empirical powers of Wald test based on model (III) and proposed score test (model (IV)) with 1000 simulations for (m0h, m0u, m1h, m1u) = (2.0, 1.5, 1.5, 1.0) Uncensored Censored % Model (β0, β1) Resp. (III) (IV) Cens. (0.4, 0.0) 44.8 0.108 0.141 26.8 47.5 0.102 (0.8, 0.0) 37.6 0.332 0.402 23.4 44.3 0.244 0.290 (1.2, 0.0) 30.9 0.634 0.777 20.1 40.9 0.538 0.585 (1.5, 0.0) 26.4 0.844 0.932 17.6 38.2 0.750 0.826 (0.0, 0.4) 52.1 0.223 0.210 30.0 49.7 0.138 0.125 (0.0, 0.8) 0.602 0.646 49.1 0.304 0.349 (0.0, 1.2) 0.915 0.958 48.5 0.560 0.654 (0.0, 1.5) 0.986 0.999 48.1 0.747 0.859
Model I, II는 제 1종의 오류에 심각한 문제가 발생 : 고용상태 변화에 대한 불완전한 통제 Introduction Objectives Methods Results Conclusion Model I, II는 제 1종의 오류에 심각한 문제가 발생 : 고용상태 변화에 대한 불완전한 통제 제안한 새로운 방법과 고용상태를 시간의존형 변수로 분석한 Cox모형은 제 1 종의 오류가 잘 유지됨 제안한 방법이 시간 의존형 Cox 모형보다 건강근로자 생존효과가 있는 경우 검정력이 높음