Adjusted Kaplan-Meier Estimator for Period Analysis with Long-term Survival Data Jinheum Kim (jinhkim@suwon.ac.kr) Department of Applied Statistics University of Suwon
동 기 Brenner 교수 팀은 1996년 Cancer 학술지에 “An alternative approach to monitoring cancer patient survival” 라는 논문을 발표 한 이래로 생존율 추정과 관련된 다수의 논문을 발표 주요 관심은 생명표 작성: 그룹 자료 중심 왜 각광(脚光) 받고 있나? Complete data를 바탕으로 하면 장기간 생존자료에서는 study에 일찍 들어 온 환자의 생존정보에 영향을 많이 받음. 그러나 Brenner 교수 팀의 ‘Period analysis approach’ 는 최근의 생존정보에 민감함. 실제 생존율에 가까운 추정이 가능` 생명표보다 유연한 생존율 추정을 위해서
무엇이 새로운가? Actuarial 추정량 보다 조밀(fine)하게 추정 가능 ( 관찰된 생존시간 각각을 개별 그룹으로 형성!) 최근에 변화된 생존정보를 더 잘 반영 Period analysis approach + Kaplan-Meier estimate
LTRC 자료와 어떻게 다른가? 관심기간 내에서 관찰된 환자만 분석에 포함. 관심기간 내에서 관찰된 환자만 분석에 포함. 마치 LTRC (left-truncated & right-censored) 자료처럼 보임. ▣ 이전에 진단되어 의 시작시점까지 이벤트가 발생하지 않은 환자의 경우에 이전까지의 생존경험을 분석에 포함.` 생존시간: 의 시작시점과 이벤트 발생시점 간의 차이 진단시점과 이벤트 발생시점 간의 차이 (NO!) (Yes!)
위험집합과 사망집합의 재정의 : 관찰된 서로 다른 생존시간 , 만일 번째 환자가 동안 에서 위험에 노출 , 만일 번째 환자가 동안 에서 위험에 노출 되어 있으면; 0, o.w , 만일 번째 환자가 동안 로 이벤트가 발생하면; 0, o.w ▣ : 에서 위험집합에 속하는 환자수 : 에서 사망집합에 속하는 환자수 ▣ 형태적으로는 KM과 동일!
Illustration
Illustration (t1) (t2) (t3) (t4) 관찰된 생존시간 0 4 6 8 14 환자 2 환자 5 환자 8 0 4 6 8 14 (t1) (t2) (t3) (t4) 환자 2 21 환자 5 14 환자 8 6 환자 9 10
Illustration d (환자번호) (위험 집합) (사망 집합) - 14 13 1 12 11 10 7 6 4 3 1 5 2 tji d - 14 13 1 12 11 10 7 6 4 3 1 5 2 1 9 8 1 2 3 4 5 7 합계
생존함수 추정과 표준오차 : 진단시점부터 시간 이후 생존율 재정의한 를 Greenwood 공식에 대입
응 용 예 1993-1997 동안에 등록되어 2001년 말까지 추적 조사된 79,707명의 서울시 암 등록 자료 응 용 예 1993-1997 동안에 등록되어 2001년 말까지 추적 조사된 79,707명의 서울시 암 등록 자료 (Ahn et al., 2002) 성별과 연령 (<20, 20-40, 40-60, >60)의 조합에 따라 8개 층으로 층화 =[1997, 2001] Complete data와 period analysis approach에 따른 KM 추정량의 비교
표본 통계량 Left truncation 비율: 남성 > 여성; 고령층으로 갈수록 커짐 39 20 15 25 43 37 31 27 59 79 85 82 50 62 73 36 63 72 61 28 51 53 14,578 15,089 6,162 772 20,519 17,969 3,258 1,004 60< 40-60 20-40 <20 여 자 남 자 표본 통계량 Left truncation 비율: 남성 > 여성; 고령층으로 갈수록 커짐 Censoring 비율: Complete dada < Period analysis approach (성별, 연령 무관)
생존율 비교 연령층에 무관하게 남자의 생존율이 여자보다 낮음. 20-60대 층에 서 큰 차이를 보임. 성별에 관계없이 고령층으로 갈수록 생존율이 낮음. 인접 연령 층 간 차이는 고령층으로 옮아갈수록 커짐. Complete data를 바탕으로 추정한 경우보다 period analysis approach에 의한 추정값이 큼. 그러나 예상했던 것처럼 후자의 표준오차가 전자보다 큼. Period analysis approach에 기초한 KM 추정량의 95% 신뢰구간 내에 complete data에 기초한 KM 추정량이 포함되지 않음. 두 방법은 유의수준 5%에서 통계적으로 유의함.
Actuarial 추정량의 생존율 비교
마치면서 장기간 생존자료의 생존율 추정에서 최근 생존정보를 잘 반영할 수 있는 추정량을 제안 장기간 생존자료의 생존율 추정에서 최근 생존정보를 잘 반영할 수 있는 추정량을 제안 서울시 암등록 자료에 적용: 매년 새로운 암 치료법이 개발되고 있기 때문에 암 환자들의 생존율은 증가 추세 에 있으며, 제안한 추정량이 이를 잘 반영하고 있는 것 으로 나타남. 유효 표본수가 줄어들고, 이로 인해 표준오차가 커지는 단점이 있지만 대용량 자료에서는 크게 문제되지 않음.
THANK YOU!