Eliminating noise and other sources of error 오차분석 Eliminating noise and other sources of error
3. 오차 분석 a. 기기의 불확실성 기기를 갖고 어떤 측정을 할 경우 기기의 눈금을 읽는 데서 발생되는 오차, 눈금 자체의 불확실성, 측정자의 오차, 등으로 기기 오차가 발생. 이러한 불확실성은 때로 실제 측정치의 크기와 무관한 경우도 있다. 기기 불확실성 은 일반적으로 기기를 조사하여 결정하거나 측정의 신뢰도를 추정하는 과정 을 통해 측정하여 결정한다. 일반적으로 기기에 가장 적은 척도 크기의 수분 의 일로 읽을 수 있어야 한다. 수은 온도계 : 수은의 높이를 가장 작은 척도 크기의 반에 해당되 는 적은 수 로 읽을 수 있어야 한다. 이 적은 수의 반이 + 또는 - 로 인용되어 한 번의 측 정에 대한 표준 편차로 인용된다. 관측 : 망원경+ 검출기 : 천체의 빛을 검출할 때, 빛은 광자들의 Poisson 분포로 들어오며, CCD 같은 검출기의 오차는 무작위의 가우스 분포로 취급할 수 있음. Gaussian 분포 : 무작위 측정이 평균에서 1 표준 편차 내에 있을 확률은 68%가 된다.
b. 통계적 불확실성 측정치 x가 무작위 과정에서 단위 시간 간격 당 검출기에 측정치를 나타낸다면 이 측정치에 내 포된 불확실성은 통계적이라고 본다. 왜냐하면 이는 측정에서 정확도 때문에 발생되는 것이 아니고 일정 시간 간격 내에서 유한한 수를 모으는 데서 발생된 통계적인 요동에서 발생되기 때문이다. 통계적 요동은 실험을 통해서 보다는 각 관측치에 대해 표준편차를 해석적으로 구해서 분석할 수 있다. 같은 관측을 계속 반복한다면 관측치가 평균에 대해 Gaussian 대신 Poisson 분포를 하는 것을 발견하게 된다. Poisson 분포의 장점은 표준 편차가 자동으로 결정된다는 점이다. s = m1/2 평균에 대한 표준 편차 비인 상대적 불학실성은 s/ m = 1/ m1/2 는 단위 시간 간격 당 count 수 가 증가함에 따라 불확실성이 감소한다. 따라서 count가 증가되면 상대적 불확실성은 감소한다. 물론 표준편차를 결정하는 m 는 모 분포에서 평균치며 각 측정 x 는 이 모 분포의 근사 샘플일 뿐이다. 무한한 측정을 해야 측정치의 평균이 모분포 평균에 아주 접근되지만 때로는 무한의 측정보다 훨 씬 작은 경우, 각 측정치의 x를 하나 이상 결정할 수 없는 경우도 있다. 따라서 하나의 측정치 x에서 표준 편차는 x1/2 로 억지로 쓰기도 한다. 예 3.1 강한 방사성 물질에서 방출되는 감마선 측정 실험에서 순간적인 count rate을 결정할 수 없으므로 시간 간격 Dt 안에 검출된 x 수를 결정하여 이를 이 시간 간격에 평균으로 나타낸다. 1초 간격에 5212 count를 기록했다면 시간에 대한 무작위로 count가 분포되어 Poisson 확률 분 포함수를 따른다면 분포의 표준편차 s = 52121/2 가 된다. 시간 간격 Dt 에 x count의 결과를 5212 +- 72로 기술할 수 있고, 상대적 오차는 s/ x = 1/72 = 0.014 = 1.4%
전체 부정확도에는 기기에 의한 부정확도가 포함된다. 즉 시간 간격이라는 것은 단지 유한한 정확도를 갖는 것이기 때문에 이러한 부정확도는 조절할 수 있으므로 통계적 부정확도가 전체 오차를 지배하도록 실험을 할 수 있다. 예를 들어 시간 간격 Dt = 1.00 초 에서 기기에 의한 부정확 s=0.01 초라 하자. 시간 간격에서의 상대적 부정확도는 s/Dt = 0.01/1.00 = 1% 이다. 즉 시간 간격 때문에 발생되는 상대적 기기 오차는 x count에 1%에 해당되는 오차를 유발한다. 이 기기 오차가 통계적 오차와 맞먹는 크기라면 좀더 정확한 시간 간격을 제 거나 시간 간격을 증가시켜 기기오차를 줄여야 한다. 시간 간격을 1초에서 4 초로 늘일 경우 x count 도 4배로 늘 것이며 따라서 1.4%의 통계적 오차는 2배로 감소되어 0.7%가 될 것이며 반면에 기기 오차는 4배로 감소되어 0.25% 가 될 것이다. 이 때 같은 기기 오차 유발을 가정했다.
3.2. 오차의 전달 한 개 이상의 측정 변수의 함수로 된 종속 변수 x를 결 3.2. 오차의 전달 한 개 이상의 측정 변수의 함수로 된 종속 변수 x를 결 정해야 할 경우가 있다. 따라서 측정 변수에 부정확도가 종속 변수의 부정확도에 어떻게 전파되는지를 알아야 한다. 예 : 길이 L, 넓이 W, 높이 H 인 상자의 부피 V 각각을 재어 L0, W0, H0에서 부피는 V0=L0W0H0가 된다. 그렇다면 각 측정치에 부정도는 부피 V0에 어떤 영향을 줄까? 만일 실제 오차가 DL = L - L0, DW= W-W0 , DH=H- H0 로 각 변에 나타난다면 결과적으로 부피에 나타나 는 오차는 부피 V를 점 (L0, W0, H0)에 대해 Taylor series 로 전개하여 측정할 수 있다.
부정확도 = 오차
3.3 특수한 오차 공식들 a. 단순 합과 차 b. 가중된 합과 차 c. 곱과 나눔
오차전달 x, y 가 각각 정상분포(Gaussian=normal distribution) 로 평균, 표준편차, variance sX2, sY2 를 갖는 경우 Z= x+y, W=x-y의 variance sZ2, sW2 는 두 variance 의 합이다. sZ2 = sW2 = sX2 + sY2 곱과 나뭄의 경우 ; Z=xy, W=x/y (sZ/Z)2 = (sW/W)2 = (sX/X)2 + (sY/Y)2
d. power 함수
3.4 오차식의 적용
b. 오차의 컴퓨터 계산
4. 평균과 오차 계산 4.1 최소 자승법
b. 평균 계산
c. 평균에 추정된 오차
관측에서 배경에 의한 오차 노출 Dt 동안 천체에서 S count , 배경에서 B count 를 방출한다면, 1. 천체 측정(on source) = S + B 2. 천체 주변 측정 (off source) = B 천체의 측정치 S = (S+B) –B 에서 얻어진다. 1, 2 의 측정은 독립적이미므로 S 의 variance 는 sS2 = sS+B2 + sB2 Poisson 분포의 표준 편차는 평균의 제곱근이므로 sS2 = S+B + B = S +2B Signal /Noise = significance = S/sS = S/(S+2B)1/2
Intensity Represented by the source event rate rs (counts/s) independent of exposure time On-source와 off-source가 같은 노출 경우 rs = S/Dt +- ss /Dt (2항은 단위시간당 count수에 대한 표준편차) 정확한 Dt 일 경우 : fractional error = ss/s 따라서 srs=ss/Dt 정확하지 안은 Dt 경우 srs 에 그 factor 가 포함되야함. 만일 B 와 S+B 의 시간 간격이 다를경우 rs, rb (count /s) 와 ts+b, tb 를 고려
Two Background limits (B<<S,or B>>S) Low Background limit (B<<S) Dt on source and off source : Same S/ ss ~ S/S1/2 = S1/2 = (rs Dt )1/2 High Background limit (B >> S) S/ ss ~ S /(2B)1/2 = rs Dt /(2 rb Dt)1/2 = rs Dt1/2/(2rb)1/2 (S/ ss )B>>S = (rs/2rb)1/2(S/ ss )B<<S
CCD frame에 측정치 오차 여러 개(N) 의 관측 프레임을 갖고 있을 경우 평균치 <S> = (S1+S2+S3+ …)/N 표준편차 s <S> = sqr(sS12+sS22 +sS32+..) if poisson dis : S1 = sS12 Variance s <S>2 = (sS12+sS22 +sS32+..) If Poisson dis : s <S>2 = S1+ S2+ S3+ … Average(frames): S/N = <S> / s <S> = sqr(S1+S2+S3+…)/N If S1=S2=…, S/N= SqrS/SqrN increased by 1/sqrN (cf one frame : S/N = Sqr S)
Finding parameters & checking hypotheses 예: 어느 지역 에 한 시간 내 자동차 통행수 : N1=20, N2=30 Error? Poisson statistics : N1=20 +-4.47, N2=30+-5.48, <N>= 25+-3.53 3.53=sqr(4.472 +5.482)/2 True ; 3 표준편차 내(99.8%) ; 35 ~15 자동차 통행수의 시간적 변화가 있는가? N2-N1=10 +-7.07, (7.07=sqr(4.472 +5.482)) 변화치는 표준편차의 1.4배 확률분포함수에서 16% ; 즉 변화한다고 하기 어려움. 변화치가 3배의 표준편차가 될 경우 : 변화를 확신 least square fit & chi square test
Least Squares Fit, Chi square test At xi, value & uncertainty yi+-si At exch xi, yobs,i – yth,i 이 차이를 표준편차의 단위로 환산하여 제곱한 것을 모두 더한 것 : chi square c2 c2 = S [(yob,i –y th,i)/si]2 (chi square) A best-fit theoretical curve ? ;
Least Sqares fits
4.2 관계식에 적용되는 최소 자승법
Chi square test 관측이나 측정 자료에서 평균값과 표준 편차를 계산하면 모 분포를 추론 (가우시안 또는 푸와송 분포) 확율분포 : X 의 관측 또는 측정자료는 일정 측정치에 대한 막대 분포로 표현: 각 xj (j=1 ~ n) 의 h(xj) xj 를 측정할 확률 = p(xj) xj 측정 수 = N p(xj) 각 xj 는 표준편차 sj(h) 여러 자료 셋트 (k=1…nk), 각 빈도 y(xj) 에 대한 여러 측정치 hk(xj) 각 xj 값에 대해 기대치 y(xj) 를 k 번째 실험에서 hk(xj)를 얻을 분포 각 j 에 대한 측정의 분산은 sj (h) 옆의 그림에 점으로 표시한 프와송 커브 는 각 칸 mj = y(xj)에서 확률 pj(yk) 를 나타냄 또한 표준 편차 sj (h) = mj1/2
Definition of chi-square n, N, xj, h(xj), p(xj), & sj(h) 앞의 그림에서 y(xj)는 가우시안이나 각 pj(hk) 는 프와송 분포 variance sj(h)2 =mean y(xj) sj(h) = Np(xj)1/2 ~h(xj)1/2 각 측정치의 평균적인 퍼짐이 기대치의 평균 퍼짐과 일치할 경우, 두 경우가 잘 부합된다고 보므로 , 각 xj, 에 대한 값이 1 즉 c2 는 ~ n 이 될 것이다.
Test of c2 If observed frequency agrees exactly with the predicted frequency, c2 =0 it is not very likely outcome of an experiment Physical experiment, expect c2 ~n, In fact true expectation value of c2 n : number of degree of freedom = n , number of sample frequency – nc number of constraints or parameters Reduced chi-square : Expectation value
Reduced chi square Reduced chi square cn2=c2/n : near unit for the correct model. Satisfactory fits (probabilities in the range 0.1-0.9) n =10 : 0.49 < cn2< 1.6 = 200 : 0.87 < cn2 < 1.13
Chi square test
숙제 1. 항성의 거리가 0.5” +-0.05로 측정되었을 경우 거리 d 와 거리 오차를 구하시오. 2. 이 항성의 겉 보기 등급이 m = 4.50+- 0.02 로 관측되었다. 절대 등급과 오차를 구하시오. 3. 이 항성의 온도 T= 4000 +- 100 도 로 관측되었다면 이 별의 반경과 오차는 얼마일까?
숙제 4.