9.확률 분포 정규 분포 형태 : 평균을 중심으로 좌우대칭의 종 모양을 가진 분포이다. 중요모수 : 평균(위치모수), 표준편차(산포모수) 사용용도 : 통계학의 모든 분포의 기준이 되며,통계적인 확률값이 필요한 곳에 거의 모두 활용되고 있다.
Chi-Square 분포 형태 : 0 이상의 값을 가지며,한쪽으로 치우친 형태의 분포를 가진다. 중요모수 : 자유도(자유도가 커지면 정규분포에 근사한다.) 사용용도 : 제곱 합 등으로 표현되는 값들을 표현하는 분포,산포의 비교,이산형 분산등에 사용된다.
Chi-Square 분포(1) 자유도에 따른 Chi-Square 분포의 형태 자유도1 자유도3 자유도50 자유도10
표준정규분포에서의 대표값의 위치 평균값, 중앙값 Descriptive Statistics Variable N Mean Median TrMean StDev SE Mean C2 10000 0.0018 -0.0060 0.0024 1.0104 0.0101
Chi-Square 분포(df=3)에서의 대표값의 위치 중앙값 평균값 Descriptive Statistics Variable N Mean Median TrMean StDev SE Mean C1 10000 2.9895 2.3692 2.7536 2.4386 0.0244
10.통계학의 적용 통 계 연속형자료 정규성 검정 기초통계량 (자료요약) 통계 가설감정 모형구축 (MODELLING) 공정능력분석 상관분석 회귀분석 실험계획법 시계열 분석 다변량분석 이산형자료 -빈도 (Frequency) -Pie Chart -Bar Chart 연속형자료 -평균 -분산(표준편차) -중위수 -히스토그램 -Box Plot -Dot Plot -줄기-잎-그림 -산전도 정규성 검정 One-Sample T-test Two-Sample T-test Paired T-test ANOVA 분산검정 Chi-Square Test
통계가설검정 통계검정은 비교대상 그룹이 서로 다른지, 또는 모집단이 특정 의 가정된 값을 갖는지를 확인하고자 할 때 활용된다. 통계검정은 비교대상 그룹이 서로 다른지, 또는 모집단이 특정 의 가정된 값을 갖는지를 확인하고자 할 때 활용된다. 통계검정은 데이터의 속성에 따라 적용되는 방법이 다르며 크게 연속형 데이터와 이산형 데이터에 따라 구분 된다. 통계 검정 방법 * T-검정 * 카이-제곱(Chi-Square)검정 * 분산분석(ANOVA) * 상관관계 (Correlation) * 회귀분석 (Regression)분석
Chi-Square Test (독립성 검정) 통계가설검정의 분류 가설검정 이산형자료 연속형자료 One-sample Z test Two-sample T test One-sample Sign test Levene’s T test One-sample ANOVA Paired T test 2 Variances Equal Variances Mann- Whitney test Kruskal Whitney test 변수가 하나인 경우 변수가 둘인 경우 변수가 셋 이상인 경우 Chi-Square Test (독립성 검정) 정규성 검정 One-sample T test Y N
Y X 연속형 이산형 연 속 형 이 산 Histogram Run-Chart Matrix Plot t-Test Regression Fitted Line Plot DOE Logistic-Regression 이 산 Histogram, Box-Plot Run-Chart, Dot-Plot t-Test, Multi-Vari-Chart DOE, 2-Variance Test Pareto, ANOVA Chi-Sqaure Test Pareto X
주어진 명제가 참인지,거짓인지 결정하기 위한 과정을 의사의 결정의 과정이라고 한다. 11.가설수립과 검정 주어진 명제가 참인지,거짓인지 결정하기 위한 과정을 의사의 결정의 과정이라고 한다. 1.주어진 가설에 적합한 파라미터 값을 정한다.(예, 평균, 표준편차) 2.대립가설(H1) 수립 3.귀무가설(H0) 수립 4.유의수준(α) 결정 5.검정통계량 결정(예) t-통계량 f-통계량 6.시료를 조사하여 통계량 값을 계산 7.P-value를 구함 8.가설을 채택할 것인지 기각할 것인지 결정
가설수립의 예제 K사는 타이어의 단면폭이 215mm인 제품을 납품 받기로 H사와 계약 하였다. 계약 후 3달이 지난 후부터 타이어의 폭이 조금 작아 보인 다는 고객들의 불만사항이 쌓이기 시작하여 이 부분에 대해 조사 하려고 한다. 통계적 검정을 위해 가설을 먼저 세운 후 가설 검정을 위한 순서를 설정하여 보십시오. 시간 :10분
제1종 오류와 제2종 오류 가설검정 과정에는 두 가지 오류를 범할 수 있다. 이 두 가지 오류는 서로 Trade-Off관계가 있으며, 이 중 제1종 오류를 기준으로 설정 한다. 판정 H0 H1 실제 사실 타당한 판정 제1종 오류 제2종 오류 H0 : 살인범인 아님 H1 : 살인범인 예) 검사가 살인죄로 기소한 피고인에게 판사는 다음과 같은 두가지 오류를 범할 수 있다. ◈ 1종오류 :죄가 없는 사람에게 살인죄인 으로 판정함 ◈ 2종 오류 : 실제 살인을 저지른 사람 에게 무죄를 판정함 판사의 판정의 기준선
만약 P=Vaule가 0.054라면 여러분은 어떠한 판정을 하겠습니까? 귀무가설이 사실일때 사건이 일어날 확률이다. 따라서 P=Vaule가 유의수준(α)보다 클 경우에는 귀무가설 (H0)을 기각 시키는기에는 무리가 있으며 귀무가설을 채택한다. 일반적으로 P-Vaule가 0.05보다 작으면 귀무가설을 기각한다. 검정결과 P-Vaule가 0.07 이었다면… 1.유의수준((α) 을 0.05로 정했을 경우 : 귀무가설을 기각할 수 없음. 2. 유의수준((α) 을 0.1로 정했을 경우 : 귀무가설을 기각할 수 있음. 만약 P=Vaule가 0.054라면 여러분은 어떠한 판정을 하겠습니까?
12.정규성 검정 분석목적 - 연속형 측정자료의 형태를 파악 - 추후 통계분석에 대한 정규분포 가정을 검정 분석목적 - 연속형 측정자료의 형태를 파악 - 추후 통계분석에 대한 정규분포 가정을 검정 데이터 종류 연속형 자료 통계방법 1) 기초통계량을 이용한 정규성 검정 2) 히스토그램,상자그림을 이용한 정규성 검정 3) 정규확률 그림(Normal Probability Polt)을 이용한 검정 4) 통계검정(ex. Anderson-Daring 검정)
Minitab을 이용한 정규 검정 1. Minitab Data File : Box-Cox.mtw를 Open 합니다. 2. Skewed 변수의 정규성 검정 방법은 크게 두 가지로 나누어 볼 수 있다. 1) 기초 통계량과 분포의 형태를 알 수 있는 그래프를 통하여 정규성 검정을 합니다.(Method 1,2) 2) Normal Probability Plot과 통계감정을 통하여 정규성 검정을 합니다. (.(Method 3,4)
정규성 검정 –Method 1,2 1. 기초통계량과 그래프를 통한 정규성 검정이다. 2. Minitab 명령 : Stat>Basic Statistics >Display Descriptive Statistics 4. 필요한 그래프를 선택합니다. 여기서는 Histgram,Box-POLT 을 합니다. 5.Ok를 선택합니다. 1. Stat>Basic Statistics >Display Descriptive Statistics 을 선택합니다. 2.기초통계량을 그릴 변수를 선택합니다. 여기서는 Skewed를 선택합니다. 3.우측하단의 Graphs를 선택합니다.
Graph Output-Histogram Method 1,2의 Minitab 결과 해석 Session Output 기초통계량과 두개의 그래프를 보면 평균을 중심으로 하는 좌우 대칭형태의 정규분포라고 보기에 는 어렵다. Graph Output-Histogram Graph Output-Boxplot 이상치
정규성 검정 – Method 3,4 1. 정규확률에 주어진 자료를 표시하여 정규성 검정을 실시하고, 분포에 근거 한 통계검정방법으로 정규성 검정을 실시합니다. 2. Minitab 명령 : Stat > Basic Statistics > Normality Test 1. Stat > Basic Statistics > Normality Test를 선택합니다. 2. 정규성 검정을 실시할 부분을 선택합니다. 여기서는 Skewed를 선택합니다. 3. 3가지 정규성 검정 방법중 하나를 선택합니다. 여기서는 Anderson-Daring을 선택합니다. 4. Ok를 선택합니다.
Method 3,4의 Minitab 결과 주어진 자료에 대해 정규확률 그래프를 보면 정규분포(직선형태)와는 다른 경향을 보여주는 것을 확인할 수 있고(Method3),P=Vaule가 0으로 정규분포를 하지 않음을 통계검정 결과로도 확인할 수 있다(Method 4) 정규분포 기준선 정규 검정 자료 정규성 통계검정가설 H0:정규성을 한다. H1:정규성을 가지지 못한다. 정규성 통계검정결과
MiniTab 실습예제(10) 목 적 : 실습을 통하여 정규성 검정에 대해 이해한다. 시 간 : 15분 실습내용 1. 한국 Minitab 자료중 Tiles.mtw 중 Waring 변수에 대해 정규분포인지 검정하십시오. (4가지 방법을 모두 적용 하십시오.) 2. 평균이 2 이고 표준편차가 2인 정규분포에서 난수 100개를 생성하여 정규분포를 하는지 검정하시오. 3. 자유도가 50인 ChiㅡSquare 에서 난수 100개를 생성하여 정규분포를 하는지 검정 하시오.
13. Box-Cox 변환 변환목적 - 연속형 측정자료의 형태를 파악 - 추후 통계분석에 대한 정규분포 가정을 검정 변환목적 - 연속형 측정자료의 형태를 파악 - 추후 통계분석에 대한 정규분포 가정을 검정 데이터 종류 연속형 자료 연관통계분석 - 공정능력분석, T-test, 회귀분석….. 변환자료 해석변환 1. Lamda (λ) 를 이용하여 자료를 변환 2. 통계분석결과는 변환된 자료를 사용한 것으로 해석 및 분석결과에 있어서 주의가 필요
Minitab을 이용한 Box-Cox변환 Box-Cox.mtw의 Skewed 변수는 정규성을 만족하지 못하고 있다. 정규성 만족을 위한 최적의 Lamda(λ)를 찾기위해 BoxCox 변환을 실시한다. 1. Stat>Control Charts > Box-Cox Transformation을 선택합니다. 2. 가운데 상단의 Single Column Box에 변수변환 할 변수를 선택합니다. 3. Subgroup Size는 반복측정 횟수를 입력합니다. 여기서는 1을 입력합니다. 4. 가운데 하단에 Single Column Box에 변수변환 후 변수를 저장할 변수명을 입력합니다. 여기서는 Tskewed를 입력합니다. 5. Ok를 입력 합니다.
Box-Cox 변수변환결과 1. Box-Cox 변수변환을 통한 Minitab 의 결과 입니다. 2. 추정된 Landa값을 기준으로 하여 변수변환을 실시합니다. 변환에 필요한 Landa값 추정 Skewed 변수의 정규성을 만족하기 위한 최적의 Landa(λ)는 0 으로 추정 되었다.
Box-Cox 변수변환 자료 Skewed 변수를 변수변환한 후 자료에 대해 정규성 검정을 실시 하였다. 정규성 만족 변환된 자료의 히스토그램 변환 전 자료의 히스토그램 Box-Cox 변수변환 정규성 만족 정규성 검정
MiniTab 실습예제(11) 목 적 : 실습을 통하여 비 정규 자료을 만족하도록 하는 Box-Cox 변환을 이해 한다. 시 간 : 15분 실습내용 1. Minitab 자료 Tiles.mtw 중 Waring 변수에 대해 변수변환을 실시하십시오. 2. 자유도가 2인 Chi-Square에서 난수 100개를 생성한 후 변수변환을 실시 하십시오.
14.공정능력 분석 공정능력분석이란? 설계시방서 대로 제조단계에서 공정의 변동정도를 측정하고 얼마나 규격에 맞는 제품을 생산하고 있는가를 분석하는 과정 을 공정능력분석이라고 한다. 공정능력 일정기간을 통하여 안정된 공정상태에서 설계규격에 얼마나 일치하는 제품을 생산할 수 있는가를 나타내는 척도이다. 그 척도로서는 일반적으로 6Sigma를 사용한다. 공정능력지수 일정기간공정이 관리상태 있을 때 그 공정에서 생산되는 제품 의 품질변동이 어느 정도 인가를 양적으로 정량화 시킨 값.
공정능력 분석 프로세스 Y Y N N Normality Test (정규성 검정) Capability Analysis(Normal) 공정능력분석(정규분포) Y Session output 결과해석 N Box-Cox transformation (변수변환) Normality Test (정규성 검정) Dialogue 입력 Graph 결과분석 N Capability Analysis(Weibull) 공정능력분석(와이블분포)
Normal Distribution Weibull Distribution Normal 과 Weibull 적용차이 통계적으로 계산할 경우, 공정의 데이터는 정규분포(Normal Distribution)를 따른다고 가정한다. 하지만 정규분포를 따르지 않는 공정의 데이터가 발생될 경 우도 있다. 현재의 공정을 감안하여 정규분포를 적용하기 위해서는 Box- Cox Transformation을 이용하여 적용해야 한다. 만약 공장 데이터가 단축 규격 즉, 상한치 또는 하한치만 주어져 데이터의 분포 왜곡(Skewness)이 매우 심하고 정확한 불량률을 산출하기 원할 경우 Weibull을 사용한다. Box –Cox Transformation을 이용한 Normal과 Weibull 사용 용도 Normal Distribution Weibull Distribution Histogram,규격 범위지정,평균값 단기/장기 표준편차,공정능력 통계치 산출 단기/장기 공정 변수 및 공정 능력 통계치 동시 산출 정규 곡선 작성 Histogram,공정변수 (shape,scale), 공정능력 통계치 장기 공정변수 및 공정 능력 통계치 Weibull 곡선 작성 주) 어느방법이 좋은가는 실제 데이터가 어느 분포에 더 적합한 가로 결정된다. 하지만 두 분포가 비숫한 결과 (Cp,불량률)를 준다면 단기/장기 공정능력을 계산할 수 있기 때문애 Normal로 하는 것이 더 낫다.
공정능력 분석 가정 : 자료는 정규성을 만족한다. (정규성을 만족하지 않는 경우 (Box-Cox 변환을 실시함) 데이터 입력 - 측정 데이터 - 규격 공차 - 샘플수(그룹,시료) 출력되는 정보 : - 산포의 크기(Short-term,long-term) - 공정능력지수(Short-term,long-term) - 히스토그램 - Xbar-R관리도 - Normal Probability Plot - Capability Plot
Tile의 뒤틀림 조사자료에 대해 히스토그램을 보면 정규성을 만족 하지 못하고 있다. MiniTab 이용한 공정능력 분석 타일공장에서 생산되는 타일의 뒤틀리는 정도에 대해서 자료를 측정 하여 타일공장의 공정능력분석을 실시하였다. Spec : Upper Spec – 8 공정능력을 조사하기 위하여 한 번에 10개의 Tile을 Sampling하여 뒤틀리는 정도를 조사하였다.(Tiles.mtw) 정규성 검정결과 P-Vaule가 0.01로 공정능력분석의 적용에 어려움이 있다. 히스토그램 Tile의 뒤틀림 조사자료에 대해 히스토그램을 보면 정규성을 만족 하지 못하고 있다. Minitab을 이용한 공정능력분석은 자료의 정규성이 확보되어야 한다.
MiniTab 이용한 공정능력 분석(1) 1. file : Tile.mtw를 Open 합니다. 2. Stat>Quality Tools>Capability Analysis(Normal)을 차례로 선택합니다. 3. Single Column을 선택한 후 왼쪽 Box 안에 있는 :Warping”을 두 번 클릭 하여 오른쪽으로 Box로 보냅니다. 4. 바로 밑에 있는 Sub Group Size의 Box에 있는 숫자 “10”을 입력합니다. 5. Upper Spec “8.0”을 입력하니다. 6. Ok를 선택합니다.
공정능력 분석 Output 자료가 정규성을 만족하지 못하므로 출력된 결과에 대한 신뢰성은 없음.자료 에 대한 변수변환을 통한 정규성 만족 후에 공정능력분석 재 실시가 필요함
공정능력 분석을 위한 변수변환 모수 설정(Box-Cox변환) 공정능력분석을 실시하기 위하여 Box-COX변환을 실시하여 최적의 변수변환 모수 Lambda(λ)를 0.5로 설정함.
Minitab을 이용한 공정능력분석 1. File : Tile.mtw를 Open 합니다. 2. Stat > Quality Tool > Capability Analysis (normal)을 차례로 선택합니다. 3. Single Column을 선택한 후 왼쪽 Box 안에 있는 “Warping”을 두 번 클릭하여 오른쪽 Box로 보냅니다. 4. 바로 밑에 있는 Sub Group Size의 Box에 숫자 “10”을 입력합니다. 5. Upper Spec “8”을 입력합니다. 6. 오른쪽 모서리에 있는 Option을 클릭한 후 , Box-Cox Power Transformation을 선택하고 그 밑에 있는 Lambda=0.5 (Square Root)를 선택합니다. 7. OK를 선택합니다. 8. OK를 선택합니다.
공정능력분석 Output
용 어 설 명 Cp (단기 공정 능력지수) : 공정의 변동 정도를 지수로 표현 Cpk (치우친을 고려한 단기 공정능력 지수) : 현실의 공정은 중심 치가 한쪽 편으로 치우치는 경우가 대부분이다. 이 경우를 고려하여 공정의 변동정도 를 지수로 표현 CPL : Upper Spec을 지정할 경우의 단기 공정 능력지수 CPU : Lower Spec을 지정할 경우의 단기 공정 능력지수 주) 장기의 경우 C대신 P(Performance)로 표기하여 사용한다. PP,Ppk,PPL,PPU등.. Cpm(설비 능력지수:Machine) : 품질 특성치가 목표치 m에서 어느 정도 떨어져 산포 하고 있는가를 나타내는 양으로 양쪽 규격의 중앙값이 목표치 와 일치하지 않거나, 손실 함수를 사용하는 경우에 공정능력지수보다 더 유용하게 활용할 수 있다. UCL : 규격의 상한 치 LCL : 규격의 하한치 Mean : 산포의 중심치 PPM : Part Per Million 으로 불량률을 나타낸다.
15.관리도(Control Chart)란? 산포의 통제 도구 프로세스를 모니터링 할 수 있는 도구 프로세스의 성과 척도를 시각적으로 이해 개선팀이 프로세스 산포에 대한 근본원인을 이해
관리도의 운영 관리도는 목적에 따라 해석용과 관리용으로 분류할 수 있다. 해석용 관리도 - 품질 특성에 영향을 미치는 요인과 각 요인별 영양력 파악에 대부분 사용이 된다. - 이미 수집된 자료를 이용하여 그리는 경우가 많다. 관리용 관리도 - 공정의 관리(공정의 안정상태 유지)를 목적으로 사용한다. - 안정된 공정의 관리상태를 기준으로 하여 측정되는 자료를 타점한다. - 타점 된 자료와 관리한 개선과 비교하여 관리상태를 파악한다.
데이터의 형태와 관리도의 종류 데이터 형태 연속형 이산형 결점수 불량율 C-관리도 시료의 크기는 일정함 U-관리도 시료의 크기는 일정하지않음 NP-관리도 시료의 크기는 일정함 P-관리도 시료의 크기는 일정함 X-bar-R관리도 시료의 크기 = 5개미만 X-bar-S관리도 시료의 크기 = 5개이상 -Individuals, -Moving Range 시료의 크기 =1
연속형 관리도 데이터의 종류 Y : 연속형 자료 예) 자동차의 크랭크 축의 길이, 노트북의 무게 Xbar-R 관리도 분석목적 제품에 대한 평균과 변동 범위로 공정의 안정상태를 파악 한다. 특징 전체 공정의 변동을 일회 샘플링의 군내 범위(Range)로 표시한다. 데이터의 종류 Y : 연속형 자료 예) 자동차의 크랭크 축의 길이, 노트북의 무게 예제 1) 맥주를 생산하는 J 회사에서는 맥주 한병에 355cc를 담고 있다. 매일 생산되고 있는 맥주는 안정적으로 생산되고 있는가? 2) 노트북에서 무게는 매우 중요하다. 노트북을 생산하고 있는 공정 은 안정적으로 노트북을 생산하고 있는가?
Minitab을 이용한 Xbar-R관리도 생산하고 있는 Wafer의 지름을 통하여 제조공정의 안정상태를 확인한다 Minitab 명령 : Stat > Control Chart > Xbar-R 1. Minitab Wafer1.mtw 을 불러옵니다. 2. Stat > Control Chart > Xbar-R 를 선택 합니다. 3. 우측 상단의 Data are arrange as 명령에 다음과 같이 입력합니다. * Single Column : Diameter(좌측 Box에서 선택) * Sub group Size : 5 (숫자입력) 4. OK를 선택합니다. 모 집단의 평균과 표준편차 를 아는 경우에는 그 값을 그대로 입력합니다.
Wafer의 제조공정은 조금 불안정한 상태라고 할 수 있다. X-bar-R 관리도 Output Wafer의 제조공정은 조금 불안정한 상태라고 할 수 있다. 1번 불량 평균 범위
데이터의 종류 Y : 연속형 자료 예) 자동차의 크랭크 축의 길이, 노트북의 무게 Xbar-S관리도 분석목적 제품에 대한 평균과 변동으로 공정의 안정상태를 파악 한다. 특징 일회 샘플링 시 자료의 수가 많은 경우 군내 변동을 표준편차로 표시한다. 데이터의 종류 Y : 연속형 자료 예) 자동차의 크랭크 축의 길이, 노트북의 무게 예제 1) 맥주를 생산하는 J 회사에서는 맥주 한병에 355cc를 담고 있다. 매일 생산되고 있는 맥주는 안정적으로 생산되고 있는가? 2) 노트북에서 무게는 매우 중요하다. 노트북을 생산하고 있는 공정 은 안정적으로 노트북을 생산하고 있는가?
Minitab을 이용한 Xbar-S관리도 제품 생산 공정이 안정적인지를 확인하고자 한다. Minitab 명령 : Stat > Control Chart > Xbar-S Subgroup의 크기가 큼 1. Minitab Strength.mtw 을 불러옵니다. 2. Stat > Control Chart > Xbar-S 를 선택 합니다. 3. 왼쪽 Box안에 있는” Strength”를 두 번 클릭하여 Single Column 의 오른쪽 Box안 으로 보냅니다. 4. Sub group Size의 오른쪽 Box안에 “10”을 입력합니다. 5. OK를 선택합니다. 모 집단의 평균과 표준편차 를 아는 경우에는 그 값을 그대로 입력합니다.
X-bar-S관리도 Output Wafer의 제조공정은 조금 불안정한 상태라고 할 수 있다. 평균 범위