SPC (Statistical Process Control) 심화 과정
SPC 심화과정 (Version 1) 본 교재에 대한 저작권은 송도 테크노 센터 및 (주)드림힐에서 보유하고 있습니다. 어떤 목적으로든 본 문서의 일부 또는 전부를 (주)드림힐의 서면 승인 없이 임의로 배포하거나, 사용할 수 없사오니 이 점 양지하시기 바랍니다. SPC Advanced Course, Copyright © Dream-hill Co., Ltd., Rep. of Korea. All rights reserved.
교육과정 안내 SPC 심화 과정
교육시간 안내문 교육과정중 의문사항은 손을 들어 언제든지 질문하시기 바랍니다. 핸드폰은 전원을 꺼 주시거나, 진동모드로 바꿔주시기 바랍니다. 휴식시간 및 점심시간을 준수하여 주시기 바랍니다. 교육을 이수하기 위해서는 전체 교육과정을 모두 참석하셔야 합니다.
교육과정 목적 현 자동차 업계의 품질수준과 요구사항을 이해하고 이에 따는 SPC의 필요성을 및 개념 이해 현 자동차 업계의 품질수준과 요구사항을 이해하고 이에 따는 SPC의 필요성을 인식한다. 또한 SPC의 기본 개념 및 주요 용어정의를 이해한다. SPC의 기초 통계 및 기본 Tools SPC 이해 및 적용에 필요한 기본 통계와 SPC 활동에 필요한 주요 도구들을 적용방법 및 사례 연구 및 실습을 통해 공정 변동 및 품질문제의 분석 및 개선을 효과적으로 수행할 수 있는 능력을 배양한다. 관리도와 공정평가 도구 SPC의 핵심 Tools인 관리도의 선택, 원리, 작성, 해석 및 공정에서의 실제 운용방법을 이해하고, 공정능력 등 다양한 공정평가 방법을 숙지하여 공정개선을 통한 품질개선 능력을 배양한다. 측정시스템 분석 측정시스템의 전문 용어 및 변동요인을 이해하고 측정시스템의 능력 판정을 위한 측정시스템 분석 방법을 학습 및 실습을 통해 SPC의 효과적 적용과 검사시스템의 검출력을 향상 시킬 수 있는 능력을 배양한다.
SPC 교육모듈 I II III IV v v I SPC의 필요성 및 기본 개념 SPC를 위한 기초 통계 관리도 공정 평가 도구 – 공정능력/공정실적 IV 측정시스템 분석 v SPC 운영 체계 v I
교육 프로그램 시간표 순의 교육모듈 명 날짜 시간 교육내용 강사 1 SPC의 적용 목적 및 정의 1일차 2시간 드림힐 전문위원 2 SPC 이해 및 적용을 위한 기초 통계 - 기초 통계용어, 확률분포, 통계량 등 SPC의 통계적 기반 이해 3 SPC 적용을 위한 기본 Tools - QC 7 Tools에 작성 및 적용 방법 - QC 7 Tools의 활용 및 사례 4 SPC 기초통계 및 기본 Tools 실습 - SPC 개념 및 기초통계 이해도 측정 - QC 7 Tools 실습 5 관리도 작성, 적용,해석 방법 2일차 - 관리도의 기본 수리/원리 - 계량형/계수형 관리도 작성 및 해석 방법 6 공정평가 방법 - 공정능력/공정실적의 개념 및 수리 - 기타 공정능력 평가 방법 7 관리도 작성 및 공정평가 실습 3시간 - Xbar-R 관리도 작성, 해석 및 조치 - P 관리도 작성, 해석 및 조치 - 공정 능력/실적 산출 및 해석 8 효과적인 관리도 운영방법 1시간 - Best Practice 연구
교육 프로그램 시간표 순 교육모듈 명 날짜 시간 교육내용 강사 1 측정시스템 개요 3일차 1시간 - 측정시스템 용어정의 - 측정시스템의 특성 및 영향 드림힐 전문위원 2 측정시스템 변동 - 측정시스템 변동 유형 - 편의, 안정성, 반복성, 재현성, 선형성 3 측정시스템 평가 2시간 - 측정시스템 평가절차 - Gage R&R 등 측정시스템 평가 방법 4 실습 - Gage R&R (계량형 게이지) 분석 실습 - 계수형 게이지 분석 실습 5 실무 사례 - 측정시스템 유형에 따른 분석방법 연구
SPC Statistical Process Control 자동차 업계의 품질현황 및 요구수준 어떻게 요구품질을 달성할 것인가? SPC 정의 및 기본 개념 SPC 기본 용어
SPC Statistical Process Control 1. 자동차 업계의 품질현황 및 요구수준
SPC Statistical Process Control 2. 어떻게 요구품질을 달성할 것인가?
어떻게 요구품질을 달성할 것인가? 기존의 제품 설계, 공정 개발 및 관리 방법으로는 달성이 불가능 함 ▶ 60~30 PPM 수준의 공정 달성 기존의 제품 설계, 공정 개발 및 관리 방법으로는 달성이 불가능 함 설계, 공정개발, 양산관리 각 단계에서 적극적으로 통계적 기법을 사용하여 → Robust한 제품 및 공정을 만들고 유지해야 한다. 산포에 둔감한 설계(Cpk) 요구품질을 충족하는 공정개발(Cpk, RPN) 안정된 공정 유지 관리 (PPH) Product Design Process Design Process Control Customers 제품 평가 (최종검사, 제품 Audit) 1. Capable Design (CPk.) - Verified BOM Reuse - Robust Design/DFSS - DFMEA,PFMEA, KPC, PQC - Complexity/Variation - DFX 2. Design Review - SE/DR 3. Design Validation - DVP/PVP - Design for Six Sigma 4. 단계별 Sign-off - Gate Review, Quality Valve 등 1. Capable Process (CPk) - BOP(공정계획) 2. Reduced Process Risk (RPN) - PFMEA, RPN Reduction, QCOS - Fool Proof 3. Manufacturing Process Validation - Parameter Optimization (DOE) - Tooling Sign-off - 설비 및 공정 능력 (Cmk/Ppk) 4. 관리방법 - Process Control (SPC) Plans 5. Production Readiness Review 1. 무결점 Launch Process 2. In-Process Control - 제품품질표준 - 표준 작업/검사 - SPC(관리도 등) - Process Audit - Quality Systems Mgmt. 3. Problem Solving (PS) - CFT/Training - 통계적 지식 및 방법론 - All the Time All the People 1. PPH/Spill/GCA 2. Warranty 2. J D Power 재외주 업체 공정 제품 및 공정 설계 확인 업체 품질개선 프로세스 Continuous Improvement
어떻게 요구품질을 달성할 것인가? 제품/공정 설계단계에서의 Robustness 확보 Robustness 검증 양산 관리 및 지속적 개선 SPC (Control Chart, Cpk/Gpk) 통계적 문제해결 기법 Six Sigma QRD 무결점 개발/생산 설계 능력 확보 강건설계 DFSS 공정능력 확보 공정변수 최적화 (DOE) Cmk/Ppk/Gpk Time
SPC Statistical Process Control
Statistical Engineering (Robust-Design Of Experiments) SPC 정의 및 기본 개념 ▶ SPC는 … … SPC는 품질과 생산성의 개선을 달성하기 위한 하나의 전략이다. 이 전략의 목표는, 통계를 이용하여, 제품 및 공정산포를 이해하고, Engineering 및 관리를 통해, 목표치 주위에서 <산포를 최소화>하는 활동 Quality Engineering Facilitator: Key Issues: Design / Process Robustness Ability to Maintain Centering Equipment Capability Ability to Maintain Statistical Control Off - Line QC On - Line QC SPC 정의 및 기본 개념 제품설계 공정설계 공정관리 Statistical Engineering (Robust-Design Of Experiments) 통계적 공정관리의 활용 (SPC) 협의(狹義)의 SPC 광의(廣義)의 SPC
SPC 정의 및 기본 개념 사용 목적 기법 데이터 수집 및 공정 분석 확률 분포, 데이터 정리법, 평균, 분산, QC 7가지 도구, 추정, 검정 공정 감시 및 유지 관리도, 공정 능력 분석, 히스토그램, 상자 그림, 추이도, 특수 관리도(USUM, EWMA, 다변량 관리도, 메디안 관리도 등) 제품 및 공정 설계의 Robustness 확보, 공정 개선 신 QC 7가지 도구, 상관 분석, 회귀 분석, 실험계획법, 다꾸지 방법, FMEA, FTA, 다변량 분석, 시계열 분석
SPC의 정의 및 기본 개념 S(Statistical) : 통계적 자료와 분석 기법을 활용하여 공정에서의 변동을 측정하고 분석하기 위해 통계적 방법론을 적용하는 관리활동 S(Statistical) : 통계적 자료와 분석 기법을 활용하여 P(Process) : 주어진 품질규격과 공정상태를 파악해 C(Control) : 원하는 상태의 제품이 생산될 수 있도록 관리 고유기술과 접목하여 불량원인 파악 현 공정상태의 탐지 및 문제점 식별 개선을 위한 합리적 대책 수립 품질산포가 적은 균일한 제품의 생산!!!
SPC의 정의 및 기본 개념 출력물 공정 (Process) 공정변수 제품 변수 예방전략 원인 또는 입력물 출력물 공정 (Process) 공정변수 제품 변수 공정 및 입력물 관리 산포 개선 표준작업 관리도 안돈 다변량 차트 Error Proofing 공정능력 PFMEAs 제품 및 출력물 관리 검사 Containment 한도견본 선별/재작업/Scrap 예방전략 (Strategy Of Prevention) 검출전략 (Strategy Of Detection)
전통적인 검사방법으로는 공정을 효과적으로 관리할 수 없다. DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 다음 문장을 읽고 모든 대/소문자“C”를 세고 총 숫자를 기록하라. The recent time clock incident in Kansas City, in which a malfunction kept the clock from starting for 15 seconds after a time-out, has caused much controversy and considerable interest in changing the whole process of timekeeping. Cries of cheating and charges of poor officiating have obscured the fact that the Michigan State University-University of Kansas basketball scrimmage was one of the most exciting contests in the current year’s NCAA tournament. Scott Skiles, Vernon Carr, Larry Polec and crew gave Cliff Dreiling, Danny Manning, and company a contest they won’t soon forget. Should Kansas successfully complete its NCAA championship challenge, M.S.U. recruiters certainly can claim that Jud Heathcote’s charges could be considered the second-best court fivesome in the country. No team can come as close to conquering another, and still be denied the victory, as did the Spartans. ANSWER ______________ 57개 Facilitator says Traditional ways of controlling process output operated under the “Detection” philosophy. The idea was to create product and find any discrepant product at the end of the process. This is no guarantee of acceptable quality. Users must do more by controlling the process itself. In the words of Dr. W. Edwards Deming, who along with Walter Shewhart “founded” SPC, we “Must work smarter, not harder”. Trying to “inspect quality into” a process is inefficient and fails on several counts. The first problem is that 100% inspection is not 100% accurate -- studies have shown 100% inspection is more like 70-90% accurate. This means that some bad parts, products, or services get to the customer, while some “good” items get wrongly rejected. For even a simple matter as totaling the number of one letter in a passage, there can be disagreements between people, and even for the same person when the “count” is made several different times. PARTICIPANTS SHOULD COMPLETE THIS EXERCISE ONCE OR TWICE, AND COMPARE ANSWERS WITH EACH OTHER. NOTE TO FACILITATOR: THERE ARE 57 “C’s” IN THE PARAGRAPH. CONSIDER MAKING A FREQUENCY TALLY TO RECORD ALL THE “COUNTS”. THIS WILL MAKE THE DIFFERENCES MORE VISIBLE.
왜 “검사” 전략이 효과적으로 고품질을 보증할 수 없는가? DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 생산 검사 고객 X X X Y X Y Y Y X X X X X Y X X X X Y X X Y X 재검사 Facilitator says We have seen that traditional inspection is not 100% accurate. Not only may “bad” items be missed, but “good” ones may be rejected. There are even more reasons why traditional inspection fails in controlling processes efficiently. * Items correctly rejected as “nonconforming” may then be subject to a scrap or rework decision. If the parts are reworked, then the parts may be placed back in the production stream. A reinspection should be done before this occurs. Many believe that a nonconforming part can never be made as good as if the part were made correctly the first time. * Focusing on inspection of product rather than improving the process means that a continual percentage of nonconforming items will be produced. * The results of the traditional method of sorting process output are : dissatisfied customers excess cost (which is often passed on to the customers) wasted product, time, effort, motion, storage wasted human resources that could be used making good products and services. * Using statistical methods to learn about the behavior of processes will provide a better understanding of what needs to be done to improve processes and output. This will prevent many problems from occurring and so reduce the amount of bad product. That will improve customer satisfaction, and lower costs. Optional Exercise: “Finesse and containment are a commitment to poor quality”. Discuss what this means using the above discussion and in terms of Prevention versus Detection. More on Prevention versus Detection: If 100% inspection were 100% accurate, it would still not be enough to assure quality efficiently: Items correctly rejected as “nonconforming” would then cause more activities: a scrap or rework decision reworked parts must be reinspected many say a nonconforming part can never be made as good as if it were created correctly the first time Results of focusing on the traditional method of sorting process output: accepting a continual percentage of nonconforming items. excess cost passed on to the customer wasted product, effort, storage, and human resources Statistical methods provide a better understanding of what needs to be done to improve processes and their output -- prevention of problems. prevention keeps problems from occurring and reduces the amount of bad product prevention improves customer satisfaction, and lowers costs 검사 스크랩 재작업
SPC Statistical Process Control
. . SPC의 기본 용어 이해 어느 총이 더 좋은가? 산포(변동)의 다양한 유형 DIFFERENT WAYS TO CATEGORIZE VARIATION ▶ 목표 (Target) 산포(변동)의 다양한 유형 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION . . 어느 총이 더 좋은가?
SPC의 기본 용어 이해 DIFFERENT WAYS TO CATEGORIZE VARIATION ▶ 목표 (Target) 산포(변동)의 다양한 유형 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 어느 총이 더 좋은가?
SPC의 기본 용어 이해 산포(변동)의 다양한 유형 1) 부품 내의 산포 2) 부품들 간의 산포 3) 시간별 산포 DIFFERENT WAYS TO CATEGORIZE VARIATION ▶ 산포 (변동) 산포(변동)의 다양한 유형 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 1) 부품 내의 산포 2) 부품들 간의 산포 3) 시간별 산포 4) 설비/기계별 산포 5) 장소(Cell/Line/Plant)간 산포 산포(변동)는 모든 생산제품을 서로 다르게 만든다. Categorizing Variation by Where it is Found: Within piece variation -- illustrated by the surface finish of a part where one spot of the surface is rougher than another Piece to piece variation -- occurs among pieces produced at the same time Time to time variation -- relates to the difference observed in parts produced at different times of the day, or on different days Machine to machine -- each machine has its own characteristic pattern of production Location to location -- products from different plants have different patterns of variation, due to differences in the plants’ respective machines, environments, work forces, management, incoming materials, and work methods Categorizing Variation by its Source: MATERIAL METHODS MANPOWER MACHINERY MEASUREMENT MANAGEMENT
SPC의 기본 용어 이해 ▶ 우연 원인 과 이상 원인 우연 원인 이상 원인 통계적으로 통계적으로 안정적(Stable) 관리상태 예측가능 통계적으로 유의한 변화 (Significant Change) 불안정 (Unstable) 이상상태 (Out of Control) 예측 불가능 목표선 목표선 예측 가능 예측 불능 시간 시간 개선 조치 국부조치(Local) 작업자/감독자 개선 조치 시스템적 조치 관리자/경영자 산포 산포
SPC의 기본 용어 이해 공정관리 공정능력 관리 상태 (이상원인 제거) 시간 비정상 상태 (이상원인 존재) 산포 시간 ▶ 공정관리와 공정능력 공정관리 관리 상태 (이상원인 제거) 시간 비정상 상태 (이상원인 존재) 산포 공정능력 시간 관리상태이고 공정능력 있음 (우연원인에 의한 산포가 감소) 산포 관리상태이나 공정능력 없음 (우연원인에 의한 산포가 과다)
단원 요약 품질전략과 SPC의 필요성 SPC의 정의 및 기본 개념 SPC의 기본 용어 산포(변동) 우연원인 Vs 이상원인 DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 품질전략과 SPC의 필요성 SPC의 정의 및 기본 개념 SPC의 기본 용어 산포(변동) 우연원인 Vs 이상원인 공정 관리 Vs 공정능력 Answer 설계, 개발, 양산의 모든 단계에서 적극적인 SPC 적용 통계적 공정관리는 공정이 일관되게 유지되도록 그래픽 도구를 통해 정보를 얻고 사용하는 것이다. “검출” 철학은 제품이 만들어진 후 불량제품을 찾는 것이고, “예방” 철학은 불량품을 만들지 않기 위해 공정 신호에 사전 대응하는 개념이다. 예방 철학이 공정을 관리하기에 더 좋은 전략이다. 4.공정변수가 제품변수를 결정하고 관리한다.
심화 학습 DIFFERENT WAYS TO CATEGORIZE VARIATION 1. 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 1. 고객의 요구품질을 어떻게 달성할 수 있는지 논의 하시오 2. 통계적공정관리 (SPC) 란 무엇인가? 3. 예방과 검출 철학을 설명하고, 어느 것이 공정관리에 더 효과적인가? Answer 설계, 개발, 양산의 모든 단계에서 적극적인 SPC 적용 통계적 공정관리는 공정이 일관되게 유지되도록 그래픽 도구를 통해 정보를 얻고 사용하는 것이다. “검출” 철학은 제품이 만들어진 후 불량제품을 찾는 것이고, “예방” 철학은 불량품을 만들지 않기 위해 공정 신호에 사전 대응하는 개념이다. 예방 철학이 공정을 관리하기에 더 좋은 전략이다. 4.공정변수가 제품변수를 결정하고 관리한다. 4. 공정 및 제품 변수 중 어느 것이 다른 것을 결정 및 관리하는가? 5. 이상원인에 의한 변동과 우연원인에 의한 변동의 차이를 논하고, 각 변동에 대한 적절한 대처방법은 무엇인가?
SPC Statistical Process Control Data의 분석 및 통계처리 확률 분포 – 연속형 확률 분포 - 이산형
SPC Statistical Process Control DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION Data의 분석 및 통계처리
데이터란 무엇인가? 데이터는 측정 또는 판단의 결과이며, 수치형태로 나타나는 정보이다. 왜 데이터를 수집하는가? DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 데이터는 측정 또는 판단의 결과이며, 수치형태로 나타나는 정보이다. 왜 데이터를 수집하는가? 현재의 상황을 이해하기 위해 원인 결과 관계의 공정을 분석하기 위해 공정을 관리하기 위해 지속적 개선을 위해 공정을 조정하기 위해 제품의 합부 판정을 위해
계량치 및 계수치 데이터 DIFFERENT WAYS TO CATEGORIZE VARIATION 계량치(Variable Data) – 측정을 통하여 얻어진 연속적으로 변화하는 값 Ex) 길이, 무게, 온도, 시간, 두께 등 계수치(Attribute Data) – 세어서 얻을 수 있는 불연속적으로 변화는 값 Ex) 불량개수, 재해발생 건수, 결점수 등 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION .118 .111 .108 .115 .105 .103 .113 .114 .110 .112 .109 .107 .104 철판 두께의 검사결과 .118 .111 .108 .115 .105 .103 .113 .114 .110 .112 .109 .107 .104 철판 두께의 검사결과 CHECK SHEET CHECK SHEET XXXXXXXXX XXXXXXX XXXX XXXXX XXX X = Scratch O = Dent OOO OOOOO OO
계수치 데이터의 두 주요 유형 부 적 합 (결 함 , 불 량) 부 적 합 품 (불 량 품) DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 부 적 합 (결 함 , 불 량) 부적합은 스크래치, 칩, 크랙과 치수 규격을 벗어난 제품 생산의 원인이 되는 것 부 적 합 품 (불 량 품) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 한가지 혹은 그 이상의 부적합 발생으로 인하여 불합격된 제품
Data 종류 및 처리 (실습) VARIABLE OR ATTRIBUTE DATA? ________ 1. 교차로의 사고 건수 ▶ 계량형 또는 계수형 데이터? ____1. Number of accidents at a corner ____2. Speed of a vehicle ____3. Typing errors per page ____4. Tensile strength ____5. Number of nonconformities on a hood ____6. Caster/Camber measurement ____7. Number of good vehicles ____8. Wheel balance measurement ____9. Number of wheels with unacceptable balance ___10. Measurement of fender to hood gap ___11. Go no-go measurement ___12. Air pressure gage ___13. Volt gage ___14. Number of plant accidents ___15. Toe-in measured values ________ 1. 교차로의 사고 건수 ________ 2. 자동차의 속도 ________ 3. 페이지당 오타 수 ________ 4. 인장 강도 ________ 5. 자동차 후드의 결점수 ________ 6. 자동차 캐스터/캠버 각도 ________ 7. 합격 부품의 수 ________ 8. 타이어의 밸런스 ________ 9. 불합격 휠 밸런스 타이어 수 _______ 10. 펜터와 후드의 갭 _______ 11. Go no 게이지 측정값 _______ 12. Air pressure gage 측정값 _______ 13. Volt gage 측정값 _______ 14. 안전사고 건수 _______ 15. 회로기판의 결점수 Exercise: Instructions: Write a “V” for “Variable” or an “A” for “Attribute” immediately to the left of each question. This indicates what type of data is described on that line. You have five minutes to complete the exercise. We will discuss the answers as a group; you will correct your own answers. Notes:
데이터 분석 과정 기술(Descriptive)통계 : 수집된 데이터의 특성을 서술하고 측정자료를 요약/정리 ▶ 통계의 구분 기술(Descriptive)통계 : 수집된 데이터의 특성을 서술하고 측정자료를 요약/정리 추론 (Inferential)통계 : 표본에 포함된 정보로부터 모집단의 특성을 파악 현실의 문제와 통계적 개선 과정 공정 (Process) LOT 표본 (Sample) DATA 조치 (Action) 의사 결정 정보 Information 통계적 처리
모집단 및 모수 모집단은 일정한 속성을 가지고 있는 전체 개체 집단이다. 모수는 모집단의 특성을 설명하는 수리적 측정값이다.
표본 및 통계량 표본은 모집단을 나타내기 위해 선택된 일부 집단이다. 통계량은 표본의 특성을 나타내는 수리적 측정값이다.
Data 의 통계적 분석 방법론 모집단 DATA 획득 통계량 1 2 3 4 5 중심위치 산포 분포형태 수치요약 관계 (정보) GRAPHICAL ANALYSIS 샘플링 측정 DATA 획득 대표성 확보 중심위치 산포 분포형태 관계 · 확률구조 및 오차분포 수치요약 (정보) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 모집단의 추론 ,결론 통계량 Notes:
Data 의 통계적 분석 방법론 모집단 DATA 획득 통계량 1 2 3 4 5 중심위치 산포 분포형태 수치요약 관계 (정보) GRAPHICAL ANALYSIS 샘플링 측정 DATA 획득 대표성 확보 중심위치 산포 분포형태 관계 · 확률구조 및 오차분포 수치요약 (정보) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 모집단의 추론 ,결론 통계량 Notes:
데이터의 수집 모집단 시 료 데이터 LOT 시료 DATA 시간에 1) 필요한 정확하고 신속하게 전달되어야 살아 ▶ 데이터 수집 시간에 1) 필요한 정확하고 신속하게 전달되어야 살아 있는 데이터가 된다. 장소에 정보를 2) 데이터는 모집단의 특성을 대표하여야 한다. 모집단 시 료 데이터 LOT 시료 DATA 3) 데이터는 조치를 취하기 위해서 필요한 것이다. 조치를 수반하지 않는 데이터는 수단과 목적을 모르는 숫자 놀음에 불과하다.
샘플링의 유형 랜덤 샘플링 각 개체가 동일한 확률로 선택되어야 한다. 계통적 샘플링 정해진 순서 및 시간에 각 개체가 선택된다
랜덤샘플링 (Random Sampling) 층별샘플링 (층화=層化=Stratified Sampling) 세부 샘플링 방법 랜덤샘플링 (Random Sampling) * 좋은 것만 고르거나, 나쁜 것만 골라 잡는 것 같은 치우침이 없어야 한다. ※ 무작위(無作爲)추출=랜덤샘플링 <비 교> ① 층별샘플링은 추출편차는 줄일 수 있으나, 비용이 많이 들고, ② 취락샘플링은 시료채취비용은 줄일 수 있으나, 추출편차가 커짐. ③ 따라서 로트를 층별하되, 매층에서 시료를 취하지 않고, 일부 층에서만 시료를 취하는 <2단계샘플링>방법도 좋다. 층별샘플링 (층화=層化=Stratified Sampling) * 층간의 차는 크게, 층내는 균일하게 층별함을 원칙으로 한다 취락샘플링 (집락=集落=Cluster Sampling) ★ * 취락간의 차는 없어야 한다 * 선택된 한 집단 모두 조사. ★ ★ ★
표본 크기 표본 크기가 커지면, 데이터의 신뢰도가 증가한다. 표본 크기가 작아지면 데이터의 신뢰도가 작아진다. 이것은 샘플링 대한 기본원칙이다. 계량치 데이터에 대한 표본크기는 최소 30개이며, 계수치 데이터는 더 많은 표본이 필요하다.
데이터의 통계적 분석 방법론 모집단 DATA 획득 통계량 1 2 3 4 5 중심위치 산포 분포형태 수치요약 관계 (정보) · GRAPHICAL ANALYSIS 샘플링 측정 DATA 획득 대표성 확보 중심위치 산포 분포형태 관계 · 확률구조 및 오차분포 수치요약 (정보) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 모집단의 추론 ,결론 통계량 Notes:
데이터 DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION .118 .111 .108 .115 .105 .103 .113 .114 .110 .112 .109 .107 .104 철판 두께의 검사결과 CHECK SHEET XXXXXXXXX XXXXXXX XXXX XXXXX XXX X = Scratch O = Dent OOO OOOOO OO
많은 데이터로 구성된 분포를 통해 더 많은 정보를 얻을 수 있다 데이터의 분포 DIFFERENT WAYS TO CATEGORIZE VARIATION 한 개의 데이터로는 모집단에 대해 알 수 없다; 많은 데이터로 구성된 분포를 통해 더 많은 정보를 얻을 수 있다 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION Facilitator says While individually measured values may all be different, as a group these values tend to form a pattern that can be described as a distribution. It is important to have enough individual values to form a good idea of the actual pattern of the variation -- where the process is located how great is the spread of the process what is the shape created by the distribution of individuals An advanced SPC course will go more deeply into the question of sufficient sample size. This course is just interested in showing how important sample size is. In the example above, one piece of data gave no real idea of the process’ pattern of variation -- spread or centering. This example is like the one bullet hole in a target. As the data are compiled, some idea of these characteristics is formed. Part of the “art” or “science” of SPC lies in figuring out how much data is necessary to form an adequate picture of a situation.
데이터 의 통계적 분석 방법론 모집단 데이터 획득 통계량 1 2 3 4 5 중심위치 산포 분포형태 수치요약 관계 (정보) · GRAPHICAL ANALYSIS 샘플링 측정 데이터 획득 대표성 확보 중심위치 산포 분포형태 관계 · 확률구조 및 오차분포 수치요약 (정보) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 모집단의 추론 ,결론 통계량 Notes:
히스토그램 100명 학생의 키 30 학생의 수 25 20 15 10 5 Facilitator says Histograms are bar graphs which show the pattern of variation in variable or attribute data, although they are more often used for variable data. The histogram has “cells”, each indicating a zone within which certain groups of readings occur. The height of each cell is determined by the count of individuals within that cell. Histograms can indicate where a process was centered and what its dispersion was during the period when a sample was taken. These may also be related to the specifications for the process. However, when evaluating a histogram, some notion should first be gained as to whether the distribution of values may represent a stable process. If the pattern of the histogram is non-normal for the process, then judgements as to the mean and dispersion of the process are valid only for the data collected. So a histogram can “prove” only a negative conclusion; that is, if the pattern of data in the histogram indicates instability, then it is most likely that the parent process is unstable. If the distribution appears to be that of a stable process, then some idea of the dispersion and centering of the living process, and how these relate to specifications, if any, may be gained. 163 164 165 166 167 168 169 170 171 72 173 174 175 176 키 (인치) 공정의 분포에 대한 유용한 정보를 제공한다
정규성 검토 (Normality-Study) 히스토그램 돗수분포(Freqency Distribution)와 히스토 그램 - 돗수분포는, KS A 3001 정의에 의하면, ① 측정치중에 같은 값이 되풀이 되어서 나타날 경우, 각 값의 출현 돗수를 늘어 놓은 것 ② 측정치가 존재하는 범위를 여러개의 구간(계급, Class) 으로 나누었을 때, 각 구간에 속하는 측정치의 출현 돗수를 늘어 놓은 것. - 히스토그램은, 돗수분포를 주상도(柱狀圖)로 그린 그림. 히스토그램을 작성하는 목적 ① 공정분포의 모양을 알고자 한다 ② 공정 중심과 산포의 크기를 알고자 한다 ③ 공정(제조품질)과 규격(설계품질)과를 비교하고자 한다 ① 공정은 정규분포에 근사하여야 공정이 안정상태라 판정 ② 공정평균(μ)와 표준편차(σ)를 추정하여야 한다 ③ 공정능력(6σ)을 평가하여야 한다. 정규성 검토 (Normality-Study) Cp, Cpk, Cpu, Cpl, PP%, Ppk - - 등.
히스토그램 작성 방법 1 측정치중 범위(R)을 우선 구한다 : R = Xmax - Xmin 2 계급의 폭(h)을 결정한다 ① KS A 3251에 의한 방법 - R을 1,2,5,단위로 나누어 그 값이 5~20이 되는 것을 택한다 * 보통 계급의 수는 7~12개가 적당 ② Sturges Rule에 의한 공식 활용법 - 계급의 수 (k) = 1+ × log n = 1+3.322(log n) <예> n=150 이면, k = 1+3.322 × log 150 = 1+3.322 ×2.1761 ≒ 8 < * 범위 R을 k=8로 나누어 폭 h를 결정 > 1 log2
규격치 기입 및 각종 정보량 ( μ, σ, Cp, Cpk 등 ) 히스토그램 작성 방법 3 돗수분포 용지 (공정조사용 Check-Sheet) 준비 4 계급의 경계치 결정 - 측정단위보다 소숫점 한자리 더 내려가 로 함 1 2 5 계급의 중심치(중앙값=대표값=Xi)를 계산 6 계급별로 출현 돗수를 체크한다 ( / , // , /// , //// , //// 등) 7 히스토그램을 작성한다 8 규격치 기입 및 각종 정보량 ( μ, σ, Cp, Cpk 등 ) 9 데이터의 History를 5W 1H에 의해 기입
히스토그램 작성 방법 ▶ 히스토그램 작성 연습 < 작성 순서 > ① 범위 R = L - S = 64 -23 = 41 <예> 어떤 제품의 중량의 규격치는 37.5±12.5 (g) 이다. ( n=100 ) 랜덤으로 취해진 샘플을 측정하여 다음의 중량 데이터를 얻었다. < 작성 순서 > ① 범위 R = L - S = 64 -23 = 41 ( * L=Xmax, S=Xmin ) ② R ÷ 1,2,5 단위 = 41 ÷ 5 = 8.2 → “9 ”= k (계급의 수) * 그러므로 계급의 폭 (h) = 5 로 정한다. ③ S=23 과 L=64가 제1계급과 맨끝계급에 포함되도록 * 제1계급 출발 : 20 ~ 25 로 하면 되나 측정단위와 같으므로 소숫점 하나 더 내려가 로 하여, 20.5 ~ 25.5 로 한다. 54 38 43 43 54 39 42 39 47 31 37 47 37 28 36 49 36 47 43 31 54 27 41 43 48 23 30 30 34 41 31 47 33 29 41 37 43 26 41 38 45 45 42 54 32 44 34 41 47 26 47 54 34 24 42 41 42 24 37 37 25 33 38 47 27 37 36 35 47 32 58 48 52 35 47 35 33 47 44 43 59 52 37 60 35 45 49 44 36 53 48 64 45 43 48 53 39 49 52 37 1 2
< 히스토그램으로 작성하고 규격한계를 기입한다 > 히스토그램 작성 방법 < 돗수 분포표 : 공정 조사용 Check - Sheet > 계급 No 구간 ( Class ) 중심치 (Xi) Check fi 1 2 3 4 5 6 7 8 9 20.5 ~ 25.5 25.5 ~ 30.5 30.5 ~ 35.5 35.5 ~ 40.5 40.5 ~ 45.5 45.5 ~ 50.5 50.5 ~ 55.5 55.5 ~ 60.5 60.5 ~ 65.5 23 28 33 38 43 48 53 58 63 ●●●● ●●●●●●●● ●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●● ●●●●●●●●●● ●●● ● 15 18 24 17 10 계 100 < 히스토그램으로 작성하고 규격한계를 기입한다 > 돗 25 수 20 ↑ 15 10 5 SL=25.0 m=37.5 Su=50.0 20.5 25.5 30.5 35.5 40.5 45.5 50.5 55.5 60.5 65.5 측정치 →
히스토그램 해석 방법 ▶ 히스토그램 보는 법 ① 가장 잘 분포된 모양 ② 이빠진 형 ③ 삐뚤어진 형 ① 가장 잘 분포된 모양 ② 이빠진 형 ③ 삐뚤어진 형 * 정규분포에 근사 * 측정방법이 다른 경우 * 어떤 값 이하를 취하지 않는 경우 * 매우 안정적 ④ 절벽 형 ⑤ 고원 형 ⑥ 낙도 형 * 규격외 것, 모두 선별 * 평균치가 약간 다른, * 다른 분포에서 약간의 * 측정과정의 오차 체크 필요 2개이상의 분포 혼입 테이터가 혼입된 경우 ⑦ 쌍봉우리 형 * 평균치가 다른 분포가 혼합되어 있을 경우 동일한 분포로 층별하여 작성 요망 * 이 강의실에 만약 남자와 여자가 50여명씩 있다고 했을 때, 100명의 < 신장 >을 측정하여, 층별하지 않고 히스토그램 으로 그렸을 때 나타날 수 있는 현상.
▶ 아래 데이터는 A부품회사의 전기 저항값이다. 히스토그램을 그리고 분포를 추측하시오 단, 규격은 80±4(Ω) 히스토그램과 분포 (실습) ▶ 아래 데이터는 A부품회사의 전기 저항값이다. 히스토그램을 그리고 분포를 추측하시오 단, 규격은 80±4(Ω) 77 80 82 81 79 84 78 82 77 79 81 80 83 78 81 79 82 78 80 77 80 79 81 82 78 77 84 78 82 79 80 81 77
데이터의 통계적 분석 방법론 모집단 데이터 획득 통계량 1 2 3 4 5 중심위치 산포 분포형태 수치요약 관계 (정보) · GRAPHICAL ANALYSIS 샘플링 측정 데이터 획득 대표성 확보 중심위치 산포 분포형태 관계 · 확률구조 및 오차분포 수치요약 (정보) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 모집단의 추론 ,결론 통계량 Notes:
데이터의 수치 요약 데이터 수치 요약 데이터 C1 C2 C3 C4 C5 Sum 33.8 36.3 32.5 30.2 36.2 DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 데이터 수치 요약 데이터 C1 C2 C3 C4 C5 2.9 2.7 3.3 3.3 4.1 3.1 3.4 3.3 3.2 4.1 3.1 3.6 3.5 3.4 3.7 3.7 3.2 3.5 2.7 4.2 3.1 4.0 2.8 2.7 3.1 4.2 4.1 2.8 3.3 3.5 3.7 3.8 3.2 2.9 2.8 3.9 3.8 2.8 3.2 3.5 3.1 4.3 3.8 2.9 3.7 3.0 3.4 3.5 2.6 3.5 2.9 3.3 3.8 2.8 3.9 C1 C2 C3 C4 C5 Sum 33.8 36.3 32.5 30.2 36.2 Min 2.9 2.7 2.8 2.6 Max 4.2 4.3 3.8 3.4 Range 1.3 1.6 1 0.8 1.4 통계량은 데이터를 간단하고 사용하기 쉽게 요약하는데 사용된다. 평균, 비율 등 여러 가지 통계량이 사용된다. 프로야구에서 누가 더 잘 치는지 알려고 할 때, 마지막 타격 기록보다는 평균타율이,휴가에서 입을 옷가지를 선정할 때, 지난해 같은 날의 휴가지 기온보다는 온도범위가 훨씬 더 가치 있는 정보이다. 공정의 모든 생산제품이 측정될 수 없다. 따라서 공정에서 채취된 샘플의 통계량이 공정분석 및 판단에 사용된다. 위의 사례에서 어느 것이 통계량이고 데이터인가? Facilitator says Statistics summarize data in more compact and useful ways. Statistics include averages, proportions, and other things, some of which will be discussed soon: * Fans feel more knowledgeable about a baseball batter’s performance if there is an ”average” listed rather than just the information from the last-at-bat * People feel more secure planning what to wear on a vacation if the usual temperature range for the destination is known, rather than that the high was 65 degrees Fahrenheit there one day last year. * Automakers do not want consumer rating services to recommend or criticize corporate performance based on only one vehicle. * Every characteristic of all the output of processes can not be measured, so statistics gained from taking samples of the process are used. Exercise: In the slide above, which cases represent data, and which are statistics? Variable N Mean Median StDev C1 11 3.336 3.100 0.452 C2 11 3.600 3.600 0.460 C3 11 3.300 3.300 0.371 C4 11 3.0000 2.900 0.286 C5 11 3.645 3.700 0.432
데이터의 통계적 분석 방법론 모집단 데이터 획득 통계량 1 2 3 4 5 중심위치 산포 분포형태 수치요약 관계 (정보) · GRAPHICAL ANALYSIS 샘플링 측정 데이터 획득 대표성 확보 중심위치 산포 분포형태 관계 · 확률구조 및 오차분포 수치요약 (정보) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 모집단의 추론 ,결론 통계량 Notes:
점추정 표본으로부터 얻어진 단일 값 알려지지 않은 모집단의 모수에 대한 최적의 추정 값
점추정 대상 “중심의 위치” (중심 경향) 빈도 값 “퍼짐 정도” (산포의 경향) DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION “중심의 위치” (중심 경향) “퍼짐 정도” (산포의 경향) 값 빈도
중심위치의 점추정 방법 ▶ 중심화 경향의 척도 평균 = 모든 데이터의 합 데이터의 수 최빈수 – 가장 빈도가 많은 데이터 xn +…xn 1 x = + x x 2 n = “합의 기호f” x = 개별값 x = 평균 - n = 샘플 데이터의 수 = 샘플의 첫번째 값 = 샘플의 두번째 값 = 샘플의 “n” 번째 or 마지막 값 = 평균 계산식 평균 = 모든 데이터의 합 데이터의 수 최빈수 – 가장 빈도가 많은 데이터 중앙값 – 데이터의 가장 중앙값 예) : 어떤 주물공장에서 생산되는 부품의 단위 Cm2 당 생기는 임계크기 이상의 기공수를 측정하였더니 다음과 같았다. 무작위로 추출된 5개 샘플 (5, 3, 8, 5, 6)에서 나타난 기공수의 표본 평균은 ? x = (5 + 3 + 8 + 5 + 6) / 5 = 27 / 5 = 5.4
중심위치의 점추정 - 연습문제 차량 5대에 대한 도어 개폐력(Kgf)은: 10.5, 9.5, 11.0, 12.5 10.0 10.5, 9.5, 11.0, 12.5 10.0 평균에 대한 점추정 값은
산포 (퍼짐 정도)의 점추정 방법 표준 편차(σ )는 범위보다 가치 있는 산포의 측정자이다. 평균 DIFFERENT WAYS TO CATEGORIZE VARIATION 1) WITHIN PIECE VARIATION 2) PIECE TO PIECE VARIATION 3) TIME TO TIME VARIATION 4) MACHINE TO MACHINE 5) LOCATION TO LOCATION 표준 편차(σ )는 범위보다 가치 있는 산포의 측정자이다. 6σ, 공정 평균으로부터 좌우 방향으로 3σ 표준편차 범위는 안정적인 공정의 경우 데이터의 99-100%를 포함한다 평균 Facilitator says Range is the difference between largest and least numbers in a particular set of values. Find the range by simple subtraction. The range does not take into account the pattern of variation within the spread of the numbers. The range is the same whether the numbers between the largest and least arrange themselves in a bell-shape or any other pattern. Also, the range is affected only by the difference between the largest and least values in a given set of values. The magnitude of the numbers is not important in itself -- just how far they are apart. For example, the range is “6” for a set of values whose maximum value is 7 and whose minimum value is 1. A set of values whose maximum value is 72 and whose minimum is 66 would have the exact same range of “6”. Standard deviation is a measure that considers variations within the distribution. More specific definitions of the standard deviation are rather technical, and sometimes prone to challenge. Usually, an estimate is made of , or sigma -- the standard deviation, from sample data. What is most important here is that six standard deviations account for almost all of the variation in a process. Standard deviation is an important concept. Standard deviation helps discover how great the variation is in a particular distribution or process. Fairly consistent percentages of a stable distribution can be expected to lie within portions of the curve representing that distribution, those portions being defined by standard deviations. Approximately 99-100% of the distribution, virtually the entire “width” of the distribution, will be located within a zone three standard deviations on either side of the mean. When the mean and standard deviation of a normally-distributed process are known, a good view of what that process looks like can be developed. 범위 –최대값과 최소값 간의 거리 최대값 최소값
HOW STANDARD DEVIATION IS CALCULATED 산포 (퍼짐 정도)의 점추정 방법 HOW STANDARD DEVIATION IS CALCULATED (Population standard deviation) The square root of the average of the summed squares of the deviations of the individuals in a population from that population average. (모집단 표준편차) = 모집단 평균으로부터 분포의 개별 데이터 값을 뺀 값의 제곱합의 평균의 루트 값 (“편차제곱 평균의 루트 값”) s (Standard deviation estimated from a sample) Used to estimate the standard deviation for a population. Where is the average range of subgroups of sample data, for a process that is in statistical control, as shown by a control chart. is a factor dependent upon the number of individual items in each subgroup of the sample. 모집단에 대한 표준편차를 추정할 때 사용 s (샘플로부터 추정된 표준편차 = (Standard deviation estimate) = Measuring and Estimating Standard Deviation: Standard deviation describes the dispersion in a set of numbers. There are three common ways to measure the standard deviation using variable data. The population standard deviation is usually unavailable as it is generally not feasible to measure all members of a population. Thus N, the number of values in the population, is not known, nor is m , the population average. Generally the standard deviation for a population has to be estimated from sample data. The sample average, , is substituted for the population average, and the sum of squared deviations in the sample is divided by the number of values in the sample, minus one, which biases this estimate of the population standard deviation on the higher side. This is especially important with small sample sizes (less than 30 values in a set). A more simple formula for estimating standard deviation may be used when the process is shown to be in control by a variable control chart. This has the added benefit of being backed up by statistical proof that the process is in a state of control, and that the measurement has predictive value. In other words, a stable process can be expected to maintain the standard deviation estimated for it as long as the process remains in statistical control. Methods exist to calculate standard deviation when attribute data is involved (see Module IV). 는 통계적 관리상태하의 공정에서 추출된 샘플데이터의 군의 범위 평균이다. 는 각 샘플군의 개별 값의 숫자에 따른 상수 값이다 (표준편차의 추정자) =
아래 데이터에 대해 산포를 표본표준편차 (s)와 모 표준편차(σ) 수식을 이용하여 각각 점추정 하시오 산포의 점추정 – 연습문제 아래 데이터에 대해 산포를 표본표준편차 (s)와 모 표준편차(σ) 수식을 이용하여 각각 점추정 하시오 데이터 : 25 , 40 , 35 , 10 , 17 , 15 (단위 ℃) Xi 25 40 35 10 17 15 ∑Xi=142 Xi 2 625 1600 1225 100 289 225 ∑Xi =4064 2
주요 통계량을 통한 분포의 이해 ▶ 분포의 특성 중심 척도 산포 척도 형태 척도 모집단의 특성치가 어느 값을 중심으로 분포되어 있는가에 대한 분포중심의 척도 통계량 : 모집단의 특성치가 중심위치 에서 얼마만큼 퍼져있는가에 대한 척도 통계량 : s, V, 모집단이 분포중심에서 얼마 만큼 치우져 있는가에 대한 척도 통계량 : 왜도 * 계량치는 정규분포에 근사해야 안정 된 분포의 모습을 보인다 * 통계학에는 정규성 검토 (Normality-Study) 기법이 있다
데이터의 통계적 분석 방법론 모집단 데이터 획득 통계량 1 2 3 4 5 중심위치 산포 분포형태 수치요약 관계 (정보) · GRAPHICAL ANALYSIS 샘플링 측정 데이터 획득 대표성 확보 중심위치 산포 분포형태 관계 · 확률구조 및 오차분포 수치요약 (정보) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 모집단의 추론 ,결론 통계량 Notes:
통계량 모 수 표본 통계량 μ σ² s² σ s or 점추정 표본 표본 모집단 Sampling 표본 표본 데이터 모 수 표본 통계량 μ σ² s² σ s or 점추정 모집단 - 조사나 분석의 대상이 되는 어떤 특성을 가진 것들의 전체집단 통계량 – 모집단에 관한 정보를 얻기 위해 모집단으로부터 발취된 시료를 관측하여 얻어진 데이터로부터 계산된 값.
기본 통계량 ▶ 표본과 모집단 평균의 관계 표본 평균 = 추정 모집단의 평균 = μ 표본 평균 = 추정 모집단의 평균 = μ 표본의 크기가 크면 추정치는 더 정확해 진다. 데이터의 산포가 크면 추정치의 정확도는 떨어진다.
기본 통계량 ▶ 표본과 모집단 표준편차의 관계 s , 표본 표준편차 = 추정 모집단의 평균 = , σ , σ 표본의 크기가 크면 추정치는 더 정확해 진다. 데이터의 산포가 크면 추정치의 정확도는 떨어진다.
기본 통계량 ▶ 통계량 표시 기호 요약 σ = 모집단의 표준 편차 μ = 모집단의 평균 = 평균의 추정자(estimator) = 표본의 평균 σ = 모집단의 표준 편차 = 표준편차의 추정자 s = 표본 표준 편차 σ2 = 모집단의 분산 s2 = 표본의 분산
데이터의 통계적 분석 방법론 모집단 데이터 획득 통계량 1 2 3 4 5 중심위치 산포 분포형태 수치요약 관계 (정보) · GRAPHICAL ANALYSIS 샘플링 측정 데이터 획득 대표성 확보 중심위치 산포 분포형태 관계 · 확률구조 및 오차분포 수치요약 (정보) Kinds of Attribute Data A “Nonconformity” is a specific occurrence of a condition which does not conform to a specification or other inspection standard. “Nonconforming Units” are items that are unacceptable because of one or more nonconformities. Each category has its particular strength for process understanding. 모집단의 추론 ,결론 통계량 Notes: