컴퓨터를 이용한 데이터 분석기법의 간단한 소개 부산대학교 물리학과 교수 유인권 yoo@pusan.ac.kr 강의 목적 및 개요 무엇을 할 것인가 ? 왜? 어떻게 할 것인가? 연습
1. 강의 목적 및 개요 강의 목적 : 강의 개요 : 이해에 대한 접근 방식 – 직관과 분석 ‘이론과 실험’ or ‘실험과 이론’의 상관관계 컴퓨터 사용에 대한 호기심과 흥미 고취 IT 전문가, 사회적 영향(WWW) 향후 연구, 개발에 대한 기대 강의 개요 : 무엇을 할 것인가? 왜? 어떻게 할 것인가? 컴퓨터 이용의 소개, 연습 핵물리학교2005@SKKU 데이터분석 강의
1.1 무엇을 할 것인가? 왜? 연구 개발에 대한 순서도 확인가능성? 인간의 무지 가 설 가설의 전개 예 측 해 석 Alternative? 실 험 결론/오차 결과 분석 장치 개발 / 기술 실험 구상 핵물리학교2005@SKKU 데이터분석 강의
1.2 생각 / 자료 (데이터) 의 전개 해석학적 전개 논리적 도구 : 수학 계산적 전개 핵물리학교2005@SKKU 데이터분석 강의
1.3 예측, 확인, 해석 가설의 구체화 : 모델 설정 모의 실험 : 결과의 예측 실제 실험 : 모의 실험 결과와 비교 해석학적 예측의 한계 몬테카를로 모의 실험 (MC simulation) 모의 실험 : 결과의 예측 실제 실험 : 모의 실험 결과와 비교 모의 실험의 약점 실제 실험의 약점 해석의 재료 : 다른 변수(오차)에 대한 이해 새로운 모델의 제시 : “이상과 현실” 핵물리학교2005@SKKU 데이터분석 강의
2. 어떻게 할 것인가? 고에너지 물리학 실험의 구조 고에너지 (고운동량) 충돌 (생성) 입자의 검출 모델 데이터의 획득 결과와 오차 데이터 분석 핵물리학교2005@SKKU 데이터분석 강의
2.1 충돌 실험 데이터 Beam – Collision – Production – Detection RAW data : 모든 검출기들로부터의 모든 디지털 정보, 압축 (데이터의 손실 : dead time) Data Array! 데이터베이스!! Single- vs. Multi-Parameter Analysis Function, Histogram, Graph, Picture MC Database On/Off line Analysis : Event Builder (Collision) Event building ? g-p, p-p, p-p, p-d, p-A, A-A Track Reconstruction : 검출된 입자들의 경로 만들기 Reconstruction Chain Beam/Event/Track Selection Acceptance / Efficiency Correction : HOW? 핵물리학교2005@SKKU 데이터분석 강의
2.1.1 실험 데이터의 종류 RAW data : on storage media Reconstructed data : DST Evenwise saved with conditions, trigger/beam informations Reconstructed data : DST Trackwise recombined with full information http://na49info.cern.ch/cgi-bin/w3-msql/na49/Status/production.html Selected data : mini-DST, micro-DST, nano-DST.. 관심에 따라 선택한 데이터만 저장 분석 도구에 따라 포맷이 다양 : ntuple (PAW), tree (ROOT) 핵물리학교2005@SKKU 데이터분석 강의
2.1.2 실험 데이터의 구조 Beam time RUN : 편의상 데이터를 나눈 단위 (e.g. ~30000 events) Event variables : Impact parameter, Centarlity, beam info, Main Vertex Tracks (particle) : Primary and Secondary Particles Track variables : All possible physical variables, dE/dx, p, mass, charge etc. Fit-quality info for the track 핵물리학교2005@SKKU 데이터분석 강의
2.2.1 컴퓨터에 대한 기본 Hardware : Operating System : CPU : Intel x86, Mac, Alpha, SGI .. Random Access Memory (RAM), Read Only Memory (ROM) Storage : Disk, Tape, Exabyte .. BUS : (E)IDE, SATA(raid), PCI, SCSI, ISA, AGP, VESA .. Operating System : Apple : Mac OS MS : DOS, Window, NT IBM : OS2, OS9 .. Unix : Linux, HP-UX, Irix, AIX, Solaris .. Software Package : Precompiled or Source 핵물리학교2005@SKKU 데이터분석 강의
2.2.2 Linux Linux vs. Windows Linux : Copyleft vs. copyright Development (user=developer) vs. Commercial (only user) Open source vs. Secret source Universality vs. CPU dependent (Intel) Stable X-window system vs. instable Single window system Multi-tasking and – user vs. Single- stand-alone style Expert-friendly vs. user-friendly … Linux : Kernel 2.4… Various names : Red Hat, Debian, SuSE, Hancom, SLC… 핵물리학교2005@SKKU 데이터분석 강의
2.3 Programing Algorithm Programing Link Compile Execution Interpreter (C, C++, Fortran) Link (libraries, subroutines) Compile (Language Grammar, CPU, OS Environment dependent) Execution Interpreter 핵물리학교2005@SKKU 데이터분석 강의
2.3.1 Packages & OOP http://cernlib.web.cern.ch/cernlib/version.html Cernlib : 고에너지 물리 데이터 분석용 패키지 모음 http://cernlib.web.cern.ch/cernlib/version.html Physics Analysis Workstation (PAW) hbook, kuip, kxterm, minuit, zebra etc. Fortran based (old), no more development ROOT : new Object Oriented Tool http://root.cern.ch C++ based, all inclusive framework tool Object Oriented Programing Object Building Simple Adoption Preloading libraries 핵물리학교2005@SKKU 데이터분석 강의
2.3.2 Origin : NA49 Collaboration Interactive / bground working Grafic User Interface OOP : user = developer, sharing LIBs own personal lib/Class, group/collab. lib/Class root49, STARoot, ALIRoot, CBMRoot 핵물리학교2005@SKKU 데이터분석 강의
2.4 Learning Programing Sad “hello world” story Demo program + Manual 언어는 약속된 습관 목적의식 필요 무조건 흉내/사용 : 문법책부터 읽지 말 것 Demo program + Manual 예제 프로그램 활용 목적을 분명히 할 것 복사 / 편집 / 사용법의 경험적 습득 문법책 참고 / 논리 (수학) 적 사고 핵물리학교2005@SKKU 데이터분석 강의
3. 연습 계획 및 개요 / 소개 VNC for WinXP 설치 : http://nuri.pusan.ac.kr/~hipex/utility/vnc-3.3.3r2_x86_win32.zip Linux VNC (Virtual Network Computing) Server 연결 : radium.phys.pusan.ac.kr:1 = user group 1 lead.phys.pusan.ac.kr:1 = user group 2 Fermium.phys.pusan.ac.kr = user group 3 Login : nps / Password : 핵물리학교 Shell open : GUI click! 자기 디렉토리 만들기 nps@lead:~>mkdir mine nps@lead:~>cd mine 여기를 본거지로 활용할 것 핵물리학교2005@SKKU 데이터분석 강의
3. 연습 Root interactive 연습 프로그래밍 편집 해보기 (다른 shell open) nps@lead:~/mine>root root [0] .x demos.C 프로그래밍 편집 해보기 (다른 shell open) nps@lead:~/mine>cp –r /cern/root/macros ~/mine/ Emacs (텍스트 에디터 열기) Open mine/macros/demos.C 각각의 demo 버튼이 어떤 프로그램을 불러내는지 들여다 본다. 그 차례대로(!) 프로그램을 열어서 조금씩 바꿔가며, 일어나는 일과 비교한다. root [32] .x macros/new.C 필요한 경우 online manual을 참고한다. (http://root.cern.ch) 핵물리학교2005@SKKU 데이터분석 강의