Frequency distributions and Graphic presentation of data 이 chapter 에서는 data를 좀 더 이해하기 쉽게 organize하고 present하는 방법 논의 Table and Graphic technique data를 검토하고 요약하기 위해 많이 사용하는 방법
Frequency distributions 하나의 범주에 속하는 측정값의 수 Frequency distribution (도수분포) Frequency summary의 display table이나 graph로 보여줄 수 있다 Both discrete and continuous variables에 적용
Frequency distributions of discrete variables (불연속 변수의 도수분포) 1m2 quadrat (방형구)에 분포하는 단풍나무 묘목 (seedling)의 수. 100개의 quadrats을 설치 이러한 형태의 자료를 해석하는데 어려움이 있음 Frequency distribution으로 자료를 grouping하는 것이 자료분석의 첫 번째 단계가 될 수 있다. 0 plant의 quadrat 수, 1 plant quadrat 수, and so on
Frequency distributions of discrete variables 위의 자료를 table이나 graph로 나타낼 경우 자료를 쉽게 해석할 수 있다
Graphs of frequency distributions Frequency distribution의 graphs Histogram: continuous variable일 경우, 각 bar 들이 서로 연결되어 있음 Bar graph: discrete variable일 경우, 각 bar 들이 서로 연결되어 있지 않음 (중간 값이 존재할 수 없으므로)
Frequency distributions of continuous variables (연속변수의 도수분포) Random sample 된 송사리의 길이 (mm), 172 마리
Frequency distributions of continuous variables Length는 continuous variable measured on a ratio scale Discrete variables와는 달리 class (계급)의 범위를 정해야한다 17 – 18 mm into one class, and 19 – 20 mm into another, and so on Class interval을 결정하는 것은 다소 자의적이다 Sample size와 값의 range에 의해 주로 결정된다 너무 많은 class로 나누면 자료가 혼란스러워지고, class 수가 너무 적을 경우 정보가 줄어들게 된다 여러가지 class interval을 시도한 후 적절한 interval을 결정 Number of class = 1 + 3.3 log n 1 + 3.3 log 172 = 1+ 7.4 = 8.4
Frequency distributions of continuous variables Table로 자료가 잘 organized 되었으나 , visualize 하기는 쉽지 않다
Histograms and their interpretation Histogram of the table 3.4 Discrete variable에서와는 달리 class 사이에 빈 공간이 없다 Continuous variable 이라는 것을 의미한다 Histogram으로부터 distribution이 symmetric (대칭적)인지 skewed (비대칭적)인지 쉽게 알 수 있다 송사리의 length는 symmetric distribution을 보여준다 Histogram은 또한 평균값과 값들의 분포를 보여준다
Histograms and their interpretation Continuous variable의 frequency distribution은 line graph로 나타내기도 한다 Frequency polygon (도수다각형)이라고 부름 Discrete variable은 line graph로 나타낼 수 없다