Download presentation
Presentation is loading. Please wait.
1
Data measurement and management of numbers
2
Variables and data Variables (변량, 변수) Data (자료)
모집단들 사이에 차이를 보이는 특성 Ex. 키, 몸무게, 꽃색 Data (자료) 변량의 값들. 우리가 관심을 가지는 대상으로부터 측정된 값들의 집합 Variants, observations라고도 불림 Variable (x), variants (x1, x2, x3, …xn)로 표시 Total number of observation of a variable (한 변량의 총 측정수) Sample size (표본크기; n 으로 표시)
3
Types of Variables (변량의 유형)
Continuous variables (연속변량) 값이 연속적인 변량 특정범위에서 어떤 값이든 가능함 Ex. length, mass, time, temperature, concentration Discrete variables (불연속변량) 값이 불연속적인 변량 Ex. 개체의 수, 둥지의 수 Ranked variables (순위변량) 그 group에서 상대적 위치로 측정된 변량 Rank 1과 rank 2 사이의 차이가 rank 2와 rank 3 사이의 차이와 같을 필요가 없다 값들 사이에 ‘equal to’, ‘greater than’, or ‘less than’의 관계만 있음. How much는 알 수 없음
4
Types of Variables Attributes (속성), or Qualitative variables (질적변량)
양적 (quantitative) 으로나 순위(rank)로 표현할 수 없는 변량 Ex. Male and female, red and white, alive and dead Transformed variables (변환 변량) Original variable을 수학적으로 변형한 변량 Ex. pH (pH = -log [H+], 따라서 pH의 실제변량은 수소이온농도) Original variable이 통계처리의 가정 (assumption)을 만족시키지 못할 경우 transformed variable을 사용함 (Chapter 10)
5
Types of Variables Derived variables (파생변량)
Two continuous measurement로 부터 계산된 variable Ex. rates, ratios, percentages 동물이 이동한 거리 (A), 동물이 이동한 시간 (B) A/B = 동물의 velocity Response and predictor variables Ex. 투약에 따른 혈압의 변화 Blood pressure: response variable (반응변수; output) Drug dosage: predictor variable (예측변수; input) Response variable = dependent variable (종속변수) Predictor variable = independent variable (독립변수): 연구자에 의해 결정
6
Scales of measurement 자료는 다음 4가지 척도로 측정될 수 있다 1. Nominal scale (명목척도)
2. Ordinal (ranking) scale (서수척도) 3. Interval scale (구간척도) 4. Ratio scale (비율척도)
7
Scales of measurement The nominal scale (명목척도)
Classificatory scale 라고도 불림 조사하고자 하는 대상이나 사건을 exclusive categories (배타적 범주)로 분류 Exclusive category 중간이 없음. ‘Equal’ and ‘not equal’ 만 있음 ‘Greater than’ and ‘less than’은 nominal scale에서는 의미가 없음 Ex. Male and female; present and absent; 박씨 and 이씨 and 김씨
8
Scales of measurement The ordinal (ranking) scale (서수척도)
자료들 사이의 크기를 비교하여 내림차순 또는 올림차순으로 순위를 부여 실제 값보다는 순서 크다, 작다는 알 수 있으나 얼마나 큰지, 작은지는 알 수 없다. Rank 1과 rank2 사이의 차이가 rank2와 rank3 사이의 차이와 같을 필요가 없다 Ex. 사자무리에서 숫사자들의 순위 1번 사자와 2번 사자 는 힘의 세기에서 많은 차이가 나지만, 2번과 3번은 비슷할 수 있다.
9
Scales of measurement The interval scale (구간척도) 자료들 사이의 크기가 의미를 갖는 척도
자료의 값이 실제 크기를 나타냄 크다, 작다는 알 수 있으며 얼마나 큰지, 작은지도 알 수 있다. 절대 0의 값 (true zero)이 없다 Ex. 온도, 서기년도, 달력의 날짜 100°C는 끓는 점, 0°C는 어는 점. 끓는점과 어는점을 100등분한 값 0의 의미가 ‘absent’ 를 의미하지 않음 화씨온도는? (Fahrenheit’s T: 32 – 212) 비율이 의미가 없음 (승제의 연산은 불가능) Ex. 40°C가 20°C보다 2배 뜨겁다는 의미가 아님 20°C = 68°F; 40°C = 104°F 차이는 의미가 있음 30도와 20도의차이는 20도와 10도의 차이와 같다
10
Scales of measurement The ratio scale (비율척도) 자료들 사이의 크기가 의미를 갖는 척도
자료의 값이 실제 크기를 나타냄 크다, 작다는 알 수 있으며 얼마나 큰지, 작은지도 알 수 있다. 절대 0의 값 (true zero)이 있다 (interval scale과 다른 점) Ex. 질량, 길이, 시간, 속도
11
Scales of measurement Interval scale에 적합한 통계처리는 ratio scale에도 적합하다. (and vice versa) 어떤 특정 통계처리에서 ratio, interval scale이 assumption일 경우 ordinal,이나 nominal measurement는 처리할 수 없다 대부분의 주요한 통계처리는 ratio scale 이나 interval scale로 측정된 경우에만 적용 가능하다.
12
Converting data from one scale to another
Nominal scale을 ordinal, interval, or ratio scales로 바꿀 수는 없으며 Ordinal scale을 interval, or ratio scales로 바꿀 수 없으나 반대의 경우는 가능하다 Interval or ratio scale → ordinal or nominal scale Ordinal scale → nominal scale
13
Converting data from one scale to another
Tree number 1 2 3 4 5 Height (m) 31.3 29.1 32.6 19.5 37.8 Tree height: continuous variable measured on a ratio scale Tree number 1 2 3 4 5 Height rank Converted to an ordinal scale -Shortest: 1; Tallest: 5 위와 같이 변환할 경우 많은 정보를 잃게 된다 -얼마나 큰지, 작은지를 알 수 없다 -그러나 이러한 변환이 필요한 경우가 있음 -nonparametric statistics의 적용 시 (chapter 9)
14
Exercises Height of male humans (in cm) 1m2 당 개미지옥의 구멍 수
187, 181, 180, 178, 170, 175, 174 What is the scale of measurement? Discrete or continuous variables? 1m2 당 개미지옥의 구멍 수 5, 15, 23, 21, 17, 11, 5, 2, 1
15
Exercises 연못 속의 개구리 수 Convert into an ordinal scale.
Convert the data in a nominal scale. S: Sparsely populated, 30 or fewer frogs D: Densely populated, more than 30 frogs Pond # 1 2 3 4 5 6 7 8 9 10 11 Number of frogs 34 65 23 18 20 15 70
16
Exercises 1) Identify the type of variable (attributes, continuous, or discrete), 2) scale of measurement, and 3) indicate these variables are simple, derived or transformed variables 1. Enzyme 반응속도 (micro-mole substrate/mill-gram protein/ min) 2. 연못 속의 연꽃 수 3. 연꽃의 색 4. pH 5. 달팽이의 속도 (1시간 동안 이동한 거리)
Similar presentations