공간 패턴 분석 (Statistics for Spatial Data)

Slides:



Advertisements
Similar presentations
제 7 장 표본분포. 표본분포 통계량의 확률분포 표본분포 (sampling distribution) 통계량 (statistic) 표본자료의 함수 즉 모집단 … … 표본 표본추출 … … 통계량 계산.
Advertisements

지금 우리 지구는 HOT, HOT 에너지자원. 아이스에이지 2 시청 초 1-11 기후변화의 주된 원인인 지구 온난화 현상을 알고 온실가스의 영향을 실험을 통해 확인할 수 있다. 학습목표 초 1-11.
Chapter 8. TEXT CLUSTERING 서울시립대 전자전기컴퓨터공학과 데이터마이닝 연구실 G 노준호.
1 통계를 왜 공부해야 하나 ? Dept. of Public Administration Chungnam National University.
기본적 분석과 기술적 분석 강원대학교 증권동아리 $tOck.
GIS(Geographic Information System)
4.3.3 초기하분포 (Hypergeometric distribution)
Entity Relationship Diagram
기술 통계학 (Descriptive Statistics)
데이터 마이닝을 이용한 분류 분석.
공간자기상관 Spatial Autocorrelation
판별분석의 개념과 적용(→ 추계통계적 성격)
(Numerical Analysis of Nonlinear Equation)
정 의 학습의 일반적 정의 기계학습(Machine Learning)의 정의
공차 및 끼워맞춤.
수치해석 6장 예제문제 환경공학과 천대길.
10장 랜덤 디지털 신호처리 1.
제4장 측정과 척도 (Measurement and scale)
포항공과대학교 COMPUTER VISION LAB. 석박통합과정 여동훈
Z-test -Z 검증은 추리 통계의 여러 가지 검증 기법들 가운데 가장 기본적인 형태의 검증방식이다.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
Cluster Analysis (군집 분석)
숭실대학교 마이닝연구실 김완섭 2009년 2월 8일 아이디어  - 상관분석에 대한 연구
for Robust Facial Landmark Localization
상관함수 correlation function
제 10장 주성분 분석(PCA) 주성분 분석(PCA)이란? 여러 개의 양적변수들 사이의 분산-공분산 관계를
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
상관분석 (p , p ).
11장. 1차원 배열.
논문을 위한 통계 논문과 통계의 기초 개념 하성욱 한성대학교 대학원.
군집 분석 (Cluster Analysis) 2016년 가을학기 강원대학교 컴퓨터과학전공 문양세.
4-1 Gaussian Distribution
PCA Lecture 9 주성분 분석 (PCA)
빅데이터 연구회 6주차 발표 주제 : 서포트 벡터 머신 통계학과 서태석.
제 15 장 거시경제의 측정 PowerPoint® Slides by Can Erbil
Data Mining Final Project
Linear Mixed Model을 이용한 분석 결과
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
(independent variable)
Association between two measurement variables Correlation
Cpt.4 제품과 서비스의 설계 Product and Service Design 생산운영관리.
Inferences concerning two populations and paired comparisons
Term Projects 다음에 주어진 2개중에서 한 개를 선택하여 문제를 해결하시오. 기한: 중간 보고서: 5/30 (5)
Association between two measurement variables Correlation
: Two Sample Test - paired t-test - t-test - modified t-test
컴퓨터 프로그래밍 기초 - 10th : 포인터 및 구조체 -
Statistical inference I (통계적 추론)
Frequency distributions and Graphic presentation of data
Mean and Variance.
The normal distribution (정규분포)
사용자 경험 측정 (Measuring User Experience)
정보처리학회논문지 B 제10-B권 제1호(2003.2) 김만선, 이상용
제3장 함수와 배열수식 전진환
2장. 일차원에서의 운동 2.1 평균 속도 2.2 순간 속도 2.3 분석 모형: 등속 운동하는 입자 2.4 가속도
Modeling one measurement variable against another Regression analysis (회귀분석) Chapter 12.
비열.
최소의 실험 횟수에서 최대의 정보를 얻기 위한 계획방법 분석방법: 분산분석(Analysis of Variance, ANOVA)
상관계수.
수치해석 (Numerical Analysis)
7. 힘과 운동 속력이 변하지 않는 운동.
통계학 R을 이용한 분석 제 2 장 자료의 정리.
텍스트 분석 ㈜ 퀀트랩.
3장 (2) 구문과 의미론 순천향대학교 컴퓨터공학과 하상호.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
Where the Crossovers are: Recombination distributions in mammals
I. 수와 식 1. 유리수와 순환소수.
경영통계학 제1장 통계학은 어떤 학문인가? What is Statistics? 1.1.
수치해석 ch3 환경공학과 김지숙.
CH3. 데이터의 기초적 정리방법 모집단과 표본 모집단 (Population) , 표본 (Sample, 시료) 그림 3.1
Progress Seminar 이준녕.
Presentation transcript:

공간 패턴 분석 (Statistics for Spatial Data) 지형정보공학 2017 단국대학교 토목환경공학과

목차 공간 관계 (Spatial Relationship) Global Spatial Autocorrelation measures Moran’s I Geary’s C General G-statistic Local Spatial Autocorrelation measures LISA Getis-Ord Gi* hot-spot analysis Moran Scatterplot

Spatial Relationship Clustered: 특성치가 일정한 지역에 군집 Dispersed: 특성치가 일정한 간격으로 분포 Random: 분포가 Clustered이나 Dispersed 되지 않는 분포

Spatial Autocorrelation 특성치의 공간에 따른 연관성  degree of sameness of attribute values among areal units within their neighborhood 이웃한 polygon의 특성치가 유사 -> positive spatial autocorrelation spatial autocorrelation의 정도? Strong or weak? 이웃한 polygon의 특성치가 규칙적으로 변화 -> negative spatial autocorrelation 이웃한 polygon의 특성치가 공간적으로 불규칙 분포 -> no spatial autocorrelation

Spatial Autocorrelation 정도 Global Measure of spatial autocorrelation: Moran’s I, Geary’s Ratio C, G-statistic Assumption: spatial autocorrelation 이 주어진 지역에 대해 일정 -> spatial homogeneity Local Measure of spatial autocorrelation: - LISA (Local Indicators of Spatial Autocorrelation) - Local version of G-statistic (Gi*) - Moran scatterplot

Spatial Weights Matrix Spatial autocorrelation 계산 이전에 이웃 (neighborhood)개념의 정량화 필요 Binary connectivity matrix i polygon에 인접한 이웃의 j polygon i polygon에 인접하지 않는 이웃의 j polygon J=13 (# of joints) W=2J=26

Spatial Weights Matrix Stochastic or Row-Standardized Weights Matrix

Spatial Weights Matrix Centroid Distance (inverse distance weighted)

Global Spatial Autocorrelation Statistics Moran’s I :전체 평균, :Spatial weight matrix의 요소의 합, : 변수 수 Moran’s I의 범위는 -1 (extremely negative spatial autocorrelation) 1 (extremely positive spatial autocorrelation) 사이 spatial autocorrelation이 없는 경우 (random), Moran’s I의 기대값: 항상 음수이고 변수가 매우 클 때 음으로부터 0으로 수렴. 변수의 수가 적을 경우 음의 Moran’s I가 항상 negative spatial autocorrelation 을 의미하지 않는다. Moran’s I의 계산에 있어 binary나 stochastic weight matrix가 주로 사용 Moran’s I는 대상 변수 (xi)와 이웃하는 변수 (xj)의 전체평균으로부터의 편차의 곱 (공분산과 관계): High-High, Low-Low  Positive spatial autocorrelation

Moran’s I 계산 예제 (negative spatial autocorrelation??)

Significance test for Moran’s I Moran’s I 기대값 (random distribution: no spatial autocorrelation) Significance test (z-score)  Variance of Moran’s I under the normality assumption Not significant  random 패턴이 아니라고 말할 수 없다!

Global Spatial Autocorrelation Statistics Geary’s Ratio, C Geary’s C의 범위는 0 (extremely positive spatial autocorrelation) 2 (extremely negative spatial autocorrelation) 사이 spatial autocorrelation이 없는 경우 (random), Geary’s C의 기대값: 1 Geary’s C의 계산에 있어 binary나 stochastic weight matrix가 주로 사용 Geary’s C는 대상 변수 (xi)와 이웃하는 변수 (xj)과의 차이의 제곱

Geary’s C 계산 예제  Negative autocorrelation

Global Spatial Autocorrelation Statistics general G-statistic Moran’s I와 Geary’s C는 ‘global measure’이고 이웃하는 값들이 유사한지에 대한 정량적인 공간 관계를 나타낸다. 즉 지역적인 밀집도 (local clustering pattern)을 묘사하여 hot/cold spots을 구분해 내는데 한계가 있다.  높은 값의 군집인지 낮은 값끼리의 군집인지 구분을 못한다. general G-statistic은 hot/cold spots의 존재를 구분할 수 있는 잇점이 있음. : =1 (거리 d내에 위치할 때); =0 (그렇지 않을 때) G-statistic 은 이웃하는 변수가 클 때 상대적으로 크고 (곱셈의 원리), 작을 때 상대적으로 작다. Hot/cold spot 구분 가능

G-statistic 계산 예제

G-statistic 계산 예제 Relatively large value: some types of clustering exist.

Significance test for general G-statistic Significance test (z-score)  Slightly positive autocorrelation, but statistically not significant!

Local Spatial Autocorrelation Statistics LISA (Local Indicator of Spatial Association) 어떤 지역들 (subregions)에서 spatial autocorrelation이 다른 지역들에 비해 상대적으로 높을 때 global measure 사용은 적합치 않음. 따라서 지역 마다 spatial autocorrelation를 나타내는 local measure가 필요 LISA는 Moran’s I와 Geary’s C의 ‘local’ 버전으로 다음과 같이 정의된다. (Anselin, 1995) 일반적으로 wij는 stochastic (low-standardized matrix) 이웃한 z-score의 비중에 따른 선형적 결합 z-score of xi

LISA 계산 예제 (Local Moran’s I)

Significance test for Local Moran’s I Significance test (z-score)

Local Spatial Autocorrelation Statistics Local G-Statistic

Hot Spot Analysis: Getis-Ord Gi* (Spatial Statistics) The Hot Spot Analysis tool calculates the Getis-Ord Gi* statistic for each feature in a dataset. The resultant Z score tells you where features with either high or low values cluster spatially. This tool works by looking at each feature within the context of neighboring features. A feature with a high value is interesting, but may not be a statistically significant hot spot. To be a statistically significant hot spot, a feature will have a high value and be surrounded by other features with high values as well. The Gi* statistic returned for each feature in the dataset is a Z score. For statistically significant positive Z scores, the larger the Z score is, the more intense the clustering of high values (hot spot). For statistically significant negative Z scores, the smaller the Z score is, the more intense the clustering of low values (cold spot).

Local Spatial Autocorrelation Statistics Moran Scatterplot Local Moran I ( )를 scatterplot 형태로 분포시켜 spatial autocorrelation의 지역적인 instability를 확인하는 데 매우 유용한 그림 x 축: standard variable( ), y축: spatial lag of that variable ( ) Low income with High income neighborhoods R2=0.87 Outlier High income with low income neighborhoods  Moran scatterplot의 기울기: Global Moran’s I

Local Spatial Autocorrelation Statistics Moran Scatterplot  Moran scatterplot의 기울기가 Global Moran’s I인 이유 일반적으로 scatterplot의 선형회귀식: y=a+bx where = Row-standardized

Local Spatial Autocorrelation Statistics Moran Scatterplot example Moran’s I=0.316  Positive spatial autocorrelation, but..