교통운영 및 실습 - 데이터 분석 무엇이 문제인가? 왜 그런가? (예) - 버스 승객이 왜 줄어드는가? (예) - 버스 승객이 왜 줄어드는가? - 버스 이용률이 높은 곳과 버스 이용률이 낮은 곳이 있는데, 그 이유가 어디에 있는가? 2. 예상되는 결론은? (예) - 도시 공간구조 변화에 따른 인구이동? - 세종시 영향으로 인구 유출? --> 미리 왜 그런지를 생각해 보는 것은, 분석 방법을 구상하는 데 도움이 됨. 전혀 모르는 사실을 분석을 통해 발견하는 것은 쉽지 않음.. 예상되는 결론을 분석을 통해 확인해 보는 것, 그 과정에서 또 다른 사실도 함께 발견하게 됨.
*다음주까지 과제 3인1조 - 출석부 순서대로.. 2014년 10월4주(일주일)과 2015년 10월4주(일주일) 비교 행정동별 데이터, 정류장별 데이터가지고.. 버스카드데이터 특성 분석 - 버스승객 변화가 어떤지 나름대로 찾아오기~ - 왜 그런지 밝히려면 뭘 어떻게 하면 좋을지... *다음주 실습 과제 - 정류장별, 행정동별, 법정동별 - 산포도, 도수분포표, 데이터 요약(평균, 편차)
*기존 분석 ppt 설명
3. 분석 방법 설정 3-1. 활용 가능한 데이터 3-2. 지표결정 3-3. 분석 시간적, 공간적 범위 3-4 분석 시간단위, 공간 분석 단위. 3-5. 분석절차 (1) 데이터 신뢰성 검증 및 데이터 전처리 - (2) 개별 데이터 특성 이해 (2)-1. 산포도, 도수분포표, 데이터 요약(평균, 편차) (2)-2. 군집분석, 데이터 시각화 (3) 지표 생성 및 특성 이해 -- 상동 (4) 지표별 비교 -- 상관분석, 군집분석, 데이터 시각화
3. 분석 방법 설정 3-1. 활용 가능한 데이터 - 버스카드 데이터 <--- 버스 수요 (승차, 환승, 하차) - 버스 노선/정류장 <--- 버스 공급/서비스 - 승용차 교통량, 속도 데이터 - 도시철도 이용객 - 사회경제 지표 (인구, .....) 데이터DATA
*교통지표 vs. 사회경제지표 혹은 관련분야 지표 3-2. 지표결정 *양 vs. 비율 *단순 값 vs. 표준화된 상대 값 *수요지표 vs. 공급지표 *교통지표 vs. 사회경제지표 혹은 관련분야 지표 단순 값 표준화된 상대 값 양 인구 단위면적당 인구 (밀도) 비율 인구증감 인구증감율
3-3. 분석 시간적, 공간적 범위 *대전광역시 혹은 주변지역까지 *한 시간, 한 주, 한 달, 일년??? 시간변동, 요일변동, 주간 변동, 월간 변동을 어떻게 고려하고, 어떻게 포함시켜 분석할 것인가? 3-4 분석 시간단위, 공간 분석 단위 *행정동/법정동 단위, 노선단위, 정류장 단위.. *시간평균, 일평균...
3-5. 분석절차 데이터 신뢰성 검증 및 데이터 전처리 - 정류장이 신설되고, 정류장 관리번호가 바뀐 것.. - 행정동 vs. 법정동 맵핑 - 비교시 미미한 변화는 0으로 놓고 할 것인가? 그대로 할 것인가?? (2) 개별 데이터 특성 이해 (2)-1. 산포도, 도수분포표, 데이터 요약(평균, 편차) (2)-2. 군집분석, 데이터 시각화 --> 시각적으로 데이터 왜곡시키지 않도록 유의!!! (3) 지표 생성 및 특성 이해 -- 상동 (4) 지표별 비교 -- 상관분석, 군집분석, 데이터 시각화
4. 분석 Tool *통계분석 - 엑셀, R(오픈소스 통계 패키지) *시각화 - Tableau, QGIS 5. 분석 결과