Chapter 32 Analyzing Web Traffic
Contents Web Traffic Analysis Jargon Log File Data Analyzing Log Files Products for Analyzing Web Traffic
Web Traffic Analysis Jargon Hit - 일반적으로 browser가 웹사이트에서 요청한 페이지 수 - 페이지에 link된 그림, 파일 등이 포함됨 예) 1page+그림9개 = 10 hit • Page view - HTML문서만 Counter(link된 그림, 파일 포함 안 함) 예) HTML page → other HTML page갔다가 Back하면 one counter (browser 가 caches에 저장하였다가 다시 요구하지 않음) Visit - 한 사용자가 1시간 또는 그 이상 동안 연속된 페이지들을 보는 것 - 일반 웹 서버에 File 요구하면 서버는 Client IP Address를 log file에 저장 → 이것을 Start/End Point 이용하여 각 User의 Traffic analysis 분석 Visitor - 중복 IP 제외한 사이트에 전체 방문한 사용자 수. (PPP때문에 정확하지 않음 ) - 사용자는 IP주소 및 쿠키(Cookie)에 의해 결정. (Cookie를 Client가 Accept 하지 않으면 정확하지 않음) Organization - 사용자의 domain name 웹 서버 로그에 저장하는 것.
Log File Data 대부분의 웹 서버는 표준 Log file format를 유지 ■ Access_log -Main log file로 filenames, IP address, dates, times 등을 저장 ■ Referer_log -사용자가 접속하여온 URL저장한 파일 ■ Error_log -file과 system의 error messages를 저장 파일
Data in the Access Log File ■ Address field 접속하는 Domain name과 IP address. ■ ID field 일반적으로 사용되지 않으나, 보안과 Privacy의 목적으로 사용. ■ AuthUser field 특정 페이지를 볼 때 사용자 이름과 패스워드가 요구될 때 사용. ■ Date and time field 날짜, 시간 ■ Method field HTTP 명령어 (Get,Post 명령어)로 Web Browser가 Web Server에게 요구할 때 ■ File name field Served 파일의 이름 ■ Status field 상태 또는 에러 코드( Request가 TRUE or FALSE) ■ Size field Served 파일의 크기(Byte)
Data in Other Files The Referrer field - 현재 접속하고 있는 페이지의 링크를 포함하는 페이지의 URL정보를 포함 The Browser field - Browser and Version에 정보를 포함
Analyzing Log Files(1) Log 분석 툴 - webtrends (www.webtrends.co.kr) - 3Dstats … Tracking interest in a topic - log file의 분석을 통하여 가장 많이 hit하는 page • Application for Tracking -log file 분석을 통하여 사용자들의 어떤 page을 좋아하는지 파악하여 그 Page를 더 발전 시킬 수 있음
Analyzing Log Files (2) Test Marketing -Log 분석을 통하여 주요 고객 층, 고객구매패턴, 주 구매시간, 구매경로탐색 등의 데이터를 추출 통해 Marketing -Sevio 소프트웨어(http://www.sevio.com) -접속자수 , IP주소나 사이트, 인기도 페이지, 특정광고 방문횟수 등을 마케팅 전략에 이용하는데 이용 -방문자 분석과 주요 정보서비스의 검색경로를 분석하여 사용자들이 요구하는 서비스를 강화
Products for Analyzing Web Traffic Analyzing web traffic software가 web server에서 운영될 때는 HTML 형태로 Report하여 웹에서 볼 수 있도록 처리 Analyzing web traffic software가 PC에서 운영될 때는 log file를 pc에서 저장 Web server traffic high → large log files ISP 호스트일 때는 traffic reports를 PC로 Download (large log file → pc download 어렵다 ) • Analyzing web traffic software( shareware/freeware) 이용하여 web traffic report를 누구나 볼 수 있다. • 웹 서버는 log file를 database,ASCII 형태로 지원
Traffic Analysis Reports 총체적인 통계치 가장 많이 요청된 페이지 가장 적게 요청된 페이지 한 번 접근한 페이지 (가장) 많이 접근된 디렉토리 (가장) 많이 다운로드된 파일 (가장) 많이 업로드된 파일 많이 다운로드된 파일 타입들 참조하는 사이트, URL 광고의 뷰 및 클릭 가장 활동적인 국가 주의 날짜별 활동수준 시간별 활동수준 대역폭 가장 많이 사용되는 플랫폼 및 OS 브라우저 및 버전 활동적인 국가 요일별 활동 현황 검색엔진 검색구문
◇예) http://www.webtrends.com 사이트