http://www.yire.net Tel:02-2118-7114~5 최종 사용자 관점의 웹 서비스 성능 관리 SmartSQM Agentless 실시간 전구간 성능 모니터링 최종 사용자 체감 성능 측정 성능 저하 원인 파악 November 2013 http://www.yire.net Tel:02-2118-7114~5
Contents 1 2 3 4 5 6 7 8 제안 배경 제품 개요 주요 기능 주요 특장점 상세기능소개 도입 효과 주요 성공사례 주요 고객
1. 제안 배경 전통적인 웹 서비스 성능 관리 체계 각각의 고유 영역만을 관리하는 포인트 솔루션으로 전체적인 웹 성능을 관리 인프라의 시스템 자원만을 모니터링 하고 있음 인프라 중심의 성능 관리 애플리케이션 성능 관리 APM WAS, DB트랜잭션 성능 문제 시스템 리소스 관리 SMS 시스템 부하 네트워크 트래픽 관리 NMS 과도한 트래픽 데이터센터 Last-Mile Middle-Mile Front-Mile User Network 현재 Server, DB, APP
1. 제안 배경 인프라 중심의 성능 관리 체계의 현실 실제 최종 사용자가 체감하고 있는 서비스 성능 수준을 알 수 없음 Internet Router Firewall Switch Application Tier Database Web Real End-User APM 솔루션, DB 모니터링 솔루션 NMS로 모니터링 SMS로 모니터링 모니터링 방안 없음 국가/지역 불만 지속 Network: 정상 고사양 서버 고가용성 시스템 최신 OS 디바이스별 System: 정상 환경별 App & DB: 정상 인프라 관점의 성능관리 장애가 발생 하였는데 WAS나 DB 모니터링 만으로는 원인이 명확하지 않음. 홈페이지 응답속도가 늦다고 장애가 접수 되었는데 네트웍 문제인지, 웹서버 문제인지, 사용자 PC의 문제인지 원인을 알 수 없음. 특정한 사용자만 인터넷 접속이 안 되거나 응답속도가 늦다고 하는데 도저히 원인을 찾을 수 없음 장애가 발생 했는데 그 당시의 상황을 그대로 재현 하여 원인을 찾아야 함 다양한 문제 발생
1. 제안 배경 효율적인 웹 서비스 성능 관리를 위한 관점의 변화가 요구됨 최종 사용자의 성능 기준 서비스 가시성 확장 최종 사용자의 성능이 서비스의 성능 기준이 되야 하며 사용자까지 모니터링 영역 확대 필요 인프라 중심의 성능 관리 사용자 관점의 성능 관리 최종 사용자의 성능 기준 어플리케이션 성능 관리 실제 사용자가 체감하는 속도가 웹 서비스의 성능 기준이 됨 성능 관리 방안의 변화 필요 시스템 리소스 관리 서비스 가시성 확장 전구간 모니터링을 통한 사용자의 성능과 서비스 성능 현황을 파악 네트워크 트래픽 관리 전구간의 성능을 모니터링 할 수 있는 End-to-End 성능 관리 필요 사용자가 성능 불만을 제기하기 전에 먼저 인지하고 신속히 해결할 수 있는 능력이 요구 사용자와 서버간의 영향도를 상관 분석하여 서비스 가용성 분석이 요구 최종 사용자의 성능 문제를 비즈니스에 반영할 수 있는 도구 필요 요구 사항
2. 제품 개요 SmartSQM 소개 전구간 성능 모니터링 사용자 성능 모니터링 성능 저하 원인 분석 서비스 가용성 분석 Visibility 트랜잭션 추적 구간별 응답속도 서비스 성능/상태 모니터링 위협, 유해 사용자 경고 사용자 체감 속도 측정 성능/행위 분석 트래픽 분석 App 응답속도 전구간 성능 모니터링 SmartSQM Availability Internet Router Firewall Application Server Database Web Server Real End-User APM 솔루션, DB 모니터링 솔루션 NMS로 모니터링 SMS로 모니터링 SmartSQM으로 상세 분석 SmartSQM
2. 제품 개요 SmartSQM의 설치 구성 Agentless방식으로 쉽고 빠른 구성이 가능하며 운영 시스템에 영향을 주지 않습니다. 스위치의 포트 미러링 사용 Switch Internet Port mirroring WEB SmartSQM TAP 스위치 사용 TAP Internet Mirroring WEB SmartSQM
3. 주요 기능 주요기능 요약 End-to-End 실시간 모니터링 성능 분석 원인 분석 최종 사용자 체감 속도 측정 모든 영역의 관점(사용자, 네트워크, 서버)에서 접근할 수 있는 통합 모니터링 비즈니스 관점의 서비스 현황 모니터링 사용자, 서버 상태 모니터링 서비스 이상 징후 실시간 모니터링 성능 분석 국가별/지역별/사용자 환경별(OS, 브라우저, 모바일 기기) 성능 URL 서비스, 서버, 사용자, 세션별 성능 구간별 응답속도 측정 원인 분석 사용자 트랜잭션 추적을 통한 불만 해결 위협, 유해 요소 실시간 탐지 및 경고 트랜잭션 성능 로그 저장, 재현 분석(타임 머신 회귀 분석) 이벤트 시점의 드릴다운 분석 최종 사용자 체감 속도 측정 실제 최종 사용자 관점의 로딩 시간을 측정 웹 서비스 가용성 분석 및 성능 수준 검증 각 컴포넌트별 서비스 성능 분석 통계 및 보고서 국가별/지역별/사용자 환경별 성능 통계 지표 서버, URL, 응답코드, 브라우저, 국가, 지역별 보고서 다양한 포맷 형태의 파일 추출 및 기간별 통계
SmartSQM 4. 주요 특장점 실시간 사용자 행위 분석(UBA)을 통한 웹 서비스 성능관리 특허 획득 1초당 실시간 성능 모니터링 서비스 상태를 1초당 실시간 모니터링 최종 사용자 관점의 성능 분석 유연한 설치 구성 Service Quality Managent Agentless 방식의 구성으로 기존 서비스에 영향이 없음 유지보수가 쉬우며 관리가 매우 용이함 L7기반 DDoS 탐지 Slowrolis, RUDY, HTTP flooding등 L7기반의 공격 탐지 경고 사용자 행위 분석을 통한 악의적인 행위 실시간 확인 SmartSQM Agentless 다양한 성능 분석 도구 제공 Insightful Analysis 트랜잭션 실시간 추적 대용량 데이터 분석을 통한 이벤트 시점의 회귀 분석 Real-time Performance Monitor 강력한 커스터마이징 120여 가지의 기초 데이터를 이용한 다양한 대시보드 제공 HTTP, HTTPS외 SAP, RTSP, SIP등 비디오, 보이스 프로토콜 지원 가능 마이플랫폼 환경 커스터마이징 지원 APM 솔루션 통합 연동 지원
5. 상세 기능 소개 – 통합 대시보드 실시간 대시보드 운영자는 성능 저하 문제 발생시 모든 관리 영역(N/W, SERVER, APP, USER)의 관점에서 통합 분석이 가능합니다. 실시간 대시보드 모든 관리 영역의 관점에서 접근 사용자의 영향도 및 연관성을 분석 서버 상태 상세 모니터링 네트워크 구간의 상태와 추이를 분석 2 3 4 서비스의 이상 징후 인지 1 사용자 네트워크 서버 커스터마이징 대시보드
5. 상세 기능 소개 –통합 모니터링 실시간 서비스 전구간의 성능 및 사용자 행위 모니터링 사용자가 어떤 서버에 접속해 있고 제공받는 서비스 품질이 어떠한지, 사용자의 행위가 인프라에 어떠한 영향을 주고 있는지에 대한 성능 저하 요인을 실시간 모니터링 합니다. 엔드-투-엔드 통합 모니터링 웹서버의 문제인지? 어플리케이션 서버의 문제인지? 특정 사용자가 서버에 부하를 주고 있는지? 세션별 내부 네트워크 문제인지, 외부 네트워크 문제인지? 가장 성능이 저하되는 서비스는?
Download (Response) time 5. 상세 기능 소개 – 구간별 응답속도 구간별 성능 모니터링 어느 구간에 성능 문제가 발생하는지 각 구간에 대한 응답 속도를 측정하여 분석 할 수 있습니다. 4 5 3 4 Request time App(µ) latency WAS와 DB의 트랜잭션 성능이 좋지 못할 경우 단말기의 성능이 좋지 않거나 네트워크 성능이 좋지 않을 경우 Dynamic Content WEB WAS DB Client RTT 1 Server RTT 2 웹서버 성능이 좋지 못할 경우 외부 네트워크 구간이 느릴 경우 내부 네트워크 구간이 느릴 경우 5 Web(µ) latency Static Content 6 Download (Response) time 1 2 3 6
5. 상세 기능 소개 – 사용자 체감 속도 측정 사용자 관점의 서비스 응답속도 모니터링 한 페이지를 로딩하는 속도와 컴포넌트별 로딩 속도를 분석하여 사용자가 체험하는 웹 서비스 성능 수준을 파악할 수 있습니다. 페이지 로딩 시간 측정 최종 사용자 관점의 성능 분석 사용자 환경별 페이지 로딩 타임 측정 컴포넌트별 성능 분해 분석 서버별 가용성 측정 사용자 체감 속도 Delay Real User Experience Loading…………. Loading complete. 사용자 체감 속도를 저하시킨 원인 확인 사용자 컴포넌트별 상세 분해 분석
5. 상세 기능 소개 – 사용자 체감속도 측정(계속) 단위 서비스, 업무별 체감 성능 분석 단위업무를 구성하는 컴포넌트를 그룹핑하여 서비스 페이지의 실제 체감 성능과 성능 문제를 실시간 모니터링 합니다. 페이지 로딩 시간 측정 단위 업무별 체감속도 분석 서비스별 실제 체감 속도 측정 단위 업무별 성능 저하 원인 분석 서비스 성능 수준 파악(SLA) 메인 화면 서비스별/업무별 그룹핑 단위 서비스별 성능 모니터링 회원가입 서비스1 서비스1-1 서비스1-2 서비스 목록 설정 구성 컴포넌트 사용자의 체감 속도 단위: 한 페이지
5. 상세 기능 소개 – 사용자 성능 추적 및 분석 사용자 성능 문제, 행위 정밀 추적 분석 어떤 컴포넌트가 느린지, 어떤 구간이 느린지 해당 사용자의 트랜잭션을 정밀 분석하여 고객 불만에 대한 업무 대응력을 크게 향상시킬 수 있습니다. 특정 사용자의 성능 불만 해결 사용자 단말의 지연 현상 확인 세션별 응답 지연 구간 확인 단말기의 지연 현상 확인 상위 장비로부터의 세션 종료 현상 확인 특정 사용자만 문제가 되는 경우 특정 세션만 문제가 되는 경우 사용자의 성능 문제를 분석해야 할 경우 사용자 단말의 지연 현상 확인 비정상적으로 세션이 종료될 경우 확인 어떤 세션에서 지연이 되었는지 확인 Bar 상태의 간격이 비정상적으로 길고 Client RTT값이 높으면 사용자 단말의 성능저하나 네트워크 문제로 인한 지연상태로 간주 각 세션별 응답시간을 표현색에 따라 출력 Client RTT Server RTT Request Time Latency Time Response Time
5. 상세 기능 소개 – 서비스 가용성 서비스 성능 모니터링 서비스의 성능, 각 컴포넌트별 가용성을 모니터링 하여 해당 서비스의 성능 수준을 확인할 수 있습니다. 서비스 지연을 경험한 비율 서비스 성능 수준 분석 서비스 성능 저하 요인 컴포넌트 확인
5. 상세 기능 소개 – 성능 통계 지표 사용자 환경별 성능 통계 분석 사용자의 환경적 요소별 성능 문제를 모니터링하고 분석하여 향후 비즈니스 전략에 반영할 수 있는 정량화된 지표를 생성합니다. 어떤 국가가 느린지? 영향을 받았던 지역은? 가장 느린 ISP는? 가장 느렸던 사용자는? 모바일 디바이스별 속도는? OS에 따른 서비스 연관성은? 브라우져별 성능 및 에러는?
5. 상세 기능 소개 – 장애 모니터링 서비스 이상 징후 예측 서비스 이상 징후를 실시간 탐지, 예측하여 심각한 문제가 발생하기 전 사전 대응을 할 수 있습니다. 사용자의 비정상 행위 서버 응답 지연 발생 응답시간, 데몬, OS의 문제 성능 추이 실시간 모니터링
5. 상세 기능 소개 – L7 DDoS탐지/경고 위협 요소 실시간 탐지 및 경고 방화벽, IPS를 통과한 지능적인 L7기반의 위협 요소를 최종 단계에서 탐지하여 최적의 운영 환경을 유지할 수 있도록 합니다. 성능 저하 요소 경고 Layer 7 기반의 유해요소 탐지 경고 Slow HTTP Post(RUDY) HTTP Slowloris HTTP Slow Read HTTP CC Attack HTTP GET Flooding Fast Attack Syn Flooding SCAN Slowloris RUDY 방화벽 IPS www 방화벽과 IPS 모두 있지만 외부로 부터 지속적인 공격이 의심되는 경우 정상 트래픽이지만 사용자의 악위적인 행위에 의해 발생되는 서버 위협 트래픽 감지
5. 상세 기능 소개 – 회귀 분석 사후 정밀 원인 분석 단순 로그 저장이 아닌 서비스 상태에 대한 해당 시점의 분석된 성능 데이터를 저장, 재현 하여 과거 시점의 성능 문제를 분석합니다. 특정 시점의 성능을 재현/분석 타임 머신 분석 대용량 데이터 초고속 검색 대용량 데이터의 초고속 검색 과거 이벤트 시점 현재 1 2 3 4 과거 시점의 성능 상태를 재현하여 문제점을 명확히 분석 서버와 사용자간 영향도 상관 분석 성능 로그 포맷 1 서버의 부하, 리소스는? 2 사용자 행위로 인한 영향도는? 3 서비스 성능, 상태는? 4 정상적으로 서비스 완료되었나?
5. 상세 기능 소개 – 통계 및 리포트 통계 데이터 및 분석 리포트 성능 요소별, 서버별 다양한 성능 통계 리포트를 제공합니다. 유연한 리포트 제공 14가지의 보고서 파일 포멧 지원 (pdf, xls, hwp, html, txt, doc, jpg등) 데이터 Export기능 요소별 사용자 지정 리포트 생성
6. 도입 효과 SmartSQM 성능관리 업무 대응력 향상 IT 운영 효율성 향상 서비스 경쟁력 향상 운영자 관리자 경영자 사용자 구간의 가시성 확장을 통한 효율적인 웹 서비스 성능 관리 신속한 원인 파악을 통해 인적, 물적 자원 낭비 방지 성능 저하 문제를 신속하게 식별, 사전 예방함으로써 고객의 불만 해결 IT 인프라 투자 대비 서비스 성능 향상 효과 검증 및 효율성 판단 장애 징후의 신속한 탐지로 서비스 품질 연속성 및 안정성 향상 불필요한 중복투자 방지 및 유지보수 비용 감소 서비스 성능 지표를 통한 IT 운영 자원의 최적화 및 향후 투자 계획 수립 SmartSQM 성능관리 실시간 모니터링 진단, 사전 조치 고품질 웹 서비스 성능 개선
시스템 구성도 – 내부업무 및 대민 서비스망에 적용 7. 주요 성공사례 - 공공기관 서울시청 전산센터에 8월 웹 서비스의 성능향상을 위하여 모니터링 시스템을 도입함. 대민서비스와 내부업무시스템의 품질 향상과 운영효율화 및 안정성 확보가 추진 목표. 시스템 구성도 – 내부업무 및 대민 서비스망에 적용 현재상황 SMS, NMS, ESM 관제툴이 도입되어 운영중 WAS 모니터링, DB 모니터링 솔루션이 도입되어 있음. 외산의 관제툴 도입되어 있음 방화벽 Switch 패킷 미러링 Collector Port MGMT 저장관리 서버 패킷 수집 및 분석 서버 SmartSQM 모니터링 TAP 웹 서버 WAS DB 추진 배경 및 필요성 정보서비스 인프라 중심에서 다양한 분야로 관제포인트 확대 다양한 장애에 대한 원인파악에 장시간 소요 기대효과 원활한 시스템 운영을 통해 서비스의 품질에 대한 신뢰도 확보 사후 정밀 분석을 통한 IT인프라 구축에 활용 사용자관점의 응답시간 모니터링으로 성능지연의 문제점 해결로 고객 만족도 향상
7. 주요 성공사례 - 지자체 추진 배경 도입 효과 서비스 접속 현황에 대한 통계 데이터 추출을 위한 방안 부재 운영 환경 변화에 따라 분리된 환경의 다수의 통계 로그 서버를 추가 증설해야 하는 상황으로 환경 변화시 마다 불필요한 예산 낭비 발생 도입 효과 한 대로 운영되고 있는 모든 웹 서비스 성능 통계와 접속 통계를 분석할 수 있게 되었으며 IT 운영을 위한 예산을 절감시킴 분리된 웹 서비스 성능 관리의 통합하여 제한된 운영 인력의 업무 효율성을 향상시킴
7. 주요 성공사례 - 기업 추진 배경 스마트TV를 이용하여 다양한 컨텐트를(인터넷, VOD, 펌 웨어 업데이트 등) 사용하는 최종 사용자의 실제 체감 성능 파악과 성능이 저하시 문제의 원인을 파악하기 위해 도입 관계사에 제공하는 인프라 서비스의 서비스 성능 관리 방안 부재 도입 효과 사용자별 성능을 실시간 모니터링 하고 지연 원인을 분석, 개선하여 고객 서비스 품질 혁신에 기여하고 있음 복잡한 웹 서비스 구간의 성능 관리를 단일화 하므로 써 각 관리영역에서 발생되는 성능 문제에 대해 신속하게 대응하고 있음
8. 주요 고객
감사합니다. 제품문의 : 이래정보시스템㈜ (02) 2118-7115 www.yire.net