An Intra-Task DVFS Technique based on Statistical Analysis of Hardware Events 2008.07.30 순천향대학교 컴퓨터학부 윤희성.

Slides:



Advertisements
Similar presentations
1 그리드 테스팅 제안서 스마트폰 앱 기능테스트 솔루션 TestOne Mobile 소개
Advertisements

1 일시 : 2015 년 5 월 24 일 조사한 사람 : 강수연, 신예 솔 자료정리 : 김규민, 이지훈 발표자 : 2 모둠 2.
10장. 시기별 학급경영 11조 염지수 이 슬 권용민 신해식.
일본 근세사. (1) 에도막부의 개창 ( ㄱ ) 세키가하라의 전투 (1600) - 히데요시의 사후 다섯 명의 다이로 ( 大老 ) 가운데 최대 영지 (250 만석 ) 를 보유하고 있던 도쿠가와 이에야스가 급부상. 이에 이에야스와 반목해 온 이시다 미쓰나리 ( 石田三成 ),
아니마 / 아니무스 송문주 조아라. 아니마 아니마란 ? 남성의 마음속에 있는 여성적 심리 경향이 인격화 한 것. 막연한 느낌이나 기분, 예견적인 육감, 비합리적인 것에 대 한 감수성, 개인적인 사랑의 능력, 자연에 대한 감정, 그리.
대구가톨릭대학교 체육교육과 06 학번 영안중학교 체육교사 신웅섭 반갑습니다. 반야월초등학교 축구부 대륜중학교 축구부 대륜고등학교 대구가톨릭대학교 차석 입학 대구가톨릭대학교 수석 졸업 2014 년 경북중등임용 체육 차석 합격 영안중학교 체육교사 근무 소개.
교수님 영상 제 2 장 관세법 일반 제 1 절 통칙 제 2 절 법 해석의 원칙 등 제 3 절 기한과 기간 제 4 절 서류의 송달 등 제 5 절 관세의 부과 및 징수 제 6 절 납세의무의 소멸 등.
일장 - 1 일 24 시간 중의 명기 ( 낮 ) 의 길이 ( 밤은 암기, 낮은 명기 ) 광주기성 - 하루 중 낮의 길이의 장단에 따라 식물의 꽃눈 형성이 달라지는 현상 일장이 식물의 개화현상을 조절하는 중요한 요인 단일식물 - 단일조건에서 개화가 촉진되는 식물 장일식물.
2 학년 6 반 1 조 고은수 구성현 권오제 김강서.  해당 언어에 본디부터 있던 말이나 그것에 기초하여 새로 만들어진 말  어떤 고장 고유의 독특한 말  Ex) 아버지, 어머니, 하늘, 땅.
음란물에 대하여. 인터넷 음란물의 의미 돈벌이를 위해 단지 성적 욕망을 불러 일으키기 위한 음란한 인터넷 상의 사 진, 동영상, 만화 등을 말한다.
아이핑 소개 (탁구대회) 아이핑 담당 신동일 네이버(다음)에서 아이핑검색 아이핑 소개 (탁구대회) 담당 신동일 아이핑.
2014년도 교원 및 기간제교사 성과상여금 전달교육 개 회 국기에 대한 경례 - 인사말
Linux Seminar #1 리눅스 이해하기.
마이크로 컨트롤러 Microcontroller.
선진 고양교육 “유아교육 행정 업무 연수” 유치원 회계실무 및 유아학비 연수 경기도고양교육청.
묵자 겸애, 비명, 비공, 상현, 상동, 천지, 명귀, 삼표 법.
Linux Debugging issues
1. PC 에서 회원가입 1. 회원가입 버튼 클릭 클릭.
내 아이를 위한 구강관리.
교육과정개발.
직무분석의 이론과 접근방법 전략기업컨설팅 전략기업컨설팅 세종사이버대학교 장수용 교수
제16장 원무통계 • 분석 ☞ 통계란 특정의 사실을 일정한 기준에 의하여 숫자로 표시한 것을 말한다.통계로서 활용할 수 있는 조건으로는 ① 동질성을 지녀야 하고 ② 기준이 명확하고 ③ 계속성이 지속되어야 하며 ④ 숫자로 표시하여야 한다 경영실적의.
SNS의 개인행위 특성요인이 사용의도에 미치는 영향
서울지방세무사회 부가세 교육 사진클릭-자료 다운 세무사 김재우.
치매의 예방 김 은민 윤금 노인요양원 치매의.
크로스 컴파일 환경 구축.
4-4 Comparison of Standard Deviations with the F test
실습 (using SPSS) Department of Biostatistics, Samsung Biomedical Research Institute Samsung Medical Center.
정적분석기술을 이용한 sw오류 자동 검증 Airac의 예를통해서
소개: Unix란 무엇인가? 숙명여대 창병모 2009/09.
임베디드 운영체제 (리눅스 중심) Lecture #2.
McGraw-Hill Technology Education
DSP와 TMS320F28X의 이해
기상연구소 응용 프로그램 (MM5/MPP) 시스템 별 성능 측정 결과 보고
임베디드 시스템 개론 3주차 Embedded System..
Technological Forecasting & social change(2014)
2016년 9월 전자전기컴퓨터공학부 김한준 소프트웨어시스템 실습 2016년 9월 전자전기컴퓨터공학부 김한준
5장 경영프로젝트의 개발 2조 이정환 이돈혁 송승환.
운영체제 (Operating Systems) (Multi-Thread Programming)
                              아키텍처 평가 – ATAM (SI 트랙)                              
마산에 대하여 만든이 : 2204 김신우, 2202 권성헌.
초등학생이 pc방을 가도 되는가? 등마 초등학교 5학년 4반 김근아.
CPU(중앙처리장치) CPU의 기능 종류와 특징 스펙 분석.
UNIX Internet Server의 대부분을 차지 대표적인 공급업체
IPv6 기반의 Mobile IP 기술 개발 (iSCSI 성능 분석) - 프로젝트 제안서 -
소리가 작으면 이어폰 사용 권장!.
사회복지프로그램 기획 및 평가 -로직모델을 중심으로 김유심(가양4종합사회복지관장) 프로그램의 개발과 평가의 개념
기초통계학 Chapter 5: 회귀분석 (Regression analysis)
회귀분석.
■ 화성공장 산학인턴 버스 노선 확인 안내 문의 전화 : 안내페이지 접속 1
소프트웨어 형상관리: 목차 변경 및 형상관리의 기초 개념 형상항목 확인 및 버전관리 변경관리 감사 및 감사보고 99_11
Chapter Ⅱ. 연구 설계.
제1장 정리 컴퓨터소프트웨어과 2-A반 주세호.
데이터 사이언스 실무 시계열 분석 기초 유재명.
의성어 국어어휘론 이신옥 정지연 정지형 임총인.
전사적 위험관리를 위한 비용절감 방안.
6장 마케팅 조사 박소현, 김중호, 박기찬.
한밭대학교 창업경영대학원 회계정보학과 장 광 식
게임엔진 프로젝트 발표 상어 사냥 안 정 웅.
음양오행과 물리학 조 원 : 김용훈, 양범길, 박수진, 윤진희, 이경남, 박미옥, 박지선 (11조)
(제작자: 임현수)모둠:임현수,유시연,유한민
천국 가는 길 천국 가는 길 ♧ 천국 가는 길 ♧ 1. 죄와 사망(지옥) 1) 사람의 3가지 공통점 - 죄인, 죽음, 심판
이야기 치료에 대하여 <8조 학문적 글쓰기 발표> 주희록 최은지
간호관리Ⅱ Chapter 4. 인적자원관리 동아인재대학교 장 광 심.
시민이 체감하는 편리한 건축인허가 절차 개선 추진.
100세 시대, 스마트 헬스케어와 미래직업 (3) 고령화 사회에 필요한 웨어러블.
토론의 기술 3 쟁점분석과 입론.
코딩교육, 어떻게 해야 할까 이천양정여자고등학교 김가연 안선영.
중국문학개론 한부와 겅건안문학 중어중국학과 ㅇ이진원 한부와 건안문학.
2015년도 연세대학교 의과대학 의과학자육성 장학금 신청안내
Presentation transcript:

An Intra-Task DVFS Technique based on Statistical Analysis of Hardware Events 2008.07.30 순천향대학교 컴퓨터학부 윤희성

ABSTRACT 통계적 분석에 기반한 DVFS 기법 제안 기존 논문은 지식-기반 방식으로 컴퓨터 동작을 정성적(qualitatively) 분석, 동적 최적화 모델 생성 제안하는 방식은 하드웨어 이벤트들의 정량적인 데이터에서 동작을 분석, 통계적인 모델 생성 프로그램의 실행 단계(phase)와 같은 정적 정보와 성능 카운터의 동적 정보를 이용하는 혼합 기법 성능과 성능 카운터 간의 관계는 통계적으로 미리 학습됨 컴파일러는 성능을 예측하고 예측된 성능에 따라 주파수/ 전압을 설정하는 런-타임 코드를 삽입 소프트 타이밍 제약을 만족하면서 에너지 소모를 크게 줄임

INTRODUCTION 프로그램 실행 시 적용되는 동적 최적화의 필요성이 증대됨 정적 최적화에 비해 서로 다른 데이터 세트의 크기, 하드웨어 환경 등에 기인한 동적 동작들에 더 잘 적응하는 장점을 가짐 ex) 주파수/전압 스케일링, 캐시나 명령 큐 등에 적합한 크기의 구조 선택, SMT(simultaneous multithreading) 프로세서나 CMP(chip multi-processors) 상에서 수행되는 쓰레드의 수 등이 있음 OS, 하드웨어 기반 기법들은 런-타임 정보들을 활용하여 캐시 미스, 분기예측 미스 등과 같은 프로그램 실행 시 발생하는 동적 동작에 응답 실행단계의 변화와 같이 프로그램의 소스 코드로부터 얻어지는 정보를 사용할 수 없는 단점을 가짐

INTRODUCTION 컴파일러 기반 기법들은 프로파일링 결과들을 사용, 오프-라인에서 프로그램의 동작을 분석 프로파일링과 다른 데이터 세트 크기, 하드웨어 등 다른 런-타임 환경 적용 시 적절한 최적화를 제공하지 못함 모든 최적화는 최적화 적용시점과 방법을 결정하기 위해 타겟 프로세서의 동작을 모델링해야 함 하지만 최근 프로세서들은 비순차 실행의 깊은 파이프라인, 복잡한 분기예측기의 슈퍼 스칼라로 설계되고 있음 또한 단일 칩 상에서 리소스를 공유하는 여러 쓰레드를 실행할 수 있는 SMT나 멀티-레벨 캐시 구조의 CMP가 보편화되고 있음 프로세서의 동작을 정성적으로 파악하는 것이 어려워짐

INTRODUCTION 제안된 통계적 방식은 Intel Pentium M, AMP Opteron, AMD Turion 프로세서 상에서 DVFS 적용기법을 개발함 성능 카운터로 구해진 동적 정보를 이용하여 주파수/전압이 변경될 때 프로세서의 성능을 온-라인 상에서 예측, 에너지 소모를 줄이는 방법 제안 성능과 성능카운터 정보 사이의 관계를 미리 통계적으로 학습하여 성능을 예측하는 수학적인 표현 설계 세 프로세서에 적용한 결과 쉽과 적용 가능하고, 좋은 결과를 보였다.

METHOD Multiple Regression Analysis 독립변수의 값들로부터 종속변수의 변화의 예측을 위해 널리 사용되는 통계분석 제안된 모델은 성능이 종속변수, 성능 카운터 값이 독립변수가 됨 독립변수가 2개 이상인 경우 다중 회귀분석을 실시 Y는 예측된 성능, X는 성능 카운터 값, b는 회귀계수

METHOD DVFS Technique Based on Statistical Analysis

METHOD 학습 프로그램을 실행하여 성능과 성능카운터 값 수집 수집된 데이터를 사용하여 회귀분석 모델을 생성, 각기 다른 주파수에서 성능을 예측할 수 있는 수학적인 표현을 구함 또한 가장 높은 기여율(상관관계 요인)을 갖는 카운터들을 선택 통계적인 학습의 결과가 라이브러리로 저장되고, 컴파일러는 타겟 응용의 소스코드의 성능카운터로부터 성능을 예측하도록 라이브러리 호출 삽입 예측된 성능에 따라 주파수/전압을 변경하는 런-타임 코드를 삽입 마지막으로 온-라인으로 서로 다른 주파수/전압에 대해 성능을 예측하고, 주어진 소프트 타이밍 제약에 따라 DVFS 적용

METHOD Performance Predicting Model AMD Turion 프로세서에서 여러 개의 phase의 각 주파수에서 최대 주파수에 대한 성능비율을 보여줌 일부 성능 카운터는 선형, 일부는 log model이 더 높은 정확도를 보이기 Eans에 위의 식과 같은 log-based linear regression model을 사용하여 성능 예측

METHOD Run-time Code Insertion by the Compiler 컴파일러가 타겟 소스코드를 분석, 루프나 함수 등과 같이 반복될 가능성이 높은 “phase”를 찾음 그 뒤 성능 카운터를 사용해 성능을 예측, 주파수를 변경하는 런-타임 코드를 라이브러리에 삽입

METHOD “phase”에 삽입되는 런-타임 코드의 개략임 함수 set_freq()는 주파수를 설정하고, 라이브러리 호출 start_perf_counter()는 성능 카운터를 리셋시킴 이 코드는 phasei 직전에 삽입됨 Freq_phasei는 이전에 설정된 주파수이고 초기값은 최대 주파수임 Phasei 수행 후 성능 카운터를 측정하는 end_perf_counter() 함수가 호출되고 클럭은 최대 주파수로 설정됨 Phase가 아닌 다음 코드를 성능 저하 없이 최대 성능으로 수행시키기 위함 함수 estimate_perf_raito()는 통계적 학습으로 구해진 회귀식에 측정된 성능 카운터를 대입하여 최대 주파수에 대한 성능비율을 예측하는 함수임 프로세서가 유지해야 되는 최소 성능을 나타내는 성능비율 임계값은 Pthrehold로 표시됨 Pthrehold를 초과하는 최소의 주파수가 다음 실행 주파수

EVALUATION Evaluation Environment 표 1과 같은 프로세서의 실제 PC에서 실험 수행하고 표 2는 각 프로세서의 클럭주파수/공급전압 관계를 보여줌 Pentium M은 33개의 성능카운터, 동시측정 2개 가능 Opteron과 Turion은 29개의 성능카운터, 동시측정 4개 가능 Linux 2.6.11 상에서 PAPI를 사용하여 성능카운터 측정

EVALUATION Learning Programs and Evaluation 통계적 학습을 위해 SPEC CPU2000의 9개의 정수 프로그램(gzip, vpr, gcc, mcf, gap, vortex, bzip2, twolf)로부터 phase로 지정될 만큼 긴 함수들을 선정함 Phase는 오프라인으로 GNU prof를 사용한 프로파일링 데이터를 이용, 수작업으로 선정 다양한 종류의 입력 데이터 크기를 커버하도록 (ref, train, test) 데이터 세트를 사용 또한 학습을 위해 다양한 크기(행렬 크기, 벡터 길이)의 데이터를 갖는 행렬곱과 벡터곱 프로그램도 사용 300개의 phase로부터 성능카운터 값을 측정하고 통계적으로 학습됨

EVALUATION 제안된 DVFS 방식의 평가를 위해 SPEC CPU2000 정수에서 mcf, bzip2, SEPC CPU2000 실수에서 swim, mgrid (ref 입력 사용), 행렬곱 프로그램 선정 통계학습을 위해 leave-one-out 방식을 사용 성능비율 임계값으로 Pthrehold = 1.0, 0.9, 0.8, 0.5를 적용 성능카운터를 수집하는 라이브러리 함수 호출 추가는 1% 미만으로 성능에 영향을 주어 크지 않음

EVALUATION RESULTS Statistical Learning Results 표 3은 각 프로세서의 선택된 성능카운터와 기여율을 나타냄

Evaluation Results 그림 4는 각 프로세서의 DVFS 적용 결과 최대 주파수 성능 대비 비율을 보여줌 점선은 임계값을 나타냄

EVALUATION RESULTS 그림 5는 각 프로세서에서 선택된 주파수의 분포를 보여줌 막대 바의 임계값은 0.9, 0.8, 0.5 순으로 표시됨

EVALUATION RESULTS 표 4, 5, 6은 상대적인 에너지 소모값을 보여줌 실측 값이 아닌 그림 5의 주파수 분포와 공급전압과의 관계를 분석하여 계산됨 임계값이 0.9인 경우 Pentium M은 12%, Opteron은 6%, Turion은 9% 에너지가 감소하고 0.5인 경우 각각 35%, 27%, 31% 감소

EVALUATION RESULTS

CONCLUSION 통계적인 분석에 근거한 DVFS 기법 제안 성능과 성능카운터와의 관계를 통계적으로 미리 학습, 컴파일러가 성능을 예측하고, 예측된 성능에 따라 주파수/ 전압을 설정하는 런-타임 코드를 삽입 삽입된 코드는 예측된 성능에 따라 성능비율을 만족하는 낮은 주파수를 선택함 세 하드웨어 플랫폼에 적용한 결과 조건을 만족하면서 에너지 소모를 감소시킴 향후 더 나은 통계 학습방법을 개발하고, 다른 형태의 동적 최적화, 분석이 어려운 동작에 적용할 예정

Questions ? Please contact : 윤 희 성 순천향대학교 컴퓨터공학부 멀티미디어관 M611 Email :iloveyr2@gmail.com