When Poll is Better than Interrupt

Slides:



Advertisements
Similar presentations
보 고 서 보 고 서 목  차.
Advertisements

슈퍼돔 고가용성 Page 1 슈퍼돔을 이용한 고가용 시스템 구성 2002 년 2 월 21 일 강사 : 이승국 대리.
(1/7) Postech DP&NM Lab On the Performance Characteristics of High-Speed Enterprise Networks (Performance Analysis of Underutilized Enterprise Network)
1 Efficient and Transparent Dynamic Content Updates for Mobile Clients Trevor Armstrong and Olivier Trescases and Cristiana Amza and Eyal de Lara Department.
1/37 Chapter 4: 프로세서 성능과 휴대성을 위한 하드웨어 © The McGraw-Hill Companies, Inc., 세기의 가장 중요한 발명품 : 마이크로 프로세서 일상생활에 널리 사용됨 프로그램에 의한 적응성.
컴퓨터의 구조 2006년 2학기 컴퓨터의 개념 및 실습.
2.1 컴퓨터 시스템의 구성 2.2 컴퓨터 시스템의 정보 표현 2.3 중앙처리장치 2.4 저장장치 2.5 컴퓨터 주변기기
사 양 서 발행번호 품 목 임상용 W/S (Desktop) 청구부서 발 행 일 수 량 22 EA 용 도 (체크:)
2010 – 06 – 24 주간 보고서.
LOGO 주기억장치와 보조기억장치 한재성.
한국hp rx1620 서버 표준 제안서 HP Korea/TSG/Presales
2007년 1학기 전산학개론 성신여자대학교 컴퓨터정보학부
Linux Debugging issues
IBM System x3400 표준 제안서 Your Department Your name
소프트웨어와 운영체제.
제 4 장 프로세스 Section 1 프로세스의 개념 Section 2 프로세스 스케줄링
컴퓨터 하드웨어 Computer Hardware
사용자 메뉴얼 차량용 4CH 블랙박스 매뉴얼 버전 : Version 2.1 Hardware Version : 2.0
2014학년도 중학교 교육과정 편성시 유의사항 울산광역시교육청 교육과정운영과 한 상 철.
제 2장 컴퓨터 구조.
13장. 시스템 버스 다루는 내용 시스템 버스의 개념 다중버스 계층 구조 버스 중재.
정보통신실습 및 특강(5)
하드웨어 3 : RAM.
비업무 사이트 차단 시스템 Venus/CPS.
CIDISK STEALTH File Server 제안서
제7장 버스와 입출력.
PowerEdge R920 표준 제안서.
DELL International Inc. 고객을 위한
Windows CE 메모리 아키텍처 및 관리 서진호
크로스 컴파일 환경 구축.
IBM System x3400 표준 제안서 Your Department Your name
임베디드 시스템.
7장 : 캐시와 메모리.
임베디드 하드웨어 Lecture #6.
Uniprocessor Scheduling
운영체제 (Operating Systems)
6장 단일 프로세서 스케줄링.
임베디드 운영체제 (리눅스 중심) Lecture #2.
Linux를 이용한 Embedded 장비 개발
병렬처리와 성능향상 A 정승휘.
Unix Project-Final <test character device 생성>
6장. 기 억 장 치 Lecture #6.
DELL International Inc. 고객을 위한
컴퓨터 구조.
Chapter 10. Interrupt.
Lecture #3 프로세스(Process).
R520 서버 1 제품 개요 DELL PowerEdge R520
운영체제 (Operating Systems) (Multi-Thread Programming)
3주 컴퓨터구조.
강의 및 교재의 목표 리눅스 초보자 리눅스 중급자. 강의 및 교재의 목표 리눅스 초보자 리눅스 중급자.
Fault Diagnosis for Embedded Read-Only Memories
Programmable Logic Device
제5장 CPU스케줄링(CPU Scheduling)
홈 네트워크 시뮬레이션 정 찬 번 석 성 환.
Sensor EDA 소개서
EMP/EMC PROTECTION SMART RACK
분산 파일 시스템의 구조 GFS 와 CEPH SW공학센터 융합SW공학팀 장원석 책임 연구원
Computer System Overview
언어교육 게임SW를 위한 음성인식 기술 IT 신성장 동력 분야별 기술개발 계획(안)
제 3 장 운영체제와 입출력 방식 Section 1 입출력 기능 Section 2 입출력 방식 Section 3 입출력 버퍼링
제 2장 프로세스 관리와 CPU 스케줄링 2.1 프로세스의 개념 2.2 CPU 스케줄링의 목적과 유형
운영체제 (Operating System) (하드웨어와 응용 프로그램 사이의 인터페이스 역할을 담당하는 시스템 소프트웨어)
기술 진화와 진보.
인터럽트 발생원인 정전 혹은 데이터 전송 과정에서 오류 발생 등 컴퓨터 자체의 기계적인 문제 발생
I/O Management and Disk Scheduling
임베디드 하드웨어 Lecture #6.
게임 엔진 ~인체 대 탐험~ 조주열.
Lecture 7 7-Segment LED controller using u-controller
Chapter 7: Deadlocks.
가상 기억장치 (Virtual Memory)
Presentation transcript:

When Poll is Better than Interrupt Jisoo Yang, Dave B. Minturn, and Frank Hady (Intel Corporation) 11th USENIX Conference on File and Storage Technologies (FAST’ 12) May 23, 2013 발표: Jeong Su Park (jspark@archi.snu.ac.kr)

Asynchronous I/O model vs. Synchronous I/O model File System Page cache Application Polling (spin-waiting) Sleep & context switch Wake & context resume A’ B’ Request coalesce, Reordering I/O scheduler Device Device driver ISR L A B Interrupt When device latency is very low Device A+B > A’+B’+L L Do other task

Test environment Host Device DRAM DMA IP DRAM PCI-e Gen. 2 x8 Random I/O with Async. I/O model Sync. I/O model CPU : Intel Xeon processor (quad core, 2.93GHz) X2 with 256KB L2 cache, 8MB L3 cache Main Memory Size : 12GB Kernel : Linux 2.6.33 Latency measurement : CPU timestamp counter IOPS measurement : FIO benchmark Emulates future NVM-e based SSD * Theoretical PCI-e Max. Bandwidth ≈ 3.98GB/s (for 4KB payload) * Theroretical PCI-e Min. Latency ≈ 1us

Experimental results Random Read test The work the CPU performs in async. path (6.31 us) is greater than the spin-waiting time of the sync. path (4.38 us) 9.01us 1.4us 2.7us *C-state : CPU enters power saving mode during I/O 4.1us

Experimental results 512KB random read test For sync. I/O model, only one thread running on each CPU. For async. I/O model, I/O threads are added until the utilization if each CPU reaches 100%

Conclusion 저장장치의 latency가 충분히 작아지는 경우, synchronous I/O model을 사용하는 것이 이익임. Kernel의 I/O 처리 방식이 간단해짐 작은 요청들을 모아 큰 요청으로 만들거나 요청 순서를 바꿀 필요가 없음. 오히려 작은 요청들을 바로 sync . 방식으로 보내는 것이 더 좋을 수도 있음. Ordering 를 쉽게 보장할 수 있음. Buffering/pre-fetching 등의 예측에 기반한 성능 향상 기법들을 적용할 필요성이 적어짐.