LSM-trie: An LSM-tree-based Ultra-Large Key-Value Store for Small Data

Slides:

Advertisements

Similar presentations

이혁재 /KASA NoSQL. 요약 NoSQL 소개 데이타베이스 관련 문서 대상 : 클라이언트 프로그래머 NoSQL 소개 데이타베이스 관련 문서 대상 : 클라이언트 프로그래머.

Advertisements

10장. 시기별 학급경영 11조 염지수 이 슬 권용민 신해식.

KB 스타 경제 · 금융교실 나는 용돈관리왕. KB 스타 경제 · 금융교실 나는 용돈관리왕 선생님은 ? KB 2  이름 : 김국민  별명 : 스타 왕자  소속 : KB 국민은행 소비자 보호담 당 ( 간단한 자기 소개 : 교육 대상이 흥미 를 가질 수 있는 이미지와.

일본 근세사. (1) 에도막부의 개창 ( ㄱ ) 세키가하라의 전투 (1600) - 히데요시의 사후 다섯 명의 다이로 ( 大老 ) 가운데 최대 영지 (250 만석 ) 를 보유하고 있던 도쿠가와 이에야스가 급부상. 이에 이에야스와 반목해 온 이시다 미쓰나리 ( 石田三成 ),

사 진 성명 학교 휴대폰 전공 / 학년 / 학번 ●교내 외 활동내역 활동명활동기간주요내용 ●공모전 수상경력 년 월 일년 월 일내 용내 용시행처 재학 / 휴학 본 주소 ※ 공모전 수상경력은 참고사항일 뿐 평가에 반영되지 않습니다 수상내용 생년월일 SNS/ 미니홈피.

아니마 / 아니무스 송문주 조아라. 아니마 아니마란 ? 남성의 마음속에 있는 여성적 심리 경향이 인격화 한 것. 막연한 느낌이나 기분, 예견적인 육감, 비합리적인 것에 대 한 감수성, 개인적인 사랑의 능력, 자연에 대한 감정, 그리.

대구가톨릭대학교 체육교육과 06 학번 영안중학교 체육교사 신웅섭 반갑습니다. 반야월초등학교 축구부 대륜중학교 축구부 대륜고등학교 대구가톨릭대학교 차석 입학 대구가톨릭대학교 수석 졸업 2014 년 경북중등임용 체육 차석 합격 영안중학교 체육교사 근무 소개.

파리바게트의 기업이미지 주요 타겟 라이벌 기업 광고 방법 광고 INDEX 1. 파리바게트의 기업이미지 파리바게트 의 기 업이미 지 신선한 원료로 갓 만든 “ 건강한 빵 ” 프랑스의 지명 ’ 파리 ’ + 전통 빵 ’ 바게트 ’ 가 합쳐진 브랜드명 그 대로 유럽전통 베이커리에서.

학교폭력이란 ? 학교 내외에서 학생을 대상으로 발생한 상해, 폭행, 감금, 협박, 약취, 유인, 명예훼손, 모욕, 공갈, 강요, 강제적인 심부름 및 성폭력, 따 돌림, 사이버 따돌림, 정보통신망을 이용한 신체 · 정신 또는 재산상의 피해를 수반하는 행위 음란 · 폭력 정보.

일장 - 1 일 24 시간 중의 명기 ( 낮 ) 의 길이 ( 밤은 암기, 낮은 명기 ) 광주기성 - 하루 중 낮의 길이의 장단에 따라 식물의 꽃눈 형성이 달라지는 현상 일장이 식물의 개화현상을 조절하는 중요한 요인 단일식물 - 단일조건에서 개화가 촉진되는 식물 장일식물.

언어의 자서전 소단원 (1) 단원. 언어의 특성 기호성 자의성 사회성 규칙성 창조성 역사성.

2 학년 6 반 1 조 고은수 구성현 권오제 김강서.  해당 언어에 본디부터 있던 말이나 그것에 기초하여 새로 만들어진 말  어떤 고장 고유의 독특한 말  Ex) 아버지, 어머니, 하늘, 땅.

5장. 시장 조사와 사업계획서 시장 조사는 창업을 하려는 사업가가 자신이 선택한 사업 아이템에 대하여 반드시 실시하여야 하는 것이다. 아무리 창조적인 제품이라 할지라도 시장에서 선택받지 못한다면 그러한 제품을 아무리 생산하여도 결국 사업에 실패할 수밖에 없기 때문이다.

청소년 범죄 손아영 오지연.

2014년도 교원 및 기간제교사 성과상여금 전달교육 개 회 국기에 대한 경례 - 인사말

ABAP Programming 정보자동화그룹 ERP팀 김 아 람 SW.

MB노믹스의 실패와 미래 22조 배주환 외 5명.

선진 고양교육 “유아교육 행정 업무 연수” 유치원 회계실무 및 유아학비 연수 경기도고양교육청.

2012년 12월 정기 제직회 기 도 : 김영민 집사 출 석 : 서 기 개회 선언 : 제직회장 (이태환 장로)

한국신뢰성학회 퀴즈 세션 주제 공지 제목 : 인터넷(포럼 , 동호회, SNS)에서 현대/기아/경쟁사 고객불만항목 정량화 및 발췌 목적 : 사외데이터를 활용하여 현대/기아/경쟁사의 고객불만사항을 발췌하고 숨어 있는 항목을 찾는 방법 필요 선정사유 : 인터넷 고객 불만.

묵자 겸애, 비명, 비공, 상현, 상동, 천지, 명귀, 삼표 법.

300% + 고급 엘르이불(퍼팩트골드,운전자보험 추가시상)

북한 교회의 과거(2) - 구한말 선교되는 교회에서 선교 하는 교회로

내 아이를 위한 구강관리.

제16장 원무통계 • 분석 ☞ 통계란 특정의 사실을 일정한 기준에 의하여 숫자로 표시한 것을 말한다.통계로서 활용할 수 있는 조건으로는 ① 동질성을 지녀야 하고 ② 기준이 명확하고 ③ 계속성이 지속되어야 하며 ④ 숫자로 표시하여야 한다 경영실적의.

KB희망서포터즈 지원서 ▣ 기본사항 ▣ 보험가입사항 (본인포함) ▣ 주요경력 (패널) ▣ 기타사항 (인터넷 활용능력) 사진

2017 인권과 성평등교육 고려대학교 인권센터.

진행 공모사업 흐름도 ①약정체결 킥오프워크샵 ②사업비지급 공유,토론회 (수시) ③사업비지출관리 ④예산변경 ⑤중단이슈발생

240%~250% + 메리스가든 그릇set (5만↑ 건당)

커뮤니케이션 스킬 UP -전화매너- ..

서울지방세무사회 부가세 교육 사진클릭-자료 다운 세무사 김재우.

치매의 예방 김 은민 윤금 노인요양원 치매의.

7장 : 캐시와 메모리.

Korea University of Technology and Education Hongyeon Kim

On the computation of multidimensional Aggregates

제 7장. 멀티미디어 저장 시스템.

㈜학술교육원 온라인논문투고시스템 투고자 메뉴얼.

마산에 대하여 만든이 : 2204 김신우, 2202 권성헌.

사범 대학 05 사범 대학 01 하반기 공약사항

Design of Flash-Based DBMS: An In-Page Logging Approach

목차 INDEX 1. 회원가입 및 로그인 2. 업체정보 3. 제조검사 신청 4. 인보이스 5. 검사진행현황(현장검사 신청)

Chapter 08 구조적 분석과 설계 8.1 구조적 분석(Structured Analysis)

분산 파일 시스템의 구조 GFS 와 CEPH SW공학센터 융합SW공학팀 장원석 책임 연구원

JFS operation HP Korea / Operations JFS operation.

알쏭달쏭 요한복음 성경퀴즈.

Chapter 12 Memory Organization

KB스타 경제·금융교실 은행에 가요.

미래의 커뮤니케이션 기술과 이 기술이 인간에 미치는 영향

C언어 응용 제 15 주 검색.

“서울시랑 즐거웁게, 시민이랑 어울리게, 모바일로 만나는 스마트한 서울라이프”

6장 마케팅 조사 박소현, 김중호, 박기찬.

3단원 디지털 세상 속으로 1. 0과 1의 비밀.

한밭대학교 창업경영대학원 회계정보학과 장 광 식

컴퓨터 및 스마트폰용 게임 기획서 OOO (프로젝트명) 컴퓨터공학과 학번 : 성명 : O O O.

6장: 기억장치 대화성, 멀티미디어에 대한 기반들.

# 이렇게 2쁘조? 소소하지만 확실한 행복 #심창섭 #양윤석 #김민지 #김민경 #임지현 #김선우 #정연하.

음양오행과 물리학 조 원 : 김용훈, 양범길, 박수진, 윤진희, 이경남, 박미옥, 박지선 (11조)

「2015년도 열린 관광지」공모 사업제안서 관리번호 관 광 지 명 대 표 자 (인) 작 성 인

이야기 치료에 대하여 <8조 학문적 글쓰기 발표> 주희록 최은지

(Ⅰ) 독서와 언어의 본질 언어의 본질 1 2 [고등 국어] – 독서와 문법 독서의 본질 (1) 독서의 특성

▶서류관리 프로그램 1. 로그인….2 2. 서류등록 … 서류도착 서류스티커발행

데이터 베이스의 내부 구조.

잡학다식, 디지털 집단지성과 미래직업 (3)SNS를 통한 집단지성의 이해.

2019 대교국제조형심포지엄 출품원서.

착한가게 광고 제안 착한 매출, 착한 광고! 돈벌리는 착한 어플!.

책을 읽읍시다  탈향 진지하게 설명해드림 1303 김소희 1309박지호 1315이지수.

2016년 제1차 운영위원회 평택시건강가정 ∙다문화가족지원센터

중국문학개론 한부와 겅건안문학 중어중국학과 ㅇ이진원 한부와 건안문학.

KB스타 경제·금융교실 화폐가 태어났어요.

Presentation transcript:

LSM-trie: An LSM-tree-based Ultra-Large Key-Value Store for Small Data Xingbo Wu ATC 2015 Lee, Kangmin

어플리케이션의 요구사항 방대한 양의 데이터가 요구되는 어플리케이션이 증가 SNS E-commerce Online game 기존의 관계형 데이터베이스(ex: mysql)보다 빠른 성능의 Key-Value Store가 각광을 받고 있음

Key-Value Store Key와 Value로만 이루어진 데이터베이스 단순한 인터페이스 Value는 오직 하나의 Key에 의해서만 접근이 가능 단순한 인터페이스 Put(key, value) Get(key) Delete(key) 데이터간의 비교가 불가능한 대신, 읽기/쓰기 속도가 매우 빠름

Key-Value Store의 특징 요구되는 용량이 점점 증가 Value의 크기는 작음 TB단위의 데이터 메타데이터의 크기도 무시할 수 없음 Value의 크기는 작음 페이스북의 경우 99%의 item이 68B 이하 메타데이터의 증가가 성능에 큰 영향을 미침 캐시량이 줄어들음 Warm-up 시간 증가 Disk R/W 횟수 증가

LevelDB의 구현 LSM-tree(Log-Structured Merge-Tree) Google BigTable, Cassandra에서 사용하는 자료구조 B+ Tree에 비해 쓰기 성능이 우수 MemTable, SSTable, Commit Log라는 3개의 저장 공간을 사용 SSTable(Sorted String Table) MemTable이 가득 차게 되면, 디스크에 SSTable을 생성 변하지 않는(immutable) 파일 내부 데이터는 key를 기준으로 정렬 되어짐 Index block을 배치하여 원하는 block을 이진탐색으로 검색 Bloomfilter 지원 여러 SSTable을 통합(compaction) 할 수 있음

Compaction 각 레벨의 크기가 꽉 차면 새로운 레벨에 SSTable을 merge- sort 하는 작업 비용이 작지 않고, 레벨이 증가함에 따라 쓰기 확장(Write Amplification) 이 크게 증가함

SET Throughput 저장하는 수가 늘어날수록 쓰기 성능이 크게 감소 100B - KV item이 10TB 있을 때, 메타데이터의 크기는 155GB

Goals 크기 확장을 줄이고 small data에 최적화된 Key-Value Store 소개 LevelDB의 LSM-tree를 기반으로 한 LSM-trie LevelDB에 비해 R/W throughput 20배 향상

Trie String set의 각 위치의 문자로 트리를 구성 접두사 트리(prefix tree)라고도 불림 길이가 M인 N개의 문자열 집합의 탐색은 O(MlgN)인것에 비해, Trie를 사용하면 O(M)에 찾을 수 있음

LSM-trie KV를 sha-1로 해싱하여 비트단위로 쪼개고, N개의 비트로 묶은 트리를 구성하여 해당하는 위치에 저장

LSM-trie Compaction Compaction은 자식노드에 선형적으로 쌓이기 때문에 확장이 적게 발생함

LSM-trie HTable 노드에서 특정 KV를 찾기 위해 해시 테이블을 제공 각 버켓의 default 값은 4KB 크기가 초과된 버켓은 다른 작은 버켓으로 이동됨(정렬)

LSM-trie Cache 메타데이터는 각 버켓마다 이동된 KV에 대한 정보(8B)만을 담음 평균적으로 1.01 번의 disk read가 발생 1TB의 데이터에 필요한 메모리는 약 400MB

BloomCluster 같은 해시를 갖는것끼리 모든 블룸필터를 모음 결과적으로 GET 명령에 한번의 read가 필요

PUT Performance

WA Comparison

Read Performance

Read Performance

Conclusion 작고 많은 데이터를 관리하기위한 LSM-trie 구현 쓰기 확장 비율 감소 디스크상의 메타데이터 연산에도 빠른 성능

thanks