<소스코딩(Source Coding)> 제4장 가변길이 코드

Slides:



Advertisements
Similar presentations
10-7 부동소수점 (Floating-Point) 계산  컴퓨터에서 숫자를 표기하는 방법  가수 (Fraction) : 부호화된 고정소수점 숫자 지수 (Exponent) : 소수점의 위치를 표시 ( 예 )10 진수 를 표기하면 Fraction Exponent.
Advertisements

Chapter 2. Text Patterns 2.1 ~ 2.3 서울시립대 전자전기컴퓨터공학과 데이터마이닝 연구실 G 노준호.
폭력. 폭력이란 무엇인가 우상의 눈물 물리적인 폭력 ( 최기표 ) VS 지능적인 폭력 ( 임형우, 담임선생님 )
제3장제3장 제3장제3장 이산균등분포  확률질량함수 :  평균 :  분산 : 공정한 주사위를 한 번 던지는 경우 나온 눈의 수를 확률변수 : X 확률질량함수 : 평균 : 분산 :
DNA Solution of the Hitting Set Problem 전기컴퓨터공학부 문승현, 김진.
1 박 2 일 !!! 인천마장초등학교 유수아. 1 박 2 일 멤버 인기순 위 1 위 이승기 2 위 엄태웅 3 위 은지원 4 위 김종민, 이수근 ※인터넷에서 본것이기 때문에 사람에따라 서 다를 수 있다. ※
문자코드 1 박 2 일 (4 조 ) 이경도 이준집 이수연 엄태규. 문자코드란 ? 문자나 기호를 컴퓨터로 다루기 위하여, 문자나 기호 하나하나에 할당 시키는 고유의 숫자를 말하는 것이다.
석관중앙교회 5남전도회 석 관 중 앙 교 회 회원 소식 통권 05-04호 발행일 : 2005년 04월 회 장 : 장진호 집사
지역사회복지론 1조. 요양보호시설에 대해서 황성국 임재형 이동영
Hamming Code 이근용. 2 Error Control Error Detection Parity Check CRC Check Error Correction Hamming Code.
제2장 주파수 영역에서의 모델링.
Chapter 7 무손실 압축 기법 7.1 소개 7.2 기본적인 정보 이론 7.3 줄길이 부호화 7.4 가변 길이 부호화 7.5 사전 기반 부호화 7.6 산술 부호화 7.7 무손실 영상 압축 학기 멀티미디어시스템.
유한 오토마타 Finite Automata
I 문학의 개념과 역할 1. 문학의 개념 (1) 언어 예술로서의 문학 (2) 소통 활동으로서의 문학
4. 목적론적 윤리와 의무론적 윤리 01. 경험주의와 이성주의 01. 경험주의와 이성주의 02. 결과론적 윤리와 공리주의
제 9 장의 구성 9.1 원천부호화 (Source Coding) 9.2 채널부호화 (Channel Coding) 연습문제
<소스코딩(Source Coding)> 제5장 상관관계와 자료압축
제 9 장 구조체와 공용체.
사원수 (Quaternion)
정보공학의 구조 (관련분야) 신호시스템 모델 정보의 원천과 디지털 신호 Source/Channel Alphabet
<정보이론(Information Theory)> 제7장 Source Coding의 한계
멀티미디어 처리 4장 : 정보압축의 원리 및 기본이론.
발표제목 발표제목 둘째 줄 2000년 11월 송 홍 엽 연세대학교 전기전자공학과 송 홍 엽
Distillation Filtration: Chromatography:. Distillation Filtration: Chromatography:
Lecture #6 멀티미디어 데이터 압축 & 복원.
제9장 채널용량(Channel capacity)
Error Detection and Correction
Chapter 7 무손실 압축 기법 멀티미디어시스템 학기.
Simulating Boolean Circuits on a DNA Computer
CH 4. 확률변수와 확률분포 4.1 확률 확률실험 (Random Experiment, 시행, Trial) : 결과를 확률적으로 예측 가능, 똑 같은 조건에서 반복 근원사상 (Elementary Event, e) : 시행 때 마다 나타날 수 있는 결과 표본공간.
행렬 기본 개념 행렬의 연산 여러가지 행렬 행렬식 역행렬 연립 일차 방정식 부울행렬.
Mathematics Review for Algorithm
제3장 채널코딩(Channel Coding)
제 4장 시스템 신뢰도와 중복설계.
<정보이론(Information Theory)> 제6장 정보의 특성과 Entropy
From Block To C SW 코딩을 위한 5단계 교육
국가대표 생애주기교육 프로그램 참여방법 안내
프로그래밍 개요
군집 분석.
개항기 조선과 동아시아 박 범 한국역사입문Ⅱ.
자료구조: CHAP 7 트리 –review 순천향대학교 컴퓨터공학과 하 상 호.
[예제] 의사결정나무 현재의 공장을 기술적 진부화에 대비하여 현대화하는 문제를 고려 중인 상태에서,
Java의 정석 제 5 장 배 열 Java 정석 남궁성 강의 의
Ch 5 영상압축.
CHAP 5. 레이아웃.
공용위원회 e-시스템을 이용한 심의신청하기
☆ASCII☆ 김연주.
영상 압축 방법에 관한 연구 컴퓨터응용과학부 유정숙.
수업 첫 날 교육B 황유미 첫 수업 계획에 대해 알아보도록 하겠습니다..
2장. 변수와 타입.
요한계시록 (2) 요한계시록의 7가지 중점사항 Rev 2-0.
연결링크 이미지를 마일리지샵 내에 기획전으로 제작하여 오픈/노출 사이즈 가로 1000/세로 상관x 배너사이즈 가로 400
스케줄링 (Scheduling) 시스템 내부시간(time in the system): 스케줄링 문제
Hanoi Tower.
제19장 솔로우 모형 제1절: 인구가 일정하고 기술진보가 없는 경우 제2절: 인구가 증가하는 경우
강수동 (전)전국공무원노동조합 진주시지부장 (현)민주노총 진주지부장 (현)민주노총 경남지역본부 수석부본부장
1. 2진 시스템.
대구의 부도심 대구의 주요축 동대구 부도심 4조 강민석 / 박성균 / 최은지/ 황재현/김예지.
In Managing Gigabytes 과목 : 정보검색론 강의 : 부산대학교 권혁철
2nd day Indexing and Slicing
사도행전 13장 22절 말씀 –아멘 다 윗 을 왕 으 로 세 우 시 고 증 언 하 여 이 르 시 되 내 가 이 새 의 아 들
7장 전위이론 7.2 금속의 결정구조 7.4 인상전위와 나선전위 7.5 전위의 성질.
Flow Diagram IV While.
쉽게 배우는 알고리즘 2장. 점화식과 점근적 복잡도 분석
경찰행정과 세미나 결과를 공개해야한다. VS 비공개로 해야한다. 경찰의 근무성적평정 제도.
Chapter 7 – Curves Part - I
내소착성이 우수한 금속 압출용 금형 및 그 제조방법
제 4 장 Record.
(Permutations and Combinations)
7 생성자 함수.
Presentation transcript:

<소스코딩(Source Coding)> 제4장 가변길이 코드 고정/가변길이 코드(variable-length code) 유일디코딩과 동시디코딩 최적 동시코드와 Huffman Code Huffman Code의 응용

소스코딩(Source Coding) 정보원 심볼들에 대하여 Binary Code를 부여하는 방법 • 평균코드길이(avg. code-length)의 최소화 지향 • 고정길이코드 vs. 가변길이코드 <고정길이코드(fixed-length code)> 예) ASCII code  모든 정보원 심볼에 대하여 동일한 길이의 코드 부여  정보원 심볼의 수를 M이라 하고, 코드의 고정길이를 n이라 하면 <가변길이코드(variable-length code)> 예) Morse code  정보원 심볼의 발생확률에 따라 서로 다른 길이의 코드 부여 - 발생빈도가 높은 심볼 : short code - 발생빈도가 낮은 심볼 : long code  유일성, 동시성, 동기 등의 문제를 해결해야 한다. 정보공학 2001-1

유일성 / 동시성 코드체계 1 s1 = 0 s2 = 01 s3 = 11 s4 = 00 코드체계 2 s1 = 0 s2 = 01 s3 = 011 s4 = 111 코드체계 3 s1 = 0 s2 = 10 s3 = 110 s4 = 111 코드체계 4 s1 = 0 s2 = 10 s3 = 110 s4 = 1110 s5 = 1111 코드체계 5 s1 = 00 s2 = 01 s3 = 10 s4 = 110 s5 = 111 정보공학 2001-1

UI-Code(unique & instantaneous code) Unique Code  모든 extension이 서로 다르다 UI-Code  코드체계 내에 prefix가 없다  디코딩트리 존재 코드체계 2 s1 = 0 s2 = 01 s3 = 011 s4 = 111 코드체계 3 s1 = 0 s2 = 10 s3 = 110 s4 = 111 s2 s3 s4 s1 1 s1 s4 s3 s2 1 정보공학 2001-1

Kraft Inequality 최대 코드길이에 대한 수학적 귀납법으로 증명 Basis step 2) Induction step (최대길이=1 인 경우) (최대길이=n 일때 성립함을 가정하여 최대길이=n+1일때 성립함을 보임) K’ K K’’ 최대길이= n 정보공학 2001-1

최적 UI-Code의 특성 Source Alphabet S = {s1, s2, …, sq}, Code Alphabet C = {0, 1} & pi = Pr{si occurs}, i = 1, 2, …, q & li : code-length for si , i = 1, 2, …, q 평균 코드길이 최적 UI-Code의 특성 (“평균 코드길이”의 관점에서 최적) 정보공학 2001-1

Binary Huffman Coding Step 1. 축소과정(reduction process) 1) 최하위(최소 확률)의 두 심볼을 결합, 합의 확률을 갖는 하나 의 심볼을 형성 2) 새로 형성된 심볼을 확률순서에 따라 천이 3) 오직 두 개의 심볼만 남을 때까지 1), 2) 과정을 반복 Step 2. 확장과정(splitting & expansion process) 1) 남은 두 심볼에 대하여 각각 ‘0’, ‘1’을 할당 (split) 2) 축소과정을 통하여 결합되었던 심볼을 다시 분리하면서 각각 ‘0’, ‘1’을 첨가 (expand) 3) 원래의 q개 심볼이 될 때까지 2) 과정을 반복 정보공학 2001-1

Huffman Coding (예) 예제1) 예제2) 예제3) Zipf’s Distribution (language problem simulation) q = 4 일 때 2. q = 8 일 때 3. q = 16 일 때 각각 Huffman 방식으로 Coding 하라. 정보공학 2001-1

Zipf 분포에 대한 Huffman coding의 이득 N LB LH (Average) G 2 1 1.0 0 4 2 1.8 10 8 3 2.68 10.7 16 4 3.43 14.3 32 5 4.17 16.6 64 6 4.89 18.5 128 7 5.60 20 256 8 6.26 21.8 512 9 6.90 23.3 1024 10 7.54 24.6 정보공학 2001-1

Huffman Code의 특수한 경우 1. 모든 심볼들이 동일한 발생확률을 갖는 경우, • Huffman code = m-bit block code 2. • Huffman code = m-bit block code 심볼들의 발생확률이 대동소이한 경우 3. • Huffman code = Comma code 심볼들의 발생확률이 서로 크게 다른 경우 정보공학 2001-1

코드의 확장 1-차 확장 (원래의 Alphabet) 2-차 확장 (2nd extension) Si Pi S1 2/3 0 S2 1/3 1 2-차 확장 (2nd extension) Sij Pij S1S1 4/9 S1S2 2/9 S2S1 2/9 S2S2 1/9 1 4/9 5/9 01 00 3/9 4/9 1 000 2/9 01 001 3-차 확장 (3rd extension) 4-차 확장 (4th extension) 정보공학 2001-1

코드의 확장과 Entropy Entropy ‖ 0.944444 4 3 2 0.938270 1.000000 Ln 평균코드길이 1 0.918296 1 0.98 0.96 0.94 ‖ Ln 평균코드길이 n 코드확장의 차수 0.944444 4 3 2 0.938270 1.000000 정보공학 2001-1

Radix-r Huffman Coding Step 1. 전처리과정(pre-processing) 1) 소스알파벳의 심볼 수를 개가 되도록, 필요한 경우 dummy Symbol들을 추가한다. Step 2. 축소과정(reduction process) 1) 최하위(최소 확률) r 개 심볼을 결합, 합의 확률을 갖는 하나의 심볼을 형성 2) 새로 형성된 심볼을 확률순서에 따라 천이 3) 오직 r 개의 심볼만 남을 때까지 1), 2) 과정을 반복 Step 3. 확장과정(splitting & expansion process) 1) 남은 r 개의 심볼에 대하여 각각 ‘0’, ‘1’, …, ‘r-1’을 할당 (split) 2) 축소과정을 통하여 결합되었던 심볼을 다시 분리하면서 각각 ‘0’, ‘1’, …, ‘r-1’을 첨가 (expand) 3) 원래의 q개 심볼이 될 때까지 2) 과정을 반복 정보공학 2001-1