영상 압축 방법에 관한 연구 컴퓨터응용과학부 유정숙
차례 I. 서론 1. 영상데이터 압축의 중요성 2. 영상 압축 알고리즘 II. 본론 II. JPEG알고리즘 분석과 변환 및 양자화 과정 III. WSQ알고리즘 분석과 변환 및 양자화 과정 IV. 실습 결과 및 고찰 V. 결론
I. 서론 1. 영상 데이터 압축의 중요성 멀티미디어 응용분야에서 영상정보가 중요한 정보 전달 매체로 부각 주고 받는 영상 데이터 양의 증가 디지털 영상 데이터의 크기 – 해상도 1000x1000의 트루 컬러(24bit) 영상 1장 = 3MB 동영상 : 1초에 30장 이상의 프레임(정지 영상)필요 저장 장치 용량, 통신 상에서의 데이터 전송률의 한계 - 영상 데이터의 압축은 필수적
JPEG (Joint Photographic Expert Group) 2. 영상 압축 알고리즘 프랙탈 압축 방법(IFS) 영상데이터를 축소변환의 변수들만으로 표현함으로써 정보량을 줄이는 방법 닮음성의 관계를 변환식으로 표현 복호화 과정이 빠르고 간단, 재생이 주로 요구되는 전자사전 압축에 적합 JPEG (Joint Photographic Expert Group) 정지 영상 압축용 국제 표준 이산 코사인 변환(DCT)이용 압축률을 높이게 되면 블록화 현상 등의 결점 발생 Wavelet 변환을 이용한 압축 영상을 고압축비로 압축, 선명한 화질을 제공하므로 데이터통신에 주로 활용 Wavelet 변환방식을 이용한 영상압축의 표준 채택 (JPEG2000) FBI에서 웨이브렛을 이용한 지문 인식에 관한 연구 진행(WSQ)
Decoding은 encoding의 역순 II. JPEG 알고리즘 JPEG Encoding Encoding RGB 영역에서 YIQ영역으로 변환 YIQ 영역을 8*8 block 화 이산 코사인 변환 (DCT) 양자화 (Quantizing) Zig – zag scanning 차등 부호화(DPCM on DC component) 또는 부호 흐름 길이 부호화(RLE on AC component) 엔트로피 코딩(Entropy coding : 허프만 부호화 또는 산술 부호화) Decoding은 encoding의 역순 Y = 0.30R + 0.59G + 0.11B I = 0.60R + 0.28G + 0.32B Q = 0.21R - 0.52G + 0.31B
DCT 원리 (II-1) 영상을 공간영역에서 주파수 영역으로 전환하는 양자화 전 단계 영상을 일정한 크기(8x8)의 블록으로 나누어서 각 영역에 대해 변환 적용 영상의 평균값 (F[0,0])부터 매우 정교한 최고주파수의 영상성분 (F[7,7])까지 여러 가지 주파수 성분으로 분해. 공간영역에서 주파수 영역으로의 변환 주파수 영역에서 공간 영역으로의 변환 8*8 DCT basis function 저주파수 부분이 상대적으로 큰 값을 가지게 됨 대부분의 정보가 저주파수 부분으로 집중
검은색 : 가장 작은 픽셀 값 (-115.567) , 흰색 : 가장 큰 픽셀 값 (1116) 원리를 이용한 DCT 예 (II-2) 22.9876 [u, v] = [0, 7] 1116 [u, v] = [0, 0] 4.44451 [u, v] = [7, 7] -23.106 [u, v] = [7,0] 흰색 : 165, 검은색 : 75 검은색 : 가장 작은 픽셀 값 (-115.567) , 흰색 : 가장 큰 픽셀 값 (1116)
양자화 및 복원 과정 (II-3) 목적 : 코사인 변환된 계수들을 양자화 시킴으로써 영상의 저주파수 영역만을 선택하여 압축 시행 DCT 원 영상의 픽셀 값 코사인 변환된 영상의 주파수 계수, 0의 개수 = 15 양자화 테이블 양자화 된 영상의 주파수 계수, 0의 개수 = 54 IDCT 역 양자화 후의 주파수 계수 복원된 영상의 픽셀 값
Original image 양자화 후 복원된 이미지 DCT- 이산 코사인 변환 (II-4) Original image 양자화 후 복원된 이미지 SNR = 28.8993 (dB) 신호 대 잡음비 (SNR) 복원된 영상이 원 영상에 얼마나 일치하는지의 판단 자료 수치가 클수록 손실이 적다는 것을 의미 (정지 영상의 경우 보통 25~28 dB) 이산 코사인 변환의 장점 변환 전 화면에 불규칙하게 퍼져있던 화소값이 변환 후에 저주파 영역으로 집중 양자화를 통해서 압축률 증가
WSQ encoding/decoding III. WSQ 압축 알고리즘 WSQ encoding/decoding Encoding Step 1 : DWT Step 2 : Scalar quantization Step 3 : Huffman coding Decoding Step 1 : Huffman coding Step 2 : Scalar quantization Step 3 : IDWT
DWT 원리 (III-1) Original Image f1 d1 1st Decomposition f2 d2 이미지를 고주파수 영역(d)과 저주파수 영역 (f) 으로 분리 저주파수 영역을 반복 분리(다해상도 분석) Original Image f1 d1 1st Decomposition f2 d2 2nd Decomposition f3 d3 3rd Decomposition Original image 1st 2nd 3rd d1, d2, d3 : 다해상도 영상의 수직, 대각, 수평 고주파 성분에 대한 값을 나타낸 부분 f1,f2,f3 : 다해상도 영상의 저주파 성분
다해상도 분석을 이용한 DWT 예 (III-2) 사용한 필터 : LeastAsymmetric filter Order (n) = 4 필터 계수 = {-0.0757657, -0.0296355, 0.497619, 0.803739, 0.297858, -0.0992195, -0.012604, 0.0322231} 5회 웨이브렛 변환 후 다해상도 분석 Original image (256x256) Wavelet Transform 각 요소별 계수 표시된 부분은 저주파수 영역으로 원 영상의 저주파수 부분만을 분리 시킨 계수의 값
웨이브렛 스칼라 양자화 (III-3) FBI 지문 압축 표준 - 64개의 서브밴드로 분해 58 59 62 63 56 57 60 61 45 46 49 50 51 54 55 43 44 47 48 37 38 41 42 35 36 39 40 13 14 17 18 29 30 33 34 52 53 11 12 15 16 27 28 31 32 5 6 9 10 21 22 25 26 4 7 8 19 20 23 24 FBI 지문 압축 표준 - 64개의 서브밴드로 분해 2 3 1
위의 16 x 16의 웨이브렛 계수를 예로 들어 양자화와 역 양자화 과정을 살펴보자. 변환 공식 (III-4) - 양자화 공식과 역 양자화 공식 - 웨이블렛 변환된 영상의 계수 (16 x 16) 위의 16 x 16의 웨이브렛 계수를 예로 들어 양자화와 역 양자화 과정을 살펴보자.
스칼라 양자화 및 복원 과정 (III-5) 웨이블렛 변환된 영상의 계수 (16 x 16), 0의 개수 = 0 역 양자화 계수 양자화 계수, 0의 개수 = 66
DCT의 SNR [28.8993 (dB)]에 비해 WSQ의 SNR이 약 7.8dB이상 높은 성능을 나타냄 웨이브렛 변환을 이용한 복원 (III-6) 원 영상 양자화를 거쳐 복원된 영상 SNR = 36.7975 (dB) DCT의 SNR [28.8993 (dB)]에 비해 WSQ의 SNR이 약 7.8dB이상 높은 성능을 나타냄
IV. 결과 및 고찰 - DCT와 Wavelet비교 – 원 영상 (589.824K) JPEG방식으로 복원된 영상 (45.853K) WSQ방식으로 복원된 영상 (45.621K) 양자화 과정을 통한 복원
V. 결론 느낀 점 힘들었던 점 JPEG과 WSQ알고리즘 비교 분석 JPEG알고리즘은 DCT에 기반을 두고 제작 WSQ알고리즘은 DWT에 기반을 두고 제작 같은 압축률에서 WSQ알고리즘이 압축 효율과 영상이 뛰어남. 느낀 점 자주 쓰이는 압축 알고리즘에 관해 공부할 수 있는 좋은 기회 알고리즘을 분석하면서 여러 가지 지식 습득 (수학적, 양자화…) 새로운 알고리즘에 대한 이해 간단한 알고리즘 계산과정 개발 요구 힘들었던 점 수학 계산 과정과 수식의 이해 WSQ알고리즘에 대한 자료부족과 논문을 읽어야 했던 점