디지털정보기술 ( 4 장 디지털 파일압축 ) 디지털정보기술 ( 4 장 디지털 파일압축 ) 2014 년도 1 학기
2 1. 정보혁명과 압축의 필요성 텍스트와 사운드 텍스트, 사운드, 이미지 또는 애니메이션이 되는 그래픽 이미지 텍스트, 사운드, 비디오이미지 멀티미디어 정보 비디오, 사운드 PCM ?
3 - 문자, 음성, 영상 등 모든 정보가 디지털 코드로 표시 - 제한된 크기의 메모리에 많은 정보를 저장 - 제한된 전송선로를 통해 많은 정보를 전송 - 정보에 따른 필요 전송속도 * 전화 – 64kbps * CD 음악 – 1.4Mbps * TV – 114.5Mbps * HDTV – 1.2Gbps 반드시 압축이 필요 압축의 필요성 1. 정보혁명과 압축의 필요성 휘도 ?
4 1. TV 의 기본사항 : ․ ․ 구 분 디지털 정보의 크기 디지털 데이터 계산 초당 데이터 전화 음성 8KHz 표본화 x 8bit 64Kbps 스테레오 CD 44.1KHz 표본화 x 16bit x 2 채널 1.5Mbps 컬러 TV 복합영상 (NTSC) 14.3MHz 표본화 x 8bit 114.5Mbps 컬러 TV 스튜디오 디지털 규격 13.5MHz 표본화 x 8bit ( 휘도 ) MHz 표본화 x 8bit x 2 색 216Mbps HDTV 스튜디오 74.25MHz 표본화 x 8bit ( 휘도 ) MHz 표본화 x 8bit x 2 색 1.2Gbps 디지털데이터를 디지털 통신망, 하드디스크, CD, DVD 로 수용가능 ? 인간의 시각, 청각 특성을 이용하여 최대한 압축 사용 ISO, ITU, IEC 기관 MPEG 멀티미디어 정보
5 2. 압축의 종류와 원리 디지털 코드의 압축 방법 무손실 압축 - 압축 후 복원하면 원래의 코드로 완벽한 재생 가능 - 컴퓨터 데이터, 도형, 문자 등 - Run-length, DPCM, Entropy 손실 압축 - 인간의 시각 및 청각이 느낄 수 없는 부분을 제거 - 높은 압축율, 완벽한 재생 불가 - DCT, MPEG
6 : ․ ․ 구 분 무손실 압축 (lossless compression) 손실 압축 (lossy compression) 압축률 상대적으로 낮음 상대적으로 높음 데이터의 복구 원래 데이터의 완전 복구 가능 복구 데이터 / 원래 데이터가 다름 적용 압축파일 PKZIP, ARJ, LHA GIF, TIFF JPG(JPEG), MPEG, MP3, MP4, RA(real audio) 재압축 여부 재압축 시 파일 크기가 줄지않음 반복압축 시 파일 크기가 줄어듬 응용 분야 컴퓨터의 실행 파일 데이터 파일 영상, 음성 등 인간의 시청각 기관으로 느끼는 정보 적용 기법 Run-Length 보호화 Huffman 보호화 Lempel-Ziv 부호화 변환기법 : FFT, DCT 예측기법 : DPCM,ADPCM, DM, ADM 양자화 보간기법 하이브리드 방식 사용 2. 압축의 종류와 원리
7 - 동일한 값이 연속적일 때 그 횟수를 코드화 - 연속되는 값이 길수록 압축률 높음 무손실 압축 Run –length 부호화 000 압축후 압축전
8 : ․ ․ ․ : 압축후 압축전 압축의 예 33 비트 49 비트 -16 비트 압축, 67% 의 비트수로 데이터 표현 - 압축해제는 3 비트 간격으로 끊어 데이터 재현 은 ‘5’ 이므로 ‘0’ 이 5 개, 111 은 ‘0’ 이 7 개 등 비고 2. 압축의 종류와 원리
9 - 가변길이 부호화 - 데이터의 출현 확률에 따라 코드길이를 달리하는 방법 Huffman 부호화 빈도가 높은 정보는 적은 비트 수, 빈도가 낮은 정보는 많은 비트 수를 사용하는 가변 길이 코드 ( 영상 압축에 사용 )
10 어구가 반복될 때 문서상의 처음 위치정보를 이용하여 이후 어구를 [ 위치, 길이 ] 로 표현 Lempel-Ziv(LZ) 부호화 2. 압축의 종류와 원리
11 - 영상의 압축에 응용, 예측 부호화 - 서로 인접한 화소는 거의 같은 값을 가진다는 가정 - 아래 그림은 화소를 표현, 부호화할 화소는 X - X=B 로 예측한 후, X 와 실제값 x 의 차를 코드화 - B=5 이면, X 는 5 로 예측하여 ‘0’ 으로 부호화 DPCM 압축 2. 압축의 종류와 원리 손실 압축 C A D B E X
12 - 표시된 화소는 앞 화소값 (5) 로 예측 - 실제 화소값 (5) 와의 차, 즉 ‘0’ 으로 부호화 - 각 화소가 순서대로 부호화가 진행됨 2. 압축의 종류와 원리 예제
13 - 원래값은 0 – 5 까지 6 단계 존재 - 각 화소를 3 비트만으로 표현가능 ( 전제 48 비트 ) - 압축한 후는 –5 에서 5 까지 11 단계 존재 - 화소당 4 비트필요 ( 전체 64 비트 ) - 실제 압축이 일어나지 않은 결과 - 그러나 결과는 ‘0’ 근처의 값이 많이 나타남 - DPCM 결과를 Run-length 등 다른 압축방법을 사용하여 재압축 2. 압축의 종류와 원리 비고
14 DCT 압축 2. 압축의 종류와 원리 - 영상 내의 밝기나 색상 등의 변화율을 나타냄 - 하나의 영상은 여러 공간주파수의 합으로 이루어짐 - DCT 를 통하여 각 주파수성분의 크기를 계산함 - 변환부호화, MPEG 의 핵심기술 - 영상을 여러 개의 공간주파수 성분으로 분해 공간주파수
15 2. 압축의 종류와 원리 = b 1 * + b 2 * + b 3 * + b 4 *+ b 5 *+ b 6 * + ‥ b 16 * 원영상최저주파수 최대주파수 공간주파수가 점점 높아진다
16 a1a1 a2a2 a3a3 a4a4 a5a5 a6a6 a7a7 a8a8 a9a9 a 10 a 11 a 12 a 13 a 14 a 15 a 16 a 17 a 18 a 19 a 20 a 21 a 22 a 23 a 24 a 25 a 26 a 27 a 28 a 29 a 30 a 31 a 32 a 33 a 34 a 35 a 36 a 37 a 38 a 39 a 40 a 41 a 42 a 43 a 44 a 45 a 46 a 47 a 48 a 49 a 50 a 51 a 52 a 53 a 54 a 55 a 56 a 57 a 58 a 59 a 60 a 61 a 62 a 63 a 64 b1b1 b2b2 b6b6 b7b7 b 15 b 16 b3b3 b5b5 b8b8 b 14 b 17 b4b4 b9b9 b 13 b 18 b 10 b 12 b 19 b 11 b 20 b 21 b 61 b 22 b 60 b 62 b 59 b 63 b 64 c1c1 c2c2 c6c c3c3 c5c c4c 원영상 DCT 변환후 계수양자화 후의 계수 DCT 변환 양자화 원영상을 8×8 화소의 블럭으로 분할 저주파항고주파항 변환계수를 상수 Q 로 나 누어 반올림 C1 = b1/Q 저주파항만 남고 나머지는 거의 ‘ 0 ’ 무손실압축 실행 전송 2. 압축의 종류와 원리
17 2. 압축의 종류와 원리 원 영상과 히스토그램 DPCM 압축영상과 히스토그램 DPCM 영상압축 예제
18 2. 압축의 종류와 원리 원영상 DCT 후 복원영상두 영상의 차이 DPCM 영상압축 예제
19 3. 데이터 압축기술의 표준 (MPEG) - 손실부호화 (DCT+ 양자화 ) - 무손실 부호화 (DPCM, Run length, Huffmann, 산술부호화 ) 의 결합 JPEG 압축방식 - 화면을 블록 (8×8) 으로 분리 - 블록 별로 DCT 실행 - 양자화 ( 고주파 계수에 대해 양자화 레벨 크게 함 → 거의 “0”)
20 - 산술부호화 * 확률 집합 개념을 이용하여 코딩 * [0,1) 사이의 열린 부분 구간을 이용 * 발생 확률이 높은 데이터는 긴 부분구간을, 발생 확률이 낮은 데이터는 짧은 부분구간을 할당 * 압축할 데이터를 새로운 하나의 부동 소숫점 값으로 압축 3. 데이터 압축기술의 표준 (MPEG)
21 3. 데이터 압축기술의 표준 (MPEG)
22 3. 데이터 압축기술의 표준 (MPEG)
23 3. 데이터 압축기술의 표준 (MPEG)
24 3. 데이터 압축기술의 표준 (MPEG) - Head-and –Shoulder 영상 - 고정된 배경화면 + 약간의 얼굴 ( 눈, 입 ) 움직임 ← 이웃하는 화면 간에 상관도가 높으므로 부호화가 효율적임 - 화면 구성 : I 화면 ( 화면 내 부호화 ), P 화면 ( 순방향 예측부호화 ), IPPPP- H.261 압축방식 : 영상전화나 영상회의를 위한 동영상 압축 표준
25 MPEG 년 표준화 완료 (ISO/IEC 11172) 1.5Mbps 이하, VTR 화질 (SIF 영상 ) Video CD 용, 2 채널 stereo MPEG 년 표준화 완료 (ISO/IEC 13818) Laser Disc 급 이상의 화질, 5.1 채널 입체 음향 4Mbps 이상, 방송용, DVD, digital, DBS, HDTV, VOD 에 활용 MPEG 년 표준화 고 압축율, 저 전송용, 24Kbps ~ 2Mbps 객체 지향부호기법, 비디오 전화 (Video Phone), 멀티미디어 데이터베이스 ( 인터넷 ) MPEG-7 내용기반 검색을 필요로 하는 분야에 응용 설명기법과 색인기술 집합의 표준화, 색인정의언어 표준화, 색인의 코딩방식 표준화 현재 연구 진행 중 3. 데이터 압축기술의 표준 (MPEG) MPEG
26 ㆍ I(Intra coded) Picture ㆍ P(Predictive coded) Picture ㆍ B(Bidirectional coded) Picture MPEG 화면구성
27 3. 데이터 압축기술의 표준 (MPEG) - 사용용도 : CD-ROM 에 동영상과 음향을 기록 / 재생 - I( 화면 내 부호화 ) 일정한 주기로 위치, 그 사이 화면은 예측부호화 - I 화면은 JPEG(DCT+ 양자화 +Run –length, Huffmann 부호화 ) - 예측부호화 화면 * P 화면 : 움직임 보상 (motion compensation) 예측부호화 * B 화면 : 전후의 가장 가까운 I 혹은 P 화면으로부터 양방향으로 움직임 보상 예측부호화 - 화면구성 : B 화면 2 개, I 화면 9 화면에 1 번씩, IBBPBBPBBIBB 영상 : H.261 과 Motion-JPEG 의 중간형태 MPEG1
28 3. 데이터 압축기술의 표준 (MPEG)
29 3. 데이터 압축기술의 표준 (MPEG)
30 3. 데이터 압축기술의 표준 (MPEG) - 입력신호를 32 개의 균일한 폭을 가지는 대역통과필터 사용 ( 필터 뱅크 ) 하여 저주파에서 고주파까지 성분 별 분석 - 인간의 청각특성 * 1kHz 부근 잘 들림 * 20Hz, 20kHz 는 잘 들리지 않음 * 어떤 주파수 성분이 큰 값이면 그 크기 이하의 신호는 잘 안 들림 - 압축 * 잘 들리는 성분 : 많은 양자화 레벨 할당 * 잘 안 들리는 부분 : 적은 양자화 레벨 할당 MPEG-1 오디오 : 서브밴드 부호화 MPEG1
31 4. CODEC CODEC CODEC: Compression-decompression) - 디지털 미디어의 압축 및 복원을 하는 수학적 논리 - 즉 압축, 복원 알고리즘 - 디지털 미디어에서 압축을 하고 또 압축을 푸는 하나의 프로그램 - 윈도우 미디오 플레이어 6.4 * 파일 포맷 : ASF(Advanced Streaming Format) * 비디오 : MS MPEG-4 Video Codec V3 으로 압축 * 오디오 : Windows Media Audio V2 로 압축 - 서로 다른 코덱은 압축, 복원 ( 재생 ) 하는 계산 알고리즘이 틀리기 때문에 호환되지 않음 * DivX 로 압축된 동영상을 보기 위해서는 컴퓨터에 DivX 코덱이 설치 * 컴퓨터에 DivX 3.11 의 코덱으로는 DivX 5.0 버전으로 압축된 동영상을 다운 받아 재생을 하려면 재생이 되지 않음
32 4. CODEC
33 5. MP3 -MPEG-1 * 비디오 CD 를 만들기 위해 개발 * 음악을 비롯한 각종 소리 ( 오디오 ) 에서 불필요한 소리를 제거하는데 탁월한 성능을 가진 압축 기술인 Layer-3 를 응용 MP3: 'Moving Picture Experts Group Layer-3 - MP3 의 파일 압축 원리 * 청각 심리 모델 ( 인간의 귀로 들을 수 없거나 듣지 않아도 되는 소리부분 ) 을 활용 → 데이터의 양을 줄이는 방식의 압축 방법 * 사람은 아주 강한 소리 다음에 이어지는 낮은 소리를 느끼지 못함 * 가청 주파수 영역 (20Hz 에서 20KHz) 에서 실제로 우리가 모든 소리를 다 듣는 것이 아니라 특별히 민감하게 인식하는 부분만을 들음
34 5. MP3 - 비디오 CD 나 DVD 로 만들 경우 동영상 부분과 오디오 부분을 구분해 데이터를 저장 * 비디오 CD : MPEG-1 방식 ( 화질과 압축률이 높은 DVD 는 MPEG2 를 사용 ) * 오디오를 압축하고 저장 : Layer-1 부터 3(MP1, MP2, MP3) 기술이 적용 * MP4 는 DVD 에서 사용되는 MPEG-2 의 오디오 부분, 공식 명칭은 MPEG-2 AAC(Advanced Audio Coding) 또는 MPEG-2 NBC(Non Backwards Compatibility) * MP3 보다는 MP4 가 최대 30% 정도 높음 * MP4 는 저작권 문제로 많은 논란을 빚고 있는 MP3 와는 달리 복제 방지 시스템을 채택, 새로운 음반 매체의 가능성을 지닌 오디오 파일 포맷 파일형식 WAVMP2MP3MP4 압축률 1,411Kbit256 ~ 192Kbit128 ~ 112Kbit96Kbit CD 에 수록된 스테레오 음악 1 초 분량 저장의 경우 용량 비교
35 5. MP3 MP3 파일의 압축률에 따른 음질 수준 (WAV 방식으로 인코딩한 파일크기 기준 ) 오디오 품질대역폭모드비트율압축률 전화 수준 2.5KHz 모노 8Kbps96 ː 1 AM 라디오 수준 7.5KHz 모노 32Kbps24 ː 1 FM 라디오 수준 11KHz 스테레오 56 ~ 64Kbps26 ~ 24 ː 1 CD 수준 15KHz 이상스테레오 112 ~ 128Kbps14 ~ 12 ː 1