멀티미디어 처리 10.2 디지털 사운드 포맷
수업목표 및 내용 내용 아날로그-디지털 변환 PC의 디지털 사운드 포맷 디지털 오디오 데이터의 압축 음악용 디지털 미디어 아날로그 데이터의 디지털로의 변환과 관련된 이론 및 디지털 사운드 포맷, 기초적인 압축 원리에 대해 이해한다.
o 아날로그/디지털 변환 표본화 또는 샘플링(Sampling)은 일정 시간 단위로 표본을 추출하는 과정 아날로그 신호 표본화된 신호
o 아날로그/디지털 변환 표본화율(sampling rate): 1초의 시간동안 추출한 표본의 개수, 단위는 Hz CD의 샘플링 레이트는 44100Hz 최근 DVD-audio는 96000Hz, 192000Hz 샘플링 레이트: 44100Hz 샘플링 레이트: 8000Hz 8Hz 샘플링 레이트 40Hz 샘플링 레이트
o 아날로그/디지털 변환 표본화율은 아날로그 신호가 가지고 있는 최대 주파수보다 2배 이상되어야 원본과 같이 복원 가능 - > 나이퀴스트(Nyquist) 이론 나이퀴스트 표본화율 = 아날로그 신호의 최대 주파수의 2배 10Hz의 사인파의 나이퀴스트 표본화율은 20Hz 한 주기에 대해 두번 표본화하는 것에 해당됨 2Hz 신호와 2Hz 표본화율 2Hz 신호와 4Hz 표본화율
o 아날로그/디지털 변환 양자화는 추출한 표본의 크기를 제한된 범위의 숫자로 바꾸는 과정 양자화 비트: 하나의 표본을 나타내기 위해 사용한 비트(데이터) 량 양자화 비트가 클 수록 원본에 가깝게 표현 됨. Bit->22=4단계, 16Bit->216=65578 단계 CD의 양자화 비트는 16비트, DVD-audio는 24비트 사용 양자화비트: 16비트 양자화비트: 4비트 3단계 양자화 5단계 양자화
o 아날로그/디지털 변환 PCM : 표본화 후 양자화한 데이터로 표현하는 방법 DPCM : PCM 데이터의 차이 데이터로 표현하는 방법 ADPCM : 고정된 비트를 사용하지 않고 차이가 많이 나는 부분은 큰 비트수, 차이가 적게 나는 부분은 작은 비트수를 할당하는 방법 PCM DPCM
o 아날로그/디지털 변환 A/D 변환은 1)저역 통과 필터, 2)샘플링, 3)양자화, 4)부호화의 과정을 거침 샘플링 레이트가 높을 수록, 양자화 비트가 클수록 음질이 좋아지나, 데이터 량이 증가 함 초당 비트 수(bps) = 샘플링 레이트(Hz) X 양자화 비트(Bit) X 채널 수 발생 데이터 량(Byte) = 샘플링 레이트(Hz) X 양자화 비트(Bit) X 채널 수 X 시간(초) /8 저역 통과 필터 샘플링 양자화 부호화 A/D 변환 과정
o 아날로그/디지털 변환 디지털 사운드의 장점 저장 및 보관 용이 압축 용이 전송에 유리 편집 용이 원본과 동일한 복사본을 만들 수 있음 반영구적으로 보존 가능 압축 용이 손쉽게 압축 가능 -> 데이터량 감소, 네트웍 부하 감소 전송에 유리 하나의 전송채널로 간섭 없이 다채널 사운드 전송 가능 편집 용이 하나하나의 샘플을 미세하게 조절 가능 알고리즘만 동일하면 결과가 동일함(저가의 장비 제작 가능) 비선형 편집 가능(랜덤 엑세스 가능)
o PC의 디지털 사운드 포맷 다양한 사운드 포맷이 존재 함 WAV, AIFF, MP3, AU, Ogg, WMA, RA, APE … 단, 모든 포맷은 재생이나 편집 시 기본형태인 PCM으로 변환되어 처리 됨. WAVE가 가장 기본적인 포맷 PCM 데이터 앞쪽에 헤더 정보가 붙어 있는 형태 MIDI 미디 파일은 실제 파형 정보가 아닌 악기별 재생 정보만을 가지고 있음. 미디(MIDI: Musical Instrument Digital Interface)는 전자악기간 정보 교환을 위한 규격
o PC의 디지털 사운드 포맷 웨이브 파일 포맷 그림 10-5) 웨이브 파일 포맷
o 디지털 사운드 데이터의 압축 무손실 압축 장점: 압축 이전의 사운드로 복원 가능 단점: 압축률이 많이 떨어짐(높아야 2:1 정도) Ex) FLAC, Monkey’s Audio… 손실 압축 장점: 압축률이 높음(MP3의 경우 10:1 정도) 단점: 압축 이전의 사운드로 복원 불가능 “사람이 듣지 못하는 데이터는 필요 없다” -> 심리 음향의 측면에서는 무손실 압축 Ex)MP3, RA, Ogg, WMA …
o 디지털 사운드 데이터의 압축 인지 코딩: 심리 음향적으로 사람이 듣지 못하는 부분을 제거하여 압축률을 높이는 압축 방식: 주파수와 시간 마스킹 손실 압축기법은 대부분 인지 코딩을 사용 함 인지 코딩에 사용되는 대표적인 심리음향 효과는 라우드니스효과와 마스킹 효과 가청 가능 문턱값 라우드니스 효과 마스킹 효과(주파수) 마스킹 효과(시간)
o 음악용 디지털 미디어 대표적인 디지털 음악 미디어인 CD-DA가 1982년 상용화 됨 현재는 거의 디지털 미디어로 대체된 상태 임 현재 크게 1)고음질(높은 샘플링 레이트, 큰 양자화 비트)/다채널(6채널) 포맷과 2)고압축 포맷(MP3, MD…)의 추세