5.1 비디오 신호의 종류 5.2 아날로그 비디오 5.3 디지털 비디오 제5장 비디오의 기본적인 이해 5.1 비디오 신호의 종류 5.2 아날로그 비디오 5.3 디지털 비디오 멀티미디어시스템 2010-2학기
5.1 비디오 신호의 종류 컴포넌트 비디오 컴포넌트 비디오: 스튜디오와 같은 곳에서 쓰이는 비디오 시스템은 빨강 (red), 녹색(green), 파랑(blue)의 세 가지 비디오 신호를 사용한다. 각각의 컬 러 채널은 분리된 비디오 신호로 전송된다. 대부분의 컴퓨터 시스템에서는 RGB를 이용하는 컴포넌트 비디오를 사 용한다. 다양한 컬러 표현 방식 중에서도 컴포넌트 비디오는 다른 채널 사이에서 의 “crosstalk” 현상이 없기 때문에 컬러의 재생성을 가장 효과적으로 수 행한다. 하지만 컴포넌트 비디오는 더 넓은 대역폭이 필요하고 동기화에 민감하 다는 단점이 있다. 멀티미디어시스템 2010-2학기
컴포지트 비디오 – 1신호 컴포지트 비디오: 휘도(luminance)와 색(chrominance) 신 호가 단일 반송파에 실리게 된다. 색은 I와 Q 또는 U와 V의 두 가지 컬러 성분의 조합이다. NTSC TV에서는 I와 Q가 색 신호로 조합되며, 이 색 신호는 컬러 부 반송파에 의해 휘도 신호가 실리는 채널의 상위 주파수에 실리게 된 다. 색과 휘도 성분은 수신 단에서 분리될 수 있고, 또한 두 개의 컬러 성 분으로 복원될 수 있다. 컴포지트 비디오는 TV나 VCR에 연결될 때 한 가지 회선을 이용하며, 비디오 컬러 신호는 서로 분리되지 않고 섞인 채로 전송된다. 오디 오 신호는 여기에 한 가지 신호가 더해지게 되는 것이다. 컬러와 밝기가 동일한 신호에 포함되므로 색 신호화 휘 도 신호 사이에 간섭 현상이 다소 일어나는 것은 피할 수 없다. 멀티미디어시스템 2010-2학기
S-비디오 – 2신호 S-비디오: 절충적인 형태로 두 개의 회선을 사용한다. 하 나는 휘도 신호를 위한 것이고, 다른 하나는 컴포지트 색 신호를 위한 것이다. 결과적으로 컬러 정보와 중요한 회색계 정보 사이에 crosstalk 현상이 적다. 신호 자체에 휘도를 싣는 이유는 흑백 정보가 인간의 시계 지각 측면에서 중요하기 때문이다. 사실, 인간은 컬러 영상의 컬러 성분보다 회색계 영상에서의 공간 해상도의 차이에 민감하다. 그 결과, 컬러 정보는 밝기 정보보다 정확성이 덜 요구된다 – 컬러의 큰 얼룩들만 볼 수 있기 때문에 컬러의 세부적인 부분들을 덜 전송 하더라도 알 수 있다. 멀티미디어시스템 2010-2학기
5.2 아날로그 비디오 아날로그 신호 는 시간에 따라 변화하는 영상을 샘 플링한 것이다. 소위 “순차주사” 방식은 매 시간 간격마 다 행 방향으로 완전한 하나의 영상(프레임)을 주사한 다. 고해상도 컴퓨터 모니터는 일반적으로 1/72초 주기를 가진다 다른 방식의 시스템으로 TV와 일부 모니터, 그리고 멀 티미디어 표준에는 “비월주사” 방식(Interlace scanning) 이 사용된다. 홀수 번째 줄이 먼저 주사되면, 다음으로 짝수 번째의 줄이 주사되 는 방식을 말한다. 이 결과 “odd” 와 “even” 필드가 나타나며, 이 두 개의 필드가 하나의 프레임을 구성한다. 1로 시작하는 홀수 줄은 마지막 홀수 줄의 중간에서 끝나게 되고, 짝 수 줄의 주사는 중간에서 시작한다. 멀티미디어시스템 2010-2학기
그림 5.1 비월주사 방식 그림 5.1에서 보듯이, 우선 홀수 줄을 따라가면 점 P에서 점 Q로, 다음 으로 R에서 S로 주사를 하며, 결국 점 T에서 종료된다. 다음으로 짝수 줄이 주사되는데, 점 U에서 시작하여 V에서 끝나게 된다. 그림 5.1의 점 Q에서 점 R로의 이동과 같은 경우를 수평조사라고 하며, 이때 CRT의 전자빔이 깜박이게 된다. 점 T에서 점 U, 점 V에서 점 P로의 이동은 수직회귀라고 부른다. 멀티미디어시스템 2010-2학기
예를 들어, 그림 5.2에서와 같이 움직이는 헬리콥터의 경우 정지된 배경 화면에 비해 흐려짐이 생기는 것을 알 수 있다. 비월주사로 인해 홀수 행과 짝수 행은 서로 교대로 화 면에 나타나게 되는데, 화면상에 빠른 움직임이 발생하 는 경우를 제외하고는 눈에 띄는 흐려짐이 없다. 예를 들어, 그림 5.2에서와 같이 움직이는 헬리콥터의 경우 정지된 배경 화면에 비해 흐려짐이 생기는 것을 알 수 있다. 멀티미디어시스템 2010-2학기
그림 5.2 비월주사에 의하여 각 프레임당 생성된 두 개의 필드 영상: (a) 비디오 프레임; (b) 필드 1; (c)필드 2; (d) 필드 간 차이 영상. 멀티미디어시스템 2010-2학기
때때로 프레임률이나 영상의 크기를 변화시키거나, 비 월주사 방식의 영상으로부터 정지 영상을 생성해 내야 하는 경우 등의 상황에서 “디-인터레이싱” 기법이 필요 하다. 가장 간단한 다-인터레이싱 방식은 하나의 필드를 제거하고, 다른 하나의 필드 행을 각각 복사하여 프레임을 구성해 내는 방법인데, 이 방법은 하나의 필드 정보를 고스란히 잃게 된다. 다른 방법으로, 두 개의 필드의 정보를 모두 유지할 수 있는 좀더 복 잡한 방법도 있다. 아날로그 비디오의 경우에서 위 물음에 대한 대답은 검 은색을 가리키게 되는 0으로부터의 작은 오프셋 전압 값과, 0과 같이 선의 시작을 가리키는 값들이라고 할 수 있다. 다시 말해서, “검은색보다 더 검은” 신호를 이용하 게 되는 것이다. 멀티미디어시스템 2010-2학기
그림 5.3 단일 주사선에 대한 전기적 신호 멀티미디어시스템 2010-2학기
NTSC 비디오 NTSC (National Television System Committee) TV의 표준 은 북미와 일본에서 주로 사용되고 있다 4:3 종횡비와 525 스캔 라인, 초당 30 프레임률을 가진다. NTSC는 비월주사 방식을 따르며, 매 프레임은 두 개의 필드로 구성되어 262.5 lines/field 가 된다. 따라서 수평 주사 주파수는 525ⅹ29.97 ≈ 15,734 lines/sec가 되며, 각 선을 주사하는데 1/15,734 sec ≈ 63.6 ㎲가 소요된다. 영상 데이터가 디스플레이 되는 동안 수평조사가 10.9 ㎲가 걸리므로 활성 영상 라인 신호를 위해서 52.7㎲가 남는다(그림 5.3). 멀티미디어시스템 2010-2학기
그림 5.4 수직, 수평 조사와 동기 신호를 포함한 전체 비디오 래스터 그림 5.4에서 NTSC 비디오 래스터에서의 “수직 회귀와 동기 화”와 “수평 조사와 동기화”의 효과를 보여주고 있다. 그림 5.4 수직, 수평 조사와 동기 신호를 포함한 전체 비디오 래스터 멀티미디어시스템 2010-2학기
Blank 정보는 매 필드의 시작 부분에 제어 정보를 위해 배 정된 20개의 선에 놓이게 된다 종종 화소는 주사선 사이에 놓이게 되는데, 이 때문에 비월 주사가 아닌 경우에도 NTSC TV는 단지 약 340개의 선을 보 여줄 수 있을 뿐이다. 485개 활성 라인의 약 70%에 해당한 다. 비월주사의 경우에는 50% 이하가 될 수도 있다. 멀티미디어시스템 2010-2학기
표 5.1과 같이 비디오는 각 형태에 따라 라인당 샘플 수 가 다르다. NTSC 비디오는 고정된 수평 해상도를 가지고 있지 않 은 아날로그 신호이다. 그러므로 디스플레이 하기 위해 얼마나 많은 샘플을 취할 것인가 하는 것을 결정해야 한다. 매 샘플은 하나의 화소값으로 대응되게 된다. “화소 클럭”은 비디오의 각 수평 라인을 샘플로 분할한 다. 화소 클럭의 주파수가 높아지면 라인당 샘플 수는 증가하게 되는 것이다. 표 5.1과 같이 비디오는 각 형태에 따라 라인당 샘플 수 가 다르다. 표 5.1 다양한 비디오 형식에 따른 라인당 샘플 수 멀티미디어시스템 2010-2학기
컬러 모델과 NTSC 변조 NTSC는 YIQ 컬러 모델을 사용한다. I(동상, in-phase chrominance)와 Q(직교상, quadrature chrominance) 신호 는 다음 수식으로 표현되는 직교 변조 방식을 이용하여 색 신호 C에 결합한다. 이렇게 변조된 색 신호는 컬러 부반송파이며, 이것은 의 크기와 의 위상을 가진다. C의 주파수는 이다. NTSC 컴포지트 신호는 여기에 휘도 신호 Y와 색 신호 를 조합한 신호로서 다음과 같이 정의된다. 멀티미디어시스템 2010-2학기
그림 5.5 NTSC 주파수 영역에서의 Y와 C 신호의 겹쳐짐 그림 5.5: NTSC는 인간이 컬러의 고주파 성분에 덜 민감하다 는 특성에 따라 Y에는 4.2MHz의 대역폭을 할당하고, I와 Q에 는 각각 1.6MHz과 0.6MHz 대역폭만을 할당한다. 그림 5.5 NTSC 주파수 영역에서의 Y와 C 신호의 겹쳐짐 멀티미디어시스템 2010-2학기
NTSC 신호 디코딩 수신 단에서 컴포지트 신호를 디코딩하는 첫 단계는 Y와 C 를 분리하는 일이다. 저역 통과 필터를 사용하여 Y를 분리한 이후, 색 신호 C는 I 와 Q를 추출하기 위해 복조될 수 있다. I를 추출하기 위해 서는 1. 신호 C에 를 곱한다. 멀티미디어시스템 2010-2학기
마찬가지로, C에 를 곱하고 저역 통과 필터를 적용 함으로써 Q를 추출할 수 있다. 2. 저역 통과 필터를 적용하여 I를 얻고, 두 개의 고주파 성분 을 제거한 다. 마찬가지로, C에 를 곱하고 저역 통과 필터를 적용 함으로써 Q를 추출할 수 있다. 멀티미디어시스템 2010-2학기
으로 낮추어졌다. 여기서 227.5는 NTSC 방송용 TV에서 주사선당 컬러 샘플의 수를 의미한다. NTSC의 6MHz 대역폭은 매우 빽빽하다. 오디오 부반송 파의 주파수는 4.5MHz로 채널에서 1.25+4.5=5.75MHz의 오디오 대역 중앙에 위치한다(그림 5.5). 그러나 컬러는 1.25+3.58=4.83MHz에 위치함을 주목하라. 이것은 사실 컬러 부반송파와 다소 가까운 측면이 있어 서 오디오와 컬러 신호의 간섭 가능성의 요인이 된다. NTSC 컬러 TV가 프레임률을 30ⅹ1,000/1,001 ≈ 29.97fps 로 낮춘 것도 크게 이러한 요인에 기반을 둔다. 이에 따라 NTSC 컬러 부반송파의 주파수는 으로 낮추어졌다. 여기서 227.5는 NTSC 방송용 TV에서 주사선당 컬러 샘플의 수를 의미한다. 멀티미디어시스템 2010-2학기
PAL은 프레임당 625개의 주사선, 초당 25프레임, 4:3 종횡비, 비월주사 방식의 필드를 사용한다. U = B’ – Y’ V = R’ – Y’ 5.2.2 PAL 비디오 PAL (Phase Alternating Line)은 서유럽, 중국, 인도 등 세계 각국에서 보편적으로 사용되고 있는 중요한 표준이다. PAL은 프레임당 625개의 주사선, 초당 25프레임, 4:3 종횡비, 비월주사 방식의 필드를 사용한다. PAL은 8MHz 채널을 가지는 YUV 컬러 모델을 사용하며, Y에 5.5MHz, U 와 V에 각각 1.8MHz의 대역폭을 할당한다. 컬러 부반송파 주파수는 이다. 영상의 화질을 개선하기 위하여 색 신호는 연속된 주사선에서 교차된 부호를 가진 신호로 표현되며(즉, +U와 –U), 이러한 특성에 의해 “위상 반전 주사선” 이라는 이름을 얻게 되었다. 이것은 수신 단에서의 빗살 필터(comb filter) 사용을 용이하게 한다. 즉, Y와 C를 분리하기 위해 색차 신호를 제거하고, Y 신호의 고화질을 얻기 위해 연속된 라인의 신호들이 평균된다. 멀티미디어시스템 2010-2학기
5.2.3 SECAM 비디오 SECAM 은 3번째 주요 방송용 TV 표준으로 Systeme Electronique Couleur Avec Memoire를 나타낸다. SECAM 역시 프레임당 625 주사선, 초당 25 프레임률, 4:3의 종횡비, 비월주사 방식의 필드를 사용한다. SECAM과 PAL은 비슷하면서도 컬러 부호화 구조에 있어서 다소 다르다: SECAM에서는 U와 V신호가 각각 4.25MHz와 4.41MHz의 다른 컬러 부반 송파를 사용해 변조하게 된다. 각 주사선에는 U 또는 V 신호 중 오직 하나의 신호만이 보내진다. 멀티미디어시스템 2010-2학기
표 5.2 아날로그 TV 시스템간의 비교 표 5.2에서 3대 방송용 TV 시스템을 비교하고 있다. 멀티미디어시스템 2010-2학기
5.3 디지털 비디오 비디오를 디지털로 표현하는 방식의 장점은 매우 많 다. 디지털 기기나 메모리 등에 저장할 수 있고, 처리될 수 있으 며(잡음 제거, 편집 등), 다양한 멀티미디어 응용 분야에 적 용 가능하다. 직접 접근, 비선형적인 비디오 편집이 쉽다. 영상 화질의 열화 없이 반복 저장이 가능하다. 부호화가 용이하고, 채널 잡음에 강하다. 초기의 소니와 파나소닉 녹화기에서 디지털 비디오는 컴포지트 비디오의 형태였다. 최근의 디지털 비디오는 보통 컴포넌트 비디오를 사 용하며 컬러 공간은 YCbCr 이다. 멀티미디어시스템 2010-2학기
인간은 흑백 정보에 비해 컬러의 공간 해상도에 덜 민 감하기 때문에 적절한 방법으로 색 신호를 줄이는 일 이 가능하다. 5.3.1 색차 신호 부표본화 인간은 흑백 정보에 비해 컬러의 공간 해상도에 덜 민 감하기 때문에 적절한 방법으로 색 신호를 줄이는 일 이 가능하다. 사용되는 기법들은 흥미롭기는 하나 특별한 명칭이 부여되지는 않았다. 우선, 원래의 4개의 화소당 실제로 보내질 화소값의 개수가 필요하다. “4:4:4” 색 부표본화 구조는 부표본화가 사용되지 않았음을 의미한다. 각 화소의 Y, Cb, Cr 값은 각 Y, Cb, Cr 값에 해당되 도록 전송된다. 멀티미디어시스템 2010-2학기
“4:1:1” 구조는 4의 배수로 수평 부표본화함을 의미한다. “4:2:2” 구조는 Cb와 Cr 신호를 2의 배수로 수평 부표본화 함을 의미한다. 즉, 수평방향으로 0에서 3번까지 번호가 매 겨진 네 개의 화소에 대하여, 네 개의 Y값과, Cb, Cr 값이 각 각 두 개가 (Cb0, Y0)(Cr0, Y1)(Cb2, Y2)(Cr2, Y3)(Cb4, Y4)로 전 송된다. “4:1:1” 구조는 4의 배수로 수평 부표본화함을 의미한다. “4:2:0”는 수직과 수평 방향 모두에서 2의 배수로 부표본화 한다. 그림 5.6과 같이 이론적으로 평균 색 화소값이 열과 행 사이에 놓여진다. “4:2:0” 구조는 보통 JPEG과 MPEG에서 사용된다. 멀티미디어시스템 2010-2학기
그림 5.6 색 신호 부표본화 멀티미디어시스템 2010-2학기
표 5.3에 디지털 비디오 표준별 특징이 나타나 있는데, 모두 4:3의 종횡비를 사용함을 볼 수 있다. 5.3.2 디지털 비디오의 CCIR 표준 CCIR은 Consultative Committee for International Radio (국제무선통신자문위원회)로 가장 중요한 표준 중의 하나이며 컴포넌트 디지털 비디오의 표준인 CCIR-601 을 제안하였다. 이 표준은 이제 전문적인 비디오 응용 분야의 국제 표준인 ITU-R601로 채택되었다. 이 표준은 널리 쓰이고 있는 DV 비디오를 포함한 특정 디 지털 비디오 형태에 채용되었다. 표 5.3에 디지털 비디오 표준별 특징이 나타나 있는데, 모두 4:3의 종횡비를 사용함을 볼 수 있다. CCIR 601 표준은 비월주사 방식을 사용하며, 따라서 각 필 드는 절반의 수직 해상도를 가진다(예를 들어, NTSC에서는 240선). 멀티미디어시스템 2010-2학기
CIF는 CCITT에 의해 구성된 Common Intermediate Format을 말한다. 일반 중간조 형태 CIF의 개념은 낮은 비트율을 지원하는 형태이다. CIF는 VHS와 같은 화질로, 순차주사를 사용한다. QCIF는 Quarter-CIF를 말하고, 해상도는 모두 8로 나누어 떨어지며, 88을 제외하고는 모두 16로 나누어 떨어진다. 이것은 10장에서 다룰 H.261과 H.263에서의 블록 기반 비 디오 부호화에 효율적이다. NTSC 와 PAL 의 절충적인 형태로 NTSC 프레임률과 PAL 에서의 활성선의 절반을 채용하고 있다. 멀티미디어시스템 2010-2학기
표 5.3 디지털 비디오 정격 멀티미디어시스템 2010-2학기
초기 단계의 HDTV는 1970년대 말 일본의 소니와 NHK에서 개발된 아날로그 기술에 기반하였다. 5.3.3 고선명 TV (HDTV) HDTV (High Definition TV)의 주요한 매력은 각 화면 영역의 명확성이 증가되었다는 것보다 시야 공간이 넓어졌다는 것 에 있고, 특히 가로방향의 길이가 증가하였다는 것이 큰 공 헌을 하였다. 초기 단계의 HDTV는 1970년대 말 일본의 소니와 NHK에서 개발된 아날로그 기술에 기반하였다. NHK HDTV를 향상시킨 형태로서 아날로그/디지털의 하이 브리드 방식을 사용하는 동작 보장 다중서브 샘플링 전송 방식(MUSE)은 1990년대에 사용되기 시작하였다. 이 방식은 1,125 주사선과 비월주사 방식(초당 60개의 필드), 16:9의 종횡비를 가진다. 현재의 6MHz나 8MHz의 채널에서 20MHz 이상의 대역폭이 필요한 압축되지 않은 HDTV는 전송될 수 없기 때문에 다양 한 압축 기술이 개발되었다. 압축한 이후라고 할지라도 고화질의 HDTV 신호는 한 개 이 상의 채널을 사용하여 전송될 것이다. 멀티미디어시스템 2010-2학기
1995년에 U.S. FCC의 텔레비전 방송 자문위원회는 ATSC 디지털 텔레비전 표준을 채택하였다. HDTV 발전의 간략한 역사 1987년에 FCC에서는 HDTV의 표준이 기존 NTSC 표준과 호환되어야 하 며, VHF (Very High Frequency)와 UHF (Ultra High Frequency) 대역으로 제한 되어야 한다고 발표하였다. 1990년에 FCC는 다른 제안을 발표하였는데, 그것은 완전-해상도 HDTV를 우선한다는 내용이다. 그들은 HDTV가 기존의 NTSC TV와 동시에 방송될 것이고, 결국엔 NTSC TV를 대체하게 될 것이라고 생각했다. 디지털 HDTV의 폭발적인 제안들이 쏟아지면서 FCC는 1993년 완전 디지 털화라는 중대한 결정을 내리게 되었다. General Instruments, MIT, Zenith와 AT&T 그리고 Thomson, Philips, Sarnoff 등이 만들어낸 “거대한 연합” 은 네 가지 주요한 제안을 결정하였다. 이것은 결국 HDTV의 TV 방송용 표준을 결정하기 위한 ATSC (Advanced Television Systems Committee)의 결성으로 이어졌다. 1995년에 U.S. FCC의 텔레비전 방송 자문위원회는 ATSC 디지털 텔레비전 표준을 채택하였다. 멀티미디어시스템 2010-2학기
표 5.4 ATSC가 지원하는 디지털 TV의 표준 형식들 이 표준은 표 5.4와 같은 비디오 주사 형태를 제시하였 다. 표에서 “I”는 비월주사를 의미하고, “P”는 순차주사 를 의미한다. 표 5.4 ATSC가 지원하는 디지털 TV의 표준 형식들 멀티미디어시스템 2010-2학기
비디오는 MPEG-2가 압축 표준으로 채택되었다. 오디오는 AC-3이 표준이다. 메인 프로파일의 메인 레벨과 하이 레벨을 사용한다. 오디오는 AC-3이 표준이다. 5개의 서라운드 채널에 우퍼 채널이 포함된 소위 5.1채널 돌비 서라운드 음향을 지원한다. 기존 TV와 HDTV의 가장 큰 차이점 HDTV는 4:3 대신 16:9의 종횡비를 가진다. 순차주사 방식이다. 이것은 기존의 비월주사 방식이 움직 이는 객체에 대하여 톱니 모양의 경계선을 발생시키고 수 평 경계에서 깜박임을 발생시킨다는 이론적 근거에 기인한 다. 멀티미디어시스템 2010-2학기
FCC는 2006년까지 모든 아날로그 방송을 디지털 TV 방송으로 대체한다는 계획을 가지고 있다. 제공되는 서비스는 다음과 같다. SDTV (Standard Definition TV): 현재 NTSC TV 또는 이상. EDTV (Enhanced Definition TV): 480 활성 라인 또는 이상. 표 5.4의 세 번째와 네 번째 행. HDTV (High Definition TV): 720 활성 라인 또는 그 이상. 멀티미디어시스템 2010-2학기