제 2 장 영상의 디지탈화 및 포맷
2.0 디지탈처리의 장점 잡음에 강하다- 원신호 표현이 단순 고화질의 처리가 가능하다-bit수 증가 가능 고기능의 추구가 가능하다-무한 기능 추가 및 용량 확대 가능 소형화, 저가격화가 가능하다-IC기술의 발달 멀티미디어가 가능하다-공통 디지털 방식사용
2.1 1차원 디지탈화(1) Sampling - 시간축 디지탈화, Nyquist rate 적용 2.1 1차원 디지탈화(1) Sampling - 시간축 디지탈화, Nyquist rate 적용 Quantzation - 진폭값의 디지탈화,양자화폭 변환 예 1.전화음성 : 가입자당 데이터량 64Kbps = 교환기sampling 8KHz * 8bit/sample (인간 음성대역폭 3.4KHz ) 2.CD음악 : 데이터재생속도 1.5Mbps = sampling 44.1KHz * 16bit/sample * 2channel(stereo) (인간 가청주파수 20KHz)
2.1 1차원 디지탈화(2)
2.1 1차원 디지탈화(3)
2.2 2차원 영상신호의 디지탈화(공간영역의 디지탈화) 2.2 2차원 영상신호의 디지탈화(공간영역의 디지탈화) 영상 Sampling - 공간영역의 디지탈화 정지영상데이터 = 2차원공간영역 디지탈화(수평방향 디지탈화) + 명암값의 디지탈화(수직방향 디지탈화)
2.2 2차원 영상 디지탈화 공간영역 디지탈화는 영상의 해상도를 결정한다. 2.2 2차원 영상 디지탈화 공간영역 디지탈화는 영상의 해상도를 결정한다. Sampling하는 점들을 화소(pixel, picture element)라 한다.
2.2 2차원 영상신호의 디지탈화
2.2 2차원 영상 디지탈화(공간영역의 디지탈화) Pixel의 배열방법: 직사각형, 정사각형, 정삼각형, 정육각형 배열 중 2.2 2차원 영상 디지탈화(공간영역의 디지탈화) Pixel의 배열방법: 직사각형, 정사각형, 정삼각형, 정육각형 배열 중 정사각형을 배열 일반적임.(편리성)
2.2 2차원 영상 디지탈화(해상도와 관련된 지식) 320:240 1920:1080 …. 해상도비의 유래 – 일반적인 크기 2.2 2차원 영상 디지탈화(해상도와 관련된 지식) 해상도비의 유래 – 일반적인 크기 320:240 640:480 1024:768 ….. 4:3의 비임. 20세기초 인쇄 작업시 사용하던 필름의 크기에서 시작하여 TV 기술표준으로 발전됨 인간 시각의 범위를 가장 효과적으로 표현한 aspect ratio로 알려짐 컴퓨터 모니터가 1024*768에 80만화소 - 지상파 아날로그 방송은 640*480에 31만 화소급 HDTV 고화질 TV는 1920:1080에 200만화소급 2) 해상도비의 변화 – 최근 HDTV, MPEG2 표준제정 1920:1080 …. 16:9의 비임. 영화관과 같은비
2.3 2차원 영상 디지탈화(명암의 디지탈화) 영상의 양자화(quantization) 또는 명암의 디지탈화: 2.3 2차원 영상 디지탈화(명암의 디지탈화) 영상의 양자화(quantization) 또는 명암의 디지탈화: - 각 pixel의 명암값을 정해진 몇 단계의 밝기값으로 표현하는 과정 - 일반적으로 1~10bit의 양자화를 응용분야에 따라 결정함. 흑백영상의 양 자화에서 8bit가 일반적으로 사용되는 이유 : 이론적으로 인간의 눈이 gray level에서 구분할 수 있는 색의 종류는 500가지 정도 되나, 실제로는 200단계정도를 구분하기 힘들므로 256단계(8bit)로 양자화 하면 낭비가 없이 가장 적절함.
2.3 2차원 영상 디지탈화(명암의 디지탈화)
2.3 2차원 영상 디지탈화(명암의 디지탈화) 256level 16level 4level 2level
2.4 디지털 영상의 데이터량 정지 영상 데이터량 = 수평화소수 * 수직화소수 *화소당 비트수 2.4 디지털 영상의 데이터량 정지 영상 데이터량 = 수평화소수 * 수직화소수 *화소당 비트수 동영상 데이터량 = 정지영상 데이터량 * 초당 프레임수 계산예) 어떤 동영상의 해상도는 400*300이며 8bit로 양자화 되었다(흑백). 초당 30장(frame)으로 memory에 10초간 저장된 후, 다른 사람에게 유선통신으로 전송되는데 전송속도는 10,000bit/sec이다. 저장된 10초간의 동영상이 모두 상대방에게 전송되는데 걸리는 시간은 얼마인가? 1) 전체 동영상의 데이터량 = 400*300 * 8bit * 30장 * 10초 = 288,000,000bit 2) 소요시간 = 288,000,000/10,000 = 28,800초 = 8 hr
2.4 초당 30frame이 동영상의 실시간 처리인 이유? 사람의 눈은 <잔상효과> 라는 것이 있는데, 이는 현재 보는 이미지가 눈을 감아도 시신경을 통해 계속 보이는 것처럼 뇌 속에 남아있는 현상이다. 이러한 눈의 잔상은 약 30msec(1/30초) 정도를 유지하는데 이를 이용하면, 모든 장면을 연속해서 볼 필요가 없고 1/30초 간격으로만 영상을 봐도 사람의 눈은 끊임없이 대상을 보고있는 효과가 있다. 다시 표현하면, 영상은 1초당 30장만 일정한 간격으로 사람눈으로 획득이 되면 우리 눈은 연속된 영상을 보는것과 같은 효과를 누릴 수 있다. 영상의 데이터량은 매우 크므로 30frame/sec의 속도로 획득될 때, 거의 실시간 capture로 간주하며, 그 이상의 처리속도는 고도의 정보를 분석하는 용도에서만 활용되고, 7~8frame/sec 속도로도 우리가 보는 만화급의 화질을 볼 수 있다.
2.5 디지털 영상의 파일저장 형식 Raw file 원시 데이터를 의미 헤더부분 : 파일 호환성을 위해 고유특성을 갖는 헤더가 없음. 데이터 부분 : 서식정보, 편집정보 없음 장점 : 영상분석의 시간절약, 부가적인 코드 불필요, 간단한 사용 단점 : 개발시 영상의 크기등 정보 부족
2.5 디지털 영상의 파일저장 형식 BMP file 압축등 추기적 기법이 없이 그대로 저장 비트맵 파일 헤더 + 비트맵 인포헤더+ 팔레트+실제 이미지. 비트맵의 정보를 구조체에서 읽어 배열 또는 포인터로 연결하여 실제 데이터를 처리
2.5 디지털 영상의 파일저장 형식 PCX file - 헤더 : 128바이트에 파일에 대한 정보를 가짐. 흑백과 칼라 지원 TIFF file tag에 정의되는 필드의 연속형태에 의한 영상저장형식 서로 다른 컴퓨터간의 데이터 호환을 위해 개발된 파일 형식 많은 프로그램에서 이 형식을 지원 다룰수 있는 파일의 최대 크기는 4GB GIF file Graphics Interchange Fromat 1987, 데이터 전송과 화상압축, 복구등을 위해 <컴퓨서버>가 규정 높은 압축율과 빠른 실행 속도