시각 (Vision) (Lecture Note #25) Modified from the slides by SciTech Media 시각 (Vision) (Lecture Note #25) 인공지능 이복주 단국대학교 컴퓨터공학과
Outline 영상의 획득 영상 기초 처리 잡음 제거 경계검출 영상의 이진화 특징의 추출 형태의 인식 3차원 시각
시각 (Vision) 인지 (Cognition)의 중요성 컴퓨터의 시각 (Vision) 컴퓨터가 직접 자신에 필요한 사항을 감각기를 사용하여 획득 (인간이 정보를 특정의 표현기법에 맞게 입력하는 것은 쉽지 않다) 대화(컴퓨터와 인간의 상호작용)의 효율을 향상 키보드 없이 컴퓨터와의 인터페이스 컴퓨터의 시각 (Vision) 방대한 정보를 정확하고 빠르게 획득 인공적인 시각: 컴퓨터와 카메라 + 영상 처리용 하드웨어, 소프트웨어 인간의 시각: 두뇌와 눈 및 시신경 + 시각신호를 이해하는 지식과 경험, 추론 능력 카메라를 통해 획득한 영상을 처리하고 피사체들의 특성과 상대적 관계를 이해하여 시스템의 지능적 동작을 위해 사용
시각 컴퓨터 시각의 정의 영상의 획득 (카메라 입력+표본화, 양자화) ‘영상을 해석하여 인간이 얻은 것과 비슷한 결과를 얻기 위한 기술’ [Levin 1985] ‘영상 내의 물체를 명확하고 의미 있게 묘사하는 기술’ [Ballard 1982] 분야에 따라 다양하게 해석 (인식에 중점) Vs. 영상신호처리(image signal processing): 영상 대 영상 변환중심, 신호 자체의 처리, 활용 영상의 획득 (카메라 입력+표본화, 양자화) 카메라 빛이 카메라로 입사 변환기 2차원 명암 배열로 대응 비디콘 (vidicon): 빛 광감각층 전하생성 전하중화 아날로그 전압파형 출력 단점: 부피와 무게가 크고, 수명이 짧으며 영상의 왜곡현상이 발생 장점: 저가 CCD (charge coupled device): 빛 CCD전하 축적 직렬 레지스터에 읽어짐 직렬 레지스터의 출력전압 형태로 출력
시각 표본화 (Sampling), 양자화 (Quantization) 영상의 해상도 : 비디콘 카메라: 출력 파형을 얼마나 조밀하게 표본화 하느냐? CCD 카메라: CCD 요소 배열에 의해 결정 아날로그 영상신호 Sample & Hold A/D 변환 디지털 신호 표본화 양자화 각 화소의 값의 크기 예) 256 단계 어떤 시간 간격으로 신호의 표본을 취하는 것
시각 Discrete intensity, pixel: 그림 10.6
영상 기초처리 잡음의 제거 평활화 (Smoothing): 주변 화소들과 크게 틀린 화소의 밝기 값을 주변의 것들과 비슷하게 만들어 주는 것 8이웃 (8-neighborhood) 화소 : 어떤 화소에 대해 주변 화소의 범위를 8방향의 인접 화소들만 고려한 것 3X3 mask를 적용 Vs. 4이웃 (4-neighborhood) 그림 10.7
잡음 제거 잡음의 제거 (계속) 평균 마스크 (averaging mask) 9개의 화소들의 합 / 9 중심 화소의 값과 대체 p(x, y) = i=-1..1j=-1..1m(i, j) g(x+i, y+j) g: 연산 전 화소의 밝기, m: mask, p: 연산 후 화소 밝기 그림 10.8
잡음 제거 잡음의 제거 (계속) 평균 마스크 (averaging mask) (계속) 그림 10.9 평균 마스크의 단점: 전체적인 선명성을 저하 (blurring effect) 두드러진 잡음은 잘 누그러뜨림 잡음이 아닌 부분도 흐려지게 함
잡음 제거 잡음의 제거 (계속) 중간값 여과기 (median filter) : Mask가 적용되는 영역 내의 화소값들을 sorting하여 중간 순위의 값 (median)을 중심 화소의 값과 대체 (replace) 임펄스 형태의 잡음을 저하시키는 데 탁월 예: 그림에서 잡음 46, 1 sorting에 많은 처리시간 소요 10 46 1
잡음 제거 평활화 예 14 10 9 10 46 1 Averaging Mask 10 Median Filter
잡음 제거 평균 마스크, 중간값 여과기 예 다음 1차원 배열에 3 mask 적용 평균 마스크 중간값 여과기 잡음 58의 영향이 이웃으로 퍼짐 중간값 여과기 잡음 58의 영향 나타나지 않음
경계 검출 경계 검출 (Edge Detection) 영상은 빛의 분포로 구성되므로 화소값이 급격히 변화하는 부분은 명암이 다른 물체나 면이 시작되는 부분, 즉 경계라 한다 그림 10.11
경계 검출 경계 검출 이웃 하는 화소들 사이의 밝기 변화를 계산하여 임의의 임계치 이상이면 경계로 판단 그림 10.12 경계 검출 마스크 사용 그림 10.12 그림 10.12 (b) 수직적으로 존재하는 경계선 검출만 가능
경계 검출 경계 검출 경계 검출 마스크 (2차원으로 확장된): 그림 10.13 마스크 사용의 장단점 (a) Prewitt mask: 2차원 영상에서 여러 가지 방향의 경계를 검출할 수 있는 마스크 (b) Sobel mask: 경계 검출 시 약간의 가중치를 준 것; 경계 검출용으로 널리 사용 마스크 사용의 장단점 뚜렷하지 못한 경계에서 잡음에 민감 간단, 프로그래밍 용이, 빠른 계산
영상의 이진화 영상의 이진화 (Binarization) 카메라로부터 얻어진 명암영상 (gray image)을 이진화 하기 위해 각 화소의 밝기값을 임계치 기준으로 2개의 집합으로 구분 물체 (object)와 배경 (background) 구분 용이 N x M의 배열에서 임의의 좌표 (x, y)에 대해 g(x, y) : 화소의 밝기, b(x, y) : 이진화 작업후의 화소값 b(x, y) = 1 if g(x, y) > threshold 0 otherwise (0 x N-1, 0 y M-1)
영상의 이진화 예) 3비트 화소값 (그림 10.14 참조) 0~7 사이의 값 히스토그램에서 3 또는 4값이 임계치가 될 수 있음 이진 영상 장점: 화소가 0 혹은 1의 값만을 가지므로, 표현이 간단하고, 기억용량의 수요가 적고, 실시간 처리에 유리
영상의 이진화 실제 영상에서는 임계치 결정 어려움 히스토그램 (Histogram) 얻은 후 임계치 결정: 그림 10.15 많은 빈도가 나오는 그룹들 사이의 값 110~140 사이의 값이 임계치가 됨 다른 방법: 영역 분할 후, 영역별 임계치 조정 영역별로 얻어진 히스토그램 이용
Summary 영상의 획득 영상 기초 처리 잡음 제거 경계검출 영상의 이진화 특징의 추출 형태의 인식 3차원 시각