Presentation is loading. Please wait.

Presentation is loading. Please wait.

시각의 기초 2002-2 인지과학 입문. I. Introduction 1. 시각 정보 처리 1) 매우 복잡한 과정 - 인간에게는 노력 없이 간단하게 이루어 지는 당연한 것 같음. - AI 의 노력 : 보는 것이 복잡한 과정임이 드 러남. - 원숭이의 대뇌 피질의 60%

Similar presentations


Presentation on theme: "시각의 기초 2002-2 인지과학 입문. I. Introduction 1. 시각 정보 처리 1) 매우 복잡한 과정 - 인간에게는 노력 없이 간단하게 이루어 지는 당연한 것 같음. - AI 의 노력 : 보는 것이 복잡한 과정임이 드 러남. - 원숭이의 대뇌 피질의 60%"— Presentation transcript:

1 시각의 기초 2002-2 인지과학 입문

2 I. Introduction 1. 시각 정보 처리 1) 매우 복잡한 과정 - 인간에게는 노력 없이 간단하게 이루어 지는 당연한 것 같음. - AI 의 노력 : 보는 것이 복잡한 과정임이 드 러남. - 원숭이의 대뇌 피질의 60% 이상이 시각 에 관여함.

3 2) 처리 과제 - 입체시 : 2 차원 상의 3 차원적 자각 - 항상성 : 색채, 사물 지각 물체와 관찰자 간의 거리 / 방향 달라도. 빛의 특성이 달라져도. 물체의 일부분이 가려져 있어도. - 범주화 : 시각 특질이 달라도 하나의 범주 로 범주화함. ( 예 ] 의자 )

4 2. 시각계 빛 : 각막  수양액  동공  수정체  초자체  망막

5

6 2) 망막 - 빛이 초자체를 지나면서 약간 흩어짐  망막에 떨어지는 상은 완전히 뚜렷하지 않음.  초기 시각 처리 과정의 중요한 기능 은 상을 뚜렷하게 하는 것. - 감광 세포 : 간상체, 원추체 빛을 신경의 전기 신호로 바꿈.

7 (1) 간상체 (rods): - 적은 양의 빛에도 반응 - 해상력 빈약  밤에 덜 예민한 흑백의 시각 담당 (2) 원추체 (cones): - 색채시에 관여 - 고도의 해상력 (resolution) 과 시력 (acuity)  낮에 일반적으로 경험하는 시각 담당 - 중심와 (fovea) 에 밀집

8

9 3) 시각 영역 (1) 중심시 (foveal vision) - 어떤 물체에 초점을 두는 것  눈을 움직여 그 물체의 상이 중심와에 떨어지도록  원추체의 해상력이 최대가 되도 록 하는 것. - 미세한 세부 내용의 탐지 (2) 주변시 (periphery vision) - 움직임 - 총체적인 정보의 탐지

10 II. Marr 의 계산 이론 D. Marr (1982) 는 시지각에 대한 세 수준 의 설명을 주장함. –Top level : Computational level –Intermediate level : Algorithmic level –Bottom level : Hardware level (brain) : 시각의 목표와 관련하여 중요한 설명을 제공 하기 때문에 computational level 이 중요.

11 시각은 세 수준의 표상을 산출한다고 봄. –Primal sketch: 시각 입력에서의 주 광강도 (light-intensity) 변화의 2 차원적 記述. Edges, contours, blobs 에 관한 정보. –2.5 sketch: 표면의 방향성과 깊이 정보를 더한 것. PS 와 함께 관찰자 주관적. –3D model representation: 물체의 3 차원적 형상과 상대적 위치. 관찰자 독립적.

12 영상 I (x, y) Primal Sketch 2 ½-D Sketch 3 D-Model 표상 기술 Decription 영상내의 강도변화 분포양상, 기초요소와 토큰 형성 과정 물체 표면의 방향과 깊이를 계산하는 과정 주관적 2 ½-D 스케치에서 객체중심의 3D 모형을 계산하는 과정 계산된 3D 모형과 저장된 3D 모형의 대조를 통해 재인하는 과정 Marr 의 시각 정보 처리 모형

13 1.Primal Sketch : raw primal sketch, full primal sketch 1)Raw primal sketch - 광강도 변화에 관한 정보 - 망막 상의 grey-level representation - Marr-Hildreth 알고리즘으로 광반사가 급변하는 영점교차 (zero-crossing) 찾음. - 영점교차분절들이 선분등의 위계적인 토큰을 만들어 내어 형성된 얼룩, 불연속점, 모서리, 선이 나 점의 집합으로 이루어진 표상.

14 2) Full primal sketch - raw primal sketch 에서 얻어진 기초 표상 요소들로 시야 표면의 기하학적 특성을 추 론하고, 이로부터 국소 표면의 강도, 크기, 밀도, 방향, 거리와 같은 표면 속성들을 도출 하여 경계선 탐지

15 강도 변화에 의한 윤곽 찾기

16 Gestaltist approach - 물체의 지각적 격리를 위한 지각 구성 -Law of Pragnanz: 기하학적으로 가능한 몇몇 개의 구성 중에 서, 가장 좋고 간단하고 가장 안정된 모양 (the best, simplist and most stable shape) 을 가지고 있는 것이 선택된다.

17 (1) 서로 거리가 가까운 요소들은 하나로 그룹지어 지는 경향이 있다. (2) 비슷한 생김새를 갖는 요소들은 하나로 그룹지 어지는 경향이 있다. (similarity) (3) 선의 곧기나 굽기가 최소한으로 변하는 방향을 하나로 보는 경향이 있다. (good continuation) (4) 조금 없어진 부분은 채워 넣는 경향이 있다. (closure) (5) 함께 움직이는 것은 하나의 개체로 보는 경향 이 있다.

18

19 – Gestalt 법칙의 한계 : - 직관적으로 타당해 보임. - 그러나 설명력이 없음. - isomorphism 학설의 실패로 한계가 확실해짐. : isomorphism 이란, 시각적 구성의 경험은 두뇌의 대응적 구성 처리에 의해 그대로 반영된다는 것. 그 러나 그들은 두뇌가 어떻게 작동하는지 거의 몰랐 고, 몇몇 실험에 의해 실제 두뇌의 처리 기제가 아 님이 밝혀짐.

20 2) Full primal sketch - Marr 는 기본적 지각 구성이 시지각 처리 초기 (2 차 원 스케치 단계 ) 에 일어난다고 봄. - raw primal sketch 만으로는 부족. 이를 해결하기 위해 두 가지 원리를 도입. (1) principle of explicit naming: - 그룹화된 요소 집합에 이름을 주는 것은 지각에 유용함. - raw 스케치의 부분부분에 place token 을 할당. - raw 스케치의 다양한 모서리 포인트가 Gestalt 식 개념에 기초한 single place token 을 부여받음.

21 - place token 도 Gestalt 의 그룹핑 원리에 기초하 여 그룹화됨. (2) principle of least commitment : - 중의성은 적절한 해결을 도출하는 확실한 증거 가 있을 때에만 결정된다는 것. - 이 원리는 처리의 초기 단계에서 실수를 하면 나중에 몇 개의 다른 실수를 유도할 수 있는데, 이를 방지한다는 면에서 유리함.

22 Marr 의 성공 : 프로그램이 물체에 관한 지 식이나 기대가 없이도 무엇이 어디에 속 한 부분인지 잘 결정함. Marr 의 가장 큰 한계는 그룹핑이 2 차원 표상에 근거한다는 가정일 것. 그룹핑은 3 차원 표상에 근거하기도 함.

23 2. 깊이 지각 -3 차원 지각엔 깊이 지각이 중요 - 깊이 지각 : 절대 거리 : 물체 - 관찰자 상대 거리 : 물체 - 물체 ( 더 정확 ) - 깊이 지각 단서는 관찰자나 물체의 움직임에 의해 제공되기도. 그러나 여기서 중요히 다 루는 것은 관찰자, 물체 및 환경이 모두 정적 인 경우

24 – 깊이 단서는 두 가지 : 단안 단서, 양안 단서 1) 단안 단서 (monocular cues) : pictorial cues 라고도 함. 화가들의 사용. (1) linear perspective: 평행선의 수렴 (2) aerial perspective: 멀리 있는 것은 뿌옇게 (3) texture: 질감 구성 요소가 조밀해 보이는 것이 멀리 있는 것으로 보임.

25 (4) interposition: 가까운 것이 먼 것을 가림. (5) shading: 평평한 2 차원 표면은 그늘을 만 들지 않음. 그늘은 3 차원의 증거. (6) familiar size: 실제 크기 지식. (7) motion parallax: 망막에서 많이 움직인 것이 가까운 것으로 보임.

26

27 2) 양안 단서 (binocular cues) (1) convergence: 가까운 것 볼 때 눈이 몰리 는 것. (2) accommodation: 가까운 것 볼 때 수정체 를 두껍게 하는 것. (3) stereopsis: 두 눈의 망막에 떨어지는 상 의 차이 - 위 (1) 과 (2) 는 아주 가까운 물체를 보는 경 우에만 해당.

28 - stereopsis 가 가장 중요한 양안 단서. 3) 단서 정보 통합 - 단서들이 어떻게 통합되는가가 중요. - Bruno & Cutting (1988) 의 연구 : additivity? selection? multiplication? 실험 결과 “ additivity ” selection 전략은 잘못된 선택 - 결과를 낳 을 수 있음.

29 아기들이 각 기제를 그때그때 발달시킬 수 있음. (multiplication 에 비한 유용성 ) - B & C 는 상반된 단서가 공존하는 경우에 대해서는 연구하지 않았으나 이론에 비춰 보면 두 단서를 통합할 가능성이 있음. 다른 연구에 의해 관찰자가 깊이 단서를 모두 사 용한다는 것이 뒷받침됨. ( 예외도 있기는 함.- interposition 단서가 familiar size 단서 를 압도하는 경우 )

30 III. Brain Systems 1.Zeki (1992, 1993) 의 연구 : - 기본 가정 – 대뇌피질의 다른 영역은 각기 다른 시각 기능을 한다. - macaque monkey 실험 - V1 & V2: 시지각의 초기 단계 담당. 색채와 형태에 반응하는 각기 다른 세 포 그룹 포함.

31 - V3 & V3A: 형태, 특히 움직이는 물체 의 형상에 반응하는 세포들 존재 - V4: 색채와 선의 방향에 반응하는 세 포들 존재 - V5: 시각적 움직임에 특화됨.

32

33 2. 인간 연구 : PET 나 뇌손상 환자를 통한 인간 연구도 비 슷한 결과를 나타냄. 1)PET scan (1) 색채 그림을 보여 주었을 때, 인간의 V4 영역이 가장 활동적. (2) 흑백 네모가 움직이는 패턴을 제시했 을 때, 인간의 V5 영역이 가장 활동적.

34  움직임과 색채는 원숭이의 경우와 마찬 가지로 인간의 시각 피질의 각기 다른 영역 에서 처리됨을 보이는 것임. (3) 두 가지 자극이 제시되었을 때는 V1(V2 도 ) 영역이 활성화됨. 이 영역에서는 신호를 각각 특화된 영역으로 분배함.

35 2) 뇌손상 환자 연구 : 선택적 시각 장애 (1) Achromatopsia: V4 영역 손상. 색채를 지각하지 못함. 움직임 지각은 비교적 정상. (2) Akinetopsia: V5 영역 손상. 정적인 물체는 비교 적 정상적으로 지각. 움직이는 것은 볼 수 없음. (3) Chromatopsia: 일산화탄소 중독으로 인한 넓은 범위 손상. 다른 시지각에는 심각한 장애가 왔으나 색채 지각에는 영향 없음.

36 (4) 형태만 못 보는 환자 ? 없음. : Zeki – 형태만 지각하지 못한다는 환자는 없을 것. 왜냐하면 V3 와 V4 를 모두 파괴할 정도의 손상은 V1 의 파괴를 동반할 것이기 때문. 따라서 환자는 형태 지각만을 잃기 보 다는 완전히 시각을 잃을 것. (5) Blind sight: V1 을 거치지 않고 바로 분배 되는 환자. 안 보인다고 하면서도 물체의 위 치를 가리킬 수도 있고, 우연 수준 이상으로 그림의 동일 여부를 판단할 수 있음.

37 3. 정보의 통합 - 기능적 특화는 물체의 움직임, 색채, 형태 정 보에 관한 통합 문제를 야기함. -Zeki : 다음의 처리 단계를 거쳐 이루어짐. (1) 망막에서 V1 영역까지 신호가 처리됨. (2) V1 에서 피질의 각 특화 영역으로 신호가 전달됨. (3) 피질의 각 특화 영역에서 처리된 신호가 V1 과 V2 로 다시 보내짐. - cell binding 은 동시 발화로 ?


Download ppt "시각의 기초 2002-2 인지과학 입문. I. Introduction 1. 시각 정보 처리 1) 매우 복잡한 과정 - 인간에게는 노력 없이 간단하게 이루어 지는 당연한 것 같음. - AI 의 노력 : 보는 것이 복잡한 과정임이 드 러남. - 원숭이의 대뇌 피질의 60%"

Similar presentations


Ads by Google