Presentation is loading. Please wait.

Presentation is loading. Please wait.

시각의 기초 2002-1 인지과학 입문.

Similar presentations


Presentation on theme: "시각의 기초 2002-1 인지과학 입문."— Presentation transcript:

1 시각의 기초 2002-1 인지과학 입문

2 I. Introduction 시각 정보 처리 매우 복잡한 과정 - 인간에게는 노력 없이 간단하게 이루어지는 당연한 것 같음.
- AI의 노력: 보는 것이 복잡한 과정임이 드러남. - 원숭이의 대뇌 피질의 60% 이상이 시각에 관여함.

3 2) 처리 과제 - 입체시: 2차원 상의 3차원적 자각 - 항상성: 색채, 사물 지각 물체와 관찰자 간의 거리/방향 달라도. 빛의 특성이 달라져도. 물체의 일부분이 가려져 있어도. - 범주화: 시각 특질이 달라도 하나의 범주로 범주화함. (예] 의자)

4 2. 시각계 눈 그림 빛: 각막  수양액  동공  수정체  초자체  망막

5 2) 망막 - 빛이 초자체를 지나면서 약간 흩어짐  망막에 떨어지는 상은 완전히 뚜렷하지 않음.  초기 시각 처리 과정의 중요한 기능은 상을 뚜렷하게 하는 것. - 감광 세포: 간상체, 원추체 빛을 신경의 전기 신호로 바꿈.

6 간상체 (rods): - 적은 양의 빛에도 반응 - 해상력 빈약  밤에 덜 예민한 흑백의 시각 담당 (2) 원추체 (cones): - 색채시에 관여 - 고도의 해상력(resolution)과 시력(acuity)  낮에 일반적으로 경험하는 시각 담당 - 중심와(fovea)에 밀집

7 3) 시각 영역 중심야 (foveal vision) - 어떤 물체에 초점을 두는 것
 눈을 움직여 그 물체의 상이 중심와에 떨어지도록  원추체의 해상력이 최대가 되도록 하는 것. - 미세한 세부 내용의 탐지 (2) 주변야 (periphery) - 움직임 - 총체적인 정보의 탐지

8 II. Marr의 계산 이론 D. Marr (1982)는 시지각에 대한 세 수준의 설명을 주장함.
Top level : Computational level Intermediate level : Algorithmic level Bottom level : Hardware level (brain) : 시각의 목표와 관련하여 중요한 설명을 제공하기 때문에 computational level이 중요.

9 시각은 세 수준의 표상을 산출한다고 봄. Primal sketch: 시각 입력에서의 주 광강도(light-intensity) 변화의 2차원적 記述. Edges, contours, blobs에 관한 정보. 2.5 sketch: 표면의 방향성과 깊이 정보를 더한 것. PS와 함께 관찰자 주관적. 3D model representation: 물체의 3차원적 형상과 상대적 위치. 관찰자 독립적.

10 Marr의 시각 정보 처리 모형 영상 I (x, y) Primal Sketch 2 ½-D Sketch 3 D-Model 표상
기술 Decription 영상내의 강도변화 분포양상, 기초요소와 토큰 형성 과정 물체 표면의 방향과 깊이를 계산하는 과정 주관적 2 ½-D 스케치에서 객체중심의 3D 모형을 계산하는 과정 계산된 3D 모형과 저장된 3D 모형의 대조를 통해 재인하는 과정

11 Primal Sketch : raw primal sketch, full primal sketch
- 광강도 변화에 관한 정보 - 망막 상의 grey-level representation - Marr-Hildreth 알고리즘으로 광반사가 급변하는 영점교차(zero-crossing) 찾음. - 영점교차분절들이 선분등의 위계적인 토큰을 만들어 내어 형성된 얼룩, 불연속점, 모서리, 선이나 점의 집합으로 이루어진 표상.

12 2) Full primal sketch - raw primal sketch에서 얻어진 기초 표상 요소들로 시야 표면의 기하학적 특성을 추론하고, 이로부터 국소 표면의 강도, 크기, 밀도, 방향, 거리와 같은 표면 속성들을 도출하여 경계선 탐지

13 Gestaltist approach 물체의 지각적 격리를 위한 지각 구성
Law of Pragnanz: 기하학적으로 가능한 몇몇 개의 구성 중에서, 가장 좋고 간단하고 가장 안정된 모양(the best, simplist and most stable shape)을 가지고 있는 것이 선택된다.

14 서로 거리가 가까운 요소들은 하나로 그룹지어지는 경향이 있다.
비슷한 생김새를 갖는 요소들은 하나로 그룹지어지는 경향이 있다. (similarity) 선의 곧기나 굽기가 최소한으로 변하는 방향을 하나로 보는 경향이 있다. (good continuation) 조금 없어진 부분은 채워 넣는 경향이 있다. (closure) 함께 움직이는 것은 하나의 개체로 보는 경향이 있다.

15 Gestalt 법칙의 한계: - 직관적으로 타당해 보임. - 그러나 설명력이 없음. - isomorphism 학설의 실패로 한계가 확실해짐. : isomorphism이란, 시각적 구성의 경험은 두뇌의 대응적 구성 처리에 의해 그대로 반영된다는 것. 그러나 그들은 두뇌가 어떻게 작동하는지 거의 몰랐고, 몇몇 실험에 의해 실제 두뇌의 처리 기제가 아님이 밝혀짐.

16 2) Full primal sketch - Marr는 기본적 지각 구성이 시지각 처리 초기(2차원 스케치 단계)에 일어난다고 봄. - raw primal sketch만으로는 부족. 이를 해결하기 위해 두 가지 원리를 도입. (1) principle of explicit naming: - 그룹화된 요소 집합에 이름을 주는 것은 지각에 유용함. - raw 스케치의 부분부분에 place token을 할당. - raw 스케치의 다양한 모서리 포인트가 Gestalt식 개념에 기초한 single place token을 부여받음.

17 Marr의 성공: 프로그램이 물체에 관한 지식이나 기대가 없이도 무엇이 어디에 속한 부분인지 잘 결정함.
- place token도 Gestalt의 그룹핑 원리에 기초하여 그룹화됨. Marr의 성공: 프로그램이 물체에 관한 지식이나 기대가 없이도 무엇이 어디에 속한 부분인지 잘 결정함. Marr 의 가장 큰 한계는 그룹핑이 2차원 표상에 근거한다는 가정일 것. 그룹핑은 3차원 표상에 근거하기도 함.

18 2. 깊이 지각 3차원 지각엔 깊이 지각이 중요 깊이 지각: 절대 거리: 물체-관찰자 상대 거리: 물체-물체 (더 정확)
-깊이 지각 단서는 관찰자나 물체의 움직임에 의해 제공되기도. 그러나 여기서 중요히 다루는 것은 관찰자, 물체 및 환경이 모두 정적인 경우

19 깊이 단서는 두 가지: 단안 단서, 양안 단서 단안 단서 (monocular cues) : pictorial cues라고도 함. 화가들의 사용. (1) linear perspective: 평행선의 수렴 (2) aerial perspective: 멀리 있는 것은 뿌옇게 (3) texture: 질감 구성 요소가 조밀해 보이는 것이 멀리 있는 것으로 보임.

20 (4) interposition: 가까운 것이 먼 것을 가림.
(5) shading: 평평한 2차원 표면은 그늘을 만들지 않음. 그늘은 3차원의 증거. (6) familiar size: 실제 크기 지식. (7) motion parallax: 망막에서 많이 움직인 것이 가까운 것으로 보임.

21 2) 양안 단서 (binocular cues)
(1) convergence: 가까운 것 볼 때 눈이 몰리는 것. (2) accommodation: 가까운 것 볼 때 수정체를 두껍게 하는 것. (3) stereopsis: 두 눈의 망막에 떨어지는 상의 차이 - 위 (1)과 (2)는 아주 가까운 물체를 보는 경우에만 해당.

22 - stereopsis가 가장 중요한 양안 단서.
3) 단서 정보 통합 - 단서들이 어떻게 통합되는가가 중요. - Bruno & Cutting (1988)의 연구 : additivity? selection? multiplication? 실험 결과 “additivity” selection전략은 잘못된 선택-결과를 낳을 수 있음.

23 아기들이 각 기제를 그때그때 발달시킬 수 있음. (multiplication에 비한 유용성)
- B & C는 상반된 단서가 공존하는 경우에 대해서는 연구하지 않았으나 이론에 비춰 보면 두 단서를 통합할 가능성이 있음. 다른 연구에 의해 관찰자가 깊이 단서를 모두 사용한다는 것이 뒷받침됨. (예외도 있기는 함.- interposition 단서가 familiar size 단서를 압도하는 경우)

24 III. Brain Systems Zeki (1992, 1993)의 연구
: - 기본 가정 – 대뇌피질의 다른 영역은 각기 다른 시각 기능을 한다. - macaque monkey 실험 - V1 & V2: 시지각의 초기 단계 담당. 색채와 형태에 반응하는 각기 다른 세포 그룹 포함.

25 - V3 & V3A: 형태, 특히 움직이는 물체의 형상에 반응하는 세포들 존재

26 2. 인간 연구 : PET나 뇌손상 환자를 통한 인간 연구도 비슷한 결과를 나타냄. PET scan
(1) 색채 그림을 보여 주었을 때, 인간의 V4 영역이 가장 활동적. (2) 흑백 네모가 움직이는 패턴을 제시했을 때, 인간의 V5 영역이 가장 활동적.

27  움직임과 색채는 원숭이의 경우와 마찬가지로 인간의 시각 피질의 각기 다른 영역에서 처리됨을 보이는 것임.
(3) 두 가지 자극이 제시되었을 때는 V1(V2도) 영역이 활성화됨. 이 영역에서는 신호를 각각 특화된 영역으로 분배함.

28 2) 뇌손상 환자 연구 : 선택적 시각 장애 (1) Achromatopsia: V4 영역 손상. 색채를 지각하지 못함. 움직임 지각은 비교적 정상. (2) Akinetopsia: V5 영역 손상. 정적인 물체는 비교적 정상적으로 지각. 움직이는 것은 볼 수 없음. (3) Chromatopsia: 일산화탄소 중독으로 인한 넓은 범위 손상. 다른 시지각에는 심각한 장애가 왔으나 색채 지각에는 영향 없음.

29 (4) 형태만 못 보는 환자? 없음. : Zeki – 형태만 지각하지 못한다는 환자는 없을 것. 왜냐하면 V3와 V4를 모두 파괴할 정도의 손상은 V1의 파괴를 동반할 것이기 때문. 따라서 환자는 형태 지각만을 잃기 보다는 완전히 시각을 잃을 것. (5) Blind sight: V1을 거치지 않고 바로 분배되는 환자. 안 보인다고 하면서도 물체의 위치를 가리킬 수도 있고, 우연 수준 이상으로 그림의 동일 여부를 판단할 수 있음.

30 3. 정보의 통합 기능적 특화는 물체의 움직임, 색채, 형태 정보에 관한 통합 문제를 야기함.
Zeki : 다음의 처리 단계를 거쳐 이루어짐. (1) 망막에서 V1 영역까지 신호가 처리됨. (2) V1에서 피질의 각 특화 영역으로 신호가 전달됨. (3) 피질의 각 특화 영역에서 처리된 신호가 V1과 V2로 다시 보내짐. - binding은 동시 발화로?


Download ppt "시각의 기초 2002-1 인지과학 입문."

Similar presentations


Ads by Google