시각의 기초 2002-2 인지과학 입문. I. Introduction 1. 시각 정보 처리 1) 매우 복잡한 과정 - 인간에게는 노력 없이 간단하게 이루어 지는 당연한 것 같음. - AI 의 노력 : 보는 것이 복잡한 과정임이 드 러남. - 원숭이의 대뇌 피질의 60%

Slides:



Advertisements
Similar presentations
1. 도형의 연결 상태 2. 꼭지점과 변으로 이루어진 도형 Ⅷ. 도형의 관찰 도형의 연결상태 연결상태가 같은 도형 단일폐곡선의 성질 연결상태가 같은 입체도형 뫼비우스의 띠.
Advertisements

[인격형성 ] [고양이 인생의 최대위기] [인류의 기원] (목)
재료수치해석 HW # 박재혁.
I. 자극과 반응 4. 빛을 받아들이는 눈.
적분방법의 연속방정식으로부터 Q=AV 방정식을 도출하라.
풀 다운 메뉴 File > New “intent” 이름을 넣고 OK 를 클릭한다.
Entity Relationship Diagram
(생각열기) 멘델레예프의 주기율표와 모즐리의 주기율표 에서 원소를 나열하는 기준은? ( )
원자 스펙트럼 1조 서우석 김도현 김종태.
제 9 장 구조체와 공용체.
1-1 일과 일률.
시각 인지과학 입문.
질의 사항 Yield Criteria (1) 소재가 평면응력상태에 놓였을 때(σ3=0), 최대전단응력조건과 전단변형에너지 조건은σ1 – σ2 평면에서 각각 어떤 식으로 표시되는가? (2) σ1 =σ2인 등이축인장에서 σ = Kεn로 주어지는 재료의 네킹시 변형율을 구하라.
11장. 포인터 01_ 포인터의 기본 02_ 포인터와 Const.
시각의 기초 인지과학 입문.
7. 자극과 반응 7-2. 신경계 2. 신경계의 구성.
Simulating Boolean Circuits on a DNA Computer
3D 입체 사진의 원리에 대해 배워보고, 3D입체로봇을 만들어보자
지각 Perception (6장) 무언가가 있네? (…) 어디에 있나? (공간 문제: 깊이, 거리)
Ⅱ. 지구의 변동과 역사 1. 지구의 변동 2. 지구의 역사 3. 우리나라의 지질.
무게중심으로 최적의 안정적인 팽이를 찾아라 03김동균, 04김문성, 09박 홍, 10서영우.
(생각열기) 볼록 렌즈로 물체를 관찰할 때는 어떤 상을 볼 수 있는가?
제4장 제어 시스템의 성능.
별의 밝기와 거리[2] 밝다고 가까운 별은 아니야! 빛의 밝기와 거리와의 관계 별의 밝기 결정.
(생각열기) 옷가게에서 옷을 살 때와 옥가게 밖으로 나와 서 옷을 볼 때 옷 색이 달라져 보이는 이유는?
이미지 포렌식 작성자: liberte97.
암 전이 억제 유전자 발굴 및 작동 기전 연구 (Nature지 4월 14일자 발표)
고체역학 1 기말고사 학번 : 성명 : 1. 각 부재에 작용하는 하중의 크기와 상태를 구하고 점 C의 변위를 구하시오(10).
군집 분석.
자료구조: CHAP 7 트리 –review 순천향대학교 컴퓨터공학과 하 상 호.
식물은 어떻게 자손을 남길까(1) <생각 열기> 사과, 배, 복숭아 등의 과수나무를 재배하거나
2조 식품생명공학과 조광국 배석재 윤성수 우홍배
도형의 기초 3. 기본작도 삼각형의 작도 수직이등분선의 작도 각의 이등분선의 작도.
MCL을 이용한 이동로봇 위치추정의 구현 ( Mobile robot localization using monte carlo localization ) 한양대학교 전자전기전공 이용학.
색체 인식과 영상 장치 빛의 합성과 색체 인식 백색광 ex) 햇빛, 형광등, 백열등
정다면체, 다면체와 정다각형, 다각형의 관계 한림초등 학교 영제 6학년 5반 송명훈.
P 등속 직선 운동 생각열기 – 자동차를 타고 고속도로를 달릴 때, 속력계 바늘이 일정한 눈금을 가리키며 움직이지 않을 때가 있다. 이 때 자동차의 속력은 어떠할까? ( 속력이 일정하다 .)
다면체 다면체 다면체: 다각형인 면만으로 둘러싸인 입체도 형 면: 다면체를 둘러싸고 있는 다각형
삼각형에서 평행선에 의하여 생기는 선분의 길이의 비
위치 에너지(2) 들어 올리기만 해도 에너지가 생겨. 탄성력에 의한 위치 에너지.
CAD 실습 2013년 2학기.
식물의 광합성 식물은 어떻게 영양분을 만들까요? 김 수 기.
수학10-나 1학년 2학기 Ⅱ.부등식의 영역 1. 부등식의 영역(2/5) 부등식 영역 수업계획 수업활동.
김정숙 (고려대학교 2014년) 국어국문학과 한국어학 석사 1기 이 드미뜨리
물리 현상의 원리 TIME MACHINE.
2장 변형률 변형률: 물체의 변형을 설명하고 나타내는 물리량 응력: 물체내의 내력을 설명하고 나타냄
고등학생을 위한 성교육 7단원: 음란물, 나의 미래를 좀먹는다
시각절벽실험 김현우.
2. 누화와 케이블링 1. 서론 2. 용량성 누화 3. 유도성 누화 4. 복합적인 누화(누화의 일반적인 이해)
바넘효과 [Barnum effect] 사람들이 보편적으로 가지고 있는 성격이나 심리적 특징을 자신만의 특성으로 여기는 심리적 경향. 19세기 말 곡예단에서 사람들의 성격과 특징 등을 알아 내는 일을 하던 바넘(P.T. Barnum)에서 유래하였다. 1940년대 말 심리학자인.
작도 작도 작도: 눈금 없는 자와 컴퍼스만을 사용하여 도형을 그리는 것
Chapter 1 단위, 물리량, 벡터.
Support Vector Machine
Chapter 1 단위, 물리량, 벡터.
행성을 움직이는 힘은 무엇일까?(2) 만유인력과 구심력 만유인력과 케플러 제3법칙.
1. 정투상법 정투상법 정투상도 (1) 정투상의 원리
광합성에 영향을 미치는 환경 요인 - 생각열기 – 지구 온난화 해결의 열쇠가 식물에 있다고 하는 이유는 무엇인가?
학습 주제 p 질량과 부피 측정 방법 알기.
웹 사이트 분석과 설계 [디자인 리서치] 학번: 이름 : 홍지애.
5.1-1 전하의 흐름과 전류 학습목표 1. 도선에서 전류의 흐름을 설명할 수 있다.
의미론적 관점 * TV에서 ‘푸른 빛이 아닌 청자빛’이란 표현을 들었을 경우
상관계수.
우선 각 평면도에서 점선으로 강조한 직육면체 형상의 피처를 생성한다. 여기서 컴퓨터응용가공산업기사 준비를
컴퓨터공학과 손민정 Computer Graphics Lab 이승용 교수님
눈의 구조와 기능(1) 사람이 천냥이면 눈이 팔백냥이다. 눈의 구조와 기능 시각의 전달 경로.
디자인론 5강 1. 조형을 위한 지각론(2).
Automatic Music Transcription
컴퓨터는 어떻게 덧셈, 뺄셈을 할까? 2011년 10월 5일 정동욱.
: 3차원에서 입자의 운동 방정식 제일 간단한 경우는 위치만의 함수 : 시간, 위치, 위치의 시간미분 의 함수
디 코 더 n비트의 2진 코드를 입력으로 받아들여 최대 2n개의 서로 다른 정보로 바꿔 주는 조합 회로
Presentation transcript:

시각의 기초 인지과학 입문

I. Introduction 1. 시각 정보 처리 1) 매우 복잡한 과정 - 인간에게는 노력 없이 간단하게 이루어 지는 당연한 것 같음. - AI 의 노력 : 보는 것이 복잡한 과정임이 드 러남. - 원숭이의 대뇌 피질의 60% 이상이 시각 에 관여함.

2) 처리 과제 - 입체시 : 2 차원 상의 3 차원적 자각 - 항상성 : 색채, 사물 지각 물체와 관찰자 간의 거리 / 방향 달라도. 빛의 특성이 달라져도. 물체의 일부분이 가려져 있어도. - 범주화 : 시각 특질이 달라도 하나의 범주 로 범주화함. ( 예 ] 의자 )

2. 시각계 빛 : 각막  수양액  동공  수정체  초자체  망막

2) 망막 - 빛이 초자체를 지나면서 약간 흩어짐  망막에 떨어지는 상은 완전히 뚜렷하지 않음.  초기 시각 처리 과정의 중요한 기능 은 상을 뚜렷하게 하는 것. - 감광 세포 : 간상체, 원추체 빛을 신경의 전기 신호로 바꿈.

(1) 간상체 (rods): - 적은 양의 빛에도 반응 - 해상력 빈약  밤에 덜 예민한 흑백의 시각 담당 (2) 원추체 (cones): - 색채시에 관여 - 고도의 해상력 (resolution) 과 시력 (acuity)  낮에 일반적으로 경험하는 시각 담당 - 중심와 (fovea) 에 밀집

3) 시각 영역 (1) 중심시 (foveal vision) - 어떤 물체에 초점을 두는 것  눈을 움직여 그 물체의 상이 중심와에 떨어지도록  원추체의 해상력이 최대가 되도 록 하는 것. - 미세한 세부 내용의 탐지 (2) 주변시 (periphery vision) - 움직임 - 총체적인 정보의 탐지

II. Marr 의 계산 이론 D. Marr (1982) 는 시지각에 대한 세 수준 의 설명을 주장함. –Top level : Computational level –Intermediate level : Algorithmic level –Bottom level : Hardware level (brain) : 시각의 목표와 관련하여 중요한 설명을 제공 하기 때문에 computational level 이 중요.

시각은 세 수준의 표상을 산출한다고 봄. –Primal sketch: 시각 입력에서의 주 광강도 (light-intensity) 변화의 2 차원적 記述. Edges, contours, blobs 에 관한 정보. –2.5 sketch: 표면의 방향성과 깊이 정보를 더한 것. PS 와 함께 관찰자 주관적. –3D model representation: 물체의 3 차원적 형상과 상대적 위치. 관찰자 독립적.

영상 I (x, y) Primal Sketch 2 ½-D Sketch 3 D-Model 표상 기술 Decription 영상내의 강도변화 분포양상, 기초요소와 토큰 형성 과정 물체 표면의 방향과 깊이를 계산하는 과정 주관적 2 ½-D 스케치에서 객체중심의 3D 모형을 계산하는 과정 계산된 3D 모형과 저장된 3D 모형의 대조를 통해 재인하는 과정 Marr 의 시각 정보 처리 모형

1.Primal Sketch : raw primal sketch, full primal sketch 1)Raw primal sketch - 광강도 변화에 관한 정보 - 망막 상의 grey-level representation - Marr-Hildreth 알고리즘으로 광반사가 급변하는 영점교차 (zero-crossing) 찾음. - 영점교차분절들이 선분등의 위계적인 토큰을 만들어 내어 형성된 얼룩, 불연속점, 모서리, 선이 나 점의 집합으로 이루어진 표상.

2) Full primal sketch - raw primal sketch 에서 얻어진 기초 표상 요소들로 시야 표면의 기하학적 특성을 추 론하고, 이로부터 국소 표면의 강도, 크기, 밀도, 방향, 거리와 같은 표면 속성들을 도출 하여 경계선 탐지

강도 변화에 의한 윤곽 찾기

Gestaltist approach - 물체의 지각적 격리를 위한 지각 구성 -Law of Pragnanz: 기하학적으로 가능한 몇몇 개의 구성 중에 서, 가장 좋고 간단하고 가장 안정된 모양 (the best, simplist and most stable shape) 을 가지고 있는 것이 선택된다.

(1) 서로 거리가 가까운 요소들은 하나로 그룹지어 지는 경향이 있다. (2) 비슷한 생김새를 갖는 요소들은 하나로 그룹지 어지는 경향이 있다. (similarity) (3) 선의 곧기나 굽기가 최소한으로 변하는 방향을 하나로 보는 경향이 있다. (good continuation) (4) 조금 없어진 부분은 채워 넣는 경향이 있다. (closure) (5) 함께 움직이는 것은 하나의 개체로 보는 경향 이 있다.

– Gestalt 법칙의 한계 : - 직관적으로 타당해 보임. - 그러나 설명력이 없음. - isomorphism 학설의 실패로 한계가 확실해짐. : isomorphism 이란, 시각적 구성의 경험은 두뇌의 대응적 구성 처리에 의해 그대로 반영된다는 것. 그 러나 그들은 두뇌가 어떻게 작동하는지 거의 몰랐 고, 몇몇 실험에 의해 실제 두뇌의 처리 기제가 아 님이 밝혀짐.

2) Full primal sketch - Marr 는 기본적 지각 구성이 시지각 처리 초기 (2 차 원 스케치 단계 ) 에 일어난다고 봄. - raw primal sketch 만으로는 부족. 이를 해결하기 위해 두 가지 원리를 도입. (1) principle of explicit naming: - 그룹화된 요소 집합에 이름을 주는 것은 지각에 유용함. - raw 스케치의 부분부분에 place token 을 할당. - raw 스케치의 다양한 모서리 포인트가 Gestalt 식 개념에 기초한 single place token 을 부여받음.

- place token 도 Gestalt 의 그룹핑 원리에 기초하 여 그룹화됨. (2) principle of least commitment : - 중의성은 적절한 해결을 도출하는 확실한 증거 가 있을 때에만 결정된다는 것. - 이 원리는 처리의 초기 단계에서 실수를 하면 나중에 몇 개의 다른 실수를 유도할 수 있는데, 이를 방지한다는 면에서 유리함.

Marr 의 성공 : 프로그램이 물체에 관한 지 식이나 기대가 없이도 무엇이 어디에 속 한 부분인지 잘 결정함. Marr 의 가장 큰 한계는 그룹핑이 2 차원 표상에 근거한다는 가정일 것. 그룹핑은 3 차원 표상에 근거하기도 함.

2. 깊이 지각 -3 차원 지각엔 깊이 지각이 중요 - 깊이 지각 : 절대 거리 : 물체 - 관찰자 상대 거리 : 물체 - 물체 ( 더 정확 ) - 깊이 지각 단서는 관찰자나 물체의 움직임에 의해 제공되기도. 그러나 여기서 중요히 다 루는 것은 관찰자, 물체 및 환경이 모두 정적 인 경우

– 깊이 단서는 두 가지 : 단안 단서, 양안 단서 1) 단안 단서 (monocular cues) : pictorial cues 라고도 함. 화가들의 사용. (1) linear perspective: 평행선의 수렴 (2) aerial perspective: 멀리 있는 것은 뿌옇게 (3) texture: 질감 구성 요소가 조밀해 보이는 것이 멀리 있는 것으로 보임.

(4) interposition: 가까운 것이 먼 것을 가림. (5) shading: 평평한 2 차원 표면은 그늘을 만 들지 않음. 그늘은 3 차원의 증거. (6) familiar size: 실제 크기 지식. (7) motion parallax: 망막에서 많이 움직인 것이 가까운 것으로 보임.

2) 양안 단서 (binocular cues) (1) convergence: 가까운 것 볼 때 눈이 몰리 는 것. (2) accommodation: 가까운 것 볼 때 수정체 를 두껍게 하는 것. (3) stereopsis: 두 눈의 망막에 떨어지는 상 의 차이 - 위 (1) 과 (2) 는 아주 가까운 물체를 보는 경 우에만 해당.

- stereopsis 가 가장 중요한 양안 단서. 3) 단서 정보 통합 - 단서들이 어떻게 통합되는가가 중요. - Bruno & Cutting (1988) 의 연구 : additivity? selection? multiplication? 실험 결과 “ additivity ” selection 전략은 잘못된 선택 - 결과를 낳 을 수 있음.

아기들이 각 기제를 그때그때 발달시킬 수 있음. (multiplication 에 비한 유용성 ) - B & C 는 상반된 단서가 공존하는 경우에 대해서는 연구하지 않았으나 이론에 비춰 보면 두 단서를 통합할 가능성이 있음. 다른 연구에 의해 관찰자가 깊이 단서를 모두 사 용한다는 것이 뒷받침됨. ( 예외도 있기는 함.- interposition 단서가 familiar size 단서 를 압도하는 경우 )

III. Brain Systems 1.Zeki (1992, 1993) 의 연구 : - 기본 가정 – 대뇌피질의 다른 영역은 각기 다른 시각 기능을 한다. - macaque monkey 실험 - V1 & V2: 시지각의 초기 단계 담당. 색채와 형태에 반응하는 각기 다른 세 포 그룹 포함.

- V3 & V3A: 형태, 특히 움직이는 물체 의 형상에 반응하는 세포들 존재 - V4: 색채와 선의 방향에 반응하는 세 포들 존재 - V5: 시각적 움직임에 특화됨.

2. 인간 연구 : PET 나 뇌손상 환자를 통한 인간 연구도 비 슷한 결과를 나타냄. 1)PET scan (1) 색채 그림을 보여 주었을 때, 인간의 V4 영역이 가장 활동적. (2) 흑백 네모가 움직이는 패턴을 제시했 을 때, 인간의 V5 영역이 가장 활동적.

 움직임과 색채는 원숭이의 경우와 마찬 가지로 인간의 시각 피질의 각기 다른 영역 에서 처리됨을 보이는 것임. (3) 두 가지 자극이 제시되었을 때는 V1(V2 도 ) 영역이 활성화됨. 이 영역에서는 신호를 각각 특화된 영역으로 분배함.

2) 뇌손상 환자 연구 : 선택적 시각 장애 (1) Achromatopsia: V4 영역 손상. 색채를 지각하지 못함. 움직임 지각은 비교적 정상. (2) Akinetopsia: V5 영역 손상. 정적인 물체는 비교 적 정상적으로 지각. 움직이는 것은 볼 수 없음. (3) Chromatopsia: 일산화탄소 중독으로 인한 넓은 범위 손상. 다른 시지각에는 심각한 장애가 왔으나 색채 지각에는 영향 없음.

(4) 형태만 못 보는 환자 ? 없음. : Zeki – 형태만 지각하지 못한다는 환자는 없을 것. 왜냐하면 V3 와 V4 를 모두 파괴할 정도의 손상은 V1 의 파괴를 동반할 것이기 때문. 따라서 환자는 형태 지각만을 잃기 보 다는 완전히 시각을 잃을 것. (5) Blind sight: V1 을 거치지 않고 바로 분배 되는 환자. 안 보인다고 하면서도 물체의 위 치를 가리킬 수도 있고, 우연 수준 이상으로 그림의 동일 여부를 판단할 수 있음.

3. 정보의 통합 - 기능적 특화는 물체의 움직임, 색채, 형태 정 보에 관한 통합 문제를 야기함. -Zeki : 다음의 처리 단계를 거쳐 이루어짐. (1) 망막에서 V1 영역까지 신호가 처리됨. (2) V1 에서 피질의 각 특화 영역으로 신호가 전달됨. (3) 피질의 각 특화 영역에서 처리된 신호가 V1 과 V2 로 다시 보내짐. - cell binding 은 동시 발화로 ?