Presentation is loading. Please wait.

Presentation is loading. Please wait.

인지신경기반 한국어 정보처리 모형 개발 남 기 춘 고려대학교 심리학과. 연구 목표 연구개발의 최종 목표 - 인지신경과학 연구에 따른 형태소 와 구문정보처리 자료를 기반으로 정상 뇌와 손상 뇌 모형을 구축하고, 교육과 언 어재활을 위한 한국어 형태소 및 구문 분 석 /

Similar presentations


Presentation on theme: "인지신경기반 한국어 정보처리 모형 개발 남 기 춘 고려대학교 심리학과. 연구 목표 연구개발의 최종 목표 - 인지신경과학 연구에 따른 형태소 와 구문정보처리 자료를 기반으로 정상 뇌와 손상 뇌 모형을 구축하고, 교육과 언 어재활을 위한 한국어 형태소 및 구문 분 석 /"— Presentation transcript:

1 인지신경기반 한국어 정보처리 모형 개발 남 기 춘 고려대학교 심리학과

2 연구 목표 연구개발의 최종 목표 - 인지신경과학 연구에 따른 형태소 와 구문정보처리 자료를 기반으로 정상 뇌와 손상 뇌 모형을 구축하고, 교육과 언 어재활을 위한 한국어 형태소 및 구문 분 석 / 생성 시스템 개발 (1) 정상인과 실어증 환자를 대상으로 형태소 / 구문 정보처리 모형 규명 (2) 언어처리에 관련된 손상 뇌 모형 개발 (3) 대뇌 형태소 및 구문 정보처리 모형에 기초한 전산 모형 개발

3 연차별 연구 목표 구분연구 개발 목표연구개발 내용 1 차년도 (2001) 언어 이해 / 생성 모형 규명 심성 어휘집의 언어 지식 표상 규명 인간의 형태 ᆞ 구문 분석 메커니즘 규명 인간의 형태 ᆞ 구문 생성 메커니즘 규명 형태 ᆞ 구문에 관련된 대뇌 영역 규명 2 차년도 (2002) 언어 이해 / 생성 계산주의 모형 시뮬레이션 인지신경기반 전자 사전 ᆞ구조 설계 및 개발 계산주의 어절 ᆞ 구문 분석 모형 시뮬레이션 계산주의 어절 ᆞ 구문 생성 모형 시뮬레이션 손상 뇌의 계산주의 모형 시뮬레이션

4 구분연구 개발 목표연구개발 내용 3 차년도 (2003) 언어 신경 계산 한국어 형태 ᆞ구문 정보처리기 설계 인간의 정보처리 모형에 기반한 전자 사전 구축 인지신경계산주의 어절 ᆞ 구문 분석기 설계 및 개발 인지신경계산주의 어절 ᆞ 구문 생성기 설계 및 개발 연차별 연구 목표

5 연구범위연구수행방법 ( 이론적ᆞ실험적 접근방법 ) 구체적인 내용 심성어휘집의 언어지식 표상 규명 실험 심리학적 접근 언어표상 이론 체계화 언어처리모형 개발 인간의 형태ᆞ구문분석 / 생성 메커니즘 규명 컴퓨터 시뮬레이션 형태구문의 DB 구축 및 전산화 컴퓨터 시뮬레이션 형태 ᆞ 구문에 관련된 대뇌 영 역 규명 언어영역과 대뇌영역의 상관연구 실어증 환자 인터뷰 및 진단 fMRI/MEG 영상획득 및 판독 연구 범위 및 연구 방법

6 중의어의 형태소 표상양식 (1/3) 실험 1 : 어근 또는 전체 어절의 여러의 미가 활성화 되는가 일부분만 활성화 되는가 ? 재료 얼굴이 - 전쟁얼굴이 - 연필무관련 적을 - 전쟁적을 - 연필관련 체언용언 결과 실험 2 : 어근이 중의어 이나 어절전체는 한가지 의미를 가지게 될 때 의미 활성화는 어떻게 일어나는가 ? 용언체언 관련쥐어 - 주먹쥐어 - 고양이 무관련밝어 - 주먹실천 - 고양이 * * 결과 * 재료 결론 및 논의 체언과 용언의 의미를 가지는 중의적 어절은 어절전체로 표상되어있음 (full-list) SOA 에 따른 차이를 보임 (1000ms), 실어증 환자들은 서로 다른 결과를 보임

7 실험 : 복합어의 의미처리는 어절 전체 인가 하위형태소로 분석 후 각각의 의미에 접 근한 후 이루어 지는가 ? 복합어의 형태소 표상양식 (2/3) 전체단어 빈도 앞단어의 빈도 뒷단어의 빈도 대등 -0.10-0.150.34 종속 0.05-0.140.04 융합 -0.130.180.00 신조어 -0.34-0.29 전체 ( 논밭 - 논 ) 부분 ( 논 - 논 ) 통제 ( 숨통 - 논 ) 대등 513(50)481(58)*576(82)** 종속 501(29)468(37)*579(95)** 융합 515(30)478(53)*580(90)** 신조어 526(37)476(34)*591(44)** * 전체조건과 유의미 ** 전체와 부분조건과 각각 유의미 종류예 예 대등 논밭 손발 융합 콩밥 밤낮 종속 장미꽃 앞길 신조어 노래방 국민연금 실험 1 결과 빈도와의 상관 재료 실험 2 결과 반복점화 효과 실험 3 결과 융합복합어의 의미점 화 결론 및 논의 복합어 특히 융합어의 경우 어절전체로 표상되어 처리됨

8 실험 : 이전 실험에서는 복합어의 의미 처리는 어절전체 인가 하위형태소로분석 후 각각의 의미에 접근한 후 이루어 지는 가에 대한 통제 조건이 없었음 통제 조건 을 추가하여 실험 복합어의 형태소 표상양식 (3/3) 종류예 예 대등 논밭 손발 융합 콩밥 밤낮 종속 장미꽃 앞길 신조어 노래방 국민연금 재료 복합어 특히 융합어의 경우 어절전체로 표상되어 처리됨 전체, 부분, 통제 조건이 유의미하게 차이남. ‘ 논밭 ’,’ 논 ’ 을 다른 단어로 인식. 전체목록 가설 지지 추가실험결과 반복점화 효과 결론 및 논의

9 동사 선어말어미의 처리 및 표상 (1/3) 연구목적 연구목적 - decomposition 가정이라면, prime 의 선어말어미와 target 의 선 어말어미가 기능적으로 같은 경우 통제조건에 비해 촉진효과가 있을 것임. 연구방법 – LDT 연구방법 – LDT실험조건primeTarget 선어말어미 일치조건덜었니감았다 선어말어미 이형태조건졸았니감았다 통제조건달아라감았다 선어말어미무관, 형태일치조건감식초감았다 연구결과 (150SOA, 750SOA)

10 연구목적 연구목적 - 동사의 연결어미와 어간간의 표 상의 유형 [decomposition or full-list] 연구방법 연구방법 - lexical decision task실험조건primeTarget 일치조건덜고감고 이형태조건졸아감고 통제조건닫지감고 기능무관, 형태일치장고감고 동사 연결어미의 표상 및 처리 (2/3) 연구결과 및 의의 한국어 동사의 표상 기본 단위에 관한 시사점 [ 어간 ]+[ 어미 ] 보다는 [ 어간 + 선어말어미 ] + [ 어미 ]

11 동사 피동접사 처리 및 표상 (3/3) 연구목적 연구목적 - 피동사 ( 어근 + 파생접사 ) 의 경우 선행 연구의 ‘ 선어말어미 ’ 의 결과와 유사한지 ‘ 연결어미 ’ 의 결과와 유사한지 알아보고 자 함. 연구방법 – LDT 연구방법 – LDT 연구결과 : 연구결과 : ‘ 선어말어미 ’ 와 유사함. 어 간과 접사가 따로 저장되었다기 보다는 ‘ 어간 + 접사 ” 의 형태로 심성어휘집에 저 장되어 있는 것으로 보인다.실험조건primeTarget 피동접사 일치조건꽂히고감기다 피동접사 이형태조건뺏기고감기다 통제조건삶아라감기다 피동접사무관, 형태일치조건합기도감기다 연구결과 (150SOA, 750SOA)

12 한국어 용언의 형태소 정보처리 특성 연구목적 : 한국어 용언은 어떠한 형태로 심성 어휘집에 접근하는가 연구방법 : 실험 1> - 규칙용언과 불규칙 용언 39 개, 통제 단어 40 개, 비단어 48 개. 어휘판단 과제. - 정상인 대상 실험 2> - 실험방법은 실험 1 과 동일. - 실어증 및 실행증 환자 YWO, 명칭성 실어증 환자 S 연구결과 정상인은 규칙용언은 어간과 어미로 나누어서 인식 하는 과정과 하나로 인식하는 과정이 혼재되어 있으 나 불규칙용언은 어절을 분석하여 개개의 형태소로 분석하지 않고 어절을 통째로 인식 실어증 환자는 정상인과 다른 결과 보여줌. 특히 이 해성 실어증 환자는 어간이나 어절빈도와 부적상관 을 보이지 않는 것으로 보아 형태소 분석 단계에 문 제가 있는 것으로 볼 수 있다. 실험 1 결과 > 어절빈도와 어간 빈도, 어휘판단시간간의 상관관계분석 실험 2 결과 > 환자 S - 규칙용언으 어절, 어간빈도와 반응시간간에 역관계. 어간빈도와 어절빈도의 효과가 유의미. - 불규칙 용언은 어간빈도와 반응시간간에 역관계, 어간 과 어절빈도의 상관은 0.67. 두 효과가 유의미하지는 않 았지만 경향성은 있었음 환자 YWO - 어절빈도와 반응시간은 높은 정적 상관관계 (.878), 어간 빈도와 반응시간은 낮은 부적상관관계 (-.053) - 불규칙 용언은 반응시간과 어절빈도, 어간빈도 역관계 어절어간반응시 간 규칙 용언 어절.773-.441 어간.773-.374 불규칙 용언 어절.356-.403 어간.356-.040

13 단어 규칙성 효과의 위치 실험 1> 명명과제의 경우 단어규칙성 효과가 심 성 어휘집에 접근할 때 생기는 것인지 명명과제 의 특성상 조음 할 때 생기는 것인지 알아보기 위 함. 결과 > 아이템별 분석에서 음변화만이 유의미 (F (1,29) )=5.4, p<.05). 실험 2> 순수한 점화 - 어휘 판단과제로 심성어휘집에 접근시 규칙성 효과 알아봄 결과 > 피험자 분석에서 빈도 (F (1,46) )=7.962, p<.05), 음변화 (F (1,29) )=6.188, p<.05) 유의미. 관련성과 음 변화간의 거의 유의미한 상호작용 (F (1,29) )=3.694, p<.05). 실험 3> 단어규칙성 효과가 일시적인 것인지 지속적인 것인지 알기 위해서 단어 반복효과 를 이용한 반복명명실험 결과 > 점화자극의 경우 피험자별 분석시에 음변화 (F (1,25) )=6.990, p<.05) 에서 규칙성 효과, 목표단어의 경우 빈도 (F (1,25) )=8.228, p<.01), 음변화 (F (1,25) )=5.030, p<.05) 에서 유의미한 차이 보임. 종합논의 > 한국어에서 단어 규칙성 효과는 심성어휘집에 접근할 때나 조음할 때에 모두 나타나며 그 효과는 지속적인 것으로 보임 고빈도저빈도 음변화 무 475(134)465(134) 음변화 유 478(130)480(137) 저빈도고빈도 관련무관련관련무관련 음변 화 무 627 (104) 635 (116) 625 (108) 633 (107) 음변 화 무 642 (116) 646 (119) 632 (110) 634 (112) 점화단어반복단어 고빈도저빈도고빈도저빈도 음변화 무 532 (80) 535 (85) 523 (80) 518 (81) 음변화 무 539 (94) 552 (101) 527 (84) 530 (98)

14 한국어 단어산출 및 문장 산출에 관한 대뇌 표상 연구 연구 목적 : 한국어 단어 산출과 문장산출 에 관련된 대뇌 영역 확인 및 비교 연구 방법 : Event-related fMRI ( 과학원 fMRI Center, ISOL forte 3T). SPM99 실험 1 : Picture Naming Task > Control task( 무의미한 도형 보고 의성어 반복하 기 ) 결과 : left Broca’s area(BA 44) dorsolateral prefrontal inferior gyrus(BA 6), bilateral occipital lobe, superior temporal gyrus 실험 2 : Sentence Production Task > Control task 결과 : left Broca’s area(BA 44) dorsolateral prefrontal gyrus(BA 6) are more activated in sentence production than in Picture Naming condition 종합 논의 : 단어 산출과 문장 산출에 관 한 대뇌 영역을 확인할 수 있었음. Picture Naming Task Sentence Producing Task Stimulus

15 한국어 체언과 용언의 표상구조 연구목적 [ 정상인을 대상으로 체언과 용언 의 의미표상 차이를 추론.] - 연관 연구에 대한 기초 연구 - 컴퓨터 시뮬레이션과의 결과비교 - 체언과 용언의 세부 하위 범주 ( 의 미적, 통사적 ) 의 표상구조 차이 - 연접빈도와 표상구조간의 상관연구방법 - 설문지 구성 - 실험참가자는 해당 문항을 보았을 때 떠오르는 단어를 순서적으로 작성하게 함. 연구결과 및 의의 체언과 용언의 의미표상 구조의 차이 시사

16 한국어 어절 재인에 관련된 현상 – 한국어 어절의 full-list 표상 구조 – 길이 효과 : 자소 또는 음절의 길이가 긴 단어일수록 재인 시간이 길어짐. – 빈도 효과 : 같은 길이의 어절인 경우 저빈도 단어의 재인 시간이 길어짐. – 사람의 경우 특정 접두사로 시작하는 어절의 생산성이 매우 높음 심성어휘집의 한국어 어절의 표상 구조 (1/3) 한국어 어절 재인 현상을 설명할 수 있는 어절 표상 구조 제안 – 학습자의 학습량에 따른 음절 및 어절 빈도에 따라 정렬된 TRIE 사전 구조 – 어절의 빈도, 길이 효과, 접두 어절의 생산성의 설명 가능 – 한국어 학습자의 어절 및 형태소 학습 원리 설명 – 한국어 어절정보처리의 이중모형 제안

17 한국어 어절 정보처리 모형 (2/3)

18 심성어휘집의 한국어 어절의 표상 구조 (3/3) ㅎㄷㄴㄱㅅㅇㅏㅗㅕㅇㅗㅏ Fil ㅇㄱㄴㄱㅈㅅㅂㅁㅅㄱㄹㅏㅕㅣㅗㅇㅈㅁㄹㅛㅓㅠ FIL ㅁㄴ … ….…. ㅏ ….….….….….…. 탐색시간삽입삭제어절의 생산성빈도효과길이효과 B-tree 빠름용이 XXX Hash 매우 빠름어려움 XXX FST 매우 빠름어려움 XXX TRIE 빠름용이 OXO 제안된 TRIE 빠름용이 OOO 기존 전자 사전구조와 제안된 사전 구조간의 비교


Download ppt "인지신경기반 한국어 정보처리 모형 개발 남 기 춘 고려대학교 심리학과. 연구 목표 연구개발의 최종 목표 - 인지신경과학 연구에 따른 형태소 와 구문정보처리 자료를 기반으로 정상 뇌와 손상 뇌 모형을 구축하고, 교육과 언 어재활을 위한 한국어 형태소 및 구문 분 석 /"

Similar presentations


Ads by Google