인지신경기반 한국어 정보처리 모형 개발 남 기 춘 고려대학교 심리학과
연구 목표 연구개발의 최종 목표 - 인지신경과학 연구에 따른 형태소 와 구문정보처리 자료를 기반으로 정상 뇌와 손상 뇌 모형을 구축하고, 교육과 언 어재활을 위한 한국어 형태소 및 구문 분 석 / 생성 시스템 개발 (1) 정상인과 실어증 환자를 대상으로 형태소 / 구문 정보처리 모형 규명 (2) 언어처리에 관련된 손상 뇌 모형 개발 (3) 대뇌 형태소 및 구문 정보처리 모형에 기초한 전산 모형 개발
연차별 연구 목표 구분연구 개발 목표연구개발 내용 1 차년도 (2001) 언어 이해 / 생성 모형 규명 심성 어휘집의 언어 지식 표상 규명 인간의 형태 ᆞ 구문 분석 메커니즘 규명 인간의 형태 ᆞ 구문 생성 메커니즘 규명 형태 ᆞ 구문에 관련된 대뇌 영역 규명 2 차년도 (2002) 언어 이해 / 생성 계산주의 모형 시뮬레이션 인지신경기반 전자 사전 ᆞ구조 설계 및 개발 계산주의 어절 ᆞ 구문 분석 모형 시뮬레이션 계산주의 어절 ᆞ 구문 생성 모형 시뮬레이션 손상 뇌의 계산주의 모형 시뮬레이션
구분연구 개발 목표연구개발 내용 3 차년도 (2003) 언어 신경 계산 한국어 형태 ᆞ구문 정보처리기 설계 인간의 정보처리 모형에 기반한 전자 사전 구축 인지신경계산주의 어절 ᆞ 구문 분석기 설계 및 개발 인지신경계산주의 어절 ᆞ 구문 생성기 설계 및 개발 연차별 연구 목표
연구범위연구수행방법 ( 이론적ᆞ실험적 접근방법 ) 구체적인 내용 심성어휘집의 언어지식 표상 규명 실험 심리학적 접근 언어표상 이론 체계화 언어처리모형 개발 인간의 형태ᆞ구문분석 / 생성 메커니즘 규명 컴퓨터 시뮬레이션 형태구문의 DB 구축 및 전산화 컴퓨터 시뮬레이션 형태 ᆞ 구문에 관련된 대뇌 영 역 규명 언어영역과 대뇌영역의 상관연구 실어증 환자 인터뷰 및 진단 fMRI/MEG 영상획득 및 판독 연구 범위 및 연구 방법
중의어의 형태소 표상양식 (1/3) 실험 1 : 어근 또는 전체 어절의 여러의 미가 활성화 되는가 일부분만 활성화 되는가 ? 재료 얼굴이 - 전쟁얼굴이 - 연필무관련 적을 - 전쟁적을 - 연필관련 체언용언 결과 실험 2 : 어근이 중의어 이나 어절전체는 한가지 의미를 가지게 될 때 의미 활성화는 어떻게 일어나는가 ? 용언체언 관련쥐어 - 주먹쥐어 - 고양이 무관련밝어 - 주먹실천 - 고양이 * * 결과 * 재료 결론 및 논의 체언과 용언의 의미를 가지는 중의적 어절은 어절전체로 표상되어있음 (full-list) SOA 에 따른 차이를 보임 (1000ms), 실어증 환자들은 서로 다른 결과를 보임
실험 : 복합어의 의미처리는 어절 전체 인가 하위형태소로 분석 후 각각의 의미에 접 근한 후 이루어 지는가 ? 복합어의 형태소 표상양식 (2/3) 전체단어 빈도 앞단어의 빈도 뒷단어의 빈도 대등 종속 융합 신조어 전체 ( 논밭 - 논 ) 부분 ( 논 - 논 ) 통제 ( 숨통 - 논 ) 대등 513(50)481(58)*576(82)** 종속 501(29)468(37)*579(95)** 융합 515(30)478(53)*580(90)** 신조어 526(37)476(34)*591(44)** * 전체조건과 유의미 ** 전체와 부분조건과 각각 유의미 종류예 예 대등 논밭 손발 융합 콩밥 밤낮 종속 장미꽃 앞길 신조어 노래방 국민연금 실험 1 결과 빈도와의 상관 재료 실험 2 결과 반복점화 효과 실험 3 결과 융합복합어의 의미점 화 결론 및 논의 복합어 특히 융합어의 경우 어절전체로 표상되어 처리됨
실험 : 이전 실험에서는 복합어의 의미 처리는 어절전체 인가 하위형태소로분석 후 각각의 의미에 접근한 후 이루어 지는 가에 대한 통제 조건이 없었음 통제 조건 을 추가하여 실험 복합어의 형태소 표상양식 (3/3) 종류예 예 대등 논밭 손발 융합 콩밥 밤낮 종속 장미꽃 앞길 신조어 노래방 국민연금 재료 복합어 특히 융합어의 경우 어절전체로 표상되어 처리됨 전체, 부분, 통제 조건이 유의미하게 차이남. ‘ 논밭 ’,’ 논 ’ 을 다른 단어로 인식. 전체목록 가설 지지 추가실험결과 반복점화 효과 결론 및 논의
동사 선어말어미의 처리 및 표상 (1/3) 연구목적 연구목적 - decomposition 가정이라면, prime 의 선어말어미와 target 의 선 어말어미가 기능적으로 같은 경우 통제조건에 비해 촉진효과가 있을 것임. 연구방법 – LDT 연구방법 – LDT실험조건primeTarget 선어말어미 일치조건덜었니감았다 선어말어미 이형태조건졸았니감았다 통제조건달아라감았다 선어말어미무관, 형태일치조건감식초감았다 연구결과 (150SOA, 750SOA)
연구목적 연구목적 - 동사의 연결어미와 어간간의 표 상의 유형 [decomposition or full-list] 연구방법 연구방법 - lexical decision task실험조건primeTarget 일치조건덜고감고 이형태조건졸아감고 통제조건닫지감고 기능무관, 형태일치장고감고 동사 연결어미의 표상 및 처리 (2/3) 연구결과 및 의의 한국어 동사의 표상 기본 단위에 관한 시사점 [ 어간 ]+[ 어미 ] 보다는 [ 어간 + 선어말어미 ] + [ 어미 ]
동사 피동접사 처리 및 표상 (3/3) 연구목적 연구목적 - 피동사 ( 어근 + 파생접사 ) 의 경우 선행 연구의 ‘ 선어말어미 ’ 의 결과와 유사한지 ‘ 연결어미 ’ 의 결과와 유사한지 알아보고 자 함. 연구방법 – LDT 연구방법 – LDT 연구결과 : 연구결과 : ‘ 선어말어미 ’ 와 유사함. 어 간과 접사가 따로 저장되었다기 보다는 ‘ 어간 + 접사 ” 의 형태로 심성어휘집에 저 장되어 있는 것으로 보인다.실험조건primeTarget 피동접사 일치조건꽂히고감기다 피동접사 이형태조건뺏기고감기다 통제조건삶아라감기다 피동접사무관, 형태일치조건합기도감기다 연구결과 (150SOA, 750SOA)
한국어 용언의 형태소 정보처리 특성 연구목적 : 한국어 용언은 어떠한 형태로 심성 어휘집에 접근하는가 연구방법 : 실험 1> - 규칙용언과 불규칙 용언 39 개, 통제 단어 40 개, 비단어 48 개. 어휘판단 과제. - 정상인 대상 실험 2> - 실험방법은 실험 1 과 동일. - 실어증 및 실행증 환자 YWO, 명칭성 실어증 환자 S 연구결과 정상인은 규칙용언은 어간과 어미로 나누어서 인식 하는 과정과 하나로 인식하는 과정이 혼재되어 있으 나 불규칙용언은 어절을 분석하여 개개의 형태소로 분석하지 않고 어절을 통째로 인식 실어증 환자는 정상인과 다른 결과 보여줌. 특히 이 해성 실어증 환자는 어간이나 어절빈도와 부적상관 을 보이지 않는 것으로 보아 형태소 분석 단계에 문 제가 있는 것으로 볼 수 있다. 실험 1 결과 > 어절빈도와 어간 빈도, 어휘판단시간간의 상관관계분석 실험 2 결과 > 환자 S - 규칙용언으 어절, 어간빈도와 반응시간간에 역관계. 어간빈도와 어절빈도의 효과가 유의미. - 불규칙 용언은 어간빈도와 반응시간간에 역관계, 어간 과 어절빈도의 상관은 두 효과가 유의미하지는 않 았지만 경향성은 있었음 환자 YWO - 어절빈도와 반응시간은 높은 정적 상관관계 (.878), 어간 빈도와 반응시간은 낮은 부적상관관계 (-.053) - 불규칙 용언은 반응시간과 어절빈도, 어간빈도 역관계 어절어간반응시 간 규칙 용언 어절 어간 불규칙 용언 어절 어간
단어 규칙성 효과의 위치 실험 1> 명명과제의 경우 단어규칙성 효과가 심 성 어휘집에 접근할 때 생기는 것인지 명명과제 의 특성상 조음 할 때 생기는 것인지 알아보기 위 함. 결과 > 아이템별 분석에서 음변화만이 유의미 (F (1,29) )=5.4, p<.05). 실험 2> 순수한 점화 - 어휘 판단과제로 심성어휘집에 접근시 규칙성 효과 알아봄 결과 > 피험자 분석에서 빈도 (F (1,46) )=7.962, p<.05), 음변화 (F (1,29) )=6.188, p<.05) 유의미. 관련성과 음 변화간의 거의 유의미한 상호작용 (F (1,29) )=3.694, p<.05). 실험 3> 단어규칙성 효과가 일시적인 것인지 지속적인 것인지 알기 위해서 단어 반복효과 를 이용한 반복명명실험 결과 > 점화자극의 경우 피험자별 분석시에 음변화 (F (1,25) )=6.990, p<.05) 에서 규칙성 효과, 목표단어의 경우 빈도 (F (1,25) )=8.228, p<.01), 음변화 (F (1,25) )=5.030, p<.05) 에서 유의미한 차이 보임. 종합논의 > 한국어에서 단어 규칙성 효과는 심성어휘집에 접근할 때나 조음할 때에 모두 나타나며 그 효과는 지속적인 것으로 보임 고빈도저빈도 음변화 무 475(134)465(134) 음변화 유 478(130)480(137) 저빈도고빈도 관련무관련관련무관련 음변 화 무 627 (104) 635 (116) 625 (108) 633 (107) 음변 화 무 642 (116) 646 (119) 632 (110) 634 (112) 점화단어반복단어 고빈도저빈도고빈도저빈도 음변화 무 532 (80) 535 (85) 523 (80) 518 (81) 음변화 무 539 (94) 552 (101) 527 (84) 530 (98)
한국어 단어산출 및 문장 산출에 관한 대뇌 표상 연구 연구 목적 : 한국어 단어 산출과 문장산출 에 관련된 대뇌 영역 확인 및 비교 연구 방법 : Event-related fMRI ( 과학원 fMRI Center, ISOL forte 3T). SPM99 실험 1 : Picture Naming Task > Control task( 무의미한 도형 보고 의성어 반복하 기 ) 결과 : left Broca’s area(BA 44) dorsolateral prefrontal inferior gyrus(BA 6), bilateral occipital lobe, superior temporal gyrus 실험 2 : Sentence Production Task > Control task 결과 : left Broca’s area(BA 44) dorsolateral prefrontal gyrus(BA 6) are more activated in sentence production than in Picture Naming condition 종합 논의 : 단어 산출과 문장 산출에 관 한 대뇌 영역을 확인할 수 있었음. Picture Naming Task Sentence Producing Task Stimulus
한국어 체언과 용언의 표상구조 연구목적 [ 정상인을 대상으로 체언과 용언 의 의미표상 차이를 추론.] - 연관 연구에 대한 기초 연구 - 컴퓨터 시뮬레이션과의 결과비교 - 체언과 용언의 세부 하위 범주 ( 의 미적, 통사적 ) 의 표상구조 차이 - 연접빈도와 표상구조간의 상관연구방법 - 설문지 구성 - 실험참가자는 해당 문항을 보았을 때 떠오르는 단어를 순서적으로 작성하게 함. 연구결과 및 의의 체언과 용언의 의미표상 구조의 차이 시사
한국어 어절 재인에 관련된 현상 – 한국어 어절의 full-list 표상 구조 – 길이 효과 : 자소 또는 음절의 길이가 긴 단어일수록 재인 시간이 길어짐. – 빈도 효과 : 같은 길이의 어절인 경우 저빈도 단어의 재인 시간이 길어짐. – 사람의 경우 특정 접두사로 시작하는 어절의 생산성이 매우 높음 심성어휘집의 한국어 어절의 표상 구조 (1/3) 한국어 어절 재인 현상을 설명할 수 있는 어절 표상 구조 제안 – 학습자의 학습량에 따른 음절 및 어절 빈도에 따라 정렬된 TRIE 사전 구조 – 어절의 빈도, 길이 효과, 접두 어절의 생산성의 설명 가능 – 한국어 학습자의 어절 및 형태소 학습 원리 설명 – 한국어 어절정보처리의 이중모형 제안
한국어 어절 정보처리 모형 (2/3)
심성어휘집의 한국어 어절의 표상 구조 (3/3) ㅎㄷㄴㄱㅅㅇㅏㅗㅕㅇㅗㅏ Fil ㅇㄱㄴㄱㅈㅅㅂㅁㅅㄱㄹㅏㅕㅣㅗㅇㅈㅁㄹㅛㅓㅠ FIL ㅁㄴ … ….…. ㅏ ….….….….….…. 탐색시간삽입삭제어절의 생산성빈도효과길이효과 B-tree 빠름용이 XXX Hash 매우 빠름어려움 XXX FST 매우 빠름어려움 XXX TRIE 빠름용이 OXO 제안된 TRIE 빠름용이 OOO 기존 전자 사전구조와 제안된 사전 구조간의 비교