Work Progress ’08.11.12 나소라, 윤민
문서 요약 문서를 요약하는 방법 글을 읽으면서 글의 흐름을 따라서 의미적 단락을 나눔 각 단락의 주제를 파악 중요하지 않은 단락의 주제를 요약에서 탈락시킴 문제 정의 문서의 의미적 흐름을 어떻게 파악할 것인가 나누어진 단락에 대한 주제를 어떻게 도출할 것인가
고찰 한국어의 문장 해석 단어의 위치보다 조사의 활용이 문장의 의미와 관련이 깊음 조사를 통해 단어 간의 관계 파악 ‘나는 밥을 먹는다’ = ‘밥을 나는 먹는다’ ‘나는 밥을 먹는다’ ≠ ‘나는 밥도 먹는다’ 조사를 통해 단어 간의 관계 파악 단어 간의 관계를 도식화 문장의 의미를 도식화
Main Idea 조사를 통해 단어를 추출 문장 내 단어 관계 도식 문장 간 관계 도식 주격 조사 : ‘은, 는, 이, 가’ 목적격 조사 : ‘을, 를’ 소유격 조사 : ‘의’ 서술격 조사 : ‘이다(인), 하다(한)’ 문장 내 단어 관계 도식 주어와 동사의 관계 동격으로 판단하여 실선으로 표시 목적어와 동사의 관계 종속관계로 판단하여 목적어 방향 화살표로 표현 소유격의 경우 앞 단어가 뒤 단어에 종속되는 관계로 표현 문장 간 관계 도식 문장간 단어가 같은 경우는 파선으로 표현
Example 간난아기가 두 개의 머리를 가지고 태어났다. 그것은 한 사람으로 셀 수도 있다. 아니면 두 사람으로 셀 수도 있다.
Example 전체 문장의 도식화
Example 전체 문장의 도식화
주제문 도출 문장 관계 도식을 이용한 문장 도출 파선으로 연결 되어 있거나, 하나의 단어에 대해 종속 관계인 문장은 축약 축약된 문장을 제외하고 남은 문장을 주제문으로 선정 같은 단어를 가지거나 지시대명사나 지시형용사로 꾸며진 문장의 경우, 파선을 연결 각 문장마다 연결된 파선의 수를 구하여, 가장 많은 연결 수를 가진 문장을 도출하 여, 기준 문장으로 선정 두 문장 사이의 연결이 많을 경우, 비슷한 문장으로 판단하여 두 문장 중 총 연결 수가 적은 문장을 요약에서 제외 기준 문장과 연결된 문장 중에서 기준 문장과의 연결을 제외한 연결의 수가 많은 문장을 다음 요약 문장으로 선정 위와 같은 단계를 기준문장으로 돌아오거나, 연결 문장이 없을 때까지 반복
Example 연결의 수가 가장 많은 ⑤번 문장을 기준 문장으로 선정한다. ⑤ 문장과의 연결이 많은(2회) ④, ⑦ 문장은 요약에서 제외한다. 기준 문장과 ‘머리’라는 단어로 연결된 ① 문장을 다음 요약 문장으로 선정한다. 그 다음 ① 문장과 연결된 ② 문장을 다음으로 선정한다. 그 다음 ② 문장과 연결된 ⑥, ⑧ 문장 중 문장 순서가 먼저인 ⑥ 문장을 다음 문장으로 선정한다. 더 이상의 연결이 없으므로, 문장 선정을 완료한다.
Example 문장이 하나뿐이므로, 더 이상의 요약을 하지 않는다.
Example 연결의 수가 가장 많은 ⑩, ⑪ 문장 중 한 문장을 기준 문장으로 선택한다. ⑩ 과 ⑪사이의 연결 수가 3이므로, 문장 순서가 먼저인 ⑩을 기준 문장으로 선정하고, ⑪을 요약 문장에서 제외한다. 기준 문장에서 연결 단어를 제외한 다음 연결의 수가 가장 많은 ⑫와 ⑬ 중 문장 순서가 먼저인 ⑫을 다음 요약 문장으로 선정한다. ⑫과 연결된 ⑬을 다음 문장으로 선정한다. ⑬은 기준 문장과 연결이 가능하므로, 더 이상의 요약문 선정을 하지 않는다.
요약 결과 가. ① 간난아기가 두 개의 머리를 가지고 태어난다. ② 그것을 한 사람으로 셀 수도 있다. 아니면 두 사람으로 셀 수도 있다. ⑤ 만약에 다른 한 쪽 머리가 비명을 지른다. ⑥ 그러면 한 사람이다. 나. ③ 탈무드에 제시된 답은 간단하고 명쾌하다. 다. ⑩즉 이스라엘에 있는 유태인이 박해를 받았다. ⑫그 얘기를 듣고 자기 자신도 고통을 느끼고 비명을 지른다. ⑬그러면 그는 유태인이다.
Class 구성 Class w_node //단어에 관한 클래스 { … char* data; //실제 데이터 int speech; //품사(enum으로 정의) Connect* con; //단어 관계에 대한 정의 } Class T_node //각 문장에 대한 클래스 w_node* root; int id; // 문장 번호 Struct Connect { … int type; //관계 정의(종속, 주종…) w_node *next; //다음 문장 주소값 }
Work Schedule Mon Tue Wed Thu Fri Sat Sun 11/10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 12/1 2 3 4 5 6 7 8 9 10 구현 구현 구현 소스 통합 Debugging Debugging