Presentation is loading. Please wait.

Presentation is loading. Please wait.

Morphological organization - The Low Conditional Entropy Conjecture - F. Ackerman & R. Malouf 2016년 4월 27일 수요일 이찬영.

Similar presentations


Presentation on theme: "Morphological organization - The Low Conditional Entropy Conjecture - F. Ackerman & R. Malouf 2016년 4월 27일 수요일 이찬영."— Presentation transcript:

1 Morphological organization - The Low Conditional Entropy Conjecture - F. Ackerman & R. Malouf
2016년 4월 27일 수요일 이찬영

2 엔트로피와 정보이론 자연과학적 정의: 자연 물질이 변형되어 다시 원래의 상태로 환원 될 수 없게 되는 현상/가능성. 에너지를 ‘유용한 에너지’와 ‘사용 불 가능한 에너지’로 나눌 때, 전체 에너지에서 차지하는 사용 불가능 한 에너지의 비율. 정보이론적 정의(Shannon 1948): 불확실성으로 인해 필요한 정보의 양. 동전던지기에서, 앞면과 뒷면이 나올 확률을 모른다면 불확실성의 정도가 높고 따라서 엔트로피 또한 높음. 반면 특정 면이 나올 확률 을 알고 있다면 불확실성의 정도가 낮아지게 되고 엔트로피는 감소. 굴절 패러다임 연구에서 정보이론의 개념을 가져와서, 어떤 패러다 임의 특정 칸에 대한 불확실성을 엔트로피로 정량화함으로써 패러 다임 내 칸들 간의 차이, 또는 패러다임 간의 차이를 기술하는 것을 목적으로 함.

3 패러다임 칸 엔트로피 X(x1, x2, ... xn)의 불확실성의 총합, 즉 해당 형태에 대한‘놀람의 정도’를 엔트 로피 H(X)로 나타낼 수 있음. 주어진 칸에 올 수 있는 대안이 많고 각각의 출현 가능성이 고르게 분포되어 있다면, 어떤 특정 실현형의 불확실성(또는 놀람)의 정도가 높다고 할 수 있 으며 엔트로피 또한 높음. 엔트로피 H(X)는 p(xi)에 확률을 대입하여 계산하며 bit 단위로 산출됨. 동전던지기 확률에 따른 엔트로피

4 패러다임 칸 엔트로피 각 패러다임에서 특정 칸 c의 엔트로피를 구한 후에 형태통사적 자질별로 묶을 수 있 으며, 이들을 합산하여 평균을 구하면 이 값이 해당 패러다임의 엔트로피가 됨. 엔트로피의 평균값은 화자에게 있어서 어떤 어휘소의 곡용 양상에 대해 가질 수 있는 정보의 양을 뜻함 bit는 곧 ≈3 개의 대안 집합 가운데서 선택할 수 있다는 것을 의미함. 즉, 중세 그리스어의 명사 패러다임은 8개의 곡용 부류를 가지고 있지만, 실제로 화자 가 특정 단어형의 실현을 위해 선택해야 하는 경우의 수는 3가지 정도에 불과함.

5 조건부 엔트로피 화자가 새로운 단어형을 산출하기 위해서는 해당 어휘소의 단어형 중 적어도 하나 를 알고 있어야 함. 이때 기존에 알고 있는 단어형은 새로운 단어형의 산출 확률에 영향을 줌. 조건부 엔트로피(conditional entropy) H(Y|X) : X의 자질값을 알고 있는 상태에서의 Y 자질값에 대한 불확실성. H(GEN.SG|ACC.PL) = bits → 어휘소의 대격복수 형태를 알고 있는 상태에서 속격단수 형태를 예측할 때의 대안집합(20.594=1.188)은 대격복수 형태 정보를 모르는 상태(22.156=4.312)에서보다 적음. 패러다임 전체에 대한 조건부 엔트로피를 구한 후 이들의 평균을 구하면 평균 조 건부 엔트로피 H(P)가 산출되는데, 이 값이 곧 그 언어의 굴절 패러다임에 대한 통 합 복잡성(I-complexity)를 나타냄.

6 관련 이론과의 비교 Chiquihuitlan Mazatec(CqM): 세 가지 차원의 굴절(메타 부류)이 복합적으로 나타남.
Cartairs-McCarthy의 synonymy avoidance principle 접사 첨가와 어기 변동의 양상을 독립적으로 파악하여 각각 따로 기술하는 이론(접사 첨가: 통합관계 / 어기 변동: 계열관계). 따라서 이 언어와 같이 접사 첨가와 어기 변동이 동시에 적용됨으로써 형태통사적 자질을 나타내는 경우에는 통합적 설명이 어렵다는 문제가 발생함.

7 관련 이론과의 비교 Stump & Finkel의 ‘주요형(principal parts)’
어휘소 패러다임 내의 다른 단어형을 예측하는 데 유용한, 특징적인 부분. 어떤 단어형이 주요형이 아니라고 해서 특징적 자질을 전혀 가지지 않는 것 이 아님. 다른 칸에 대한 예측자로서의 역할은 정도성을 지니기 때문에, 주요형을 식 별하는 것보다는 새로운 단어형에 대한 예측성을 조건부 엔트로피로 나타내 는 것이 적절함.

8 패러다임 복잡성과 조건부 엔트로피 CqM의 패러다임이 가지는 복잡성의 양상을 정보이론적 접근법으로 기술하 기 위해서는 평균 조건부 엔트로피의 개념이 적용되어야 함. CqM의 패러다임 엔트로피는 4.920으로 매우 높은 데 반해 평균 조건부 엔트 로피는 0.709로 나타남. 이러한 수치는 계산적 복잡성은 높은 반면 통합적 복잡성은 낮다는 것을 보 여줌. 계산적 복잡성(Enumerative Complexity): 형태통사적 자질, 굴절부류의 수, 형 태론적 현저성 등으로 나타나는 통합관계적 복잡성. 통합적 복잡성(Integrative Complexity): 정보이론의 관점에서, 화자가 굴절 패 러다임에 대해 가지는 계열관계적·심층적 복잡성.

9 패러다임 복잡성과 조건부 엔트로피 낮은 통합적 복잡성이 나타나게 된 요인
요인1: 하나의 단어형은 세 가지의 차원에 대한 정보를 동시에 제공함. 요인2: 패러다임 내부와 여러 패러다임에 걸쳐서 syncretism이 빈번하게 나타 남. 요인3: 각각의 단어형들은 함의적 관계를 맺고 있어서 서로에 대해 추론이 가능함. synonymy avoidance principl이나 principle parts 개념으로는 위와 같은 중요한 특징들을 포착해 내기 어려운 반면, 복잡성을 양분하고 (평균) 조건부 엔트 로피로서 통합적 복잡성을 산출해 내면 범언어적으로 나타나는 단어와 패러 다임의 양상을 적절히 해석할 수 있음.


Download ppt "Morphological organization - The Low Conditional Entropy Conjecture - F. Ackerman & R. Malouf 2016년 4월 27일 수요일 이찬영."

Similar presentations


Ads by Google