한국어 어휘의 특징 1 전체적 조망 한국어 어휘와 표현 2019. 3. 27.
어휘의 개념 어휘(語彙, vocabulary): 단어들의 집합. 한 언어의 단어들 전체를 의미할 수도 있고, 어떤 기준에 따라 한계가 그어진 단어들의 집합을 의미할 수도 있다. 한국어 어휘는 고유어와 외래어로 이루어져 있다. (한국어 단어들 전체) 이문열은 매우 풍부한 어휘를 구사한다. (특정 기준에 따라 한계가 그 어진 단어 집합) ‘어휘’를 ‘단어’와 혼동하지 않도록 주의할 것
기원에 따른 한국어 어휘의 분류 고유어: 한국어에 기원을 둔 단어 외래어 한자어: 한자를 바탕으로 하여 만들어진 단어 광의: 외국어에 기원을 둔 단어. 외국어에 기원을 두고 있으나, 한국어 어휘 체계 내에 들어와 한국어 문장 속에서 자 주 쓰이는 단어. 협의: 광의의 외래어에서 한자어 제외 한자어: 한자를 바탕으로 하여 만들어진 단어 중국제 한자어, 일본제 한자어, 한국제 한자어 귀화어: 본래 외래어였으나 고유어화한 것. lamp(영)→남포, kutsu(일)→구두 혼종어: 고유어, 외래어, 한자어 중 둘 이상이 섞여 있는 것
한자어인가 외래어인가 중국어식 발음인가 한국어식 발음인가 한자어는 기타 외래어와 좀 다르다. 중국에서 만들어진 단어가 음성을 매개로 하여 한국어에 들어온 것은 한자어가 아니라 외래어/차용어. 예: 쿵후, 지단, 우롱차 한국 한자음대로 발음되는 것은 한자어. 한자어는 기타 외래어와 좀 다르다. 광의의 외래어에 포함되기는 하나 다른 언어에 기원을 둔 외래어와 차별되는 특별한 면이 있다. 별로 외래어처럼 느껴지지 않는다.
한자어에 대한 바른 이해 한자라는 문자가 중국에서 만들어진 것은 사실이나, 동아시아 여러 나라에 확산되어 널리 쓰였음. 중국만의 것이 아님. 한자가 일찍이 한반도에 들어와, 그 발음이 한국어의 음운체계 에 맞게 변용되었음(한국 한자음). 한국어 화자들이 주체적으로 한자를 이용하여 다양한 단어를 만들고 한국 한자음대로 발음하면서 사용해 왔음. 이미 오래 전에 한국어에 들어오거나 한국에서 만들어져서, 오 랫동안 한국어의 일부로서 사용되어 왔기 때문에, 한국어의 어 엿한 일부임.
사용되는 시대에 따른 분류 옛말/고어: 예전에는 사용되다가 현재는 사용하지 않는 단어 현대어: 현재 사용하는 단어 死語: 이미 전혀 사용되지 않게 된 단어 쇠퇴어: 점차 사용이 줄어들어서 사어화하고 있는 단어 현대어: 현재 사용하는 단어 예전에 사용되었든 안 되었든 현재 사용되는 단어는 모두 포함 신어/신조어: 최근 새로 생겨난 단어
사용되는 지역에 따른 분류 방언: 특정 지역에서 사용되는 말 표준어: 국가에서 표준으로 정한 말 cf. 북한의 문화어 사투리: 여러 방언 중 표준어 이외의 방언 북한어: 남한에서는 안 쓰고 북한에서만 쓰는 말 북한에서는 말다듬기(순화)를 통해 많은 외래어/한자어를 고유어화하였음. 연변말: 중국 연변 조선족만 쓰는 한국어 단어 고려말: 중앙아시아 고려인만 쓰는 한국어 단어
위상에 따른 분류 전문어 대 일반어 비속어(slang): 속어와 비어로 구분하기도 전문어: 특정 전문영역에서 특별한 의미로 사용되는 단어 일반어: 전문어가 아닌 단어. 일반인의 일상생활에서 사용되는 단어 cf. 직업어: 특정 직업에서 많이 사용하는 단어 비속어(slang): 속어와 비어로 구분하기도 머리/대가리, 새끼, 년 상말(상스러운 말), 욕설 완곡어: taboo시되는 것을 직접 가리키는 것을 피하기 위해 사 용하는 우회적 표현 죽다/돌아가시다, 변소/화장실, 신체부위 관련 완곡어
위상에 따른 분류 은어: 특정 집단에서만 쓰는 단어 여성어: 여성만 쓰는 단어나 표현 청소년 은어: 담탱이, 야자 심마니 은어: 심, 심보다 여성어: 여성만 쓰는 단어나 표현 어머(나), 에그머니(나), 호호, 어쩜, 얘, -수/우, -은/는 거 있지 궁중어: 궁중에서만 쓰는 단어. 특히 임금 관련 단어 수라, 거둥(擧動), 용안(龍顔) 유행어: 일시적으로 유행하여 쓰이는 말
수준/등급별 어휘 기초 어휘(basic vocabulary) 기초 어휘와 기본 어휘를 구분하기도 어느 언어에나 거의 비슷한 의미로 존재하는 가장 기초적인 단어들 친족 어휘, 수사, 기본색채어, 기초동사, 인간의 생활에 친숙한 동식물 명 등 약 200개 정도 기초 어휘와 기본 어휘를 구분하기도 초급어휘, 중급어휘, 고급어휘로 구분하기도
의미영역에 따른 분류 친족 어휘 색채 어휘 의성의태어 이동 동사 자세 동사 동물 어휘 식물 어휘 지형지물 어휘
한국어 어휘 체계에 대한 계량적 검토 국립국어원, “표준국어대사전 연구 분석” 참고 주의사항 “표준국어대사전”은 약 50만 단어를 포함하는 대사전임. 이 속에는 옛말, 방언, 북한어, 비표준어(~의 잘못), 전문어도 다수 포함 되어 있음. 현재 일상생활에서 거의 쓰지 않는 단어(특히 한자어)도 다수 포함되어 있음. 한국어 어휘 체계를 진정으로 대표한다고 보기는 어려움.
다른 자료와의 비교 중사전에 대해 비슷한 검토를 해서, 수치를 비교해 볼 필요가 있음. “연세 한국어 사전”은 약 5만 단어가 수록되어 있어, 이런 작업을 하기에 적합함. 외국어의 비슷한 자료와 비교하여, 한국어 어휘 체계의 계량적 특 징을 알아볼 필요가 있음.
연세 한국어 사전의 품사별 통계 품사 주표제어 수 백분율 명 30772 62.0904 동 9359 18.8842 형 2899 5.84948 부 2402 4.84665 어미 932 1.88055 관 925 1.86642 준꼴 584 1.17837 접미 368 0.742534 의 314 0.633575 형성 204 0.411622 조 197 0.397498 접두 174 0.35109 감 159 0.320823 대 107 0.2159 수 86 0.173527 조동 36 0.0726392 자모 30 0.0605327 조형 11 0.0221953 조음소 1 0.00201776 계 49560 100 연세 한국어 사전의 품사별 통계
어휘 총수의 비교 표준 연세 OED 日本国語大辞典 총수 50만 5만 50만~60만 비고 북한어, 방언, 옛말, 비표준어 포함 전문어 22만 포함 고유명사 상당수 포함 중사전 전문어 미포함 포함하면 100만 넘음 초판은 45만
한국어 어휘 50만의 허구성 선진국의 대사전은 책수가 13~30권 정도 표제어 수는 50만 정도 국립국어원에서 ‘표준국어대사전’을 만들 때, 선진국 대사전의 표제어 수를 모델로 삼은 듯. 이 50만을 채우기 위해, 사전에 흔히 싣지 않는 많은 것들을 실 었음. 3책에 단어를 많이 실음으로써, 하나하나의 단어에 대한 설명은 부실하게 됨.
언어사전과 백과사전 언어사전(language dictionary) 백과사전(encyclopedia) 하나의 언어를 이루고 있는 기본 단위인 단어, 관용표현(연어, 숙어, 속 담, 격언)에 대한 지식을 담음. 인명, 지명, 작품명, 사건명은 대개 제외함. 백과사전(encyclopedia) 세상사에 대한 지식을 담음. 사람, 지역, 작품, 역사적 사건 등 포함. 선진국과 달리, 한국의 소위 ‘국어사전’들은 언어사전과 백과사 전의 성격을 겸하고 있음.
語種(기원에 따른 분류) 한자어 고유어 외래어 혼종어 표준 252,278 57.2% 111,156 25.2% 24,019 5.4% 53,141 12.0% 연세 26,075 52.6% 14,545 29.35% 8940 18% 일본어(타입) 14,407 47.4% 11,134 36.7% 2,964 9.7% 1,826 6.0% 일본어(토큰) 170,033 41.2% 221,875 53.8% 12,034 2.9% 8,030 1.9%
일본의 어휘 조사 국립국어연구소에서 1956년 실시 90종의 잡지(1956년 1년치)를 대상으로 약 53만 단어 토큰 수집 이것은 약 4만 단어 타입에 해당 이 중 인명, 지명을 제외하면 약 3만 단어 일본어도 한자어의 비중이 크긴 하나, 한국어만큼 크지는 않음. 타입은 한자어가 많으나, 실제 사용 토큰은 고유어가 더 많음
계량적 분석을 통해 드러난 한국어 어휘 체계의 거시적 특징 한자어가 차지하는 비중이 크다. 일본어도 한자어의 비중이 큰 편 영어도 프랑스를 통해 들어온 라틴계 어휘의 비중이 큰 편 형용사와 부사의 비중 유럽어에 비해 형용사는 적은 편 유럽어의 관계 형용사가 없음 유럽어에 비해 부사는 많은 편 의성/의태 부사가 많음
계량적 분석을 통해 드러난 한국어 어휘 체계의 거시적 특징 한자어 명사에 ‘하다’나 ‘되다’를 붙여서 만들어진 동사나 형용사 가 매우 많다. 외래어 동사가 한국어에서 동사로 쓰일 때에도 ‘하다’나 ‘되다’가 붙음. 한자어 어근에 ‘-이’, ‘-히’가 붙어서 만들어진 부사가 많다. 한자어 어근에 ‘-적’이 붙어서 만들어진 말이 많다. 상징 어근에 ‘-거리다‘, ‘-대다’, ‘-이다‘, ‘-하다’가 붙어서 만들어 진 말이 많다. 상징 어근 중첩형 부사가 많다: 펄럭펄럭, 졸졸, 줄줄, 뱅뱅, 빙빙
계량적 분석을 통해 드러난 한국어 어휘 체계의 거시적 특징 의존명사가 많다. 1061개 의존명사의 종류 일반 의존명사: 것, 데, 줄, 수, 놈, 이 단위 의존명사 도량형 단위 의존명사: 미터, 킬로그램, 리터 수 분류사/유별사(numeral classifier)/양사(量詞): 세는 개체의 종류에 따라 달라짐. 비가산 명사 수 분류사: 잔, 병, 컵 가산명사 수 분류사: 명, 마리, 그루, 송이, 대, 장, 자루 도량형 의존명사, 비가산 명사 수 분류사는 대부분의 언어에 존재 하나 가산명사 수 분류사는 일부 언어에만 존재함.
분류사의 의의 명사가 남성/여성(/중성)으로 나뉘는 性(gender)이 존재하는 언어 와 수 분류사가 존재하는 언어는 상보적 분포를 이룸. 특정 언어에서 분류사가 명사를 분류하는 양상은 그 언어 사용자 의 문화/세계관을 반영할 수 있음. Dyirbal의 분류 체계 인간 남성, 비인간 유정물 인간 여성, 물, 불, 싸움, 기타 위험한 것들 살코기 이외의 음식 나머지