1. 의미 빈도의 개념
우리가 일상생활에서 쓰는 낱말이 늘 한 가지 뜻으로만 쓰이는 일도 있지만, 대부분의 낱말들은 맥락에 따라 여러 뜻으로 쓰인다. 즉 다의적이다. 특히, 일상적으로 자주 사용되어, 사용 빈도가 아주 높은 낱말들에서는 이런 다의성이 더욱 두드러진다. 한 낱말이 가지는 온갖 뜻들은 모두 사전에 기술되는데, 사전을 통해서 우리는 어떤 낱말이 어떠한 뜻들을 가지고 있는지는 알 수 있지만, 그 여러 뜻 가운데 어느 뜻이 더 중요하게 또 일상적으로 자주 쓰이는가는 알 도리가 없다.
이 사전에서 말하는 ‘의미 빈도’란, 하나의 낱말에 대해 사전에 기술되어 있는 낱낱의 의미(뜻)들이 제각기 실제로 얼마나 쓰이는지를 조사하여 밝혀낸 사용 빈도수를 가리킨다. 그러므로 이 ‘의미 빈도’는 어떤 낱말이나 뜻들이 제각각 얼마만큼 중요한 비중을 차지하며 쓰이는지를 한 눈에 알 수 있도록 우리에게 보여 주는 정보인 것이다.
의미 빈도를 조사하기 위해서는 말뭉치에 실제로 나타난 모든 용례를 하나하나 살펴 뜻갈래를 새로 세우고 나누어, 그에 따라서 빈도수를 조사하는 것이 이상적이다. 그러나 그렇게 하는 것은 현실적으로 어려움이 너무 크다. 게다가 이미 대규모의 말뭉치 분석을 토대로 한 사전이 있다면 그 성과를 바탕으로 하는 것이 훨씬 손쉬울 것이다.
그런 의미에서 최초의 말뭉치 기반의 한국어 사전인 ??연세 한국어 사전??(연세대 언어정보연구원, 1998)은 의미 빈도 사전 개발에 큰 발판이 되었다. 우리는 ??연세 한국어 사전??의 뜻갈래를 바탕으로 하여 말뭉치의 실제 용례를 구분함으로써, 흔히 주관적으로 흐르기 쉬운 뜻 구분의 기준을 객관화하여 의미 빈도 조사를 성공적으로 실현할 수 있었다.
2. 의미 빈도 사전의 구조
2.1. 올림말
이 사전은 100만 마디(어절)의 한국어 균형 말뭉치(한국어교육 표준말뭉치, 모두 218개 글과 대화의 텍스트) 중 10개 이상의 텍스트에 나타나면서 아울러 그 빈도수가 15회 이상인 낱말들(5,162개)과 그들의 동형어를 올림말로 하고 있으며, 모두 합하여 총 7,203개의 낱말을 수록하였다. 이 낱말들은 먼저 ??외국인을 위한 한국어학습사전??(2004, 2006)과 “韓國語 學習 辭典 編纂과 基本 語彙의 選定을 위한 基礎硏究”(서상규, 2006)에서 제안된 ‘한국어교육 중요 어휘’ 목록을 바탕으로 해서, 의미 주석 말뭉치의 분석에 의해 얻어진 의미 빈도까지 고려하여 최종적으로 정해진 것들이다.
이 가운데 올림말의 품사 표지 옆에 세 자리의 검정과 흰 별의 조합으로 된 표시를 붙인 ‘한국어교육 기본어휘’에는 실질 어휘만(일부 접사 포함) 수록되어 있으며, 조사와 어미는 제3부에서 형태 빈도수와 비율만을 따로 보이기로 한다.
한편, ‘간장1’처럼 ‘한국어 기본어휘’ 목록에는 포함되어 있지만 실제 조사 대상의 말뭉치에서는 수록 기준(10개 이상의 텍스트에서 15번 이상 쓰임)을 충족하지 않는 경우도 있다.
--- 본문 중에서