한 언어의 어휘 속 단어는 다른 단어와 관계를 맺고 있다. 그러한 단어 사이의 관계는 의미상의 관련성이 크기 때문에 그 관계를 의미관계(semantic relation) 혹은 뜻관계(sense relation)라고 부른다. 전통적으로 언어학에서는 동의/유의 관계(synonymy, ‘사랑’-‘애정’, ‘책’-‘도서’), 반의 관계(antonymy, ‘어머니’-‘아버지’, ‘공격’-‘방어’, ‘추위’-‘더위’), 하의 관계(hyponymy, ‘동물’-‘개’, ‘색깔’-‘빨강’), 부분 관계(meronynymy, ‘손’-‘손가락’, ‘책’-‘표지’) 등의 관계가 주로 관심을 받았다.
예로 든 단어들은 모두 명사이지만 동사, 형용사 등 다른 품사에서도 동의/유의, 반의 등의 관계가 성립한다. 예를 들어, 동의/유의 관계로 ‘뛰다’-‘달리다’, ‘아름답다’-‘예쁘다’, 반의 관계로 ‘서다’-‘앉다’, ‘춥다’-‘덥다’, 하의 관계로 ‘주다’-‘선물하다’, ‘하얗다’-‘새하얗다’, 부분 관계로 ‘먹다’-‘씹다’, ‘새콤달콤하다’-‘달다’ 등이 있다. 구조주의 의미론(구조의미론)은 이러한 단어들 사이의 의미관계를 중심으로 전개되었는데(Lyons 1977, Cruse 1986), 의미관계는 특히 Trier(1931)의 장 이론(field theory)의 근간이 되었다.
생성언어학의 의미론이나 형식의미론에서는 단어들 사이의 의미관계, 나아가 어휘의미론 자체가 주요 관심의 대상이 아니었지만, 생성의미론의 어휘 해체나 형식의미론의 의미공준(meaning postulate)을 통해서 어휘의미론이 명맥을 유지했다. 이와 대조적으로, 근래의 인지의미론은 어휘의미론에 매우 큰 관심을 보이고 있으며 단어들 사이의 관계는 중요한 논의의 대상이다(Croft and Cruse 2004, Geeraerts 2010).
의미관계는 전산언어학에서도 중요하게 다루어진다. 워드넷(Wordnet: Miller 1991, Fellbaum 1998) 같은 전산 어휘 데이터베이스는 앞에 언급한 다양한 의미관계로 구성되어 있다. 또한 의미관계, 특히 연상 관계는 심리학과 심리언어학의 관심사이기도 하다. 심리학에서는 일찍이 Jung이 최초로 시행한 단어 연상(word association) 실험이 여러 차례 수행되어 왔다. 예를 들어 Kent and Rasanoff(1910)의 단어 연상 실험에서 ‘chair’에 대하여 ‘table’ ‘seat’ ‘sit’ 등의 순서로 연상이 잘 일어남이 드러났다.
본 연구에서 관심을 가지려고 하는 것은 화제 의미관계에 의한 화제관련어이다. 화제 의미관계는 앞에서 언급한 동의/유의, 반의, 하의, 부분 등의 균질적인 의미관계가 아니다. 그것은 하나의 화제(topic) 속에서 연관되어 있는 단어들 사이의 관계이다. 예를 들어, ‘병원’이 들어가는 화제 속에는 ‘환자, 의사, 치료, 수술, 약, 병, 검사, 응급실’ 등 여러 단어들이 나타날 수 있다. 병원 내에서 활동하는 사람을 가리키기는 단어(‘화자, 의사’), 병원에서 이루어지는 일을 가리키는 단어(‘치료, 수술, 검사’), 그러한 일을 위해 사용되는 사물을 가리키는 단어(‘약’), 병원을 구성하는 부분을 가리키는 단어(‘응급실’) 등 다양한 의미관계의 단어들이 하나의 화제 안에서 ‘병원’과 관계를 맺고 있다. 이러한 관계가 화제 의미관계(topic semantic relation)이고, ‘병원’의 화제관련어(topic-related word)가 ‘환자, 의사, 치료’ 등이다. 화제관련어는 경우에 따라 전통적인 의미관계 속의 단어, 즉 반의어, 유의어, 부분어 등을 포함할 수 있다. 예를 들어, ‘성공’의 화제관련어 중에 ‘실패’가, ‘혼인’의 화제관련어 중에 ‘결혼’이, ‘은행나무’의 화제관련어 중에 ‘잎’이 존재한다.
화제관련어는 심리적인 연상어와 비슷한 것으로 보이기도 한다. 하지만 본 연구에서는 화제관련어는 말 그대로 하나의 화제 속에서 함께 나타나는 단어들이다. 이 단어들이 연상어와 같은 것인지 혹은 얼마나 유사한 것인지는 현재로서는 확정할 수 없지만 그 유사성을 고려할 때 수행 연구의 목적에 따라 화제관련어가 연상어를 대신할 수도 있을 것이다. 연상어와 화제관련어가 얼마나 비슷한지의 문제는 다음의 과제에서 수행하려고 하고, 본 연구에서는 화제관련어에 집중하여 연구하고자 한다.
화제관련어를 추출하는 방법은 하나의 화제 속에서 공기하는 단어들을 찾는 것이다. 하나의 화제는, 텍스트로 보자면, 하나의 화제를 다루는 적절한 텍스트 단위에 존재한다. 하나의 책, 혹은 장이나 절은 어떤 큰 주제에 관한 것이지만 그것의 논의 과정에서 수많은 작은 주제가 나타난다. 따라서 책이나 장은 보다 균질적인 화제관련어를 찾기에는 너무 큰 단위이다.
하나의 화제를 중심으로 균질적으로 구성되어 있는 최소의 텍스트 단위는 문단이다. 문단(paragraph)은 그 정의상 “보통 하나의 주제를 다루는, 글의 한 구분 단위”(Oxford English Dictionary)이다. 여기서 ‘주제’는 ‘theme’을 말하는데 이것은 본 연구의 목적에 따라 ‘topic’ 즉 ‘화제’와 동일시될 수 있다. 따라서 본 연구에서 화제관련어는 한 문단에 같이 나타나는 다른 단어들을 기반으로 발견될 수 있다.
__본문 중에서