제1장 서 론
1. 신어, 말뭉치 언어학, 사전학
언어 연구에서 ‘신어’처럼 대중적이고도 이론적인 관심을 동시에 받아 온 분야는 드문 듯하다. 새로이 등장한 단어들은 항상 사람들의 이목을 집중시키고, 누군가는 새로운 사물이나 개념을 표현하기 위해, 또 다른 사람들의 관심을 끌기 위해 신어를 만들어 쓰기도 한다. 언어학에서 ‘단어’의 정의가 매우 난해한 것과 마찬가지로 ‘신어’ 역시 한마디로 정의하기는 쉽지 않다. 아니, 단 하나의 정의는 없다고 하는 편이 더 맞을 것이다. 신어의 수집과 연구는 사전 편찬과도 매우 밀접한 관계가 있는데, “사전의 어휘 등재와 기술이 ‘과학(science)’ 아니라 오랜 세기에 걸친 기술(art)”이라는 Aiden & Michel(2014)의 다소 객관적인(?) 평가는 신어의 정의와 범주를 정하는 데 있어서도 정확히 일치한다. 즉 신어의 정의와 범주는 ‘과학’의 만고불변의 진리나 원리보다는 연구자에 따라 다른 관점과 경험을 통해 논의되어 왔고, 연구자 또는 연구의 목적에 따라 상당히 넓은 스펙트럼으로 달리 정의되어 왔다. 신어의 조사 방법론과 범주의 설정 또한 대상 언어와 연구자에 따라 다르며, 신어를 가리키는 용어와 인접 개념 또한 다양하게 기술되어 왔다.
이 책은 지난 수년간 매년 해당 시기의 신어를 수집하고 기술해 온 연구진들의 경험을 통해 실제 말뭉치 기반 신어 추출의 방법론과 쟁점 전반을 상세히 소개하고 있다는 점에서, 특정 주제나 특정 유형 중심의 신어 연구와는 차이가 있다. 2000년대 이후 폭발적으로 증가한 웹 데이터, 웹 장르의 발달과 소셜미디어의 확산, 문자 언어의 실시간성 증가 등은 신어 연구에 새로운 변화를 요구해 왔고, 신어 연구자들에게 난제이자 새로운 기회로 작용해 왔다. 특히 신어를 만들고 향유하는 계층이 전문가에서 대중으로 확장되었다는 점은 향후 신어 수집의 대상과 기술에서 주목해야 할 부분으로 보인다.
이 연구의 특성 및 하위 목적은 다음 세 가지로 요약할 수 있다. 첫째, 이 연구는 대량의 웹 말뭉치를 활용한 말뭉치 언어학과 사전 편찬학의 관점에서 기술되었다. 따라서 연구의 목적 또한 ‘신어’의 연구를 현대 말뭉치 언어학과 사전학적 관점에서 재조명하고, 신어 연구의 최근 동향과 과제를 확인하는 데 있다. 신어는 전통 어휘론에서 ‘개인어’, ‘유행어’, ‘임시어’나 ‘전문 용어’와의 관련성 속에서 논의되어 왔지만, 최근 웹과 모바일 의사소통의 확장으로 사용자 생성 콘텐츠(UGC: User Generated Contents)에서 대두되는 광범위한 비표준 어형의 처리 문제, 사전에 등재되지 않은 미등재어 또는 미등록어(OoV: Out of Vocabulary)의 문제 역시 넓은 범위의 ‘신어’로 논의된다. 더 나아가 최근 언어 데이터 윤리성의 쟁점이 되는 차별 및 혐오 표현은 상당수 새로운 어형으로 시시각각 등장하며 다름 아닌 ‘신어’의 식별 문제와 깊은 상관관계를 가진다. 이 연구는 신어 연구의 외연을 느슨하게 범주화함으로써 신어 연구의 가능성을 폭넓게 모색하고자 한다.
둘째, 이 연구는 신어 조사 방법론의 실제를 소개하되, 국가 주도 신어 조사 사업에서 논의되지 못했던 쟁점들을 소개하는 데 목적이 있다. 지난 수십 년간 수행되어 왔던 국가 주도의 신어 조사 사업은 말뭉치와 웹의 등장, 대용량 컴퓨터와 자연 언어 처리 기술의 활용 등 방법론의 발전을 거듭해 왔다. 이 책에서는 신어 조사 사업 보고서에서 충분히 다루지 못했던 국내 신어 조사 사업의 과정과 더불어 국외의 다양한 언어권의 신어 조사 프로젝트, 사전 기술 방법론 등을 살펴봄으로써, 신어 조사의 대상, 매체, 탐색 방법론 등의 쟁점을 논의하고자 한다.
셋째, 이 책에서 신어는 결국 전문가나 대중이 만들어내는 창조물이고 다름 아닌 ‘언어 사용’의 문제라는 점에서 출발하여, 신어와 사전, 신어의 사회 문화적 의미, 사회·문화, 언어공학, 언어교육, 언어 정책 등 다양한 언어 사용에서의 신어 연구를 논의하고자 한다. 일찍이 Williams(1976)가 ‘문화적 핵심어(cultural keywords)’를 통해, 문화와 사회를 반영하는 어휘를 사전 형식으로 출판한 바 있고, 이러한 연구는 현재에도 주요한 단어의 통시적 의미 변화와 공시적 의미를 연구하는 현대판 ‘핵심어 프로젝트(Keyword project)’로 이어지고 있다. 이러한 맥락에서 이 책에서는 한국어 신어 연구 역시 ‘어휘’나 ‘사전’의 연구를 넘어서 ‘담화공동체’를 해석하고, ‘공동체의 언어’를 분석하는 방향으로 나아가야 함을 논의하고자 한다.
2. 이 책의 구성
이 책은 크게 3부로 총 9개의 장으로 구성되며, I부에서는 신어의 개념과 범주 설정을, II부에서는 신어 조사의 실제를 다루며, III부에서는 신어와 언어 사용의 접점이라는 제목 아래에서 신어의 기술과 활용 전반에 대한 내용을 다룬다. 각 장별 내용을 소개하면 다음과 같다.
2장 ‘신어란 무엇인가’에서는 연구자나 연구 목적, 관점에 따라 달리 논의되어 온 ‘신어’의 정의와 인접 용어를 소개함으로써 연구의 범위를 논의한다. 신어란 무엇인가? 신어란 ‘새로운 말’이다. 양철, 양말, 양복은 처음 만들어졌던 개화기에는 새로운 말이었겠지만 현재는 더 이상 이들을 신어라 하지 않는다. 마찬가지로 2020년 ‘코로나 19’의 대유행으로 생겨난 ‘공적 마스크, 케이(K)방역, 확찐자’는 현재는 신어지만 100년 후에는 새로운 말이 아닐 것이다. 100년 후는커녕 10년 후에조차도 이러한 단어가 여전히 사용되고 있을지는 불분명하다. 이렇게 ‘새로움’을 규정하는 일은 상대적일 수밖에 없으므로 신어 연구자들도 신어를 정의하는 데 저마다 서로 다른 기준을 제안해 왔다.
최근 신어 및 신어 연구가 다시 세간의 주목을 받고 있는 것은 전산언어학 분야의 자연 언어 처리(Natural Language Processing)의 발전과 궤를 같이 한다. 인간에게 신어는 단순히 신선하고 새로운 단어에 불과하지만 자연 언어를 처리하는 과정에서는 신어가 시스템 전반의 운용에 중대한 문제를 일으키는 ‘미확인 단어(unknown words)’가 된다. 이밖에도 신어의 유사 인접 개념으로 임시어, 미등재어, 유행어, 전문어, 은어 등이 있다. 1장에서는 이러한 유사 인접 개념과의 상관관계를 고려하여 신어를 정의하고 분류하는 기준을 제시한다.
3장 ‘신어의 유형’에서는 신어의 유형을 ‘형태적 신어(formal neology)’, ‘의미적 신어(semantic neology)’, ‘문법적 신어(grammatical neology)’로 구분하고, 각 유형의 특성과 연구의 의의를 살펴본다. 형태적 신어는 전통적인 신어 연구에서 주로 다루어온 개념으로, 전통적인 신어 연구에서 신어의 범위를 특정하거나 신어의 조어론적 특성 및 생성 기제를 밝히는 작업을 수행해 왔다. 또 최근에는 대용량의 언어 자료를 활용하여 기계적으로 사전 미등재 ‘형태’를 포착하여 신어를 추출하거나 특정 신어 형태의 시기별 사용 양상을 계량적으로 분석하여 신어의 사용 추이를 살펴보는 연구가 진행되었다. ‘기존의 형태에 의미적 확장이나 축소, 가치 상승과 가치 하락 등의 변화가 일어난 것’이라는 의미적 신어의 개념은 이미 통시언어학 및 의미론 분야에서 다루어 왔으나 신어의 관점에서 조명되기 시작한 것은 최근의 일이다. 신어 연구에서 지금까지 의미적 신어를 본격적으로 다루지 않았던 이유는 ‘의미의 새로움’에 대한 판단이 어렵고, 자연 언어 처리의 관점에서도 의미적 중의성을 해결하거나 자동으로 식별하기 어렵다는 문제점 때문이다.
그러나 신어를 포괄적으로 연구하기 위해서는 새로운 형태의 출현만큼이나 새로운 의미의 출현에도 주목해야 함은 너무나 당연한 일이다. 최근 맥락 모델(context model), 벡터 공간 모델(vector space model), 말뭉치 기반 맥락 분석(corpus-based context analysis) 등 대용량 데이터를 활용하여 어휘 의미의 변화를 포착하는 방법에 대한 논의가 진전되면서 의미적 신어를 체계적으로 탐지하고 식별할 수 있는 방법에 대한 논의도 활발히 진행되고 있다. 이 장에서는 이러한 신어 연구의 외연과 방법론의 변화를 신어의 세 가지 유형을 중심으로 살펴보고자 한다.
--- 본문 중에서