챗GPT는 챗봇의 일종입니다. 챗봇은 채팅과 로봇의 합성어입니다. 가상의 로봇(프로그램)이 사용자가 원하는 답변을 찾아내고 문장으로 정리해주는 것이죠. 여기서 챗(Chat)은 ‘담소를 나누다, 수다를 떨다’라는 뜻입니다. 일방향으로 로봇이 인간에게 지식·정보를 전달하는 게 아니라 상호 대화라는 과정을 통해 사용자가 원하는 지식에 다가갑니다. 비슷한 예로 검색로봇을 들 수 있습니다. 구글이나 네이버에서 볼 수 있는 검색로봇은 사용자가 알고 싶어 하는 정보의 키워드를 탐색하고 그에 맞는 정보가 있는 웹 페이지를 나열해 보여줍니다. 챗봇은 사용자가 요구하는 정보를 검색해서 찾아오는 과정까지는 검색로봇과 비슷한 기술로 보일 수 있지만, 정보 전달의 형태에 있어서는 ‘대화 형태’를 이용한다는 점이 다릅니다. 즉 사용자와 소통한다는 이야기입니다.
--- p.17~18
사람은 개떡같이 말해도 찰떡같이 알아들을 때가 많습니다. 누군가에게 “청소하세요”라고 지시한다고 가정해봅시다. 시간과 장소만 정해주면 나머지는 사람이 알아서 합니다. 어떤 빗자루를 들어 어떤 방향으로 먼지를 쓸어갈지 일일이 정해주지 않아도 됩니다. 그런데 컴퓨터는 다릅니다. 자동으로 움직이는 것 같은 인공지능도 실은 인간이 세세하게 정해준 순서에 따라 움직이도록 입력된 것입니다. 입력된 사항이 아니라면 구동할 이유가 없는 것이죠. 컴퓨터가 일을 할 수 있도록 세세하게 처리 과정을 정리해놓은 게 ‘알고리즘’입니다. 인간이 설정해놓은 알고리즘에 따라 검색로봇은 정보를 찾고, 챗봇은 답변을 내놓습니다. 그래서 인공지능을 이해할 때 꼭 살펴보아야 하는 것이 바로 알고리즘입니다.
--- p.39~40
‘○○ 조건이 입력되면 △△ 결과로 출력한다’라는 규칙 기반(룰 베이스) 모델은 초기 인공지능의 기반을 다졌습니다. 컴퓨터에 무수히 많은 문장을 입력한 다음 말을 걸면 그 답변에 맞는 결과가 나오는 것이죠. 사용자는 흡사 컴퓨터(인공지능)와 대화를 한다는 착각까지 느끼게 됩니다. 인간이 인간의 창조물과 교감을 하면서 연민과 사랑의 감정까지 느끼는 것입니다. 그리스 신화에서 피그말리온이라는 조각가가 자기 작품과 사랑에 빠지는 것처럼요. 최초의 챗봇 ‘일라이자’에도 이 같은 상황이 벌어집니다. 일라이자는 상대방이 한 말을 되묻는 방식으로 대화를 이끌어갑니다. 오늘날의 시각으로 보면 단순한 형태의 대화이지만 사람들은 그 자체로 위로를 받았습니다. 되묻는 방식이 정신과 의사가 환자와 대화하면서 속마음을 끌어내는 방식이기 때문입니다.
--- p.57~58
규칙 기반, 즉 룰 베이스 기반 챗봇은 사용할 수 있는 어휘의 수가 제한되어 있고(일라이자), 누가 어떻게 말을 가르치느냐에 따라 예상치 못한 논란의 주인공(심심이)이 되기도 합니다. 챗봇을 만든 것도 인간이고, 그 챗봇을 악용하는 것도 인간이 될 수 있다는 이야기죠. 인공지능 기술이 몇 단계 뛰어올랐다고 평가받는 딥러닝에서는 다를까요? 기술이 발전해도 사용하는 사람이 변하지 않으면 인공지능은 악용되기 마련입니다. 특히 챗봇이 여성으로 설정되면 성희롱의 대상이 되기도 합니다. 혐오 발언을 반복적으로 가르치려는 사람들도 있습니다. 결국 인간이 챗봇을 어떻게 생각하고 활용하는가에 따라 챗봇이 내뱉는 어휘와 말의 수준이 달라집니다.
--- p.68~69
가상비서라는 명칭이 더 어울리지만, 챗봇의 역사에서 시리와 구글 어시스트턴트를 빼놓기 힘듭니다. 스마트폰 시대를 맞아 ‘말하는 챗봇’이자 ‘알아듣는 챗봇’으로 우리 일상에 들어왔기 때문이죠. 손을 대지 않고 검색을 하거나 전화도 걸고 라디오나 팟캐스트도 들을 수 있어, 처음 이들 서비스가 나왔을 때 큰 주목을 받았습니다. 시리는 2011년 아이폰4S에 탑재되면서 나왔고, 구글 어시스턴트는 2016년 공개되어 안드로이드폰에 기본 장착됩니다. 이들 서비스가 나온 이후 가상비서 기능만을 따로 떼어놓은 AI스피커가 대중적으로 유행합니다. 가정의 필수품까지는 아니어도 하나 정도는 있어도 괜찮은 기기가 된 것이죠.
--- p.75~76
기계학습은 사람이 규칙을 알려주는 게 아니라, 컴퓨터가 다량의 데이터를 보고 공통점(패턴)을 학습하는 것을 의미합니다. 기계학습의 방법 중 하나가 잘 알려진 ‘인공신경망’입니다. 인공신경망은 인간의 뇌가 사물을 인지하고 판별하는 방식을 그대로 따라 한 기계학습의 방법입니다. 다만 기계학습에는 한계가 있었습니다. 1980~1990년대는 컴퓨터를 학습시킬 수 있는 데이터를 확보하기가 쉽지 않았습니다. 컴퓨터 성능도 부족했습니다. 수많은 데이터를 모으고 이를 분석해 처리할 만한 상황이 되지 않았습니다. 이후 상황이 바뀝니다. 바로 1990년대 들어 인터넷 시대가 열린 것이죠. 수많은 사람들이 각자의 사진과 글을 웹 사이트에 올립니다. 이에 인공지능 연구자들과 기업들은 예전보다 손쉽게 인공지능을 학습시킬 데이터를 얻게 됩니다.
--- p.109~110
챗GPT 등 대화를 생성하는 챗봇은 자연어 이해, 자연어 생성, 대화 관리 등의 고급 기능을 갖췄습니다. 이런 발전은 컴퓨터 성능의 발전과 밀접한 관련이 있습니다. 자연어 처리 기술은 매우 복잡하고 처리해야 할 데이터양이 매우 복잡합니다. 따라서 챗봇의 성능을 향상하기 위해서는 대용량 데이터를 처리하고 복잡한 모델을 구축하는 데 필요한 컴퓨팅 파워가 필수적입니다. 최근에는 대규모 병렬 컴퓨팅을 위한 GPU를 이용한 챗봇 연구가 활발하게 이뤄지고 있습니다. 클라우드 컴퓨팅 서비스를 이용해 대용량 데이터를 처리하는 일과 고성능 리소스를 저비용으로 활용하는 일이 가능해졌기 때문에, 챗봇 개발 및 성능 향상에 관한 연구와 개발이 이뤄지고 있습니다.
--- p.118~119
오픈소스는 이렇게 요약할 수 있습니다. ‘내가 개발한 소프트웨어의 설계도를 공개한다.’ 이 설계도는 많은 사람들이 공유하고 수정합니다. 다수의 개발자가 참여해 소프트웨어를 발전시키는 것이죠. 기업도 오픈소스를 활용해 소프트웨어를 개발합니다. 미리 짜여진 설계도가 있는 덕분에 개발 기간을 단축할 수 있습니다. 오픈소스는 최근 인공지능 발달에 결정적인 기여를 했습니다. 국가 기관이나 대학, 대기업의 전유물이었던 AI 연구를 누구나 할 수 있게 한 것입니다. AI를 개발하는 데 필요한 도구나 프레임워크(Framework)28 등이 공개되면서 전 세계 수많은 개발자가 참여할 수 있게 되었습니다. 20세기 인공지능은 천재적인 수학자와 공학자를 중심으로 발전했습니다. 이와 달리 21세기 인공지능은 평범한 다수의 개발자가 참여해 만든 집단지성의 산물이라고 할 수 있습니다.
--- p.125~126
일라이자나 심심이와 달리 챗GPT는 인공신경망에 기반해 수많은 텍스트 데이터를 학습했습니다. 학습한 데이터가 많다 보니 독보적인 대화 실력을 갖추게 되었습니다. 챗GPT가 기존 규칙 기반 챗봇과 다른 결정적 한 가지를 꼽으라면, 바로 인공신경망 알고리즘을 쓴다는 것입니다. 인공신경망은 우리 뇌의 학습 구조에서 힌트를 얻었습니다. 우리 뇌가 수많은 뉴런으로 연결된 신경망을 통해 정보를 전달받고 처리하는 것을 본 것이죠. 각 뉴런에서 불필요한 정보를 차단하고 필요한 정보만 뇌에 전달하는 것처럼, 인공신경망도 여러 처리 과정을 통해 학습할 데이터의 패턴을 추려냅니다.
--- p.151
1990년대에는 1.5MB 규모의 플로피디스크 한 장으로도 충분히 컴퓨터를 구동시킬 수 있었습니다. 2000년대에는 1GB(약 1,000MB) USB스틱 하나만 있어도 든든했습니다. 당시에는 우리가 사용하는 데이터의 양이 그만큼 적었기 때문입니다. 하지만 그로부터 불과 20년도 지나지 않아 세상은 또 크게 바뀌었습니다. PC, 스마트폰 등이 인터넷과 연결되고 수많은 사물인터넷 서비스가 나오면서 생산되는 데이터 양 자체가 엄청나게 증가했습니다. 이렇게 폭증한 정보를 분석하고 처리하기 위해 나온 것이 바로 빅데이터 분석 기술입니다. 빅데이터의 활용은 인공지능 발달의 자양분 역할을 하는데, 대표적인 결과물이 바로 인공지능 챗봇입니다. 오늘날 챗GPT가 사람이 입력한 문장을 알아듣고 자신이 저장한 지식을 문장으로 전달하는 것도 딥러닝에 기반한 빅데이터 기술 덕분입니다. 인터넷에 쌓인 엄청난 양의 문장 데이터를 학습하고 익힌 덕분입니다.
--- p.163~164
챗GPT는 비영리 AI 연구단체 오픈AI가 공개한 대화형 챗봇입니다. 그림을 그리거나 시를 짓는 등 뭔가를 만드는 행위를 하는 AI라서 ‘생성형 AI’라고 구분 짓습니다. 대화를 생성하는 AI라고 보면 쉽습니다. 오픈AI는 자연어 처리와 대화 등을 위한 AI 언어 모델 GPT를 발표해왔습니다. GPT는 ‘Generative Pre~trained Transformer’의 약자인데 ‘사전에 학습된 생성형 AI’로 풀이할 수 있습니다. 생성형 AI는 사용자의 요구에 따라 결과를 만들어냅니다. 데이터 원본을 통해 학습하면서 패턴을 익히고 (용도에 따라) 소설, 이미지, 비디오, 코딩, 시 등 다양한 콘텐츠를 만들 수 있는 것이죠. 인간이 하는 예술 같은 창조적 활동을 모사할 수 있다 보니 ‘인간에 좀 더 가까워진 AI’로 인식되기도 합니다.
--- p.187~188
챗GPT는 대화형 질의에 자연스럽게 답변할 뿐만 아니라 언어 번역, 콘텐츠 생성, 텍스트 요약 등 광범위한 부분에서 강력한 성능을 보입니다. 예컨대 질문 범위가 과거의 챗봇과는 다릅니다. “파이선으로 ○○○ 부분을 코딩해줘”라든가 “이 코드에서 오류를 잡아줘” 등이죠. 이 같은 질문이 들어오면 챗GPT는 대화체로 답해줍니다. 이전에 검색엔진을 이용할 때와는 다릅니다. 검색 결과로 나온 웹 페이지를 열어본 뒤 글로 다시 정리할 필요가 없는 것입니다. 챗GPT와 대화를 하면서 반복적으로 물어보고 설명을 들을 수도 있습니다. 정보 검색과 지식 습득의 방식이 바뀌는 것인데, 1990년대 후반에 검색엔진이 나타난 이후 최대 변화가 일어날 것으로 보입니다.
--- p.188~189
사용자에게 챗GPT가 환영받는 가장 큰 이유는 다양한 분야에서 활용될 수 있다는 점 때문입니다. ‘AI지만 괜찮아’ 느낌으로 전문가의 컨설팅을 받는 느낌이라고 할까요? 책을 쓰기 전 목차를 구성해달라고 할 수도 있고, 논문을 읽기 전 요약을 부탁할 수도 있습니다. 향후 연구 아이디어를 추천받을 수도 있습니다. 기계가 인간의 육체 노동을 대체했다면, 챗GPT는 ‘인간의 정신 노동 일부를 지원한다’는 표현이 맞습니다. 실제 콘텐츠 제작 분야에서 챗GPT는 지원 수준을 넘어 해답을 제시하는 정도까지 올라섰습니다. 영화, 시나리오, 소설, 노래 가사, 제품 전단지, 광고 대본, 금융 보고서, 제안서 등을 작성할 수 있습니다.
--- p.189~190
앞으로 더 많은 대화형 챗봇이 나와 사람들의 업무를 도울 것입니다. 챗GPT는 더 고도화되고, 비슷한 성격의 서비스가 여기저기서 나오는 것이죠. 구글과 페이스북 등 글로벌 IT기업은 물론 네이버와 카카오 등 국내 강자들도 준비하고 있습니다. 어느 서비스를 선택하든 우리는 지능형 챗봇을 이용하며 살아갈 수밖에 없습니다. 이미 비즈니스 환경은 챗GPT 등 대화형 챗봇이 영향을 미치고 있습니다. 미국 부동산 시장에서는 부동산 중개인들이 챗GPT를 활용해 매물에 대한 설명글을 작성하거나 법률적인 문서를 준비하는 등에 활용하고 있습니다. 프로그램 코딩을 하면서 오류 수정 등을 챗GPT에 요구하는 개발자도 많습니다. 각자 쓰임새와 정도만 다를 뿐 AI 챗봇이 생활필수품이 되고 있는 것이죠.
--- p.288~289
대화형 AI 챗봇의 발달은 ‘생각하는 근육의 소실’과 ‘편중된 지식의 비만’을 초래할 수 있습니다. 맛깔스럽게 가공된 지식은 움직이지 않고도 바로 흡수할 수 있으니까요. 무비판적이기 쉽고 지나친 편견에 빠지기 쉽습니다. 운동 부족과 비만에 시달리는 현대인들을 위해 각종 운동 클럽이 생겨나듯, 대화형 AI 챗봇 시대에는 ‘생각 부족’과 ‘확증편향’에 시달리는 사람들을 위한 클리닉이나 클래스가 많이 생겨나지 않을까 예상해봅니다. AI 시대 건강한 지식생활을 하기 위해서는 생각의 근육을 키워야 합니다. 생각의 근육을 키우는 데는 독서와 함께 ‘자신의 생각을 글로 쓰기’가 효과적이죠. 나와 생각이 다른 이들과 토론하는 것도 생각하는 근육을 자극하는 데 도움을 줍니다. 결국 AI 시대에서 ‘허약하고 나약한 인간’으로 남지 않으려면 스스로 노력하는 수밖에 없습니다. 그래야 AI도 동반자이자 조력자로 온전히 남아 있게 됩니다.
--- p.293