“여론 조사 기관 예측과 달리 왜 트럼프가 대통령으로 당선되었을까?”
“구글은 어떻게 트럼프의 당선을 알고 있었을까?”
구글 트렌드를 통해, 대선 전 일 년 동안 트럼프와 힐러리의 구글 키워드 분석 결과를 살펴보자.
놀랍게도 다른 기관과는 달리 트럼프가 압도적으로 검색률이 높았다. 즉, 기존의 설문 조사 방식이 아닌 키워드 검색을 활용했다면 정확히 예측을 할 수 있었다는 소리다.
놀랍게도 다른 대통령 선거에서 역시 키워드 검색을 통한 예측이 맞아 떨어졌다. 역대 미국과 한국의 대통령 선거 기간을 중심으로 키워드 검색을 비교해 보면 놀라울 정도로 정확하다는 결론을 내릴 수 있다.
이와 같이 전통적 데이터 관리 및 분석 방식은 이미 폐기되어가고 있었다. 다만 폐기되어 감에도 우리가 그 사실을 몰랐을 뿐이다. 한편 이와 같이 기존의 방식이 빛을 잃고 새로운 방식이 영향을 미치게 된 것은 빅데이터라는 거대한 산물이 있었기 때문이었다. 놀랍게도 이 빅데이터는 우리가 그 동안 소셜미디어에 열심히 쌓아 놓은 것들이기도 하다.
--- p.27「구글은 트럼프 당선을 알고 있었다」중에서
세상에 존재하는 모든 정보는 크게 “보이는 것”과 “보이지 않는 것”으로 나뉜다. 이중 보이는 것은 “표현이 가능한 정량적 정보”고, 보이지 않는 것은 “표현이 어려운 정보로 직관적/통찰적인 정보”라 할 수 있다.
한편 이 두 가지를 빅데이터로 다시 구분해 보면. 보이는 정보는 가공을 통해 컴퓨터에 저장할 수 있는 빅데이터고, 보이지 않는 정보는 뇌 빅데이터로 구분할 수 있다.
인공지능은 한마디로 인간의 두뇌를 대신하기 위해 만들어진 컴퓨터라고 할 수 있다. 그리고 빅데이터는 구글이나 유튜브 등 소셜 미디어에 축적된 거대한 데이터베이스라고 할 수 있다.
그리고 여기서 빅데이터와 인공지능과의 관계가 얼마나 긴밀한지를 파악할 수 있다. 빅데이터는 말 그대로 기억하고 있는 커다란 정보의 일종인 데이터베이스인데, 만약 아무리 거대한 정보가 있다고 하더라도 인출하여 사용할 수가 없다면 무의미해질 것이다. 그만큼 빅데이터와 인공지능은 떼려야 뗄 수 없는 관계이며, 이 둘이 완벽한 협업을 이룰 때 그 능력을 제대로 발휘할 수 있게 된다.
그렇다면 빅데이터 분석의 목표는 무엇일까? 위에서 잠시 언급했듯, 미래 예측이다. 미래를 정확히 예측해서 회사의 경영이나 개인, 사회의 미래에 도움이 되는 것을 목표로 삼고 있는 것이다
여기서는 데이터 분석방법의 발전 상황을 조금 더 자세히 살펴볼 필요가 있다. 그 과정에서 인공지능의 급속한 성장 배경인 딥러닝이 탄생했기 때문이다.
--- p.45「빅데이터 이해하기」중에서
수만 년 전 원시시대의 인류는 자연 앞에 놓여진 힘없는 동물에 불과했다. 그러나 인간과 다른 동물 간에는 비교할 수 없는 커다란 차이가 있었다. 그것은 바로 사고하는 능력의 유무였다. 이 능력은 인간만이 가지고 있는 것이었다.
결국 인간인 호모사피엔스는 사고하는 능력과 의사소통을 위한 언어의 사용으로 생태계의 최고봉에 오를 수 있었다. 그렇게 역사 속에서 가혹한 상황이 이어지는 동안에 살아남은 “종”은 신체적 능력이 뛰어난 동물이 아닌 지적인 역량을 가진 인간이었다.
한가지 더 언급하자면, 인간은 동물의 종도 변화시켜 나갔다. 5만 년 전 당시까지만 하더라도 인류는 미미한 존재였고 대다수는 야생 동물이었다. 그러나 앞서 말했듯이 인간은 생존하기 위해서 인위적으로 많은 종을 멸살시키고 자연을 파괴했다. 그 결과 오늘날 인간은 지적인 사고능력으로 다른 종을 능가하게 되었고, 인간이 만든 새로운 창조물인 가축 역시 7억 톤에 해당하게 되었다.
--- p.65「인류의 발달 과정」중에서
인공지능 시대는 흔히 약한 인공지능시대와 강한 인공지능 시대로 구분된다. 약한 인공지능 시대는 인간의 개입 아래 인공지능이 작동하는 상황으로 인공지능이 알아듣고, 이야기하고, 글을 읽고 쓰는 정보 조합이 이루어지는 때라 할 수 있다. 또한 이해하는 것을 사람과 비슷한 수준으로 수행하는 것 역시 이 시대에 해당한다. 그런데 이 정도의 기술은 향후 1~20년 안에 가능해질 전망이다. 그리고 이에 따라 인류는 직업이 사라지는 커다란 변화에 봉착하게 될 것이다.
반면에 강한 인공지능시대는 흔히들 사람들이 두려워하는 인공지능의 시대를 의미하는데 인간의 개입 없이 인공지능이 스스로 작동되는 상황을 말한다. 여기에 해당되는 역량은 약한 인공지능 기능과 독립성, 자아, 정신, 자유의지까지를 다 포함하는데 이 시대가 도래하면 인간은 인공지능에게 지시하는 능력, 의결권을 빼앗기게 될 것이다. 그나마 이 시기 인간의 마지막 대처 방법은 매트릭스, 마이너리티리포트의 영화처럼 인공지능과 두뇌를 합쳐야만 한다. 이것이 아니면 사실상 답이 없다.
--- p.99「강한 인공지능과 약한 인공지능」중에서
또 한편으로 기억의 변화에 대해서도 살펴볼 필요가 있다. 인터넷 시대가 도래하면서 우리는 거의 모든 것을 데이터로 남기게 되었다. 말 그대로 “망각을 망각한 시대”에 살게 된 것이다.
그런데 인공지능 시대가 오면 이 현상은 더욱 심각해질 것이다. 기계 기억의 진화는 상상을 초월할 정도로 빨라질 것이기 때문이다. 그러나 우리 인간은 잊혀질 권리를 갖고 있기에 망각 시스템 작동이 필요하다.
어쩌면 인공지능 시대에는 인간과 인공지능을 대상으로, 새로운 인종차별이 생겨날 지도 모른다. 어느 순간 인공지능 개발자들은 인간을 속이는 기계를 만들게 될 지 모르며, 기계에만 있는 특별한 지능으로 인해 새로운 차별에 직면하게 될 수 있다는 것이다.
고대 로마시대의 경우, 노예에게 일을 주고 시민들은 반 이상 실업자가 되면서 중산층이 몰락하게 되었다. 동시에 콜로세움을 세워 잔인한 경기를 하며 목욕탕 등과 같은 엔터테인먼트 문화가 자리잡게 되었다. 어쩌면 미래에도 우리는 모든 일자리를 인공지능에게 넘겨주고, 기본소득 300만원을 받으며 정신적 위로만을 위해 일하고 있을지 모른다. 혹은 엔터테인먼트에 치중하면서 살고 있을지도 모른다. 특히 섹스 인공지능 기계가 개발되는 등, 사람의 감정을 기계가 대신할 수 있는 엔터테인먼트 산업도 무시 못 할 커다란 시장이 되어있을지 모른다.
--- p.146「우리의 미래」중에서
그렇다면 이러한 뇌 빅데이터는 어떻게 만들어 질까? 우리의 뇌에 있는 정보를 다시금 살펴보자.
앞서 세상에 모든 정보는 크게 보이는 것과 보이지 않는 것으로 나뉠 수 있다고 했다. 실제로 보이는 것은 약 5%고, 보이지 않는 것은 95%로 세상에 보이지 않는 것이 보이는 것보다 더 많이 존재하고 있다. 이 두 가지의 데이터의 양은 비교가 안될 정도로 차이가 난다. 이런 이유로 뇌 빅데이터의 세계는 무궁무진한 가능성을 가지고 있다.
한편 뇌 빅데이터는 정보를 찾고 생각하는 것을 반복하다가 일정한 패턴으로 우리 뇌에 저장되는 과정을 통해 형성된다. 그리고 이러한 일정한 패턴이 쌓이게 되면 우리 뇌의 데이터에서 순간적 산출이 이루어지게 된다.
--- p.164「뇌 빅데이터는 어떻게 만들어질까?」중에서
미래를 만들어 간다는 것은 자칫 오만한 생각으로 판단될 수 있다. 그러나 다시 생각해 보면 내가 오늘 선택하고 행동하고, 생각한 모든 것은 미래에 영향을 미치게 된다. 다시 말하면 미래를 만들어 가는 것이 현실에서 충분하다는 것이다.
--- p.181「미래를 만들어 가는 두 가지 방향」중에서