확장메뉴
주요메뉴


소득공제 PDF
빅데이터는 거품이다
eBook

빅데이터는 거품이다

: 대한민국의 빅데이터 유행을 말하다

[ PDF ]
리뷰 총점6.0 리뷰 3건
정가
7,200
판매가
7,200(종이책 정가 대비 40% 할인)
추가혜택
쿠폰받기
{ Html.RenderPartial("Sections/BaseInfoSection/DeliveryInfo", Model); }

품목정보

품목정보
발행일 2016년 10월 13일
이용안내 ?
  •  배송 없이 구매 후 바로 읽기
  •  이용기간 제한없음
  •  TTS 불가능
  •  저작권 보호를 위해 인쇄 기능 제공 안함
지원기기 크레마, PC(윈도우 - 4K 모니터 미지원), 아이폰, 아이패드, 안드로이드폰, 안드로이드패드, 전자책단말기(저사양 기기 사용 불가), PC(Mac)
파일/용량 PDF(DRM) | 7.14MB ?
글자 수/ 페이지 수 약 177쪽?
ISBN13 9791186256428
KC인증

소개 책소개 보이기/감추기

목차 목차 보이기/감추기

저자 소개 관련자료 보이기/감추기

저자 : 김동환
1963년 서울에서 태어났다. 고려대 경영학과를 졸업하고 같은 대학 행정학과에서 석사 학위와 박사 학위를 받았다. 한국전자통신연구원의 연구원을 거쳐 현재 중앙대 공공인재학부 교수로 재직 중이다.

필자는 인공지능, 사물인터넷과 함께 미래 핵심기술로 꼽히는 빅데이터에 대한 열광을 광풍狂風 , 곧 미친 바람이라고 본다. 발본적拔本的 비판이다. 특히나 빅데이터를 활용하면 미래의 재난을 예측해 방지할 수 있고, 못할 것 없이 다 할 수 있다는 듯한 환상을 가지는 관료사회와 이를 부추기며 프로젝트 수주에 혈안이 된 지식인 사회 - 특히 교수 사회 - 의 치부를 낱낱이 해부한다.

행정학 전공인 교수가 첨단 IT 업종의 빅데이터 분야를 거론하는 것이 조금은 어울릴 것 같지 않다. 그러나 김동환 교수는 1980년대 후반부터 인공지능을 연구해왔다. 인공지능의 창시자 중 한 사람인 허버트 사이먼의 의사결정 이론과 인공지능 이론을 파고들어 전문가 시스템은 물론이고 신경망 이론까지 섭렵했다.

인공지능을 넘어서서 사회를 컴퓨터로 모델링하고 시뮬레이션 할 수 있는 방법을 찾았다. 시스템 다이내믹스의 컴퓨터 시뮬레이션 방법을 행정학에 도입하고자 노력하였고, 그 결과 1990년대 초반에는 시스템 다이내믹스 시뮬레이션 소프트웨어를 만들어서 세계학회에서 발표하기도 했다. 한동안 MIT 경영대학원 시스템 다이내믹스 그룹에서는 그가 만든 소프트웨어를 수업 시간에 사용하기도 했다.

그런 그가 보기에 한국사회에 난무하는 빅데이터에 대한 열광적 유행은 거품이다. 마법의 도구처럼 빅데이터를 거론하지만 빅데이터 역시 데이터와 마찬가지로 과거 사실에 대한 기록과 현상 분석을 위한 기초자료에 불과한 것이다. 그런데도 관련 정부기관과 지식인 사회에서 빅데이터를 미래 예측의 도구이자 세상의 모든 문제를 해결해주는 마법의 열쇠인 양 치켜세우는 것은 분명 사기꾼의 그것과 다를 바 없다는 것이 저자의 생각이다. 이런 상식 이하의 현상 이면에는 미국 대통령의 말이라면, 구글과 같은 미국의 첨단기업이 주장한 것이라면 검증할 것 없이 맞을 것으로 여기고 따라 하기에 급급한 한국의 관료와 지식인 사회의 식민지 근성이 있다는 것이 필자의 시각이다.

2014년 저자는 전공과는 전혀 관계없을 『3쿠션 패턴 100』이란 당구책을 내기도 했다. ‘시스템 사고’에 익숙한 저자가 당구 선수들의 암묵적인 지식을 ‘패턴’이라는 방식으로 정리하여 책으로 소개한 것이다. 지식인이라면 자신의 지식을 현학적으로 떠벌리는 데 그쳐서는 안 되고 하다못해 당구공의 물리적 움직임을 설명하는 데 도움이 되어야 한다는 게 저자의 고집스러운 생각이다.

책 속으로 책속으로 보이기/감추기

빅데이터 열풍은 이상하게도 사라지지 않았다. 잊을 만하면 다시 불었다. 다시 불 때마다 빅데이터는 열풍에서 태풍으로 그리고 광풍으로 그 세력을 키웠다. 그저 한때의 유행이니 ‘조만간 사라지겠지’라고 믿었던 필자의 생각은 보기 좋게 빗나갔다. 이명박 정부에서 시작된 열풍은 박근혜 정부로 넘어가서도 이어졌다. 보통 이런 종류의 유행은 정권이 바뀌면서 사라지기 마련인데, 이상하게도 빅데이터 열풍은 광풍으로 발전했다.
--- p.12~13

우리나라에서 빅데이터 유행은 언제부터 시작되었을까? 그날은 201 1년 1 1월 7일이었다. 이명박 대통령이 참석한 제3차 국가정보화전략위원회 보고회의에서 이각범 위원장은 빅데이터를 가장 주목해야 할 개념으로 제시했다. 그날 이명박 대통령은 “위원회가 ‘빅데이터’라는 화두를 던져줬는데 이를 실천하는 것이 필요하다”며 “그래야 다른 나라에 앞설 수 있으며 조속히 실천에 옮겨 효과가 나오도록 하자”고 말했다.
--- p.35

빅데이터 시대가 도래했다고 할 때, 초점을 두는 것은 정형 데이터가 아니라 비정형 데이터이다. 하지만 아직까지 비정형 데이터를 분석할 수 있는 기술은 충분히 개발되지 못했다. 예를 들어 CCTV에 찍힌 범죄자나 범죄 차량을 컴퓨터가 자동으로 인식할 수 있는 기술의 개발은 아직도 요원하다. 이런 상황에서 어떠한 빅데이터를 분석할 것인가? 결국 빅데이터 분석은 방대한 동영상을 제외하고, SNS에서 이루어지는 문자 메시지에 초점을 둔다. 그러다 보니 빅데이터 분석은 가십gossip 분석으로 전락하고 만다. 과연 가십 분석이 그렇게 큰 국가적 의미를 지니는가? 이에 대한 논의를 찾아보기 힘들다.
--- p.40

그렇다면 2016년 현재 우리나라의 빅데이터 기술 수준은 어떠한가? 과연 빅데이터 활용의 타당성이 확인되었는가? 빅데이터 기술의 타당성이 확인되었다고 주장하는 그 어떤 보고서도 필자는 알지 못한다. 그렇다면 2단계가 끝나야 하는 2016년 현재, 빅데이터 활용이 확산되고 있는가? 빅데이터가 어느 영역에서 활용되고 있는지에 관하여 필자는 아직 들어보지 못했다. 아직도 여기저기에서 막연하게 빅데이터가 중요하다는 이야기만 한다. 아직도 막연하게 빅데이터를 하면 무언가 좋지 않겠느냐는 이야기만 한다. 왜 좋을 것 같으냐고 물으면, 대답은 2011년 11월 7일과 똑같다. 미국 정부도 좋다고 했고, 구글도 좋다고 하지 않았느냐는 것이다. 답답한 노릇이다. 5년 동안 도대체 무엇을 한 것인가?
--- p.54

2014년 지방선거와 2016년 총선거를 거치며 빅데이터의 실효성이 현장에서 그리 높지 않음이 밝혀졌다. 이뿐만이 아니었다. 많은 빅데이터 프로젝트들이 기대했던 성과를 도출하는 데 실패했다. 빅데이터 프로젝트에 참여했던 지식인들의 열성이 모자라거나 능력이 부족했기 때문이 아니었다. 처음에 기대했던 빅데이터에 대한 환상, 즉 구글의 독감 예측Google Flu trends처럼 미래를 기가 막히게 예측할 수 있으리라는 환상은 애초에 이론적으로나 현실적으로나 실현될 수 없었다.
--- p.73

빅데이터라는 단어와 관련된 가장 중요한 단어들은 ‘전문가’, ‘빅데이터 전문가--- p.교육’, ‘양성과정’ 등이었다. 어느덧 빅데이터 시장은 빅데이터를 분석해 나름의 시사점을 도출해내는 서비스 시장이 아니라 빅데이터를 가르치는 교육 시장으로 변모한 것이다. 빅데이터 옹호론자들이 소위 빅데이터 전문가를 키우고, 빅데이터 전문가들이 다시 빅데이터 옹호론자가 되는 양의 피드백 루프가 형성된다.
--- p.75~76

두 번째로, 빅데이터 실패의 이유로 더 많이 언급되는 변명이 있다. 바로 데이터가 부족하다는 것이다. 빅데이터 연구를 하려면 빅데이터가 있어야 하는데, 빅데이터가 없기 때문에 기대했던 결과 즉, 빅데이터 산업의 부흥이 일어나지 않는다는 것이다. 그러고는 정부가 가지고 있는 빅데이터를 개방하라고 목소리를 높인다. 정부의 데이터를 개방하면 빅데이터 시장이 창출된다는 것이다.
--- p.77

빅데이터가 너무 많아서 빅데이터 분석이 필요하다고 해놓고, 이제 와서 빅데이터가 부족하니 정부가 관리하고 있는 국민들의 개인정보를 공개하라고 한다. 그리고 또 말한다. 빅데이터 분석으로 개인을 식별할 수 없다고 말이다. 빅데이터 분석 기술이 그 정도 수준에 불과하다면, 그냥 빅데이터를 때려치우는 게 나을지 모른다. 어차피 개인 정보를 다 공개해서 가져다준다 한들 아무런 분석도 못할 것이기 때문이다. 어차피 빅데이터를 분석할 능력이 없으므로, 굳이 개인정보를 공개할 필요가 없게 되는 것이다.
--- p.80~81

다시 한 번 말한다. 이 논문의 필진들은 구글의 빅데이터 분석이 미래를 예측할 수 있다고 말한 적이 없다. 하지만 이들의 논문은 빅데이터 분석이 가장 강력한 미래 예측 도구라는 주장의 근거로 이용되고 포장되어 확산되었다. 이들의 연구는 세계 각국으로 퍼져나갔다. 2년 정도 흐른 다음에는 우리나라에 상륙하여, 빅데이터가 가장 중요한 국가 전략이 되어야 하며, 빅데이터를 준비하지 않으면 국가경쟁력을 상실하여 국가 간의 경쟁에서 뒤처질 것이라는 선언의 핵심 명분이 되기에 이르렀다. 하지만 거기에는 아무런 합리적 근거가 없었다.
--- p.93~94

최근 스몰데이터로 주목받는 사람은 마틴 린드스트롬Martin Lindstrom이다. 그는 “빅데이터는 소비자 행동의 ‘전체 그림’을 보여주지는 않는다”며 이어서 “스몰데이터를 통해 사람들 본 모습을 알 수 있다” 35 고 말했다. 빅데이터는 방대한 데이터에 대한 통계적 분석을 수행하여 상관관계correlation를 찾는다. 이에 반해 스몰데이터는 원인과 결과의 관계, 즉 인과관계casual relation를 파악한다. 사업을 계획하는 사람들이나 미래의 정책을 고심하는 사람들에게 상관관계는 인과관계에 비해 중요하고 핵심적인 시사점을 제시하지 못한다. 비즈니스에 있어서 중요한 것은 원인과 결과의 관계이지, 통계적인 상관관계가 아니다. 빅데이터는 상관관계를 찾을 수는 있지만 인과관계를 확인할 수는 없다. 인과관계는 빅데이터가 아니라 스몰데이터에서 찾을 수 있는 것이다.
--- p.99~100

이렇게 해서 우리나라 빅데이터 유행의 세 가지 특성을 정리할 수 있다. 첫째, 우리나라의 빅데이터 유행은 미국에 대한 모방이며 미국으로부터 수입한 것이다. 둘째, 우리나라의 빅데이터 유행은 정부에 의해 주도된, 위로부터의 유행이다. 셋째, 우리나라의 빅데이터 유행은 반성과 비판이 없는 유행이다.
--- p.111

지적 유행의 조건을 조금 더 이해하기 쉽게 말해보자. 사기 도박이 성사되려면 세 가지 조건이 충족되어야 한다. 첫째, 돈을 주체하지 못하는 호구가 있어야 한다. 호구가 돈을 잃어주어야 사기도박이 유지될 수 있다. 이것은 여유 자원에 해당된다. 둘째, 이 돈을 뺏어 먹을 수 있는 기술자들 즉, 타짜들에게 인센티브를 주어야 한다. 비록 타짜와 같은 기술을 가지고 있지 않지만 도박 장소를 제공해주는 하우스 운영자들에게도 위험을 감수할 만큼의 인센티브가 주어져야 한다. 셋째, 호구와 타짜를 엮어주는 바람잡이들이 있다. 바람잡이들은 호구들의 도박 능력을 과도하게 칭찬해주고, 호구들에게 근거 없는 자신감을 불어넣는다. 바람잡이의 역할은 천박한 지적 풍토를 조성하는 일이다.
--- p.115

우리나라의 빅데이터 유행은 지적 유행의 세 가지 조건이 잘 충족된 전형적인 사례이다. 먼저 미국의 빅데이터 유행을 수입해오는 역할은 ‘빅데이터 옹호론자’들이 수행한다. 이들이 미국의 성공 사례를 들어 빅데이터 연구의 필요성을 부각시키면, 마치 기다렸다는 듯이 정부는 돈을 풀어 프로젝트를 발주한다. 이 세계에서는 정부 예산을 ‘눈먼 돈’이라고도 부른다.
이렇게 해서 빅데이터 시장의 규모가 점점 더 커지면, 이제는 데이터 분석 기술을 가지고 있는 업체들이 진입하게 된다. 이들은 꽤 큰 데이터들을 다루면서 화려한 그래픽으로 무언가를 보여주기도 한다. 이들의 화려한 기술에 매료된 정부 공무원들은 앞으로 더 많은 돈을 풀어 빅데이터 시장을 키워야겠다는 생각을 한다. 빅데이터 시장이 커질수록, 점점 더 많은 지식인들이 빅데이터 전문가로 변신한다. 이렇게 해서 빅데이터라는 지적 유행을 둘러싸고, 빅데이터 옹호자와 정부와 빅데이터 업체로 이루어진 ‘철의 삼각관계iron triangle’가 완성된다.
--- p.116

미국 정부의 빅데이터 연구는 허황된 미래 예측에 초점을 두기보다는 과거 데이터들 간의 상관관계를 분석하는 과학적인 방법에 초점을 두고 있다. 이에 비해 우리는 빅데이터를 만병통치약으로 신봉하는 편에 가깝다.
--- p.141

앤더슨은 상관관계로 충분하다고 생각한다. 심지어 상관관계가 인과관계보다 더 우수하다고 주장한다. 터무니없는 주장이다. 예를 들어보자. 한 나라의 암 환자 숫자와 암 전공 의사 숫자 사이에는 긴밀한 상관관계가 있다. 암 환자가 적은 나라를 보니 암 전공 의사 숫자도 적었다. 정말로 그렇다면, 의과대학의 암 전공 과정을 폐쇄시켜버리면, 암 환자가 줄어들 것인가? 아마도 그럴지도 모른다. 다만 진짜로 암 환자가 줄어서가 아니라, 암 환자가 다른 나라로 치료받으러 가거나, 진료할 의사가 없으니 암 환자로 등록되지 않았기 때문이다. 결국 암 환자를 감소시키는 정책은 성공할 것이다. 물론 실제적으로가 아니라 통계적으로 성공할 뿐이다. 이렇게 가면 통계적으로는 성공한다. 그러나 이렇게 가면 망한다. 통계적으로는 성공하지만, 실제로는 망할 수밖에 없다.
--- p.150

분명하고 절대 변하지 않는 한 가지 사실은, 빅데이터 분석을 통하여 알 수 있는 것은 인과관계가 아니라 상관관계일 뿐이라는 점이다.
--- p.150~151

어떤 형태로 존재하든 상관없이 빅데이터는 근본적으로 데이터이다. 빅데이터도 결국에는 데이터란 말이다. 데이터가 많다고 해서 데이터 자체의 특성이 달라지는 것은 아니다. 모래가 많다고 해서 물이 되는 것은 아니듯 말이다. 모래는 모래고, 물은 물이다. 많다고 변하는 것은 아니다. 빅데이터는 데이터다. 그렇다면 데이터란 무엇인가? 데이터는 ‘과거의 기록’이다.
어떤 형태를 지니는 데이터이건 모든 데이터는 과거의 기록이다. 즉, 데이터는 ‘과거’라는 특성과 ‘기록’이라는 특성을 지닌다. 이 두 가지가 데이터의 본질이다. 데이터는 미래에 발생하는 것이 아니다. 데이터는 이미 지나간 것이다.
--- p.155~156

빅데이터에 대한 가장 큰 망상은 빅데이터를 통해 미래를 예측할 수 있다는 주장이다. 근본적으로 빅데이터는 과거의 기록이다. 빅데이터를 분석해서 과거에 어떤 일이 있었는지를 자세히 알 수 있다고 한다면, 어느 정도 수긍할 수 있다. 하지만 과거의 기록인 빅데이터를 가지고 미래를 예측할 수 있다는 주장과 기대는 난센스이다.
--- p.158

빅데이터는 데이터다. 데이터는 과거의 기록일 뿐이다. 그리고 빅데이터 분석은 상관관계만을 제공한다. 이것은 아무리 복잡한 첨단 기술을 가지고 온다고 하더라도 변할 수 없는 것이다.
--- p.160

이러한 점을 명확하게 인식한다면, 빅데이터를 통해 미래를 예측해서 미래의 재난을 예방하고 미래의 기회를 선취한다는 포부는 뜬구름 잡는 이야기라는 걸 알 수 있을 것이다. 하지만여기에서 명심해야 할 점이 있다. 그렇다고 해서 빅데이터 분석이 무의미하다는 말은 절대 아니라는 점이다. 빅데이터는 나름대로 가치가 있고 의미가 있다. 다만 빅데이터는 과거를 이해하고 평가하는 차원에서 중요한 의미를 지닌다. 한데, 미래를 예측하고 미래에 벌어질 일에 대응하고자 한다면, 데이터가 아니라 이론이 필요하다. 바로 이것을 행태주의, 경제학, 통계학, 심리학, 인공지능의 대가이자 20세기의 천재라고 불리는 사이먼이 죽기 전에 역설한 것이다.
--- p.161

앞으로 사물인터넷 공간과 기기에 조 단위가 넘는 센서가 설치되어 작동될 것이다. 이들 센서로부터 매순간 발생되는 데이터는 상상을 초월하는 양이 될 것이다. 빅데이터는 바로 이 방대한 데이터를 분석해야 하는 기술이다. 공개하고 싶어 하지 않는 개인들의 정보를 강제로 공개할 필요가 없다. 빅데이터 기술을 가지고 미래를 예측할 수 있다는 허황된 이야기를 할 필요도 없다. 사물인터넷은 지금까지 보지 못했던 방대한 양의 데이터를 쏟아낼 것이다. 이것을 분석하는 것이 바로 빅데이터의 본질적 역할인 것이다.
--- p.165

빅데이터의 본질에 충실한 프로젝트는 얼마든지 훌륭한 성과를 낼 수 있다. 이렇게 본질에 충실한 빅데이터는 그다지 화려하지 않으며 엄청난 수익을 창출할 수 있다고 거짓말하지 않는다. 이제 우리나라도 선진국을 모방하는 단계에서 한 발 더 나아가 우리만의 역량으로 새로운 것을 창조하는 하는 단계로 진입했다. 선진국의 유행을 수입해서 과도한 거품을 조장하는 일은 바람직하지 못하다. 공무원과 지식인이 현실적인 문제에 대해서 보다 더 진지하게 임해야 할 때이다. 그렇게 스스로 진지한 모습을 보여줄 때, 공무원과 지식인에 대한 신뢰와 존중이 높아질 수 있을 것이다.
--- p.165~166

출판사 리뷰 출판사 리뷰 보이기/감추기

회원리뷰 (2건) 회원리뷰 이동

한줄평 (1건) 한줄평 이동

총 평점 6.0점 6.0 / 10.0

배송/반품/교환 안내

배송 안내
반품/교환 안내에 대한 내용입니다.
배송 구분 구매 후 즉시 다운로드 가능
  •  배송비 : 무료배송
반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법
  •  고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
  •  모바일 쿠폰의 경우 유효기간(발행 후 1년) 내 등록하지 않은 상품
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음

    단, 당일 00시~13시 사이의 주문은 취소 수수료 면제

  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  모바일 쿠폰 등록 후 취소/환불 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에
따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
뒤로 앞으로 맨위로 공유하기