품목정보
발행일 | 2021년 10월 13일 |
---|---|
쪽수, 무게, 크기 | 396쪽 | 604g | 148*225*30mm |
ISBN13 | 9791165217099 |
ISBN10 | 1165217090 |
발행일 | 2021년 10월 13일 |
---|---|
쪽수, 무게, 크기 | 396쪽 | 604g | 148*225*30mm |
ISBN13 | 9791165217099 |
ISBN10 | 1165217090 |
1부 다크 데이터는 어떻게 생겨나고 어떤 결과를 초래하는가 1장. 다크 데이터: 보이지 않는 것이 이 세계를 만든다 보이지 않는 위험, 다크 데이터 데이터를 다 갖고 있다고 생각하는군요? 아무 일도 안 생겨서 무시해버릴 때 생기는 일 다크 데이터의 위력 다크 데이터는 언제 어디에나 있다 2장. 다크 데이터 찾아내기: 우리가 모은 것과 모으지 않은 것 데이터를 얻는 3가지 방식과 다크 데이터의 출현 데이터 잔해에서 얻는 다크 데이터 설문조사에서 생기는 다크 데이터 실험 데이터에도 다크 데이터가 끼어든다 인간적 취약점에 주의하시라 3장. 다크 데이터와 정의: 알고자 하는 것이 정확히 무엇인가? 엉뚱한 것을 측정해버렸다: 정의가 달라질 때 ‘모든’ 것을 측정할 수는 없다: 심슨의 역설 질병 검진 프로그램의 취약성 과거 성과를 보고 선택할 때의 다크 데이터 4장. 의도하지 않은 다크 데이터: 말과 행동이 따로 놀 때 어디까지 정확해야 하지? 요약은 필연적으로 다크 데이터를 만든다 인간이니까 생기는 오류 측정 도구의 한계 데이터 세트를 통합할 때의 문제 5장. 전략적 다크 데이터: 게이밍, 피드백, 정보 비대칭 게이밍: 빈틈을 이용해 이득을 얻다 피드백: 피드백이 데이터를 왜곡시킬 때 정보 비대칭: 중고차 시장에서 무슨 일이 일어났나 다크 데이터가 알고리즘에 끼치는 영향 6장. 고의적 다크 데이터: 사기와 기만 사기의 세계: 핵심은 데이터 숨기기다 신원 도용과 인터넷 사기: ‘자칼의 날’ 계속 진화하는 개인금융 사기 금융시장 사기와 내부자 거래 보험 사기: 고객을 속이거나 보험사를 속이거나 그 밖의 사기: 돈세탁, 다단계 사기, 횡령 7장. 다크 데이터와 과학: 발견의 본질 과학의 본질: 검증 체계로서의 과학 내가 그걸 알았더라면!: 과학자들의 흑역사 우연히 만난 다크 데이터: 과학자들의 행운 반복 실험을 통한 재현: 과학 연구의 다크 데이터 사실을 감추는 방법들 철회 출처와 신뢰성: “누가 그러던가요?” 2부 다크 데이터에 빛을 비추고 이용하는 법 8장. 다크 데이터 다루기: 빛을 비추기 희망은 있다 관측 데이터를 빠진 데이터와 연결하기 3가지 데이터 누락 메커니즘 이미 가진 데이터를 활용하는 법 생존분석 문제: 당신이 먼저 죽는다면? 대치법: 빠진 데이터를 채워넣기 반복: 최대가능도 모형과 EM 알고리즘 데이터 오류에 대처하는 방법 9장. 다크 데이터로 이득을 얻는 법: 질문을 바꿔보자 데이터를 숨기는 게 이득이 될 때 무작위 대조군 시험: 데이터를 모두에게 숨겨라 시뮬레이션: 일어났을 수도 있는 일 전략적으로 복제된 데이터 베이즈 사전확률: 가상의 데이터 사생활 보호와 기밀 유지 데이터를 다크 상태로 수집하기 10장. 다크 데이터 분류법: 미로 속으로 난 길 다크 데이터의 15가지 유형 새롭게 조명하기 |
누락되는 수적 정보에 관한 이야기. | 수적 데이터들이 누락되는 이유들과 올바로 산입하는 방법들에 대해 다루고 있어서 자료 분별 사고력에 있어 괜찮은 책이다. | [나는 빠진 데이터야말로 우리가 갖고 있는 데이터 못지않게 중요하다고 보며, 많은 사례를 들어 나의 주장을 입증하려고 한다.] |
빅데이터가 화두인 시대에 데이터의 명암에 대해 잘 정리된 사실과 의견들을 설득력있게 제시해준 책이다. '보이지 않는 데이터가 세상을 지배한다.', '우리가 모르는 데이터는 왜 아는 데이터보다 치명적인가?' 라는 자극적인 문구들을 달았지만 그것들은 다크데이터의 어두운 면을 더 강조한 것일 뿐, 다크 데이터의 존재는 밝은 데이터의 존재만큼이나 만연해있으며, 어쩌면 존재자체가 필수불가결하다. 우리가 측정하는 데이터가 한정적인 만큼 어쩔 수 없다.
저자는 다크데이터(DD)의 유형을 15가지나 분류하며 그 개념과 다루는 방법들을 상세하게 설명해주고 있다. 저자는 저명한 통계학자다. 따라서 연구방법론이나 통계학을 조금이라도 접한 사람이라면 이미 알고 있는 개념도 많을 것이다. 그렇지만 저자의 역량이 빛나는건 학문적 개념을 일반인도 이해하기 쉽게 설명해주고 있다는 점이다.
최근 예일대 심리학 안우경 교수의 <씽킹101>이라는 책을 통해 다양한 인지 편향(bias)에 대해 읽은 바 있다. 우연찮게도 이 책을 읽은 직후 다크데이터를 접한 것이 내 이해에 시너지효과를 주었다. 데이터 편향성은 인간의 인지편향에 주요한 요인으로 작용할 수 있기 때문이다. 이 책에서는 '확증편향'이라고 칭하고 안우경 교수는 '확인편향'이라고 번역한 'confirmation bias' 는 사람들이 자신에게 유리한 증거만을 취해 편향을 공고히 하는 것인데, 우리가 다크데이터를 간과한 채 보이는 데이터만 취한다면 그것이 인지편향을 부추긴다. 따라서 데이터의 명암을 아는 것이 우리가 세상을 바로 알기 위해 필요한 일이다.
어디에나 명암은 있고, 우리가 무엇을 모르는지도 모를 수 있다. 그렇지만 데이터를 쉽게 얻을 수 있고, 주무를 수 있고, 데이터를 기반으로 남을 설득하거나 이론을 펼칠 사람들일수록 무지를 방패로 책임을 회피하지 말아야 할 것이다.
번역도 잘 되있고 책도 두께에 비해 가볍고 종이에서 화학품 냄새도 않나고
무엇보다 내용과 주제가 너무 마음에 드는 책이다.
21세기 넘어 들어와 점점 복잡해지는 세상 스마트폰,SNS시대에 세상은 그 어느
세대보다 복잡해지는 세상이다. 우리는 방송,신문,인터넷등 드러난 정보로 세상을
인지 하고 사는데 그 드러난 정보가 세상의진실을 말해주지 않은 경우가 참 많다.
각색되고 정제된 정보가 아니라 드러나지 않은 속성을 밝혀주는 정보 진짜 정보는
찾기가 쉽지 않은데 이따금 세상의 일부 단면이지만 그 속성을 밝혀주는 이러한
책을 만나 보게되면 글을 읽는 재미에 시간가는 줄도 모르게 읽게 된다.