품목정보
발행일 | 2021년 02월 26일 |
---|---|
쪽수, 무게, 크기 | 394쪽 | 560g | 140*210*22mm |
ISBN13 | 9788934986829 |
ISBN10 | 8934986824 |
발행일 | 2021년 02월 26일 |
---|---|
쪽수, 무게, 크기 | 394쪽 | 560g | 140*210*22mm |
ISBN13 | 9788934986829 |
ISBN10 | 8934986824 |
프롤로그: 데이터과학으로 들어가기 1부 데이터 리터러시: 숫자 없는 통계학 1장 역사 속의 데이터 - 무지와 탐욕을 밝히는 열쇠 2장 불확실한 세상을 위한 언어 -확률 3장 확률, 그 오묘함에 대하여 -조건부 확률 4장 종 모양의 데이터 -정규분포 5장 요약 본능과 변동의 이해 -표준편차 6장 합리적으로 판단하기 -가설검정과 대립가설 7장 관계의 이해 - 상관관계와 인과관계 8장 2년차 징크스는 왜 생길까? - 평균으로의 회귀 9장 왜 내 차선만 막히나요? - 데이터 편이 10장 걱정은 팔자가 아니고 과학입니다 - 극단값 11장 술 취한 사람 이해하기 - 임의보행 12장 미래 예측하기 - 차원의 저주와 과적합 문제 13장 너의 마음을 보여줘 - 표본조사 14장 로또에 당첨되는 법 - 다중비교 15장 목표 없는 정보의 허무함 - 빅데이터와 세분화의 함정 벤포드의 법칙 2부 데이터의 활약상: 세상만사의 데이터과학 1장 데이터의 발자취 - 인구 조사에서 빅데이터 시대까지 2장 네 번째 과학 - 꿈의 촬영에서 중력파 검출까지 3장 건강한 사회를 위하여 - 질병과의 전쟁 4장 백신을 위한 과학 - 임상시험과 데이터 5장 공동체를 위하여 - 신뢰받는 통계의 중요성 6장 민주주의와 선거 - 유권자의 마음을 읽어라 7장 금융과 신용 - 서민을 위한 데이터 8장 광고 속 데이터과학 - 당신도 모르는 당신의 마음 9장 제조업을 위한 데이터과학 - 좋은 제품의 비밀 10장 프라이버시 보호 - 개인정보 유출과 데이터 익명화 백신개발을 위한 특별한 확률 3부 인공지능: 데이터과학의 새로운 도전 1장 인공지능의 역사 2장 알파고의 탄생 3장 인공지능의 활약과 부작용 4장 인공지능을 인간답게 알파고 vs 이세돌, 그 뒷이야기 에필로그: 불완전한 사회 속 더 나은 선택을 위한 데이터과학 주 참고문헌 |
【 데이터과학자의 사고법 】- 더 나은 선택을 위한 통계학적 통찰의 힘
_김용대 / 김영사
“감정에 치우치지 않는 데이터”
‘4차 산업혁명’, ‘빅데이터’, ‘인공지능’과 더불어 빼놓을 수 없는 것이 ‘데이터과학’이다. 데이터과학은 빅데이터보다 전문성이 요구되는 분야이다. 이 책의 저자인 통계학 박사이자 데이터사이언스학과 김용대 교수는 현 시대에 데이터과학은 우리 주위에 공기처럼 존재한다고 언급한다.
데이터과학에 대한 오해 두 가지를 확인해볼 필요가 있다. 첫 번째는 ‘과학을 위한 데이터’이다. 데이터 중심 연구가 다양한 과학 분야에서 각광받고 있다. 의학 분야에선 ‘정밀의료’, 생물학 분야에선 ‘생물정보학’, 기상학에선 ‘엘니뇨 예측’, 인지과학분야에선 ‘뇌 네트워크 분석’, 언어학 분야에선 ‘텍스트 마이닝’등이 과학을 위한 데이터이다. 이러한 연구들은 데이터과학을 활용한 것이지 데이터과학 그 자체가 아니라는 것이다. 통계학에 가깝다고 봐야 할 것이다. 데이터 과학에 대한 두 번째 오해는 데이터를 위한 기술이라는 것이다. 응용분야의 지식과 데이터 기술은 데이터과학에서 매우 중요한 부분이지만 데이터과학의 전부가 아니라는 것이다. 데이터과학의 핵심에는 데이터로부터 유용하고 새로운 정보를 찾기 위한 합리적 사고방법이 자리 잡고 있다.
저자는 이 책을 통해 데이터과학에서 다루는 복잡하고 어려운 방법을 설명하지 않는다. 다만 데이터를 통한 합리적 의사결정이 왜 어려운지 일상 속 여러 사례를 통해서 소개하고, 다양한 분야에서 데이터과학의 활약상을 살펴보고 있다. 데이터를 통한 합리적 의사결정은 응용분야 전문가뿐만 아니라 우리의 일상생활에서도 매우 중요하다는 것에 역점을 둔다.
실생활에서 만나는 흥미로운 소재들도 많다. ‘2년차 징크스는 왜 생길까?’_평균으로의 회귀, ‘왜 내 차선만 막히나요?’_데이터 편이, ‘술 취한 사람 이해하기’_임의보행, ‘로또에 당첨되는 법’_다중비교 그리고 데이터의 활약상 챕터에선 인구조사에서 빅데이터 시대까지, 질병과의 전쟁, 유권자의 마음을 읽어라, 당신도 모르는 당신의 마음 등과 데이터과학이 새로운 도전과제로 삼는 ‘인공지능’으로 이어진다.
‘미래 예측하기’ 챕터를 정리해본다. ‘차원의 저주와 과적합 문제’라는 아리송한 부제가 붙어있다. 미래를 알고 싶어 하는 인간의 욕망은 무한질주이다. 저자는 미래를 아는 것과 미래를 예측하는 것은 다르다고 한다. 누구나 미래를 정확히 알 수 없다. 단지 예측할 뿐이다. 데이터로 미래를 예측하는 어떤 방법이 있을까? 한 예를 들면, 내 수명이 얼마나 남아있을까? 즉 앞으로 얼마나 더 살다 갈 수 있는가? 저자는 한 가지 방법을 제안한다. 나와 가장 비슷한 사람을 국민건강보험공단에서 갖고 있는 사망자 데이터를 통해 예측해볼 수 있다고 한다. 문제는 비슷한 사람을 찾는 것이 관건이다. 설령 (키, 몸무게 등 신체조건, 출생지, 학력, 직업 등등)비슷한 사람을 찾았다고 할지라도 ‘과적합 문제’에 봉착하게 된다는 것이다.즉, 조건을 너무 많이 적용할수록 결과는 안 좋다. 이럴 경우엔 조건을 줄여서 적당히 비슷한 사람 여러 명을 찾은 뒤 그들의 평균수명으로 의뢰자의 수명을 예측하는 것이 훨씬 정확하다는 이야기다.
“인공지능이 인간을 넘어설지에 대하여 많은 논의가 진행되고 있습니다. 인공지능은 데이터를 바탕으로 지식을 추출하고 미래를 예측합니다. 따라서 경험해보지 않은 상황에서는 예측을 할 수 없습니다. 반면에 인간은 창의적인 사고로 인류가 경험하지 못한 상황에서도 적절한 판단이 가능할 것입니다. 이러한 면에서 인공지능은 인간을 넘어서기 어려워 보입니다. 단, 데이터는 감정이 없습니다. 모든 상황에서 객관적인 평가를 할 수 있습니다. 이와 반대로 인간은 감정에 치우치며 종종 일을 그르치곤 합니다. 인공지능과 공존하기 위해서 인간에게 필요한 것이 무엇인지 생각하게 됩니다.” (p.143)
"출판사에서 도서를 지원 받아 작성한 리뷰"
#데이터과학자의사고법
#김용대
#김영사
#쎄인트의책이야기2021
4차 산업혁명이 시작되면서 개인적으로 관심을 집중했던 영역은 빅데이터였다. 그 어떤 정보보다 정확하게 모든 것의 설명을 가능하게 해주는 그 세계는 알면 알수록 놀랍도록 흥미로운 분야였다. 그냥 데이터 자체로는 날 것 그대로라 사용하기 힘들 수 있지만 그것들을 어떤 툴로, 어떻게 가공하느냐에 따라 모래알 속 진주가 될 수 있었다. 객관적이고 합리적인 결론을 도출해내는 데 필수 불가결한 요소인 데이터과학의 해설서인 이 책 [데이터 과학자의 사고법]은 그런 의문과 궁금증에서 출발한 독서의 시간을 안겨 주었다.
이 책의 저자 김용대 교수는 나와 같이 일반인들도 데이터과학을 좀 더 쉽게 이해할 수 있도록 도움을 주기 위한 것이 이 책의 목표라고 밝히며 오늘날 과학의 새로운 패러다임인 데이터에 대해 꼭 알아야 할 내용들을 쉽게 설명해주고 있다. 먼저 여러 내용을 언급하기 전에 데이터 과학에 대한 정의부터 짚고 넘어가야 한다. 우리는 데이터와 과학에 대해서는 어느정도 알고 있다. 데이터와 과학이 만나 하나의 단어를 만들어 내고 있는 데이터과학은 데이터를 기반으로 하여 합리적인 사고를 하는 방법에 대한 내용을 다루고 있다.
데이터 분석을 위한 학문이자 통계학과 밀접한 영역인 데이터과학은 우리 일상 속에서 자주 접하는 내용들의 바탕이 되는 것이다. 평균소득, 평균 강수량, 신약의 임상시험, 조건부확률 모두 데이터과학을 기반으로 한 통계와 확률의 수치이며 페이스북이나 인스타그램의 추천동영상, 추천쇼핑몰은 데이터과학을 이용한 것이다. 사실 이제는 데이터과학이 다루지 않는 영역이 어디인지를 살펴보는 게 더 나을 정도로 우리 삶의 대부분을 지배하고 있는 것이 데이터과학이다.
민간영역에서 데이터의 활용이 활발해지면서 새롭게 부각된 사회적 이슈는 개인정보 유출이다. 정말 자주 받는 보이스피싱, 스미싱의 사기 사례들만 봐도 이들이 내 전화번호와 이름을 어떻게 알고 이렇게 보내나 걱정스럽기만 하다. 새고 있는 개인정보는 코로나19로 인해 더 심각해졌다. 들리는 가게마다 이름과 전화번호를 남겨야 하니 이제 작은 가게에서조차도 개인정보를 제대로 관리하지 않으면 안되는 상황이 되었다. 생각했던 것보다 더 다양한 영역에서 활약하는 데이터과학의 이야기를 접할 수 있었기에 더 나은 미래로 가는 길목에 데이터과학이 지금보다 유용하게 잘 사용되길 바라는 마음이 커졌다.
'좀 더 정확하게 미래를 예측하려면 좋은 데이터와 유능한 데이터과학자가 필요합니다. 데이터과학이 다루는 중요한 분야 중 하나가 바로 미래에 대한 예측입니다(p135)'
<출판사로부터 책을 제공받아 작성한 서평입니다>