확장메뉴
주요메뉴


소득공제
데이터과학자의 사고법

데이터과학자의 사고법

: 더 나은 선택을 위한 통계학적 통찰의 힘

리뷰 총점9.5 리뷰 19건 | 판매지수 1,530
베스트
자연과학 top100 11주
정가
16,800
판매가
15,120 (10% 할인)

품목정보

품목정보
발행일 2021년 02월 26일
쪽수, 무게, 크기 394쪽 | 560g | 140*210*22mm
ISBN13 9788934986829
ISBN10 8934986824

이 상품의 태그

달력으로 배우는 지구환경 수업

달력으로 배우는 지구환경 수업

13,500 (10%)

'달력으로 배우는 지구환경 수업' 상세페이지 이동

배움의 발견

배움의 발견

19,800 (10%)

'배움의 발견' 상세페이지 이동

고래를 삼킨 바다 쓰레기

고래를 삼킨 바다 쓰레기

10,800 (10%)

'고래를 삼킨 바다 쓰레기' 상세페이지 이동

14살부터 시작하는 나의 첫 진로 수업

14살부터 시작하는 나의 첫 진로 수업

13,500 (10%)

'14살부터 시작하는 나의 첫 진로 수업' 상세페이지 이동

우리말 어감사전

우리말 어감사전

15,300 (10%)

'우리말 어감사전' 상세페이지 이동

느린 학습자의 공부

느린 학습자의 공부

13,500 (10%)

'느린 학습자의 공부' 상세페이지 이동

의사 어벤저스 1

의사 어벤저스 1

11,250 (10%)

'의사 어벤저스 1' 상세페이지 이동

뜻밖의 계절

뜻밖의 계절

11,520 (10%)

'뜻밖의 계절' 상세페이지 이동

그림책으로 시작하는 학급경영

그림책으로 시작하는 학급경영

15,300 (10%)

'그림책으로 시작하는 학급경영' 상세페이지 이동

네이버쇼핑 스마트스토어로 상위노출 하라

네이버쇼핑 스마트스토어로 상위노출 하라

19,800 (10%)

'네이버쇼핑 스마트스토어로 상위노출 하라' 상세페이지 이동

IB를 말한다

IB를 말한다

17,100 (10%)

'IB를 말한다' 상세페이지 이동

모모와 토토

모모와 토토

13,500 (10%)

'모모와 토토' 상세페이지 이동

식물학자의 노트

식물학자의 노트

17,820 (10%)

'식물학자의 노트' 상세페이지 이동

공감은 지능이다

공감은 지능이다

19,800 (10%)

'공감은 지능이다' 상세페이지 이동

리더는 하루에 백 번 싸운다

리더는 하루에 백 번 싸운다

14,220 (10%)

'리더는 하루에 백 번 싸운다' 상세페이지 이동

팀장 리더십 수업

팀장 리더십 수업

15,120 (10%)

'팀장 리더십 수업' 상세페이지 이동

킵고잉 (KEEP GOING)

킵고잉 (KEEP GOING)

13,500 (10%)

'킵고잉 (KEEP GOING)' 상세페이지 이동

빌트, 우리가 지어올린 모든 것들의 과학

빌트, 우리가 지어올린 모든 것들의 과학

14,400 (10%)

'빌트, 우리가 지어올린 모든 것들의 과학' 상세페이지 이동

닐과 순다리

닐과 순다리

11,700 (10%)

'닐과 순다리' 상세페이지 이동

나를 알고 싶을 때 뇌과학을 공부합니다

나를 알고 싶을 때 뇌과학을 공부합니다

17,820 (10%)

'나를 알고 싶을 때 뇌과학을 공부합니다' 상세페이지 이동

책소개 책소개 보이기/감추기

목차 목차 보이기/감추기

프롤로그: 데이터과학으로 들어가기

1부 데이터 리터러시: 숫자 없는 통계학
1장 역사 속의 데이터 - 무지와 탐욕을 밝히는 열쇠
2장 불확실한 세상을 위한 언어 -확률
3장 확률, 그 오묘함에 대하여 -조건부 확률
4장 종 모양의 데이터 -정규분포
5장 요약 본능과 변동의 이해 -표준편차
6장 합리적으로 판단하기 -가설검정과 대립가설
7장 관계의 이해 - 상관관계와 인과관계
8장 2년차 징크스는 왜 생길까? - 평균으로의 회귀
9장 왜 내 차선만 막히나요? - 데이터 편이
10장 걱정은 팔자가 아니고 과학입니다 - 극단값
11장 술 취한 사람 이해하기 - 임의보행
12장 미래 예측하기 - 차원의 저주와 과적합 문제
13장 너의 마음을 보여줘 - 표본조사
14장 로또에 당첨되는 법 - 다중비교
15장 목표 없는 정보의 허무함 - 빅데이터와 세분화의 함정
벤포드의 법칙

2부 데이터의 활약상: 세상만사의 데이터과학
1장 데이터의 발자취 - 인구 조사에서 빅데이터 시대까지
2장 네 번째 과학 - 꿈의 촬영에서 중력파 검출까지
3장 건강한 사회를 위하여 - 질병과의 전쟁
4장 백신을 위한 과학 - 임상시험과 데이터
5장 공동체를 위하여 - 신뢰받는 통계의 중요성
6장 민주주의와 선거 - 유권자의 마음을 읽어라
7장 금융과 신용 - 서민을 위한 데이터
8장 광고 속 데이터과학 - 당신도 모르는 당신의 마음
9장 제조업을 위한 데이터과학 - 좋은 제품의 비밀
10장 프라이버시 보호 - 개인정보 유출과 데이터 익명화
백신개발을 위한 특별한 확률

3부 인공지능: 데이터과학의 새로운 도전
1장 인공지능의 역사
2장 알파고의 탄생
3장 인공지능의 활약과 부작용
4장 인공지능을 인간답게
알파고 vs 이세돌, 그 뒷이야기

에필로그: 불완전한 사회 속 더 나은 선택을 위한 데이터과학

참고문헌

저자 소개 (1명)

책 속으로 책속으로 보이기/감추기

“불확실성은 완전히 없앨 수 없기 때문에 우리는 항상 불확실성에 대해 대비해야 합니다.”
--- p.27

“주식시장에서는 가격이 급등하거나 급락하는 사건이 정상 상태보다 훨씬 자주 발생하기 때문에 가격변동은 정규분포를 따르지 않는 것입니다. 2020년 코로나19 사태 중에 경험한 주식가격의 폭락과 폭등도 정규분포로는 설명할 수 없습니다.”
--- p.61

“법원은 ‘상당한 인과관계’라는 단어를 사용합니다. 당직실에서 숨진 전공의는 산재 인정을 받은 반면 세월호 잠수사의 골 괴사 사건은 인과관계 인정을 받지 못했습니다. 이러한 법원의 판단을 보면서 데이터과학의 한계를 생각해봅니다. 데이터를 바탕으로 모두가 동의하는 인과관계를 발견한다는 것은 매우 어렵습니다. 우리가 기술에 대한 지식뿐만 아니라 데이터과학의 한계도 잘 이해해야 하는 이유입니다.”
--- p.97

“교육생의 다음 날 성적의 오르내림은 자연현상이지 교관의 지도 때문은 아닙니다. 반대로 교관의 지도 방법은 교육생의 오늘 성적 결과에 따른 것입니다. 원인이 아니라 결과인 것입니다. 이처럼 경험에 의존해서 판단하는 것을 피해야 합니다. 경험이 필요 없는 것이 아니라 경험에 대한 해석이 어렵기 때문입니다.”
--- p.104

“데이터에서 트렌드가 보인다고 모두 예측 가능한 것은 아닙니다. 예측 불가능한 경우에 트렌드가 더 빈번히 발생합니다. 이 때문에 데이터 분석에 확률 이론이 꼭 필요하며, 데이터를 해석할 때 필요한 소양 중 하나는 보이는 것을 그대로 믿지 않는 능력입니다.”
--- p.133

“알파고 이전에 바둑 인공지능이 불가능하다고 생각한 이유는 101번째 수로 가능한 수가 261개나 되었기 때문입니다. 261개의 개별 수 각각에 대해서 수십만 번의 자체 대국을 두는 것은 물리적으로 불가능합니다. 알파고는 이 문제를 기보 빅데이터를 이용하여 해결했습니다. 기보 빅데이터를 분석하여 실제 거의 나오지 않는 수를 과감히 제거하여 계산량을 획기적으로 줄였습니다.”
--- p.344

“인공지능의 심각한 윤리적 문제로는 인공지능을 통해 이루어진 판단이나 의사결정은 부당한 편향 bias을 낳을 수 있다는 것입니다. 나이가 이러한 편향은 사회에 만연한 차별과 불공정을 더욱 강화하고 영속시킬 위험이 있다는 것입니다. 데이터에 기반을 둔 인공지능은 주어진 데이터를 기반으로 학습을 합니다. 문제는 주어진 데이터 자체나 설계된 알고리즘 자체에 모종의 편향이 내재할 수 있다는 것입니다. 이 경우 학습된 인공지능도 결과적으로 모종의 편향을 띱니다.”
--- p.367

“우리는 살아가면서 다양한 경험을 합니다. 그리고 개개인의 경험이 다르기 때문에 의견이 다르고 판단도 다릅니다. 선진사회로 발전하기 위해서는 상대방의 다른 의견이나 판단을 존중하고 서로를 이해하는 것이 중요합니다. 그런데 사회 구성원의 데이터과학에 대한 이해의 수준이 올라가면 서로에 대한 이해의 수준도 올라갑니다.”
--- p.387

출판사 리뷰 출판사 리뷰 보이기/감추기

통계로 거짓말하기는 쉬워도 통계 없이 진실을 말하기는 어렵다
불확실함만이 확실한 시대, 통계적 사고로 위험을 헷지(hedge)하라!


바야흐로 불확실성의 시대이다. 비 한 방울 내리지 않는 사하라사막에서 눈이 내리고, 한겨울에도 영상 10도 이하로 내려가지 않는 텍사스에 영하 20도의 한파가 몰아친다. 코로나19로 저점을 찍었던 주식시장은 최고점을 돌파하고, 2018년 열풍 후 대폭락을 겪은 비트코인은 연일 최고치를 경신하며 극적인 폭등세를 유지하고 있다. 이처럼 점점 불확실성이 급증하고 변동성이 최고조에 이른 오늘날, 불확실성은 이제 세계를 움직이는 법칙에 가깝다.
『데이터과학자의 사고법』은 점점 더 불확실해지고 있는 세상에서 통계와 확률로 구성된 데이터과학이라는 전문지식이 어떻게 우리 사회와 삶의 문제를 해결할 수 있는지를 보여준다. 세상과 인생은 우리가 생각한 것보다 훨씬 주사위놀이(확률)에 가깝다. 중요한 것은 불확실성을 없애려고 무모한 시도를 계속하는 것이 아니라 불확실성 자체를 받아들이고 대비하는 것이다. 데이터과학자가 알려주는 통계적 사고법은 인생에서 내리는 중요한 판단에서 찬반이 첨예하게 대립하는 사회적 문제까지 모든 사건에 내재된 불확실성을 이해하고 합리적 의사결정을 할 수 있도록 도와줄 것이다.

한 치 앞도 예측불가능한 상황을 돌파하는 가장 확실한 사고법
확률로 결정되는 세계를 탐험하기 위한 안내서


수학에서 통계 분야는 ‘수포자’를 양산하는 것으로 악명이 높다. 이처럼 확률과 통계가 어려운 까닭은 우리의 직관에 반하는 경우가 많기 때문이다. 안타깝게도 현실은 항상 우리 경험과 직관보다 통계의 손을 들어주기 때문에 우리의 많은 행동이 잘못된 선택이 되곤 한다. 저자 김용대 교수(서울대 통계학과)는 우리를 잘못된 판단으로 이끄는 여러 오류와 편향에 대해 사회 속 다양한 사례를 통해 ‘수포자’도 이해할 수 있게 설명해준다.
누구나 한 번쯤은 생각해봤을 법한 ‘내가 기다리는 버스만 늦게 오는 머피의 법칙’을 설명해주는 ‘길이 편이’부터 수많은 수학 천재들을 파산시킨 ‘극단값’, 2년차 징크스의 미스터리인 ‘평균으로의 회귀’, 행운의 로또번호를 맞추는 방법인 ‘다중비교의 오류’, 투자자들을 울리는 주식시장의 ‘임의보행’까지 책에 등장하는 통계의 핵심 개념들은 지적 자극과 새로운 통찰력을 선사하면서 우리를 확률의 세계로 인도해준다.
나아가 『데이터과학자의 사고법』은 수학교과서로만 접했던 통계와 확률이 얼마나 우리 일상 속에 얼마나 많이 사용되고 있으며 쓸모가 있는지 보여준다. 사실 우리는 일상에서 부동산이 오를지 내릴지 예측하면서 이미 ‘조건부확률’이라는 통계적 사고를 적용하고 있다. 단지 잘못된 데이터와 어림짐작에 근거해서 부정확한 분석을 할 뿐이다. 책에는 우리의 어림짐작과 실제 확률이 얼마나 다른지 보여주는 사례가 많이 등장하는데, 이를 통해 우리가 흔히 착각하는 확률에 대한 오해를 풀어준다. 97% 거짓말탐지기가 법원의 증거로 채택되지 못하는 이유, 한 반에 생일이 같은 두 사람이 있는 이유, 선거전문가들이 트럼프의 당선을 예측하지 못한 이유, 백신의 예방효과가 확률이 아닌 이유 같은 사회적으로 중요한 상황에서의 통계적 판단은 처음 접한다면 거짓말처럼 느껴진다. 그러나 설명을 따라가다 보면 우리의 직관과 경험이 틀렸으며 통계적 사고가 진실로 가는 가장 확실한 길임을 인정할 수밖에 없을 것이다.

데이터과학의 눈부신 활약과 그림자
그리고 이해와 협력의 기초로서 데이터과학


통계학은 현재 데이터과학으로 확장되어 ‘21세기의 석유’라고 불릴 정도로 주목받고 있다. 유튜브의 추천동영상, 인터넷쇼핑, 새벽배송 등 보이지 않지만 새롭게 일상이 된 서비스들이 모두 데이터과학을 기반으로 하기 때문이다. 동시에 데이터과학이 우리의 일상 속으로 깊숙이 스며들면서 이전에는 없었던 새로운 사회적 문제들도 발생하고 있다.
최근 벌어진 인공지능 챗봇 ‘이루다’ 사건은 이런 새로운 문제를 종합적으로 보여준다. 딥러닝을 통해 대화를 학습한 ‘이루다’는 자연스러운 반응으로 화제를 불러일으켰지만, 혐오 발언과 개인정보 유출로 결국 서비스는 중단되고 말았다. ‘이루다’ 사건은 인공지능의 윤리적 문제, 개인정보 유출과 데이터 익명화 문제를 모두 보여준다. 『데이터과학자의 사고법』은 각종 산업 현장에서 활약하고 있는 최첨단 데이터과학과 인공지능의 현재와 미래를 설명하는 동시에 이미 현실화하고 있는 데이터과학으로 인한 문제들에 대해서도 심도 있게 다룬다. 데이터 익명화의 난점을 비롯해 알고리즘 설계 시 편향으로 인한 인공지능 윤리 문제를 조명하고, 대안으로 평가받는 ‘설명해주는 인공지능’ 개념까지 설명해준다.
이처럼 김용대 교수는 데이터과학이 세계와 우리의 삶을 얼마나 바꿔나갈 수 있는지 이야기하는 동시에 데이터과학의 한계와 그 의미를 지적하는 것 역시 놓치지 않는다. 데이터는 왜곡과 조작에 매우 취약할 뿐 아니라 같은 데이터를 어떻게 분석하느냐에 따라 전혀 다른 해석이 나오기도 한다. 모든 통계에는 오류가 있을 수 있으며, 따라서 데이터를 통해 얻은 판단의 한계를 알아야 한다는 것이다. 설령 완벽한 데이터가 있다 해도 완벽한 선택을 보장할 수 없다. 불확실성이 세계를 움직이는 법칙이듯 불완전한 선택 역시 불가피한 것이다. 결국 자신의 판단에 내재된 불완전성을 이해할 때 비로소 타인의 판단에 대해 더 잘 이해할 수 있고 존중과 협력이 가능해진다. 의견 대립이 극단으로 치닫는 오늘날, 데이터과학자가 사회에 던지는 시사점이자 우리가 데이터과학을 더 많이 이해해야 하는 이유이다.

추천평 추천평 보이기/감추기

“요즘 데이터가 홍수다. 길을 잃지 않으려면 모두 눈을 떠야 한다. 바로 저자가 말하는 데이터 리터러시다. 서브프라임모기지 사태의 원인은 무엇이고 고속도로에서 내 차선만 유달리 막히는 이유는 무엇인지, 이 책을 보면 알 수 있다.”
- 김범준 (성균관대 물리학과 교수, 『관계의 과학』 저자)
“통계학의 수련 내공에 따라 세상이 다르게 보일 것이다. 김용대 교수는 다양한 사례를 통해 일반 대중이나 통계학의 초보자들도 깊은 수준의 통계학 사고에 다가갈 수 있게 한다.”
- 박병욱 (서울대 통계학과 교수, 한국통계학회장)
“마음이 없으면 보아도 보이지 않는다는 옛말처럼 준비되어 있지 않으면 데이터를 봐도 진실을 알아채지 못한다. 데이터과학자의 눈으로 바라보면 교묘한 변명과 위장, 편협한 위선과 편견을 논리의 망치로 한 방에 설파해버리는 통쾌함을 맛볼 수 있다.”
- 김유원 (네이버 데이터랩 리더)

회원리뷰 (19건) 리뷰 총점9.5

혜택 및 유의사항?
포토리뷰 감정에 치우치지 않는 데이터 내용 평점4점   편집/디자인 평점4점 스타블로거 : 블루스타 쎄******t | 2021.03.30 | 추천4 | 댓글0 리뷰제목
【 데이터과학자의 사고법 】- 더 나은 선택을 위한 통계학적 통찰의 힘 _김용대 / 김영사   “감정에 치우치지 않는 데이터”   ‘4차 산업혁명’, ‘빅데이터’, ‘인공지능’과 더불어 빼놓을 수 없는 것이 ‘데이터과학’이다. 데이터과학은 빅데이터보다 전문성이 요구되는 분야이다. 이 책의 저자인 통계학 박사이자 데이터사이언스학과 김용대 교수는 현 시대에;
리뷰제목

데이터과학자의 사고법 - 더 나은 선택을 위한 통계학적 통찰의 힘

_김용대 / 김영사

 

감정에 치우치지 않는 데이터

 

‘4차 산업혁명’, ‘빅데이터’, ‘인공지능과 더불어 빼놓을 수 없는 것이 데이터과학이다. 데이터과학은 빅데이터보다 전문성이 요구되는 분야이다. 이 책의 저자인 통계학 박사이자 데이터사이언스학과 김용대 교수는 현 시대에 데이터과학은 우리 주위에 공기처럼 존재한다고 언급한다.

 

데이터과학에 대한 오해 두 가지를 확인해볼 필요가 있다. 첫 번째는 과학을 위한 데이터이다. 데이터 중심 연구가 다양한 과학 분야에서 각광받고 있다. 의학 분야에선 정밀의료’, 생물학 분야에선 생물정보학’, 기상학에선 엘니뇨 예측’, 인지과학분야에선 뇌 네트워크 분석’, 언어학 분야에선 텍스트 마이닝등이 과학을 위한 데이터이다. 이러한 연구들은 데이터과학을 활용한 것이지 데이터과학 그 자체가 아니라는 것이다. 통계학에 가깝다고 봐야 할 것이다. 데이터 과학에 대한 두 번째 오해는 데이터를 위한 기술이라는 것이다. 응용분야의 지식과 데이터 기술은 데이터과학에서 매우 중요한 부분이지만 데이터과학의 전부가 아니라는 것이다. 데이터과학의 핵심에는 데이터로부터 유용하고 새로운 정보를 찾기 위한 합리적 사고방법이 자리 잡고 있다.

 

저자는 이 책을 통해 데이터과학에서 다루는 복잡하고 어려운 방법을 설명하지 않는다. 다만 데이터를 통한 합리적 의사결정이 왜 어려운지 일상 속 여러 사례를 통해서 소개하고, 다양한 분야에서 데이터과학의 활약상을 살펴보고 있다. 데이터를 통한 합리적 의사결정은 응용분야 전문가뿐만 아니라 우리의 일상생활에서도 매우 중요하다는 것에 역점을 둔다.

 

실생활에서 만나는 흥미로운 소재들도 많다. ‘2년차 징크스는 왜 생길까?’_평균으로의 회귀, ‘왜 내 차선만 막히나요?’_데이터 편이, ‘술 취한 사람 이해하기’_임의보행, ‘로또에 당첨되는 법’_다중비교 그리고 데이터의 활약상 챕터에선 인구조사에서 빅데이터 시대까지, 질병과의 전쟁, 유권자의 마음을 읽어라, 당신도 모르는 당신의 마음 등과 데이터과학이 새로운 도전과제로 삼는 인공지능으로 이어진다.

 

미래 예측하기챕터를 정리해본다. ‘차원의 저주와 과적합 문제라는 아리송한 부제가 붙어있다. 미래를 알고 싶어 하는 인간의 욕망은 무한질주이다. 저자는 미래를 아는 것과 미래를 예측하는 것은 다르다고 한다. 누구나 미래를 정확히 알 수 없다. 단지 예측할 뿐이다. 데이터로 미래를 예측하는 어떤 방법이 있을까? 한 예를 들면, 내 수명이 얼마나 남아있을까? 즉 앞으로 얼마나 더 살다 갈 수 있는가? 저자는 한 가지 방법을 제안한다. 나와 가장 비슷한 사람을 국민건강보험공단에서 갖고 있는 사망자 데이터를 통해 예측해볼 수 있다고 한다. 문제는 비슷한 사람을 찾는 것이 관건이다. 설령 (, 몸무게 등 신체조건, 출생지, 학력, 직업 등등)비슷한 사람을 찾았다고 할지라도 과적합 문제에 봉착하게 된다는 것이다., 조건을 너무 많이 적용할수록 결과는 안 좋다. 이럴 경우엔 조건을 줄여서 적당히 비슷한 사람 여러 명을 찾은 뒤 그들의 평균수명으로 의뢰자의 수명을 예측하는 것이 훨씬 정확하다는 이야기다.

 

인공지능이 인간을 넘어설지에 대하여 많은 논의가 진행되고 있습니다. 인공지능은 데이터를 바탕으로 지식을 추출하고 미래를 예측합니다. 따라서 경험해보지 않은 상황에서는 예측을 할 수 없습니다. 반면에 인간은 창의적인 사고로 인류가 경험하지 못한 상황에서도 적절한 판단이 가능할 것입니다. 이러한 면에서 인공지능은 인간을 넘어서기 어려워 보입니다. , 데이터는 감정이 없습니다. 모든 상황에서 객관적인 평가를 할 수 있습니다. 이와 반대로 인간은 감정에 치우치며 종종 일을 그르치곤 합니다. 인공지능과 공존하기 위해서 인간에게 필요한 것이 무엇인지 생각하게 됩니다.” (p.143)

 

 

"출판사에서 도서를 지원 받아 작성한 리뷰"

 

 

#데이터과학자의사고법

#김용대

#김영사

#쎄인트의책이야기2021

 

 


 

4명이 이 리뷰를 추천합니다. 공감 4 댓글 0
데이터과학으로 미래변동 예측할 수 있을까? 내용 평점5점   편집/디자인 평점5점 r*****1 | 2021.04.04 | 추천1 | 댓글0 리뷰제목
미래의 변동을 예측하고자하는 인간의 희망을 실현시켜 줄 데이터 과학, 어떻게 이해할까? p69이렇게 변동은 오랫동안 신의 섭리였다가 데이타과학의 발전으로 인하여 과학의 영역으로 바뀝니다. 데이터과학의 발전으로 달라지고 있는 세상."비나이다. 비나이다.제발 주말에 비오지 않게 해주세요."이젠 이렇게 하늘에 빌지 않는다.일기예보를 본다.ㅎㅎ내일 날씨 예보, 주가의 등락 예상;
리뷰제목
미래의 변동을 예측하고자하는 인간의 희망을 실현시켜 줄 데이터 과학, 어떻게 이해할까?

p69
이렇게 변동은 오랫동안 신의 섭리였다가 데이타과학의 발전으로 인하여 과학의 영역으로 바뀝니다.

데이터과학의 발전으로 달라지고 있는 세상.
"비나이다. 비나이다.
제발 주말에 비오지 않게 해주세요."
이젠 이렇게 하늘에 빌지 않는다.
일기예보를 본다.ㅎㅎ

내일 날씨 예보, 주가의 등락 예상, 코로나 환자수 예측,
그리고 국가 예산 계획이나 마케팅 등등
데이터가 넘쳐나고 불확실성이 커져만가는 시대에 꼭 필요한 데이터 과학자의 사고법

??1부. 데이터 리터러시; 숫자없는 통계학

통계학 기본 개념들부터 설명.
대학원 통계학 시간에 들었던 정규분포, 대립가설, 데이타편이 등
기본 개념들을 실생활 예시들을 들어 쉽게 설명.
빅데이터 개념, 인공지능과 데이터과학의 연관성까지...

p143
인공지능은 데이터를? 바탕으로? 지식을 추출하고 미래를 예측합니다. 따라서 경험해 보지 않은 상황에서는 예측을 할 수 없습니다.

p170
빅데이타 "다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 초고속, 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술? 잋 아키텍처."

??2부 데이터의 활약상; 세상만사의 데이터과학

데이터과학이 어떻게 적용되고 어떤 위험성이 있는지...
의학, 정치, 경제, 마케팅 등등 없는 곳이 없네.
유능한 데이터과학자가 많이 필요하다는 사실...

3부 인공지능; 데이터과학의 새로운 도전.

인간과 비슷한 인공지능은 가능한가?
데이터과학의 발전이 가져온 알파고와 그 이후.
지금도 나날이 발전하고 있는 인공지능,
그리고 데이타 윤리의 필요성...

p347
인공지능은 데이타를 먹고살아갑니다. 인간이 느끼는 약간의 변화가 인공지능에게는 엄청난 변화일 수 있십니다. 데이터가 바뀌기 때문입니다. 인공지능이? 인간을 대체하기 어려운 이유이면서 인공지능과 인간의 공존이 가능한 이유입니다.

p362
인간과 공감하면서 인공지능의 윤리 문제가 대두되고 있습니다. 인공지능이 인간과 윤리적으로 소통을 해야 합니다. (중략) 인공지능에게 윤리를 가르쳐야 합니다.

이 세상의 중요한 모든 것들에 데이타과학이 숨어 있다.
그리고 잘못된 이해와 해석이 가져올 위험이 도사리고 있어 데이터과학에 대한 지식은 필수!

사실 빅데이타 통계 분석은 어렵고 이해하기도 힘들다.
일반인들이 쉽게 이해하고 오류를 찾아내기 힘들다는 것.
요즘 대두되고 있는 정보민주화가 어려운 이유다.
그러므로 데이터과학을 쉽게 이해할 수 있도록 도와주는
이런 책은 현대인의 필수!

1부 통계학은 쫌 지루할 수 있지만 2부와 3부는 술술 재밌게 읽힌다.
생활 곳곳 통계에 대한 이해가 필요함을 느끼게 되고
데이터 리터러시를 키우는데 도움을 주는 책.
1명이 이 리뷰를 추천합니다. 공감 1 댓글 0
포토리뷰 데이터과학자의 사고법 내용 평점5점   편집/디자인 평점5점 스타블로거 : 블루스타 크*벨 | 2021.03.31 | 추천1 | 댓글0 리뷰제목
4차 산업혁명이 시작되면서 개인적으로 관심을 집중했던 영역은 빅데이터였다. 그 어떤 정보보다 정확하게 모든 것의 설명을 가능하게 해주는 그 세계는 알면 알수록 놀랍도록 흥미로운 분야였다. 그냥 데이터 자체로는 날 것 그대로라 사용하기 힘들 수 있지만 그것들을 어떤 툴로, 어떻게 가공하느냐에 따라 모래알 속 진주가 될 수 있었다. 객관적이고 합리적인 결론을 도출해내는 데;
리뷰제목

4차 산업혁명이 시작되면서 개인적으로 관심을 집중했던 영역은 빅데이터였다. 그 어떤 정보보다 정확하게 모든 것의 설명을 가능하게 해주는 그 세계는 알면 알수록 놀랍도록 흥미로운 분야였다. 그냥 데이터 자체로는 날 것 그대로라 사용하기 힘들 수 있지만 그것들을 어떤 툴로, 어떻게 가공하느냐에 따라 모래알 속 진주가 될 수 있었다. 객관적이고 합리적인 결론을 도출해내는 데 필수 불가결한 요소인 데이터과학의 해설서인 이 책 [데이터 과학자의 사고법]은 그런 의문과 궁금증에서 출발한 독서의 시간을 안겨 주었다.

이 책의 저자 김용대 교수는 나와 같이 일반인들도 데이터과학을 좀 더 쉽게 이해할 수 있도록 도움을 주기 위한 것이 이 책의 목표라고 밝히며 오늘날 과학의 새로운 패러다임인 데이터에 대해 꼭 알아야 할 내용들을 쉽게 설명해주고 있다. 먼저 여러 내용을 언급하기 전에 데이터 과학에 대한 정의부터 짚고 넘어가야 한다. 우리는 데이터와 과학에 대해서는 어느정도 알고 있다. 데이터와 과학이 만나 하나의 단어를 만들어 내고 있는 데이터과학은 데이터를 기반으로 하여 합리적인 사고를 하는 방법에 대한 내용을 다루고 있다.

데이터 분석을 위한 학문이자 통계학과 밀접한 영역인 데이터과학은 우리 일상 속에서 자주 접하는 내용들의 바탕이 되는 것이다. 평균소득, 평균 강수량, 신약의 임상시험, 조건부확률 모두 데이터과학을 기반으로 한 통계와 확률의 수치이며 페이스북이나 인스타그램의 추천동영상, 추천쇼핑몰은 데이터과학을 이용한 것이다. 사실 이제는 데이터과학이 다루지 않는 영역이 어디인지를 살펴보는 게 더 나을 정도로 우리 삶의 대부분을 지배하고 있는 것이 데이터과학이다.

 

민간영역에서 데이터의 활용이 활발해지면서 새롭게 부각된 사회적 이슈는 개인정보 유출이다. 정말 자주 받는 보이스피싱, 스미싱의 사기 사례들만 봐도 이들이 내 전화번호와 이름을 어떻게 알고 이렇게 보내나 걱정스럽기만 하다. 새고 있는 개인정보는 코로나19로 인해 더 심각해졌다. 들리는 가게마다 이름과 전화번호를 남겨야 하니 이제 작은 가게에서조차도 개인정보를 제대로 관리하지 않으면 안되는 상황이 되었다. 생각했던 것보다 더 다양한 영역에서 활약하는 데이터과학의 이야기를 접할 수 있었기에 더 나은 미래로 가는 길목에 데이터과학이 지금보다 유용하게 잘 사용되길 바라는 마음이 커졌다.

'좀 더 정확하게 미래를 예측하려면 좋은 데이터와 유능한 데이터과학자가 필요합니다. 데이터과학이 다루는 중요한 분야 중 하나가 바로 미래에 대한 예측입니다(p135)'

 

 


 

<출판사로부터 책을 제공받아 작성한 서평입니다>

1명이 이 리뷰를 추천합니다. 공감 1 댓글 0

한줄평 (5건) 한줄평 총점 9.6

혜택 및 유의사항 ?
구매 평점5점
읽고 싶었던 책이었고, 시간 가는 줄 모르고 읽게 되었네요.
1명이 이 한줄평을 추천합니다. 공감 1
공**주 | 2022.10.08
구매 평점5점
통계 및 데이터 사이언스관련 배경지식에 도움이 될 것 같습니다
1명이 이 한줄평을 추천합니다. 공감 1
J**1 | 2022.03.02
구매 평점5점
통계적상식과 실무적활용에 대한 좋은 안내서저
1명이 이 한줄평을 추천합니다. 공감 1
********************** | 2021.04.30
  •  쿠폰은 결제 시 적용해 주세요.
1   15,120
뒤로 앞으로 맨위로 공유하기