이미 소장하고 있다면 판매해 보세요.
|
|
머리말
1장 데이터 정리를 위한 기본 수학 01_ 평균 02_ 나눗셈의 2가지 의미 03_ 비율 04_ 여러 가지 그래프 [ 연습문제 ] [ 수학을 통계에 응용하기 ] 05_ 데이터와 변량 06_ 히스토그램 07_ 대푯값 08_ 데이터의 분포 상태를 조사한다 09_ 상자그림 2장 데이터 분석을 위한 기본 수학 01_ 제곱근 02_ 제곱근의 계산 03_ 분배법칙 04_ 다항식의 전개 [ 연습문제 ] [ 수학을 통계에 응용하기 ] 05_ 분산 06_ 표준편차 07_ 편찻값 3장 상관관계를 알기 위한 수학 01_ 함수 02_ 1차함수 03_ 2차함수의 기초 04_ 그래프의 평행이동 05_ 완전제곱과 2차함수의 그래프 06_ 2차함수의 최댓값과 최솟값 07_ 2차함수와 2차방정식 08_ 그래프와 판별식의 관계 09_ 2차부등식 [ 연습문제 ] [ 수학을 통계에 응용하기 ] 10_ 산포도 11_ 상관계수 12_ 상관계수의 이론적 배경 13_ 상관계수의 ‘직관적’ 이해 4장 흩어져 있는 데이터 분석을 위한 수학 01_ 계승 02_ 순열 03_ 조합 04_ 이항계수 05_ 집합 06_ 확률 07_ 합집합과 교집합 08_ 독립시행 09_ 반복시행 10_ 등차수열 11_ 등비수열 12_ Σ 기호 13_ Σ의 기본성질 [ 연습문제 ] [ 수학을 통계에 응용하기 ] 14_ 확률변수와 확률분포 15_ 기댓값 16_ aX+b의 기댓값 17_ aX+b의 분산과 표준편차 18_ 확률변수의 표준화 19_ 합의 기댓값 20_ 곱의 기댓값 21_ 합의 분산 22_ 이항분포 5장 연속 데이터 분석을 위한 수학 01_ ‘무한’의 이해 02_ 극한 03_ 네이피어수 e 04_ 적분 [ 연습문제 ] [ 수학을 통계에 응용하기 ] 05_ 연속형 확률변수와 확률밀도함수 06_ 연속형 확률변수의 평균과 분산 07_ 정규분포 08_ 정규분포표 09_ 추측통계란 [ 연습문제 해답 ] 맺음말 |
|
산포도를 이해하려면 1차함수와 그 그래프의 성질을 알아야 한다. 또한 상관계수의 원리는 결코 쉽지 않으며, 이것을 확실히 이해하려면 2차함수의 최댓값·최솟값이나 2차방정식의 판별식, 그리고 2차부등식 등의 수학도 꼭 필요하다. 이것들은 모두 고교 수학에서 가장 큰 비중을 차지하는 중요 단원이므로 이번 장은 상당히 배우는 보람이 있는 내용일 것이다. 이번 장의 중심 주제는 한마디로 말하면 ‘함수’다. (자세한 것은 뒤에서 쓰겠지만) 함수의 이해는 원인과 결과 관계의 파악과 연관이 있다. 또한 통계적인 상관관계의 이해를 도울 뿐 아니라 사물을 논리적으로 사고할 때의 기초도 된다. 그만큼 중요하므로 중·고등학교 때 함수를 어려워했거나 그냥 통째로 외워서 점수를 땄던 사람이라도 반드시 다시 공부해보자. ---「상관관계를 알기 위한 수학」중에서
이번 장에서는 띄엄띄엄 있는 값을 갖는 ‘흩어져 있는 데이터(이산형 데이터)’의 통계 분석에 필요한 수학을 배워보자. 공부해야 할 기둥은 2개로 하나는 확률이고, 다른 하나는 Σ(시그마) 기호다. 정통(?) 통계 책에는 대부분 ‘확률·통계’라는 제목이 붙어 있다. 왜 ‘통계’와 ‘확률’은 세트일까? 원래 통계의 목표는 (대략적으로 말하면) 세계의 ‘우연’ 안의 법칙성을 찾아내고, 그 법칙성을 사용해 부분에서 전체를 추측하는 것이다. 이 추측에 확률 지식이 반드시 필요하다. 예를 들어 당신이 시험공부를 하나도 하지 않고 4지선다형 문제를 풀어서 50점 이상을 받았다고 하자. 과연 이것은 ‘상당한 행운’일까 아니면 ‘흔히 있는 일’일까? 확률은 그 답을 가르쳐준다. 확률을 배우려면 순열이나 조합이라는 경우의 수나 집합을 알아야 한다. 또한 통계의 이항분포와 연관된 이항계수(정리)나 반복시행도 배운다. ---「흩어져 있는 데이터 분석을 위한 수학」중에서 추론통계는 표본을 조사하여 모집단의 특성을 확률론적으로 예상하는 ‘추정’과, 얻어진 데이터의 차가 오차인지 또는 어떤 의미가 있는 차인지를 검증하는 ‘검정’을 2개의 축으로 한다. 예를 들어 선거 때 매스컴이 보도하는 당선 예상은 모든 사람을 조사한 결과는 아니다. 일부 유권자만 설문조사해 추정한 것이다. 이 경우 모든 유권자는 ‘모집단’, 설문을 실시한 유권자는 ‘표본’이다. 그 밖에도 시청률이나 여론조사에도 ‘추정’이 사용된다. 한편 ‘짝수냐 홀수냐의 주사위 도박에서 20번 중에 15번이나 짝수가 되는 것은 사기다’ ‘커피를 마시면 장수한다’ 같은 가설의 신빙성을 판단하는 것이 ‘검정’이다. ---「연속 데이터 분석을 위한 수학 (09 추론통계란)」중에서 이 책의 목적은 통계를 혼자 공부할 수 있도록 만들어주는 것이다. 이 책에서 소개한 수학 내용을 어느 정도 파악한 독자라면 앞으로 추론통계 공부를 계속하는 것이 그리 어렵지 않을 것이다. 출판사가 ‘통계에 쓰는 수학의 해설서를 써주실 수 있겠느냐’는 의뢰를 했을 때 그런 책이 있으면 많은 직장인이 혼자 통계를 공부할 수 있겠구나 하고 확신했다. 세상에 도움이 되는 책을 쓸 수 있다는 것은 저자에게 있어 최고의 기쁨이다. ---「맺음말」중에서 |
|
이 책은 일본 경제·경영 부문 베스트셀러 1위에 오른《빅데이터를 지배하는 통계의 힘》의 인기와 함께 ‘통계 수학책’에 대한 요구에 의하여 기획되었다. 《통계가 빨라지는 수학력》의 저자 나가노 히로유키는 한국에서도 독자에게 극찬을 받은《수학력》의 작가이자 수학을 잘 가르치기로 유명한 도쿄 대학교 출신의 인기 강사로서, 수많은 직장인이 통계에 필요한 수학을 배우기 위해 그가 운영하는 나가노수학학원에 줄을 선다고 한다.
책을 펼치면 수학 공식만 쭉 나열되어 있는 듯 보여서 처음엔 어렵게 느껴지지만 다년간의 강의 경험을 토대로 다양한 예제와 친근한 일러스트를 동원해 하나하나 쉽고 친절하게 짚어주어 직접 현장에서 생생하게 강의를 듣는 듯 완전히 몰두하게 된다. 또 어려운 개념이나 추가 설명이 필요할 때는 통계를 전공한 센슈 대학교의 오카다 겐스케 교수가 일러스트와 함께 등장해 보충 설명을 해주고 다시 방향을 잘 찾도록 길잡이 역할도 해준다. 이 책만의 가장 큰 장점은 각 장마다 앞쪽에 수학 설명을 한 다음에는 이것들이 통계에서 어떻게 응용되고 활용되는지 하나하나 연결해주었다는 점이다. 수학 따로, 통계 따로가 아니라 둘의 연관성을 알기 쉽게 설명해 ‘통계 초보자에게 꼭 필요한 수학개념’을 익힐 수 있는 책으로 완성되었다. 또한 수학은 책을 그냥 읽어서는 자신이 진짜 이해했는지 알 수 없는 법이기에, 각 장의 수학 설명이 끝날 때마다 직접 독자가 연필을 들고 문제를 풀어볼 수 있도록 연습문제까지 실었다. 내용 소개 1장 데이터 정리를 위한 기본 수학은 정규교육을 받은 일반적인 사회인이라면 누구나 알고 있을 아주 간단한 개념에서부터 시작된다. 그렇지만 쉽다고 절대 만만히 볼 수 없는 것이 평균, 나눗셈의 의미와 비율, 그래프 등의 기본 개념을 정확히 알아두지 않으면 통계에서 헷갈리기 쉽기 때문이다. 이들은 통계에서는 데이터와 변량, 히스토그램, 대푯값에 사용되어 설득력 있는 프레젠테이션 자료를 만들 수 있게 하거나 변형된 외부 자료에 속지 않도록 도와준다. 2장 데이터 분석을 위한 기본 수학에서는 제곱근과 다항식의 계산 등을 통해 통계에 꼭 필요한 분산, 표준편차, 편찻값이 어떤 과정을 통해 구해지며 기본 식 안에 든 개념은 무엇인지 자세히 설명한다. 정규분포에서 모든 데이터의 약 70%(68.26%)가 표준편차 1개 분 안에 들어간다는 것의 의미를 수학적으로, 통계적으로 정확히 파악할 수 있다. 3장 상관관계를 알기 위한 수학에서부터는 수식이 조금 많아진다. 1차·2차함수와 그래프, 판별식, 부등식을 공부하고 산포도뿐 아니라 상관계수의 이론적 배경과 직관적 이해도를 높인다. 4장 흩어져 있는 데이터 분석을 위한 수학은 이 책의 하이라이트 부분에 해당한다. 경우의 수, 확률, 시그마 계산을 통해 확률변수와 확률분포, 기댓값, 이항분포 등을 알아본다. 5장 연속 데이터 분석을 위한 수학에서는 드디어 극한, 네이피어수와 적분 등이 나온다. 이를 통해 정규분포가 어떻게 계산되었는지, 왜 세상의 많은 일이 데이터를 계속 쌓아나가면 정규분포를 이루게 되는지 알게 된다. 또 추론통계의 맛보기로 추정과 검정 방법을 예제를 통해 설명한다. 난이도와 연관성에 따라 각 장을 구성했는데 현대 젊은이들이 반드시 배워야 할 통계는 3장까지 모두 정리했고, 4장부터 5장은 심화단계로서, 이산형 데이터의 확률분포와 연속형 데이터의 확률밀도함수 등을 이해할 수 있도록 구성하였다. 즉 수집한 데이터에서 필요한 정보를 읽어내는 기술통계를 총괄하고 부분적인 데이터로 전체를 예측하는 추론통계의 시작 단계까지 안내자 역할을 하고 있는 것이다. |