이미 소장하고 있다면 판매해 보세요.
시작하면서
제0강의 ‘통계학’을 효율적으로 한 단계씩 이해하는 것이 목적 1. 이 책은 왜 2부 구성으로 되어 있는가? 2. 통계학이란 무엇인가? 기술통계와 추리통계 3. 표준편차를 가장 중요하게 다룬다 4. ‘확률’은 거의 다루지 않는다 5. ‘95% 예언적중구간’으로 설명한다 6. 수학 기호나 공식은 거의 사용하지 않는다 7. 괄호를 채우는 간단한 연습문제로 독학이 가능하다 제1부 표준편차부터 검정과 구간추정까지를 한번에 제1강의 도수분포표와 히스토그램 : 데이터의 특징을 돋보이게 하는 도구 1. 데이터 자체로는 아무것도 알 수 없기 때문에 통계를 사용 2. 히스토그램 만들기 [제1강의 정리] [연습문제] 제2강의 평균값의 역할과 평균값을 이해하는 방법 : 평균값은 지렛대가 균형을 이루는 지점 1. 통계량은 데이터를 요약한 수치 2. 평균값이란? 3. 도수분포표에서의 평균값 4. 히스토그램에서 평균값의 역할 5. 평균값을 어떻게 이해해야 하는가? [제2강의 정리] [연습문제] [Column] 평균을 구하는 방법은 여러 가지 [보충설명] 지렛대가 균형을 이루는 받침점이 ‘산술평균’이 되는 이유 제3강의 분산과 표준편차 : 흩어져 있는 데이터 상태를 추정하는 통계량 1. 불규칙한 통계량을 아는 것이 중요 2. 버스 도착시간으로 분산을 이해 3. 표준편차의 의미 4. 도수분포표로 표준편차를 구하는 방법 [제3강의 정리] [연습문제] [보충설명] 편차의 평균이 반드시 0이 되는 것을 증명 제4강의 표준편차① : 데이터의 특수성을 평가 1. 표준편차는 ‘파도의 거칠기’ 2. 표준편차로 데이터의 ‘특수성’을 평가 3. 여러 데이터 세트를 비교할 때의 표준편차 4. 가공된 데이터의 평균값과 표준편차 [제4강의 정리] [연습문제] 제5강의 표준편차② : 주식리스크의 지표(주가변동성)로 활용 1. 주식의 평균수익이란? 2. 평균수익률만으로는 우량기업인지 판단할 수 없다 3. 주가변동성이 의미하는 것 [제5강의 정리] [연습문제] 제6강의 표준편차③ : 하이 리스크와 하이 리턴, 샤프지수도 이해 1. 하이 리스크와 하이 리턴, 로우 리스크와 로우 리턴 2. 금융상품의 우열을 가리는 방법 3. 금융상품의 우열을 가리는 수치, 샤프지수 [제6강의 정리] [연습문제] 제7강의 정규분포 : 키, 동전 던지기 등에서 흔히 볼 수 있는 분포 1. 가장 많이 발견할 수 있는 데이터 분포 2. 일반정규분포를 보는 방법 3. 키 데이터는 정규분포를 따른다 [제7강의 정리] [연습문제] [보충설명] 세상에 정규분포가 가득한 이유 제8강의 통계적 추정의 출발점 : 정규분표를 이용해서 ‘예언’ 1. 정규분포의 성질을 이용해 ‘예언’을 할 수 있다 2. 표준정규분포의 95% 예언적중구간 3. 일반정규분포의 95% 예언적중구간 [제8강의 정리] [연습문제] [Column] 예언을 정확히 맞추는 점쟁이의 기술 제9강의 가설검정 : 하나의 데이터로 모집단을 추리 1. 통계적 추정이란 부분으로 전체를 추리하는 것 2. 더욱 정확한 모집단을 추정 3. 95% 예언적중구간으로 가설의 타당성 판단 [제9강의 정리] [연습문제] [Column] 통계적 검정의 획기적인 점과 한계 제10강의 구간추정 : 95% 적중하는 신뢰구간 찾기 1. 예언적중구간을 추정에 역이용 2. 신뢰구간 ‘95%’가 의미하는 것 3. 표준편차를 아는 정규모집단의 평균값에 대한 구간추정 [제10강의 정리] [연습문제] 제2부 관측 데이터 뒷면에 펼쳐져 있는 거대한 세계를 추측한다 제11강의 모집단과 통계적 추정 : ‘부분’으로 ‘전체’를 추론 1. 모집단은 가상의 항아리 2. 랜덤 샘플링과 모평균 [제11강의 정리] [연습문제] 제12강의 모분산과 모표준편차 : 모집단 데이터의 분포 상태를 나타내는 통계량 1. 데이터의 분포 상태를 파악 2. 모분산과 모표준편차의 계산 [제12강의 정리] [연습문제] 제13강의 표본평균① : 여러 데이터의 평균값은 한 데이터의 평균값보다 모평균에 가깝다 1. 관측된 하나의 데이터로부터 무엇을 말할 수 있는가? 2. 표본평균을 구하는 이유 [제13강의 정리] [연습문제] 제14강의 표본평균② : 관측 데이터가 늘어날수록 예언 구간은 좁아진다 1. 정규분포에서 보이는 표본평균의 성질 2. 정규모집단에서의 표본평균에 대한 95% 예언적중구간 [제14강의 정리] [연습문제] 제15강의 표본평균을 이용한 모평균의 구간추정 : 모분산을 알고 있는 정규모집단의 모평균은? 1. 모평균이나 모분산을 추정하기 위한 방법 2. 표본평균을 이용한 모평균의 구간추정 [제15강의 정리] [연습문제] 제16강의 카이제곱분포 : 표본분산을 구하는 방법과 카이제곱분포 1. 표본킺산을 구하는 방법 2. 카이제곱분포란? [제16강의 정리] [연습문제] 제17강의 정규모집단의 모분산을 추정 : 모분산을 카이제곱분포로 추정 1. 카이제곱분포의 95% 예언적중구간 2. 정규모집단의 모분산을 추정 [제17강의 정리] [연습문제] 제18강의 표본분산의 분포는 카이제곱분포 : 표본분산과 비례하는 통계량 W 1. 표본분산과 비례하는 통계량 W를 만드는 방법 2. 표본분산의 카이제곱분포는 자유도가 하나 낮은 수가 된다 [제18강의 정리] [연습문제] [보충설명] W 자유도가 V 자유도보다 1만큼 작은 이유 제19강의 모평균이 미지인 정규모집단을 구간추정 : 모분산은 모평균을 몰라도 추정 가능 1. 모평균을 몰라도 모분산을 추정 2. 모분산 추정의 구체적인 예 [제19강의 정리] [연습문제] 제20강의 t분포 : 모평균 이외의 것은 ‘현실에서 관측된 표본’으로 계산할 수 있는 통계량 1. t분포 2. t분포의 히스토그램 3. 통계량 T의 계산 4. t분포의 정식적인 정의 [제20강의 정리] [연습문제] [Column] t분포의 발견은 기네스 맥주 덕분 제21강의 t분포로 구간추정 : 정규모집단에서 모분산을 모를 때의 모평균 추정 1. 가장 자연스러운 구간추정 - t분포 2. t분산를 이용한 구간추정 방법 [제21강의 정리] [연습문제] 책을 맺으면서 연습문제 해답 찾아보기 |
Hiroyuki Kojima,こじま ひろゆき,小島 寬之
고지마 히로유키의 다른 상품
추리통계는 통계학 방법과 확률 이론을 섞은 것으로, ‘전체를 파악할 수 없을 정도의 큰 대상’이나 ‘아직 일어나지 않은, 미래에 일어날 일’에 관해 추측하는 것이다. 이것은 20세기에 들어서 확립된 방법론으로, ‘부분으로 전체를 추측한다’는 의미이며, 지금까지 없었던 아주 새로운 과학이라고 해도 과언이 아니다. --- 통계학이란 무엇인가 중에서
‘통계학에서 가장 중요한 도구는 표준편차’라고 생각하고 있지만, 많은 통계학 교과서에서는 정의와 계산법을 설명하는 정도로만 다루고 있다. 그러나 표준편차를 충분하게 이해하고 있지 않으면, 그 뒤에 전개되는 정규분포와 카이제곱분포, t분포를 이용한 추리통계 방법론을 만났을 때 대체 그것들이 무엇을 하는 것인지 잘 이해할 수 없다. 그래서 많은 사람들이 통계학을 공부하다가 좌절을 느끼게 되는 것이다. --- 표준편차를 가장 중요하게 다룬다 중에서 축약이라는 것은 데이터의 세부적인 수치들을 희생시키지만, 이 희생으로 데이터의 분포와 그 이면에 있는 특징들이 돋보이게 된다. 이것을 ‘이야기의 요점’으로 설명할 수 있다. 누군가에게 이야기를 할 때 처음부터 끝까지 전부 말하면 상대방은 무엇이 중요한지 모른다. 하지만 세부적인 이야기나 비교적 필요하지 않은 부분들을 생략하고 이야기하면 ‘요점’이 돋보인다. 우리들이 알고 싶은 것은 대부분의 경우 ‘이야기 전부’가 아니라 그 ‘요점’일 경우가 많다. --- 히스토그램 만들기 중에서 평균값은 분포하고 있는 데이터 중에서 대표적인 수로 꺼낸 것이다. 그래서 데이터는 평균값을 기점으로 해서 그 앞뒤에 널리 퍼져 있다고 생각해도 좋다. 그러나 어느 정도 퍼져 있거나 흩어져 있는지는 평균값으로 알 수가 없다. 그 퍼져 있거나 흩어져 있는 것을 평가하는 것이 표준편차다. 표준편차는 데이터들의 평균값에서 떨어져 있는 것을 평균화하는 것이다. --- 표준편차의 의미 중에서 주식거래에서는 수익률의 평균값만이 아니라 그 표준편차도 중요하다. 그렇기 때문에 이 표준편차를 뜻하는 특별한 전문용어가 있는데, 그것을 주가변동성(Volatility)이라고 한다. 즉, 평균값에서 어느 정도의 폭으로 변동이 생기는가를 의미하는 말이다. 그래서 주식 수익률의 표준편차=주가변동성은 주식거래 리스크의 지표라고 생각할 수 있다. 왜냐하면, 수익으로 그 평균값을 예상해도 그 값에서부터 주가변동성만큼 떨어지는 경우도 충분히 염두에 두어야 하기 때문이다. 주가변동성은 바로 위험성을 나타내는 지표다. --- 주가변동성이 의미하는 것 중에서 많이 사용되는 것은 ‘95% 적중’ 혹은 ‘99% 적중’의 범위다. 이 책에서는 가장 자주 사용되는 ‘95% 적중’을 예로 들도록 하겠다. ‘95% 적중의 범위를 고른다’는 말을 뒤집으면 ‘5%의 예언은 틀린다’는 말이다. 일반적으로 발생확률이 5%를 밑도는 현상(예를 들어서 동전 던지기를 5번 던져서 5번 뒷면이 나오는 등)에 대해 사람들은 ‘흔치 않은 이상한 일’이라는 인상을 받는다. 다시 말해, 5%는 예언이 틀리더라도 우연에 의해 ‘보기 드물게 일어난 이상한 일이어서 어쩔 수 없다’고 납득할 수 있는 수치다. --- 표준정규분포의 95% 예언적중구간 중에서 선거의 경우, 모집단은 투표를 한 모든 사람들의 투표결과를 말한다. 그런데 관측된 데이터는 ‘출구조사에서 얻은 투표 결과’여서 모집단인 모든 투표자들의 수에 비하면 아주 적은 수에 불과하다. 선거라는 것은 ‘몇 시간 안에 모든 데이터가 밝혀진다’는 의미에서 통계학적으로 볼 때, 상당히 귀중한 상황 연구법이다. 아주 적은 수의 예외를 제외하면, 출구조사에 따른 예측과 선거의 실제 결과가 아주 정확하게 일치한다. --- 통계적 추정 중에서 |
중학교 기초수학으로 3주 만에 끝내는 통계학
마케팅을 위한 데이터 분석, 금융상품의 리스크와 수익률 분석, 주식과 환율의 변동률 분석 등 쏟아지는 데이터에서 의미 있는 정보를 뽑아내기 위한 것이 통계를 공부하는 이유다. 하지만 복잡한 수학공식과 난해한 설명으로 배우기가 쉽지 않다. 이 책은 복잡한 공식과 기호는 하나도 사용하지 않고 사칙연산과 제곱, 루트 등 중학교 기초수학만으로 통계학의 기초를 확실히 잡아준다. 통계에 밝아야 경쟁에서 이긴다 무한경쟁의 비즈니스 세계에서는 수없이 쏟아지는 데이터와 수치들 속에서 어떤 의미 있는 정보를 뽑아낼 수 있느냐 없느냐에 따라 비즈니스의 성패가 갈린다. 시장의 가격 동향, 소비자의 소비 동향, 주식과 환율의 변동, 부동산가격의 변동 등 숫자로 표현되는 여러 현상들을 분석해 자신과 자신이 속한 기업에 필요한 정보를 뽑아내고 정확히 예측해야 성공하는 전략, 이기는 전략을 세울 수 있다. 이렇게 성공하고 이기는 전략을 세우는 기초가 되는 것이 바로 통계다. 작게는 투자자 개인이 주식이나 부동산가격의 데이터를 분석해 앞으로의 가격 동향을 정확히 예측해야 돈 버는 투자전략을 세울 수 있고, 크게는 국가가 여러 통계자료를 분석해 미래를 정확히 예측해야 국가발전전략을 세울 수 있다. 개인이나 기업이나 국가나 무한경쟁의 시대에 살아남기 위해서는 미래를 정확히 예측할 수 있는 통계에 밝아야 한다. 비즈니스맨을 위한 3주 완성 통계학입문 영업, 기획, 마케팅 등 어느 부서에서나 데이터를 분석하고 전략을 짜기 위해 필요한 것이 통계수치다. 하지만 통계라는 말만 들어도 울렁증을 일으키는 비즈니스맨이 많다. 그것은 지금까지 너무 어렵게 통계를 배워왔기 때문이다. 이 책은 초보 중의 초보라도 통계학에서 가장 중요한 항목인 ‘검정’과 ‘구간추정’을 가장 쉽게, 그리고 가장 빨리 이해할 수 있도록 했다. 어려운 수학 공식은 하나도 사용하지 않고, 구체적인 사례를 들며 상세히 설명했기 때문에 수학을 잘 못하는 사람이라도 쉽게 통계를 배울 수 있다. 총 21개 강의로 구성되어 있어, 아무리 바쁜 비즈니스맨이라도 하루에 30분만 투자하면 3주 만에 통계학의 기초를 마스터할 수 있다. 책의 특징 1. 통계학 가운데 가장 필수적인 부분만 다룬 아주 쉬운 입문서다. 2. 초보적인 수준에서 시작해 ‘검정’과 ‘구간추정’이라는 통계학의 아주 중요한 항목까지 최단시간에 이해할 수 있도록 구성되어 있다. 3. 미분적분, 시그마(∑), 콤비네이션 공식(nCk), 확률변수 기호(P(X=x)) 등 어려운 수학공식은 전혀 사용하지 않는다. 따라서 사칙연산과 제곱, 중학교 기초수학인 루트와 1차방정식만으로 이해할 수 있다. 4. 통계학을 이해하는 열쇠인 표준편차를 중점적으로 설명한다. 5. 버스시간표, 주식 지표, 금융상품의 리스크와 수익률, 선거의 출구조사 등 구체적인 사례를 들어 알기 쉽게 설명한다. 6. 기업의 성장률, 주식의 월평균수익률, 펀드의 운용실적 등의 예를 통해 금융상품의 우열을 가리는 안목을 키울 수 있다. 7. ‘95% 예언적중구간’이라는 독창적인 해석을 도입해 통계학 개념에 대한 이해를 돕는다. 8. 괄호를 채우는 간단한 연습문제를 통해 공부한 내용을 확인하고 완전히 자기 것으로 만들 수 있다. |