품목정보
발행일	2020년 02월 29일
쪽수, 무게, 크기	240쪽 \| 506g \| 17223520mm
ISBN13	9791196752521
ISBN10	1196752524

더보기

책소개 책소개 보이기/감추기

데이터 혁명 시대, 비전공자를 위한 쉽고 유용한 데이터 사이언스 입문 서적! 『데이터 사이언스 입문』은 흥미로운 사례를 통해 이해하는 데이터 분석 실무서로 어려운 통계 기호 없이 통계적 시각을 확보하고 실무적으로 즉시 활용 가능한 데이터 분석 기법을 제공한다. 아무리 몇 년을 공들여 만든 제품이 경쟁상품과 다르게 효과적인 장점을 지녔다고 하더라도 정확한 데이터 분석이 이루어지지 않는다면 뚜렷한 성과를 거두지 못하는 경우가 허다할 것이다. 그렇다면 고객의 니즈를 꿰뚫어보려면 어떻게 해야 할까? 마트 상품 진열, 제약회사의 마케팅, 대통령 선거 전략 등과 같은 성공적인 데이터 분석 사례를 통해 확인할 수 있듯이, 다양한 가설검증 기법들을 활용하여 데이터의 패턴을 파악하면 미래를 좀 더 명확하게 예측할 수 있다. 이를 통해 다양한 업계에 종사하는 모든 분께 새로운 발전 가능성을 부여한다. 데이터 분석, 이제는 4차 산업 혁명 시대에 꼭 필요한 핵심 역량이다. 이는 데이터 분석 전문가들에게만 국한되는 이야기가 아니다. 인문, 과학, 예술 등 업종불문 데이터를 분석해야만 의미 있는 성과를 거둘 수 있는 시대이다. 그리고 이러한 추세는 앞으로 지속될 전망이다. 이에 기업은 데이터 분석을 통해 도출된 솔루션으로 다양한 형태의 데이터 인사이트를 실시간으로 발굴하고 복잡한 의사결정을 자동으로 해결함으로써 지속적인 수익창출을 위해 노력하고 있다. 사업의 목표가 곧 이윤창출이라면 데이터 분석이 해답이다. 여러분이 어느 기업에 있든지, 기업의 매출 상승을 위해서 데이터 분석을 반드시 활용해야 한다. 본 도서는 빅데이터, R, Python, 인공지능 등 모호했던 개념들을 명확하게 이해하고, 단기간에 데이터 사이언스 전체 프로세스를 파악하여 실무에 즉시 적용 가능한 데이터 분석 기법들을 알아본다. 또한 데이터 분석에 필요한 통계 지식을 어려운 통계 기호를 전혀 사용하지 않고, 사례를 통해 통계적 시각을 확보할 수 있다. 이 책을 통해 실무자들은 현실의 의사결정 과정에 데이터 분서 스킬을 적용함으로써 기업의 급속 성장을 꾀할 것이다.

더보기

목차 목차 보이기/감추기

PART 1 데이터 사이언스의 이해 01 데이터 분석의 목적은 더 나은 의사 결정이다 02 도대체 데이터란 무엇인가? 03 데이터 분석에 필요한 4가지 역량 PART 2 데이터 분석 프로세스와 데이터 취합 01 데이터 분석 프로세스 02 데이터 취합과 크롤링 03 데이터 전처리 PART 3 탐색적 데이터 분석과 기술통계 01 탐색적 데이터 분석이란? 02 기술 통계량과 차트 03 분산과 표준편차는 변동성을 가리킨다 04 일반적인 것과 특별한 것 PART 4 샘플 데이터로 전체를 예측할 수 있는가? 01 전수조사의 문제점 02 몬테카를로 동전 실험과 표본오차 03 중심 극한의 정리 04 표준오차와 적정 표본 수 05 표본오차와 비표본오차 06 무작위 추출과 근거 피라미드 PART 5 가설 수립과 유의성 검정 01 네이만-피어슨 추론과 베이즈 추론 02 표준 통계학의 역사 03 귀무가설과 대립가설 04 유의수준과 유의확률 05 표준 통계학의 가설 검정 단계 06 유의확률 계산 도구 07 언제 어떤 검정법이 필요한가? 08 카이제곱 검정: 월마트 영수증 분석 09 T 검정: 두 표본 집단간의 평균의 비교 10 회귀분석: 노벨상을 수여한 구호 사업 PART 6 머신러닝과 데이터 분석 모델링 01 알고리즘과 데이터 분석 모델 02 데이터 분석 모델의 복잡도와 성능 03 인공지능과 머신러닝, 그리고 딥러닝 04 머신러닝이 탁월한 효과를 발휘하는 순간 05 베이즈 추론과 축차합리성 06 널리 알려진 머신러닝 알고리즘 PART 7 대표적인 데이터 분석 도구 01 알고리즘 구현 언어 02 입문자 추천 데이터 분석 도구 03 자, 이제 남은 건? 04 저자의 말 Appendix - 주요 데이터 분석 도구 소개

더보기

상세 이미지 상세 이미지 보이기/감추기

상품 이미지를 확대해서 볼 수 있습니다. 원본 이미지

더보기

저자 소개 (2명)

책 속으로 책속으로 보이기/감추기

“정보 홍수 시대에 소화해야 할 지식은 폭증하는 상황이다. 데이터 사이언스 분야에 입문하거나 데이터 분석을 실무에 적용해서 가시적인 성과를 만들어내야 하는 사람들이 이 책을 통해서 짧은 시간 안에 데이터 사이언스 전체 그림을 파악하고, 실무 데이터 분석 기법들을 이해하고 적용하는 구체적인 방법을 제시하고자 한다.”
--- p.5, 「머리말」중에서

“방대한 데이터의 관계를 수학적으로 파악하는 과정을 사람이 수작업으로 진행하는 것은 불가능에 가깝다. 따라서, 데이터 분석 업무에는 반드시 분석 도구의 힘을 활용할 수 있어야 한다. 인기 있는 분석 도구의 종류는 엑셀(Excel), 구글 애널리틱스(Google Analytics), R Studio, 파이썬(Python), 애저(Azure), 아파치(Apache), 텐서플로우(TensorFlow) 등 헤아릴 수 없이 많다. 이 중 완벽한 도구란 없으며, 모든 도구는 각각 특징이 있고, 특정 분석 모델이나 알고리즘, 기능에 강점을 갖는다. 분석 도구는 데이터 분석 프로세스의 일부분을 사람 대신 수행하는 역할을 하는 것으로, 분석 도구 활용 역량이 분석의 질에 큰 영향을 줄 수도 있다.”
--- p.32, 「데이터 사이언스의 이해」중에서

“웹에서 데이터를 수집하는 크롤링은 매우 어려운 작업처럼 보이지만, 흔히 쓰는 엑셀(Excel) 프로그램을 이용해 누구나 할 수 있다. 엑셀 2010 PRO 이후 버전을 쓰는 사람이라면 누구나 [데이터] 탭에서 “외부 데이터 가져오기”를 볼 수 있다. 웹 크롤링을 하려면 데이터를 가져올 곳을 “웹”으로 선택하면 된다. ”
--- p.42, 「데이터 분석 프로세스와 데이터 취합」중에서

“탐색적 데이터 분석은 모든 데이터 분석 프로젝트에서 반드시 거쳐야 하는 필수 단계이다. 데이터에 관한 직관을 얻거나 변수의 분포를 비교하기 위해서, 데이터가 온전한지 확인하고, 결측치나 이상치를 찾아낼 뿐만 아니라 데이터를 요약하는 방법으로 탐색적 데이터 분석을 잘 활용할 수 있다. 탐색적 데이터 분석에서 얻은 이해는 적절한 알고리즘을 알려 주고, 분석 모델의 성능을 향상시키는 훈련 방법을 찾게 도와준다. 또한 탐색적 데이터 분석 과정에서 활용하는 다양한 데이터 시각화와 비교, 대조만으로 충분한 인사이트를 얻을 수도 있다.”
--- p.50, 「탐색적 데이터 분석과 기술통계」중에서

“데이터 분석의 궁극적인 목적은 더 나은 의사 결정이다. 만약 앞으로 일어날 수많은 사건에 변동성(불확실성 = 위험 = 분산과 표준편차)이 없다면, 뻔한 미래를 예측하고자 데이터를 분석하며 고군분투할 필요가 없어진다. 데이터 사이언스에서 분산과 표준편차는 우리의 예측이 맞거나 틀릴 확률을 가리킨다. 교과서적인 정의는 “데이터가 흩어진 정도”이지만, 여러 분야에서 다양한 이름과 의미를 띄고 등장하는 매우 중요한 통계량임을 기억하자. ”
--- p.72, 「탐색적 데이터 분석과 기술통계」중에서

“몬테카를로 방법을 한 마디로 요약하면 무작위 추출 실험을 엄청나게 많이 반복해 결과의 확률적 분포를 알아내는 것이다. 실험 비용이 너무 커서 반복하기 어렵거나 불확실성이 너무 크거나 미래 예측의 해석상의 약점을 극복하기 어려운 경우 등 여러 상황에서 몬테카를로 시뮬레이션이 매우 유용하다. 적합한 모델을 만들어 컴퓨터로 임의의 난수를 반복적으로 발생시 키는 가상의 실험이 가능하고, 수 회 실험으로 믿을만한 확률분포를 얻을 수 있기 때문이다.”
--- p.83, 「샘플 데이터로 전체를 예측할 수 있는가?」중에서

“즉, 중심극한의 정리는 표본 평균들이 이루는 표본 분포와 모집단 간의 관계를 증명함으로써, 수집한 표본의 통계량을 이용해 모집단의 모수를 추정할 수 있는 확률적 근거를 제공하는 것이다.”
--- p.79, 「샘플 데이터로 전체를 예측할 수 있는가?」중에서

“무작위 추출된 충분한 크기의 표본은 중심극한의 정리에 의해 모집단을 설명할 수 있다. 그러나 이 과정에는 필연적으로 표본오차와 비표본오차가 발생한다. 또한 현실적으로 무작위 추출이나 표본의 크기를 보장하기 어려운 데이터 분석도 흔하다. 물론 데이터 사이언티스트는 오차를 통제하기 위해 최선을 다해야 한다. 그러나 약간의 부족함이 있더라도 근거 피라미드의 하부를 이루는 연구가 많이 쌓임으로써 더 정교한 데이터 분석이 가능해짐을 이해하고 다양한 시도를 해보기를 권한다.”
--- p.84, 「샘플 데이터로 전체를 예측할 수 있는가?」중에서

“베노플러스겔은 데이터 분석을 통해 현상에 대한 더 나은 이해를 통해서 우리가 얻고자 하는 좋은 의사결정을 실행한 대표적인 성공 사례이다. 적절한 데이터를 취합, 분석하여 미처 몰랐던 패턴을 발견하고, 이를 모집단에 적용함으로써 성과를 창출했다. 가설 검정(Hypothesis testing)이란 이처럼 표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 틀리는지 통계적으로 검증하는 분석 방법이다. 이 때 채택하고 싶은 새로운 가설을 대립가설(Alternative hypothesis), 폐기하고자 하는 기존 가설을 귀무가설(Null hypothesis)라 한다. 주로 귀무가설은 H0, 대립가설은 Ha으로 표현한다.”
--- p.104, 「가설 수립과 유의성 검정」중에서

“카이제곱 검정법은 크게 2가지 목적으로 활용된다. 첫째는 두 개의 확률변 수가 서로 독립적인지 검정하는 것이다. 남녀 성별과 좋아하는 스포츠가 관계가 있는지, 고등학생일 때 좋아하던 교과목과 향후 직업 선택이 관계가 있는지 등 2개의 범주형 변수가 서로 독립적인지 아닌지를 판단할 때 쓴다. 둘째는 실제로 관측한 데이터가 예측한 분포를 따르는지 검정하는 것이다. 예를 들어 정육면체 주사위를 제대로 만들었다면 1부터 6까지 각 값이 고른 빈도로 나와야 한다. 실제로 그러한지 여부를 검증할 때 카이제곱 검정법을 활용한다.”
--- p.148, 「가설 수립과 유의성 검정」중에서

“T-검정은 모집단의 분산이나 표준편차를 알지 못할 때 모집단을 대표하는 표본에서 추정한 분산이나 표준편차를 가지고 두 모집단의 평균 차이가 있는지 여부를 판단하는 통계적 검정이다. T-검정은 두 표본 집단이 동일한 모집단의 부분 집합임에도 불구하고 표본 오차에 의해 표본평균의 차이가 발생한다고 귀무가설을 설정한다. 이를 검증하기 위해 정규분포에 근접 하는 T 분포의 두 모집단을 가정하여 각각의 표본평균 간 차이가 표본오차에 의해 발생할 확률을 계산한다.”
--- p.153, 「가설 수립과 유의성 검정」중에서

“회귀분석은 단순히 관계가 있는지를 따지는 분산분석이나 특정 조치가 취해질 때 사전-사후 데이터의 차이가 있는지 판별하는 대응표본 t 검정에 비해 훨씬 정교하다. 독립변수와 종속변수의 인과 관계를 판별할 뿐만 아니라 독립변수의 영향력, 독립변수를 조작함으로써 종속변수가 어느 정도 바뀔지 정도를 예측할 수도 있기 때문이다.”
--- p.165, 「가설 수립과 유의성 검정」중에서

“세상과 사람에 대한 관심을 기울여 적절한 가설을 세우고 알맞은 데이터를 취합해 분석을 시도한다면 월마트처럼 맥주-기저귀의 관련성을 파악할 수도 있고, 오바마 대선 캠프처럼 더 성과가 좋은 방안을 택할 수도 있다. 물론 노벨상도 얼마든지 가능하다.”
--- p.167, 「가설 수립과 유의성 검정」중에서

“데이터 사이언스란 현실 세계를 개념적으로 모델링하여 알맞은 데이터를 취합하고, 이들 사이에 존재하는 논리적인 구조를 파악하여 현실 세계에 적용함으로써 더 나은 의사 결정을 도모하는 일련의 과정이다. 데이터 간의 관계, 데이터와 현실 세계와의 관계를 논리적으로 분석하는 절차를 알고리즘이라 한다.”
--- p.184, 「머신러닝과 데이터 분석 모델링」중에서

“인공지능이 데이터를 공부하는 방식은 다양하다. 머신러닝과 딥러닝은 AI의 대표적인 학습 방법이다. 머신러닝이 가능한 기계는 복잡한 알고리즘을 이용해서 대량의 데이터를 분석하여 그 안에 숨어 있는 패턴을 찾는다. 찾아낸 패턴을 토대로 전체의 패턴을 예측하는 방식이 머신러닝이다.”
--- p.190, 「머신러닝과 데이터 분석 모델링」중에서

“머신러닝 중에서도 심층신경망 (Deep neural networks) 을 사용하는 학습 방식을 특별히 딥러닝이라 한다. 심층신경망은 데이터 세트를 분류하고 데이터 간의 상관 관계를 찾아내기 위해 인간 두뇌의 뉴런들이 연결되는 방식을 흉내낸 것이다. 머신러닝이 가능하려면 사람이 미리 처리할 지표 데이터나 알고리즘 등을 구체적으로 세워 줘야 한다. 딥러닝은 사람의 역할을 심층신경망이 대신하기 때문에 인간의 도움 없이도 새롭게 발견한 지식을 바탕으로 다른 데이터 세트를 어떻게 처리하면 될지 데이터 분석 모델을 세울 수 있다. 딥러닝 시스템은 처리하는 데이터의 양이 많아질수록 시스템의 능력이 향상 되어 더 복잡하고 정교한 분석이 가능해진다.“
--- p.192, 「머신러닝과 데이터 분석 모델링」중에서

“또 다른 새로운 데이터가 추가되면 방금 얻은 이 결과를 사전 확률로 이용한 또 다른 베이즈 추정을 실시함으로써 추론의 정확도를 점차 높여 나갈 수 있다. 이처럼 베이즈 추정을 반복할 때 처음부터 얻은 정보를 모두 반영할 필요 없이 최종적으로 얻어둔 사후 확률을 새로운 추론의 사전 확률로 활용해 정보를 업데이트하는 특징을 축차합리성이라 한다.”
--- p.206, 「머신러닝과 데이터 분석 모델링」중에서

“데이터 사이언스 분야에 입문할 때 R과 Python 중 어느 것을 배울지 많이 고민될 것이다. 간단한 기준으로 접근하자. 내가 원하는 분석 모델을 만들어 낼 기술적인 자신감이 있고 다양한 분야에서 자유롭게 활용하고 싶다 면, 개발 언어에 가까운 Python이 적합할 수 있다. 그러나, 개발자가 될 생각은 없고 조사 및 실험 결과, 사회의 다양한 데이터를 탐색해 패턴을 찾아 내며 결과를 시각화하는 것이 중요한 연구 및 비즈니스 목적이 강하다면 R 로 입문할 것을 추천한다.”

--- p.218, 「대표적인 데이터 분석 도구」중에서

출판사 리뷰 출판사 리뷰 보이기/감추기

모든 것이 데이터로 이루어진 시대, 쉽고 실용적인 데이터 사이언스 입문서로 데이터 분석에 뛰어들어라 개념 확립부터 구체적 적용 방법까지 배우는 데이터 분석, 풍부한 국내외 사례와 함께 제시하는 통계 활용법 정보의 시대를 거쳐 빅데이터 시대로 넘어오면서 수많은 정보와 데이터가 생성되었고, 사회 여러 분야에서 데이터가 폭넓게 활용되고 있다. 기존의 무의미하게 보였던 데이터들이 현재는 미래 비즈니스의 성패를 가르는 중요한 자원이 되었다. 이에 많은 기업들은 비즈니스 혁신에 유의미한 통찰을 얻기 위해 다양한 빅데이터 분석 플랫폼을 개발하여 고객의 니즈를 정밀하게 파악하고 있다. 그러나 데이터 분석이 가져다 주는 이점들만 인지하고 있을 뿐, 활용하는 방법을 모른다면 무한한 가능성의 데이터는 그저 무용지물이다. 그렇다면 데이터 분석, 어떻게 기본기를 다져야 할까? 이 책은 데이터 분석 역량을 갖추는 것을 돕기 위해서 ‘데이터 사이언스 프로세스’라는 프레임워크를 기반으로 설계했으며, 듣기만해도 어려운 데이터 분석 이론들을 일반인들도 쉽게 이해할 수 있도록 다채로운 사례와 함께 설명하고 있다. 나아가 깊이 있는 데이터 분석에 필요한 통계 지식은 전문 용어나 수식으로 설명해주는 대신, 유용한 사례와 함께 각 검증 방법을 설명하여 실생활에서 통계에 대한 아이디어를 얻을 수 있다. 더불어, 저자 김진, 최정아는 10년이상 경력의 Education/마케팅전문가로 현장에서 얻은 경험을 바탕으로 현직 실무자로서 알려줄 수 있는 즉시 적용 가능한 분석 방법을 제시한다. 데이터 분석 역량을 높여줄 『데이터 사이언스 입문』 도서를 통해 여러분이 담당하고 있는 실무 영역에서의 유의미한 인사이트를 얻길 바란다. 이 책의 주요 주제는 다음과 같다. ●데이터 사이언스의 정의와 필수 역량 ●데이터 분석 목적에 맞는 데이터 수집 방법 및 가공 방법 ●방대한 데이터를 한눈에 알아볼 수 있는 데이터 시각화 방법 ●데이터 분석에 필요한 통계 이해를 위해 복잡하고 어려운 통계 기호를 전혀 사용하지 않고 세상을 통계로 이해하는 시각 확보 ●데이터 분석 사례를 통해 배우는 실무 즉시 적용 가능한 데이터 분석 스킬 소개 ●스스로 데이터를 공부하는 인공지능(AI) 학습 시스템인 머신러닝과 딥러닝의 이해 ●데이터 사이언스 입문자를 위한 다양한 데이터 분석 도구 추천

회원리뷰 (2건) 회원리뷰 이동

리뷰 쓰기

혜택 및 유의사항?

총 평점 8.6점 8.6 / 10.0

검색결과 정렬 옵션 삭제

회원리뷰 전체보기

한줄평 (7건) 한줄평 이동

한줄평 쓰기

혜택 및 유의사항?

총 평점 7.7점 7.7 / 10.0

구매 한줄평

한줄평 전체보기

배송/반품/교환 안내

배송 안내

반품/교환 안내에 대한 내용입니다.
배송 구분	예스24 배송 배송비 : 무료배송
포장 안내	안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다. 고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다. 목적 : 안전한 포장 관리 촬영범위 : 박스 포장 작업

반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법	고객만족센터(1544-3800), 중고샵(1566-4295) 판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간	출고 완료 후 10일 이내의 주문 상품 디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품 중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용	고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임 직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음 단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제 오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소 오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소 직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음 단, 당일 00시~13시 사이의 주문은 취소 수수료 면제 박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유	소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등 복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우 eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가 중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우 LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상	상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에 따른 배상	대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리