확장메뉴
주요메뉴


닫기
사이즈 비교
소득공제
데이터 사이언스 입문

데이터 사이언스 입문

: 데이터리터러시, 예시, 전망, 실무, 프로그램, 머신러닝

리뷰 총점7.9 리뷰 9건 | 판매지수 132
베스트
경영 top100 1주
정가
18,000
판매가
16,200 (10% 할인)
배송안내
서울특별시 영등포구 은행로 11(여의도동, 일신빌딩)
지역변경
  • 배송비 : 무료 ?
  •  해외배송 가능
  •  최저가 보상
  •  문화비소득공제 신청가능

품목정보

품목정보
발행일 2020년 02월 29일
쪽수, 무게, 크기 240쪽 | 506g | 172*235*20mm
ISBN13 9791196752521
ISBN10 1196752524

책소개 책소개 보이기/감추기

목차 목차 보이기/감추기

책 속으로 책속으로 보이기/감추기

“정보 홍수 시대에 소화해야 할 지식은 폭증하는 상황이다. 데이터 사이언스 분야에 입문하거나 데이터 분석을 실무에 적용해서 가시적인 성과를 만들어내야 하는 사람들이 이 책을 통해서 짧은 시간 안에 데이터 사이언스 전체 그림을 파악하고, 실무 데이터 분석 기법들을 이해하고 적용하는 구체적인 방법을 제시하고자 한다.”
--- p.5, 「머리말」중에서

“방대한 데이터의 관계를 수학적으로 파악하는 과정을 사람이 수작업으로 진행하는 것은 불가능에 가깝다. 따라서, 데이터 분석 업무에는 반드시 분석 도구의 힘을 활용할 수 있어야 한다. 인기 있는 분석 도구의 종류는 엑셀(Excel), 구글 애널리틱스(Google Analytics), R Studio, 파이썬(Python), 애저(Azure), 아파치(Apache), 텐서플로우(TensorFlow) 등 헤아릴 수 없이 많다. 이 중 완벽한 도구란 없으며, 모든 도구는 각각 특징이 있고, 특정 분석 모델이나 알고리즘, 기능에 강점을 갖는다. 분석 도구는 데이터 분석 프로세스의 일부분을 사람 대신 수행하는 역할을 하는 것으로, 분석 도구 활용 역량이 분석의 질에 큰 영향을 줄 수도 있다.”
--- p.32, 「데이터 사이언스의 이해」중에서

“웹에서 데이터를 수집하는 크롤링은 매우 어려운 작업처럼 보이지만, 흔히 쓰는 엑셀(Excel) 프로그램을 이용해 누구나 할 수 있다. 엑셀 2010 PRO 이후 버전을 쓰는 사람이라면 누구나 [데이터] 탭에서 “외부 데이터 가져오기”를 볼 수 있다. 웹 크롤링을 하려면 데이터를 가져올 곳을 “웹”으로 선택하면 된다. ”
--- p.42, 「데이터 분석 프로세스와 데이터 취합」중에서

“탐색적 데이터 분석은 모든 데이터 분석 프로젝트에서 반드시 거쳐야 하는 필수 단계이다. 데이터에 관한 직관을 얻거나 변수의 분포를 비교하기 위해서, 데이터가 온전한지 확인하고, 결측치나 이상치를 찾아낼 뿐만 아니라 데이터를 요약하는 방법으로 탐색적 데이터 분석을 잘 활용할 수 있다. 탐색적 데이터 분석에서 얻은 이해는 적절한 알고리즘을 알려 주고, 분석 모델의 성능을 향상시키는 훈련 방법을 찾게 도와준다. 또한 탐색적 데이터 분석 과정에서 활용하는 다양한 데이터 시각화와 비교, 대조만으로 충분한 인사이트를 얻을 수도 있다.”
--- p.50, 「탐색적 데이터 분석과 기술통계」중에서

“데이터 분석의 궁극적인 목적은 더 나은 의사 결정이다. 만약 앞으로 일어날 수많은 사건에 변동성(불확실성 = 위험 = 분산과 표준편차)이 없다면, 뻔한 미래를 예측하고자 데이터를 분석하며 고군분투할 필요가 없어진다. 데이터 사이언스에서 분산과 표준편차는 우리의 예측이 맞거나 틀릴 확률을 가리킨다. 교과서적인 정의는 “데이터가 흩어진 정도”이지만, 여러 분야에서 다양한 이름과 의미를 띄고 등장하는 매우 중요한 통계량임을 기억하자. ”
--- p.72, 「탐색적 데이터 분석과 기술통계」중에서

“몬테카를로 방법을 한 마디로 요약하면 무작위 추출 실험을 엄청나게 많이 반복해 결과의 확률적 분포를 알아내는 것이다. 실험 비용이 너무 커서 반복하기 어렵거나 불확실성이 너무 크거나 미래 예측의 해석상의 약점을 극복하기 어려운 경우 등 여러 상황에서 몬테카를로 시뮬레이션이 매우 유용하다. 적합한 모델을 만들어 컴퓨터로 임의의 난수를 반복적으로 발생시 키는 가상의 실험이 가능하고, 수 회 실험으로 믿을만한 확률분포를 얻을 수 있기 때문이다.”
--- p.83, 「샘플 데이터로 전체를 예측할 수 있는가?」중에서

“즉, 중심극한의 정리는 표본 평균들이 이루는 표본 분포와 모집단 간의 관계를 증명함으로써, 수집한 표본의 통계량을 이용해 모집단의 모수를 추정할 수 있는 확률적 근거를 제공하는 것이다.”
--- p.79, 「샘플 데이터로 전체를 예측할 수 있는가?」중에서

“무작위 추출된 충분한 크기의 표본은 중심극한의 정리에 의해 모집단을 설명할 수 있다. 그러나 이 과정에는 필연적으로 표본오차와 비표본오차가 발생한다. 또한 현실적으로 무작위 추출이나 표본의 크기를 보장하기 어려운 데이터 분석도 흔하다. 물론 데이터 사이언티스트는 오차를 통제하기 위해 최선을 다해야 한다. 그러나 약간의 부족함이 있더라도 근거 피라미드의 하부를 이루는 연구가 많이 쌓임으로써 더 정교한 데이터 분석이 가능해짐을 이해하고 다양한 시도를 해보기를 권한다.”
--- p.84, 「샘플 데이터로 전체를 예측할 수 있는가?」중에서

“베노플러스겔은 데이터 분석을 통해 현상에 대한 더 나은 이해를 통해서 우리가 얻고자 하는 좋은 의사결정을 실행한 대표적인 성공 사례이다. 적절한 데이터를 취합, 분석하여 미처 몰랐던 패턴을 발견하고, 이를 모집단에 적용함으로써 성과를 창출했다. 가설 검정(Hypothesis testing)이란 이처럼 표본에서 얻은 사실을 근거로 하여 모집단에 대한 가설이 맞는지 틀리는지 통계적으로 검증하는 분석 방법이다. 이 때 채택하고 싶은 새로운 가설을 대립가설(Alternative hypothesis), 폐기하고자 하는 기존 가설을 귀무가설(Null hypothesis)라 한다. 주로 귀무가설은 H0, 대립가설은 Ha으로 표현한다.”
--- p.104, 「가설 수립과 유의성 검정」중에서

“카이제곱 검정법은 크게 2가지 목적으로 활용된다. 첫째는 두 개의 확률변 수가 서로 독립적인지 검정하는 것이다. 남녀 성별과 좋아하는 스포츠가 관계가 있는지, 고등학생일 때 좋아하던 교과목과 향후 직업 선택이 관계가 있는지 등 2개의 범주형 변수가 서로 독립적인지 아닌지를 판단할 때 쓴다. 둘째는 실제로 관측한 데이터가 예측한 분포를 따르는지 검정하는 것이다. 예를 들어 정육면체 주사위를 제대로 만들었다면 1부터 6까지 각 값이 고른 빈도로 나와야 한다. 실제로 그러한지 여부를 검증할 때 카이제곱 검정법을 활용한다.”
--- p.148, 「가설 수립과 유의성 검정」중에서

“T-검정은 모집단의 분산이나 표준편차를 알지 못할 때 모집단을 대표하는 표본에서 추정한 분산이나 표준편차를 가지고 두 모집단의 평균 차이가 있는지 여부를 판단하는 통계적 검정이다. T-검정은 두 표본 집단이 동일한 모집단의 부분 집합임에도 불구하고 표본 오차에 의해 표본평균의 차이가 발생한다고 귀무가설을 설정한다. 이를 검증하기 위해 정규분포에 근접 하는 T 분포의 두 모집단을 가정하여 각각의 표본평균 간 차이가 표본오차에 의해 발생할 확률을 계산한다.”
--- p.153, 「가설 수립과 유의성 검정」중에서

“회귀분석은 단순히 관계가 있는지를 따지는 분산분석이나 특정 조치가 취해질 때 사전-사후 데이터의 차이가 있는지 판별하는 대응표본 t 검정에 비해 훨씬 정교하다. 독립변수와 종속변수의 인과 관계를 판별할 뿐만 아니라 독립변수의 영향력, 독립변수를 조작함으로써 종속변수가 어느 정도 바뀔지 정도를 예측할 수도 있기 때문이다.”
--- p.165, 「가설 수립과 유의성 검정」중에서

“세상과 사람에 대한 관심을 기울여 적절한 가설을 세우고 알맞은 데이터를 취합해 분석을 시도한다면 월마트처럼 맥주-기저귀의 관련성을 파악할 수도 있고, 오바마 대선 캠프처럼 더 성과가 좋은 방안을 택할 수도 있다. 물론 노벨상도 얼마든지 가능하다.”
--- p.167, 「가설 수립과 유의성 검정」중에서

“데이터 사이언스란 현실 세계를 개념적으로 모델링하여 알맞은 데이터를 취합하고, 이들 사이에 존재하는 논리적인 구조를 파악하여 현실 세계에 적용함으로써 더 나은 의사 결정을 도모하는 일련의 과정이다. 데이터 간의 관계, 데이터와 현실 세계와의 관계를 논리적으로 분석하는 절차를 알고리즘이라 한다.”
--- p.184, 「머신러닝과 데이터 분석 모델링」중에서

“인공지능이 데이터를 공부하는 방식은 다양하다. 머신러닝과 딥러닝은 AI의 대표적인 학습 방법이다. 머신러닝이 가능한 기계는 복잡한 알고리즘을 이용해서 대량의 데이터를 분석하여 그 안에 숨어 있는 패턴을 찾는다. 찾아낸 패턴을 토대로 전체의 패턴을 예측하는 방식이 머신러닝이다.”
--- p.190, 「머신러닝과 데이터 분석 모델링」중에서

“머신러닝 중에서도 심층신경망 (Deep neural networks) 을 사용하는 학습 방식을 특별히 딥러닝이라 한다. 심층신경망은 데이터 세트를 분류하고 데이터 간의 상관 관계를 찾아내기 위해 인간 두뇌의 뉴런들이 연결되는 방식을 흉내낸 것이다. 머신러닝이 가능하려면 사람이 미리 처리할 지표 데이터나 알고리즘 등을 구체적으로 세워 줘야 한다. 딥러닝은 사람의 역할을 심층신경망이 대신하기 때문에 인간의 도움 없이도 새롭게 발견한 지식을 바탕으로 다른 데이터 세트를 어떻게 처리하면 될지 데이터 분석 모델을 세울 수 있다. 딥러닝 시스템은 처리하는 데이터의 양이 많아질수록 시스템의 능력이 향상 되어 더 복잡하고 정교한 분석이 가능해진다.“
--- p.192, 「머신러닝과 데이터 분석 모델링」중에서

“또 다른 새로운 데이터가 추가되면 방금 얻은 이 결과를 사전 확률로 이용한 또 다른 베이즈 추정을 실시함으로써 추론의 정확도를 점차 높여 나갈 수 있다. 이처럼 베이즈 추정을 반복할 때 처음부터 얻은 정보를 모두 반영할 필요 없이 최종적으로 얻어둔 사후 확률을 새로운 추론의 사전 확률로 활용해 정보를 업데이트하는 특징을 축차합리성이라 한다.”
--- p.206, 「머신러닝과 데이터 분석 모델링」중에서

“데이터 사이언스 분야에 입문할 때 R과 Python 중 어느 것을 배울지 많이 고민될 것이다. 간단한 기준으로 접근하자. 내가 원하는 분석 모델을 만들어 낼 기술적인 자신감이 있고 다양한 분야에서 자유롭게 활용하고 싶다 면, 개발 언어에 가까운 Python이 적합할 수 있다. 그러나, 개발자가 될 생각은 없고 조사 및 실험 결과, 사회의 다양한 데이터를 탐색해 패턴을 찾아 내며 결과를 시각화하는 것이 중요한 연구 및 비즈니스 목적이 강하다면 R 로 입문할 것을 추천한다.”
--- p.218, 「대표적인 데이터 분석 도구」중에서

출판사 리뷰 출판사 리뷰 보이기/감추기

회원리뷰 (2건) 회원리뷰 이동

한줄평 (7건) 한줄평 이동

총 평점 7.7점 7.7 / 10.0

배송/반품/교환 안내

배송 안내
반품/교환 안내에 대한 내용입니다.
배송 구분 예스24 배송
  •  배송비 : 무료배송
포장 안내

안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다.

고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다.

목적 : 안전한 포장 관리
촬영범위 : 박스 포장 작업

  • 포장안내1
  • 포장안내2
  • 포장안내3
  • 포장안내4
반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법
  •  고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음

    단, 당일 00시~13시 사이의 주문은 취소 수수료 면제

  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에
따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
  •  쿠폰은 결제 시 적용해 주세요.
1   16,200
뒤로 앞으로 맨위로 공유하기