확장메뉴
주요메뉴


소득공제
미리보기 공유하기

가볍게 떠먹는 데이터 분석 프로젝트

: 기초 이론과 케이스 스터디로 배우는 데이터 분석의 전 과정

리뷰 총점9.3 리뷰 7건 | 판매지수 1,698
베스트
OS/데이터베이스 top100 9주
정가
19,800
판매가
17,820 (10% 할인)
YES포인트
당신의 독서를 위한 친구 - 심플 폴더블 LED 독서등/크리스탈 문진/가죽 슬리브 유리 텀블러/모나미 볼펜
8월 얼리리더 주목신간 : 귀여운 방해꾼 배지 증정
월간 개발자 2022년 8월호
박해선 저자의 머신러닝/딥러닝 패스
[단독]『혼자 공부하는 파이썬』 개정판 출간
내일은 개발자! 코딩테스트 대비 도서전
[단독] 에듀윌 IT 자격증 기획전 - 가장 빠른 합격출구 EXIT
YES24 트윈링 분철 : 인서트라벨/스티커 택1 증정
8월 전사
쇼핑혜택
1 2 3 4 5

품목정보

품목정보
출간일 2021년 11월 19일
쪽수, 무게, 크기 208쪽 | 380g | 170*225*11mm
ISBN13 9791191600162
ISBN10 1191600165

이 상품의 태그

책소개 책소개 보이기/감추기

쉽게 배워 바로 써먹는 데이터 분석 입문서!

이 책은 데이터 분석 목적 수립, 데이터 취득 방법, 관련 부서 및 인원과 커뮤니케이션하는 방법, 그리고 분석 후 보고서 작성을 위한 대시보드 사용까지 전체 분석 프로젝트 사이클을 설명하고 있으며, 이어서 서울시 버스의 정류장별 승하차 인원 분석과 온라인 쇼핑몰의 블랙컨슈머를 분석하는 케이스 스터디를 통해 관련 경험과 배경지식이 없는 독자들도 실무에서 사용 가능한 지식과 노하우를 익힐 수 있도록 구성하였다.

목차 목차 보이기/감추기

추천사 viii
머리말 x
감사의 글 xiii
베타리더 후기 xiv

CHAPTER 01 데이터 분석 프로젝트 1

1.1 데이터 분석 프로젝트란? 3
1.2 데이터 분석 프로젝트의 목적 4
1.3 데이터 분석 프로젝트의 중요성 5
1.4 데이터 분석 프로젝트 수행 시 고려사항 6
1.5 체계적인 데이터 분석 프로젝트 관리의 중요성 9
1.6 데이터 분석 프로젝트가 실무에서는 어떻게 이루어질까? 12
1.7 데이터 분석 프로젝트를 진행할 준비가 되었는가? 15
1.8 마무리 18

CHAPTER 02 데이터 분석 프로젝트를 위한 6단계 절차 19

2.1 데이터 분석 프로젝트의 6단계 절차 ? 집 짓기에 비유하기 22
2.2 1단계: 목표 이해하기 24
2.3 2단계: 계획 세우기 27
2.4 3단계: 데이터 수집 및 전처리하기 30
2.5 4단계: 데이터 분석하기 33
2.6 5단계: 검증 및 평가하기 40
2.7 6단계: 시각화 및 발표 43
한 템포 쉬어가기_멜론의 데이터 활용 사례 46

CHAPTER 03 데이터 취득 47

3.1 데이터는 어디에서 구할 수 있을까? ? 내부 vs?? 외부 49
3.2 데이터 취득하기 57
3.3 마무리 63
한 템포 쉬어가기_엔씨소프트의 데이터 활용 사례 64

CHAPTER 04 데이터 검증 및 전처리 65

4.1 데이터 품질 검증 67
4.2 데이터 전처리(클렌징) 74
4.3 마무리 79

CHAPTER 05 데이터 분석 도구 소개 81

5.1 데이터 분석 도구를 사용하기에 앞서 생각해 볼 것들 83
5.2 프로젝트에 맞는 데이터 분석 도구 선택 방법 83
5.3 데이터 통계 분석 도구 84
5.4 비즈니스 인텔리전스 도구 88
5.5 프로그래밍 언어 기반 도구 92
한 템포 쉬어가기_기후 변화도 예측할 수 있을까? 98

CHAPTER 06 데이터 시각화 차트 사용법 99

6.1 프로젝트에 적합한 차트 선택 방법 101
6.2 마무리 122

CHAPTER 07 데이터 대시보드 사용법 123

7.1 대시보드를 통한 시각화 돋보이기 125
7.2 마무리 134

CHAPTER 08 케이스 스터디 1: 서울시 버스의 승하차 인원 분석 135

8.1 케이스 소개 137
8.2 케이스 스터디 분석 프로젝트 138
8.3 교훈 및 개선점 찾기 158
한 템포 쉬어가기_가짜 뉴스를 찾아라! 160

CHAPTER 09 케이스 스터디 2: 라인 쇼핑몰 마케팅 신입의 블랙컨슈머 분석 프로젝트 161

9.1 케이스 소개 163
9.2 케이스 스터디 분석 프로젝트 165
9.3 교훈 및 개선점 찾기 184
한 템포 쉬어가기_테스코의 몰락 186

찾아보기 188

저자 소개 (2명)

책 속으로 책속으로 보이기/감추기

하지만 이러한 핵심 자원인 데이터는 그 자체로서는 아무런 의미가 없다. 소비 내역을 보여주는 카드 내역, 구글 맵 검색 내역을 통해 수집된 사람들의 이동 경로, 아마존의 상품 판매 내역 등의 빅데이터가 의미 있고 가치를 가지기 위해서는 인간의 사고와 판단에 의해 적절하게 정리, 변환, 분석되는 절차가 필요하다.
--- p.xi

이번 장에서 본격적으로 데이터 분석 프로젝트 수행 절차에 대해서 알아보자. 많은 기업과 조직이 IT 기술을 적극적으로 활용하면서 자체 데이터를 축적하게 되었고, 활용 가능한 내/외부 데이터가 폭증하면서 이를 바탕으로 한 데이터 분석 프로젝트 요구가 급증하였다. 이로 인해 많은 이들이 사용자, 이해관계자 또는 분석 수행자의 자격으로 데이터 분석 프로젝트에 참여할 기회가 늘고 있다.
--- p.21

데이터를 확보한 후 가장 처음으로 수행해야 하는 업무는 데이터가 완전하고 유효한지 확인하는 것이다. 즉, 무결성 테스트(Integrity Test)를 수행해야 한다. 데이터 무결성은 여러 방법으로 평가할 수 있는데, 우선 데이터 무결성이 무엇인지 알아보자.
--- p.68

그렇다면 데이터의 시각화를 위해서 어떠한 차트를 선택해야 할까? 자주 쓰는 차트들을 의도에 따라 네 가지 그룹으로 나눌 수 있다. 그림 6.1은 청중에게 전달하고자 하는 의도에 따라 집단 간의 데이터 비교 분석, 데이터 집합의 구성 분석, 변수들 간의 관계 분석, 데이터의 분포 분석의 네 가지 항목으로 분류한 것이다. 지금부터는 각 항목과 관련된 차트에 대해 좀 더 자세히 알아보자.
--- p.101

그렇다면 진행 중인 데이터 분석 프로젝트에 어떤 테마의 대시보드를 적용하는 것이 효과적일까? 이를 이해하기 위해서는 대시보드의 종류와 각각의 차이점을 먼저 살펴봐야 할 것이다. 대시보드는 크게 전략적 대시보드, 분석 대시보드, 운영 대시보드로 분류할 수 있다.
--- p.126

혜원은 태블로 라이선스가 없는 이해관계자들도 쉽게 접속할 수 있도록 태블로 퍼블릭 서버를 사용하여 대시보드의 링크 주소를 공유하도록 설정하였다. 이를 통해 해당 주소로 들어가면 실시간으로 업데이트되는 대시보드를 이해관계자들이 쉽게 접근할 수 있었다.
--- p.157

출판사 리뷰 출판사 리뷰 보이기/감추기

쉽게 배워 바로 써먹는 데이터 분석 입문서!

4차 산업혁명 시대의 핵심은 데이터이고, 데이터를 분석하는 능력이 이 시대의 생존 무기가 되었습니다. 이 책은 데이터를 활용한 분석 프로젝트 수행을 위한 방법론, 실전 기술, 그리고 예상되는 문제 해결을 다룹니다. 즉, 데이터 분석 업무의 시작에서 보고서 작성법까지 실무에서 적용 가능한 전 과정을 배울 수 있습니다. 데이터 분석 목적 수립, 데이터 취득 방법, 관련 부서 및 인원과 커뮤니케이션하는 방법, 그리고 분석 후 보고서 작성을 위한 대시보드 사용까지 전체 분석 프로젝트 사이클을 설명하고 있으며, 이어서 서울시 버스의 정류장별 승하차 인원 분석과 온라인 쇼핑몰의 블랙컨슈머를 분석하는 케이스 스터디를 통해 관련 경험과 배경지식이 없는 독자들도 실무에서 사용 가능한 지식과 노하우를 익힐 수 있도록 구성하였습니다.

이 책의 대상 독자

● 데이터 분석을 수행해야 하는 개인이나 학생
● 데이터 분석 관련 프로젝트를 맡았지만 관련 배경지식이 없는 사회 초년생
● 데이터 분석 프로젝트를 실제로 이끌어야 하는 프로젝트 매니저나 중간 관리자
● 데이터 분석 결과를 조직에 반영하여 전략을 수립하고자 하는 최고 관리자 및 경영자

회원리뷰 (7건) 리뷰 총점9.3

혜택 및 유의사항?
포토리뷰 가볍게 떠먹는 데이터 분석 프로젝트 내용 평점5점   편집/디자인 평점5점 위**절 | 2022.01.21 | 추천0 | 댓글0 리뷰제목
    요즘은 그야말로 정보의 홍수, 데이터의 홍수 시대에 살고 있다. 손안의 컴퓨터라 불리는 자그마한 스마트폰만 실행하면 즉시 전 세계의 방대한 데이터에 접근할 수가 있고, 한편으로는 스마트폰을 이용하는 우리의 기록(Log) 전부를 수집, 저장하여 여러 기업의 주요 데이터로 활용하고 있다.   이런 빅 데이터(Big Data)의 시대에 이 수많은 데이터에 파묻혀;
리뷰제목

 



 

요즘은 그야말로 정보의 홍수, 데이터의 홍수 시대에 살고 있다.

손안의 컴퓨터라 불리는 자그마한 스마트폰만 실행하면 즉시 전 세계의 방대한 데이터에 접근할 수가 있고, 한편으로는 스마트폰을 이용하는 우리의 기록(Log) 전부를 수집, 저장하여 여러 기업의 주요 데이터로 활용하고 있다.

 

이런 빅 데이터(Big Data)의 시대에 이 수많은 데이터에 파묻혀 정신을 못 차리게 되면 낙오하는 것이고, 데이터를 잘 수집, 정리, 분석할 수 있다면 개인의 경쟁력을 보다 극대화할 수 있을 것이다.

 

"데이터 분석은 여러 데이터를 수집, 정리, 변환하여 유용한 정보를 발견하여 결론을 내리고, 사용자의 의사결정을 지원하는 총체적인 과정이다"

회사에서의 주요 업무는 매주 나오는 품질 관련 데이터를 수집, 정리, 분석하여 보고서를 작성하는 일이다.

보고서라는 것이 알다시피 단순히 데이터의 나열만으로 국한되어서는 안된다.

 

책에서는 얘기하고 있는 것처럼 수집, 정리된 데이터를 잘 분석하여 이 데이터가 어떤 의미를 가지고 있는지 그래서 어떤 의사 결정의 주요 판단 근거가 될 수 있는 통찰력을 제시할 수 있어야만 한다.

 

이를 통해서 생산성, 효율성을 높일 수 있을 뿐만 아니라 현시점에서의 수준을 파악하여 어떤 리스크를 가지고 있는지를 사전에 식별해 낼 수가 있다.

데이터 분석은 크게 6단계를 거친다.

 

1) 목표 이해하기

2) 계획 세우기

3) 데이터 수집 및 전처리하기

4) 데이터 분석하기

5) 검증 및 평가하기

6) 시각화 및 발표하기

 

데이터 분석 업무가 일상화되면서 매 단계가 중요함을 앎에도 불구하고 몇몇 단계를 건너 뛰는 경우가 발생하게 된다.

목표 이해하기와 계획 세우기의 단계를 상당 부분 축소시키고, 검증 및 평가하기 단계도 큰 비중을 두지 않고 진행하는 것이다.

 

단순히 데이터를 수집하여, 획일화된 분석을 통해 정형화된 틀 속에서의 시각화를 이용한 보고서 작성이 루틴하게 돌아가게 된다. 업무가 익숙해지면서 효율화가 되었다고 볼 수도 있겠지만 스스로 냉정히 평가해 보면 보고서 발행 그 이상, 그 이하도 아닌 것 같다.

 

이런 식의 데이터 분석을 통해서는 절대 통찰력을 줄 수는 없을 것이다. 내가 지금 이 데이터를 왜 분석해야 하는지 방향성과 목표를 분명히 하고, 그에 맞춰 철저한 계획을 세우는 것에서 시작하지 않는다면 유의미한 데이터를 추출하는 것은 결코 쉬운 일이 아니라 생각한다.

시대가 발전하며 데이터 분석 도구도 다양하게 등장하고 있다.

입사 초만 하더라도 데이터 분석을 한다 하면 무조건 엑셀만 사용했었는데, 물론 엑셀이 아직까지 유용한 툴임은 분명하지만 요즘 다양한 툴을 사용하면서 격세지감을 느끼곤 한다.

 

프로그래밍 언어인 파이썬을 활용해서는 시간이 오래 걸리는 단순 반복 작업을 자동화시켜 효율성을 극대화할 수 있으며, Power BI 툴 같은 경우는 모아진 데이터를 기반으로 대시보드, 차트, 그래프 등 데이터 시각화를 통해 효과적인 의사 전달 수단으로 활용되고 있다.

 

예전에는 엑셀의 고수가 곧 업무의 고수였던 시절이었다면 요즘은 여러 툴을 잘 다루는 사람이 업무의 고수라 불린다. 일일이 한 땀, 한 땀 수동으로 데이터를 분석하고 시각화하는 방법은 요즘과 같은 빅 데이터 시대와는 맞지 않는 형태라 할 수 있겠다.

데이터 분석을 잘 마무리했으면 마지막 단계가 바로 시각화이다.

개인적으로 시각화 단계가 보고서의 화룡점정이 아닐까 생각한다. 아무리 데이터 분석을 잘 했어도 보고서의 스토리 라인이 매끄럽지 않거나 가독성이 떨어지는 방식으로 작성돼 있다면 이해관계자들이 이해하기 어려울 뿐만 아니라 큰 임팩트를 줄 수가 없다.

 

시각화 작업을 잘 하기 위해 나름 고심을 하지만 쉽지 않은 일임을 매번 절감한다. 툴을 잘 사용하거나 잘 시각화된 보고서를 샘플로 해서 조금씩 역량을 쌓는 길밖에 없을 것이다.

 

 

책 제목에서 유추할 수 있듯이 이 책이 데이터 분석에 대한 심화 내용까지 다루고 있지는 않지만 그동안 현업을 진행하면서 놓치거나 간과한 부분들을 되짚어 볼 수 있어서 의미가 있었다. 역시나 무엇을 잘하기 위해서는 정공법을 택해야 하는 것이고 꾸준히 실력을 배양해야 함을 다시 한번 느낄 수가 있었다.

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
가볍게 떠먹는 데이터분석프로젝트 내용 평점4점   편집/디자인 평점4점 곰**푸 | 2022.01.17 | 추천0 | 댓글0 리뷰제목
빅데이터시대에~데이터를 분석하는 해주는 뉴스레터와 큐레이터플랫폼은 다채롭다! 그럼에도 불구하고 스스로의 일상과 일과 여가 나아가 라이프스타일에 있어서 데이터를 소중하고! 중요하다! 나아가 스스로 자신의 데이터를 잘 관리할 줄 알아야한다고 본다. [가볍게 떠먹는 데이터분석프로젝트]는 기초이론과 케이스터디로 배우는 데이터분석의 전과정을 담고 있다. 이 책의 대상독자;
리뷰제목

빅데이터시대에~데이터를 분석하는 해주는 뉴스레터와 큐레이터플랫폼은 다채롭다! 그럼에도 불구하고 스스로의 일상과 일과 여가 나아가 라이프스타일에 있어서 데이터를 소중하고! 중요하다! 나아가 스스로 자신의 데이터를 잘 관리할 줄 알아야한다고 본다. [가볍게 떠먹는 데이터분석프로젝트]는 기초이론과 케이스터디로 배우는 데이터분석의 전과정을 담고 있다. 이 책의 대상독자는 네유형으로 나눴는데~나는, 데이터분석프로젝트를 이끌어야 하는 프로젝트매니저나 중간관리자와 데이터분석 결과를 조직에 반영하여 전략을 수립하고자 하는 최고관리자 및 경영자사이 유형에 속한다! 즉, 데이터에 대해 관리자의 눈과 경영자의 눈을 가져야하는 중간유형이다! 그래서 전문가가 가르쳐주는 [가볍게 떠먹는 데이터분석프로젝트]책이 절실해서~절실하게 읽었다!

지금까지 내가 어떻게 데이터를 분석하는지 상당히 돌아보면서 자극을 주는 책이었다! 특히, 데이터 분석프로젝트를 위한 6단계절차에서-데이터분석유형에 있어서 과거의 분석유형으로~설명적분석과 진단분석은 배어있지만! 미래에 필요한 예측분석과 처방적분석이 부족함을 느끼게 했다! 나아가 데이터 분석시 번번하게 실수하는 다섯가지중에서-1. 숫자너머를 보지 않는다. 2. 문제를 잘 정의하지 않는다. 3. 잘못된 측정 항목에 집중한다. 4. 분석 전에 데이터를 정리하지 않는다. 5. 데이터의 계절적 변동성을 무시한다. 스스로 데이터분석점검을 해보니~ 5번이 와 닿았다!

조금 아쉬운 점이 있다면~<한 템포 쉬어가기>코너가 너무 적다는 것! 데이터분석프로젝트관련 예시는 많았지만~사례가 부족한 부분들이 아쉬웠다.

가짜 뉴스를 찾아라, 테스코의 몰락 등으로 데이터분석은 우리의 의사결정을 도와주는 객곽적인 도구지만, 데이터를 사용하고 분석할 때는 데이터가 고려하는 범위와 가정에대한 명확한 이애가 필요하며 이들에 배제한 데이터의 맹신과 단순화적 적용법은 회사의 위기를 초래하는 사례로 데이터리스크에 경각심을 주었다.

빅데이터시대에~데이터분석가들이 전공에 따라 다르다. 이공계와 산업계 나아가 인문사회계 전문가에 따라서 데이터를 수집하고 분석하는 것은 비슷할 수 있으나, 분석한 데이터에 대한 예측과 처방 나아가 대안제시와 사후관리에 덧붙여 데이터분석 예외사항과 리스크까지 파악하는지 분야와 전공에 따라 데이터에 따라 다르듯 하다. 미래시대에 AI가 데이터를 분석할지라도~그에 대한 예측과 대안은 인간의 논리적이고 과학적사고가 필요하다!

[가볍게떠먹는 데이터분석프로젝트]은, 과거의 데이터분석방식을 바꿔주는 책이다! 나아가 미래의 데이터분석프로젝트를 어떻게 할 것인가? 업종별, 산업별, 프로젝트별~다채롭게 생각하게 해준다. 플러스로~가볍게 덜어주는 책이다!

 

 

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
포토리뷰 [책리뷰] 가볍게 떠먹는 데이터 분석 프로젝트 내용 평점4점   편집/디자인 평점4점 l******2 | 2021.12.22 | 추천0 | 댓글0 리뷰제목
4차 산업 혁명, 알파고 대국, 인공지능 등 많은 데이터가 쏟아짐에 따라 데이터를 활용하기 위한 움직임이 활발해지고 있습니다. 국가적으로도 데이터산업을 활성화하기 위해서 데이터 뉴딜 사업 등의 국가 사업으로 많은 데이터 수집 및 분석 프로젝트가 쏟아지고 있습니다. http://news.heraldcorp.com/view.php?ud=20211220000753 이렇게 데이터 산업이 활성화되는 것에 비해 데이터;
리뷰제목

4차 산업 혁명, 알파고 대국, 인공지능 등 많은 데이터가 쏟아짐에 따라 데이터를 활용하기 위한 움직임이 활발해지고 있습니다.

국가적으로도 데이터산업을 활성화하기 위해서 데이터 뉴딜 사업 등의 국가 사업으로 많은 데이터 수집 및 분석 프로젝트가 쏟아지고 있습니다.

http://news.heraldcorp.com/view.php?ud=20211220000753
이렇게 데이터 산업이 활성화되는 것에 비해 데이터 분석 프로젝트에 대한 경험이 적은 사람들이 프로젝트를 관리하는 경우가 많습니다.

각 분야별로 프로젝트의 특징에 따른 관리하는 방법이 다르며, 데이터 분석 프로젝트 역시 고유의 특징을 가지고 있습니다.

처음 데이터 분석을 맡게 되는 사회초년생, PM 등은 당황하게 됩니다.

그러다 보니 사업 관리가 제대로 이루어지지 않은 경우가 많습니다.

이 책은 데이터 분석 프로젝트를 시작하기 전에 봐두면 좋을 책입니다.

책의 데이터 분석 프로젝트에 대한 기본적인 프로세스를 제시하고 각 단계에 필요한 사항을 간단하게 알려줍니다.

 

데이터 분석 프로젝트를 수행할때 데이터 분석에만 초점을 맞추는 실수를 많이 하게되는데, 생각 이상으로 데이터 수집, 처리하는 영역이 가장 많은 비중을 차지합니다.

그래서 처음 데이터 분석 프로젝트를 시작하게 되면 분석을 하는 시간보다 수집하고 처리하는 시간이 높다는 것을 알 수 있습니다. 이 책에서 제시하는 케이스 스터디에서도 분석 파트보다 처리 파트에서 많은 비중을 차지하고 있습니다.

 

이렇게 책은 데이터 분석 프로젝트를 수행하기 위한 필수적인 프로세스와 케이스 스터디를 보여줌으로서 입문자들에게 친절한 책입니다.

하지만, 이 책에서 아쉬운 점은 이 책 이후에 어떤것을 더 해볼 수 있을 것이다 라는 향후 방향성을 제시하지 못하고 있는점이 아쉽습니다. 가령, 데이터 분석 대회 플랫폼인 kaggle과 같은 플랫폼에 대한 소개도 함께 있었다면 더 좋은 책이 되었을 것이라고 생각이 됩니다.

 

 

댓글 0 이 리뷰가 도움이 되었나요? 공감 0

한줄평 (3건) 한줄평 총점 10.0

혜택 및 유의사항 ?
평점5점
입문자분들이 전체 흐름을 잡기에 좋은 책입니다.
이 한줄평이 도움이 되었나요? 공감 0
아***인 | 2021.12.12
평점5점
데이터 분석 관련 프로젝트를 준비하기에 좋습니다!
이 한줄평이 도움이 되었나요? 공감 0
아***인 | 2021.12.11
구매 평점5점
전체적인 데이터 프로젝트의 흐름과 실무에 적용가능한 유익한 내용을 쉽게 설명하고 있습니다
이 한줄평이 도움이 되었나요? 공감 0
I*********0 | 2021.11.29
  •  쿠폰은 결제 시 적용해 주세요.
1   17,820
뒤로 앞으로 맨위로 aniAlarm