품목정보
발행일 | 2019년 12월 27일 |
---|---|
쪽수, 무게, 크기 | 512쪽 | 173*230*35mm |
ISBN13 | 9791190014588 |
ISBN10 | 1190014580 |
발행일 | 2019년 12월 27일 |
---|---|
쪽수, 무게, 크기 | 512쪽 | 173*230*35mm |
ISBN13 | 9791190014588 |
ISBN10 | 1190014580 |
데이터 분석과 시각화: SQL로 분석하고 Tableau로 시각화하자
23,400원 (10%)
PART 01 태블로 굿모닝 CHAPTER 01 태블로란? 01 태블로란 무엇인가? 02 태블로 제품 소개 CHAPTER 02 태블로 시작하기 01 버전 02 시작 페이지 03 데이터 원본 페이지 04 작업 영역 05 데이터 패널 06 뷰의 요소 07 Tableau 파일 유형 08 Tableau 기본 개념 1 - 측정값 vs 차원 09 Tableau 기본 개념 2 - 연속형 vs 불연속형 CHAPTER 03 기본 차트 만들기 01 막대 차트 만들기 02 라인 차트 만들기 03 파이 차트 만들기 04 도넛 차트 만들기 05 임시 계산 06 분산형 차트 만들기 07 트리맵 차트 만들기 08 하이라이트 테이블 만들기 09 영역 차트 만들기 10 누적 막대 차트 만들기 11 간트 차트 만들기 12 히스토그램 만들기 13 이중 축 만들기(Dual axis) 14 결합된 축 만들기(Combined axis) 15 라운드형 막대 차트 만들기 16 평균 라인 만들기 17 워드 클라우드 만들기 18 캘린더 차트 만들기 19 총계 만들기 20 계층 만들기 21 지리적 역할 부여하기 22 채워진 맵 만들기 23 기호 맵 만들기 24 밀도 맵 만들기 25 이중 축 맵(면+기호) 26 그룹과 집합 차이 27 데이터 설명 PART 02 태블로 굿애프터눈 CHAPTER 01 퀵 테이블 계산 만들기 01 퀵 테이블 계산 02 퀵 테이블 계산 예제 - 전월 대비 및 전년 대비 성장률 CHAPTER 02 계산된 필드 만들기 01 집계 계산식 만들기 02 IF로 계산된 필드 만들기 CHAPTER 03 매개 변수 만들기 01 범위형 매개 변수 만들기 02 목록형 매개 변수(1) 03 목록형 매개 변수(2) 04 전체 범위로 필터 적용 및 컨텍스트 필터에 추가하기 CHAPTER 04 대시보드 액션 적용하기 01 필터 02 필터(Exclude) & 시트로 이동 03 하이라이트 & URL로 이동 04 매개 변수 변경 05 집합 값 변경 PART 03 태블로 굿애프터눈 II CHAPTER 01 데이터 원본 설정하기 01 동일한 데이터베이스 조인으로 반품률 구하기 02 교차 데이터베이스 조인 연결하기 - 달력(오른쪽 조인) 03 블렌딩(Blending) 04 유니온(Union) 05 사용자 지정 분할(Custom split) 06 데이터 해석기 사용 및 데이터 원본 필터 적용 CHAPTER 02 Tableau Prep으로 데이터 연결과 정리를 한 번에 01 Tableau Prep이란? 02 Tableau Prep Builder 작업 공간 03 Tableau Prep을 통해 효율적으로 데이터 전처리하기 04 Tableau PrepBuilder로 데이터를 결합하기 CHAPTER 03 Google Spreadsheet로 웹 데이터 크롤링하기 01 Wikipedia 데이터 불러오기 PART 04 태블로 굿이브닝 CHAPTER 01 LOD Expressions(세부 수준 식) 만들기 01 FIXED 02 EXCLUDE 03 INCLUDE CHAPTER 02 복합 매개 변수 만들기 01 날짜 매개 변수&기간 매개 변수 동시에 활용하기 CHAPTER 03 상황에 맞는 대시보드 만들기 01 PDF로 되어 있는 주식 데이터로 대시보드 화면 만들기 02 당월/전월/전년 동월 매출/수익 동시에 확인하기 CHAPTER 04 서버에 업로드하기 01 Live 연결 vs 추출 02 태블로 퍼블릭 업로드하기 03 데이터에 질문하기(Ask data) |
본 리뷰는
비제이퍼블릭
출판사"태블로 굿모닝 굿애프터눈(강승일, 송재환 저)"
을 읽고 지식을 정리한 글입니다.
최근 AI, 빅데이터 트렌드와 더불어 데이터 시각화(Data Visualization)의 중요성이 급부상하고 있다. 통계, 머신러닝, 딥러닝을 활용하여 유의미한 인사이트를 도출하거나 예측, 판별, 생성 등의 모델을 구현하는 것은 여전히 복잡한 문제이다. 이런 문제를 해결하는데 있어 데이터 시각화는 다양한 방법으로 도움을 준다.
흔히 블랙박스라고 칭하는 딥러닝 내부 학습 과정을 파악하고 싶거나, 다양한 포맷과 피처를 가진 대규모 데이터 속에서 패턴을 찾는 과정
에 있어 시각화를 이용하면 원하는 답을 쉽게 얻거나 답을 얻기 위한 시간을 상당히 절약할 수 있다.
태블로는 데이터를 분석 및 시각화하는 BI 솔루션으로 전세계 8만개 이상의 기업이 이용하고 있으며, 태블로가 차지하는 영향력은 최근 가트너가 BI분야 최고의 리더로 선정한 일례로 대신할 수 있다.
태블로가 어떤 솔루션인지 백번 설명하는 것보다 아래 그림을 보는 것이 나을 듯하다. 최근 신종 코로나 바이러스 확진자의 이동 경로를 시각화한 그림으로 태블로로 구현한 것이다.
페이스북 그룹에 공유된 에서 발췌하였으며 Il Sup Lee 회원님께서 구현 및 공유하셨다.Part1(굿모닝)
에서는 먼저 태블로의 Tableau Desktop, Server, Prep 등 다양한 제품군에 대해 소개한 후 아래 그림과 같이 Tableau Desktop 설치를 통해 간단한 기능을 맛보게 해준다.
여느 프로그램이나 그러하듯 설치 후 처음 실행하면 생소하다. 하지만 시작페이지의 연결, 열기, 검색 영역의 기능부터 시작하여 데이터 원본 페이지, 작업 영역의 메뉴별 다양한 기능까지 상세히 설명하므로 읽다보면 빠르게 사용 감각을 익힐 수 있다. 특히 태블로의 다양한 파일 유형 .twb, .tds 등에 대해 자세히 알아보고 측정값, 차원 등의 생소한 기본개념을 먼저잡고 출발할 수 있어 초보자도 후반부의 복잡한 실습 예제를 수행할 수 있도록 도움을 준다.
이어서 3장. 기본 차트 만들기
라는 기본 예제들을 실습하게 되는데 개인적으로 상당히 중요한 부분이라 생각한다. 실습을 따라하기에 전혀 부담이 없고 컴포넌트 하나 하나에 집중하여 예제를 개발하며 상세한 기능을 소개하는 방향으로 진행이 되는데 이 부분을 확실히 알아야만 나중에 실무에서 독자들이 원하는 숲을 그려낼 수 있다.
최근 데이터 사이언스의 영향으로 R의 ggplot2나 Python의 matplotlib, pyecharts 등을 활용하는 분들도 많을텐데 대부분의 시각화 구현의 문제는 라이브러리를 활용한 구현 자체에 있는것이 아니라 최종 산출물을 만드는데에 별도의 감각이 필요하다는 사실
이다. 필자도 마찬가지였는데 기본에 충실한 실습들을 진행하며 데이터가 가지는 특징에 따라 어떤 시각화 방법이 가능한지
일종의 표현 방법론에 대한 감을 익힐 수 있었다.
태블로 자체의 기능을 익히는 것은 물론 데이터의 주어진 상황과 특징에 따라 태블로 개발자들은 이러한 방식을 활용했구나라는 아이디어 및 인사이트를 얻을 수 있다. 기본 실습의 구체적인 예제는 아래 목록과 같으며 시각화를 자주 다루는 분이라면 이 목록들의 수준이 기초이지만 꽤 중요한 개념들이라는 사실을 깨달으실 것이라 생각한다. 시간이 넉넉하지 않은 분들은 본 장은 건너뛰신 후 필요할 때마다 책장에서 꺼내보는 일종의 레퍼런스로 활용하셔도 되겠다.
Part2(굿애프터눈1)
파트에서는 위에서 배운 기본차트 구현의 수준을 넘어 주어진 데이터를 가공하여 시각화하는 방법을 학습한다. 먼저 퀵 테이블 계산방법을 배우게 되는데 조금이라도 데이터에 관련된 업무를 수행한 분이라면 흔히 접하게 되는 전월대비 및 전년대비 성장률의 시각화 등을 구현할 수 있다. 주가 차트의 이평선 등 약간은 복잡할 수 있는 시각화 표현 방법을 어떻게 쉽게 효율적으로 표현할 수 있는지 도와준다.
이어 IF로 계산된 필드를 만드는 방법, 목록형 매개 변수의 생성 방법을 익힌 후 전체 범위로 필터를 적용하거나 컨텍스트 필터에 추가하는 상세한 방법을 다룬다. 대시보드 액션 적용하기 실습을 따라하다보면 아래 그림과 같은 뛰어난 시각적 표현도 가능하다.
Part3(굿애프터눈2)
에서는 드디어 본격적으로 데이터를 주무르기 시작한다. 필자가 가장 재미있게 실습했던 파트이기도 하며, 태블로가 얼마나 다양한 데이터를 손쉽게 다룰 수 있는지 장점을 맛볼 수 있는 파트이기도 하다.
데이터 원본을 설정하는 방법으로 조인, 교차 조인, 블렌딩, 유니온, Split의 실습을 통해 일종의 데이터 전처리 방법을 학습하며 데이터 해석기를 사용하여 원본 필터 등을 적용함으로써 데이터를 직관적으로 이해
할 수 있도록 돕는다.
다음으로 Prep을 다룬다. Prep은 데이터를 결합, 정리, 변형하는데 편리한 기능을 제공하는 도구로 데이터 분석 직군 혹은 개발자가 아닌 기획 및 비지니스 직군에 계신분들도 매우 직관적으로 편리하게 데이터를 활용할 수 있다는 장점이 있다.
태블로가 BI업계 시각화 리더가 된 결정적인 계기가 Prep과 같은 비전문가들도 사용하기 쉬운 도구의 제공 덕분이 아니었을까 싶다. 아래 그림은 Prep을 이용하여 데이터 결합과정을 시각화한 사진이다. 사진이 보여주듯 Prep에서 제공하는 대부분의 기능들은 비 전문가들이 다루기 매우 편리하게 도와준다.
본 파트의 마지막엔 구글 스프레드시트를 활용한 재미있는 예제를 다룬다. 지금까지 우리가 필요로 하는 입맛에 맞춘 데이터로만 실습을 해왔다면 본 장에서는 웹에 널린 데이터를 직접 크롤링한 후 태블로와 연동하는 보다 실전적인 예제를 다룬다. 아래 그림과 같이 구글 스프레드시트를 활용하여 미국 메이저리그 야구장 리스트를 웹페이지에서 크롤링한 후 태블로의 맵형태로 구장들의 위치를 표현
할 수 있다.
마지막으로 Part4(굿이브닝)
파트에서는 태블로가 가진 보다 강력한 심화기능을 다룬다. LOD 세부수준식인 Fixed, Exclude, Include를 활용하여 보다 사용자가 원하는 기준과 관점에 맞는 세부적인 집계 및 통계 자료를 추출할 수 있다. 더불어 타임라인에 특화된 처리가 가능한 복합 매개변수를 다루는 방법을 학습한다.
이어 PDF에 담긴 주식 데이터를 태블로에 연동하는 방법, 변경된 데이터의 증분만 서버에 업로드 하는 노하우, 그리고 태블로 퍼블릭에 업로드하여 전세계에 본인이 만든 대시보드를 공유하는 방법까지
태블로가 가진 확장성을 맛볼 수 있다.
본 도서의 저자들은 태블로에 직접 몸담고 있는 전문 강사들로 본 도서와 더불어 아래 사진에서 안내하는 바와 같이 유튜브 채널을 통해서도 노하우를 습득할 수 있다는 장점이 있다.
태블로에 관심이 많거나 처음 접하셔서 활용에 어려움을 겪는 분.
태블로 플랫폼을 활용하는 실무자.
그 외 데이터 시각화에 관심있는 분.
이 책은 크게 세부분으로 구성되며, 각 파트에서 다루는 내용을 아래와 같이 요약해 보았다.
데이터 시각화는 통계 등을 활용한 정보의 요약 전달 및 의사결정 등 자체로도 다양한 장점을 갖고 있지만, 특히 빅데이터 및 AI와 관련하여서도 내부 학습 과정을 파악하는데 도움이 되거나 다양한 포맷과 피처를 가진 대규모 데이터 속에서 패턴 인사이트를 찾는 과정에 유용하다.
본 도서는 초반에 태블로의 상세 기능을 다루고 특히 3장 “기본 차트 만들기” 파트에서 거의 모든 컴포넌트들을 구현해보는 실습 과정을 거치기 때문에 초반 빠른 사용 감각을 익히는데 도움을 준다. 시각화에서 겪는 대부분의 문제는 라이브러리 구현 자체에 있는것이 아니라 최종 결과물을 만드는데에 별도 감각이 필요하다는 점인데 본 도서를 통해 데이터 특징에 따라 어떤 유형의 시각화 방법이 가능한지 감을 익힐 수 있다는 점
이 큰 장점 중의 하나이다.
후반부에 다양한 데이터의 연동 방법을 익힐 수 있으며 퀵 테이블 계산방법, 계산된 필드 만들기, 조인, 교차 조인, 블렌딩, 유니온, Split 등 데이터 전처리 방법을 학습하여 태블로 연동에 필요한 데이터를 가공 스킬을 쌓을 수 있다. 이를 바탕으로 시각화 자체에도 충실할 수 있음은 물론 구글 Spreadsheet를 활용하여 크롤링 후 태블로에 연동하거나, PDF 문서와의 연동을 통한 시각화 등 태블로가 가진 다양한 확장성
을 음미할 수 있게 된다.
본 도서는 태블로를 상세하게 다루는 국내 최초의 도서라는 점에서 의의가 있고, 저자들은 태블로에 직접 소속된 전문 강사들로 직접 운영하는 유튜브 채널
시청을 통해 학습 효과를 높일 수 있다는 장점이 있다.
반면 전체 내용이 특정 프로젝트의 완성을 향한 흐름을 유지하며 통일성있게 구성되었다면 보다 전달력을 높이고 실전에 도움이 되지 않았을까 하는 아쉬움이 있다. 더불어 너무 상세한 기능 구현과 설명에 집중한 나머지 약간의 메뉴얼 같은 딱딱한 느낌을 갖게한 점과 그에 따른 독자 친화적인 구성과 거리가 있다는 점이 아쉽지만 태블로를 다루는 최초의 책인만큼 상세한 레퍼런스를 다루는 책도 필요하겠다는 생각도 든다.
실무에 태블로의 의존도가 높거나 데이터 시각화에 관심이 많은 분이라면 일독을 권하는 바이다.
국내 BI 관련 도서는 그 수도 많지 않을 뿐더러 여러 밴더의 제품을 활용 차원에서 간략하게 설명하거나 특정 제품의 튜토리얼 수준에 그치는 경우가 많다.
때문에 특정 제품을 선정하고 입문하려 할때 마땅히 추천할만한 책이 없는것도 사실이다.
태블로의 경우 시장에서 차지하는 영역에 비해 초보자가 별도의 교육없이 직접 입문하기에는 어렵고 원서로 시야를 넓히면 권할만한 책들이 몇권있지만 국내 환경은 척박하기 그지 없다.
이런 상황에서 이 책은 입문자들에게 권할수 있는 거의 유일한 책이 아닐까 한다.
입문자들을 위해 효과적인 여러 차트를 구성하고 활용하는 방법과 TIP을 적절하게 제시하고 있고 Prep, LOD등의 확장된 부분도 기본적인 내용은 언급하고 있다.
다만 아쉬운 점은 500 페이지에 가까운 책의 볼륨에 비해 큰 활자와 삽입된 이미지의 분량으로 인해 가독성은 좋으나 내용상의 깊이는 말 그대로 입문-기초 활용에 그치고 있다는 점이다.
차후 이책을 발판으로 좀더 깊이 있는 준전문가 수준의 책도 발간되었으면 하는 바램이다.