품목정보
발행일 | 2020년 01월 31일 |
---|---|
쪽수, 무게, 크기 | 308쪽 | 173*230*30mm |
ISBN13 | 9791190014694 |
ISBN10 | 1190014696 |
발행일 | 2020년 01월 31일 |
---|---|
쪽수, 무게, 크기 | 308쪽 | 173*230*30mm |
ISBN13 | 9791190014694 |
ISBN10 | 1190014696 |
1장 데이터베이스와 SQL 1. 데이터베이스 2. 데이터베이스 종류 3. 데이터베이스와 서버 4. SQL 5. MySQL, MySQL Workbench 설치 6. MySQL Workbench 구성 7. 서버, GUI 8. 분석가, SQL 9. SQL 쿼리 작성법 2장 SQL 문법 1. SQL Syntax 2. SELECT 3. FROM 4. WHERE 5. GROUP BY 6. JOIN 7. CASE WHEN 8. RANK, DENSE_RANK, ROW_NUMBER 9. SUBQUERY 3장 데이터 추가, 삭제, 갱신, 데이터 정합성 1. Import CSV 2. Insert, 행 추가하기 3. Delete, 행 삭제하기 4. Update, 데이터 갱신하기 5. Procedure 6. View 7. 데이터 정합성 4장 자동차 매출 데이터를 이용한 리포트 작성 1. 데이터 생성 2. 구매 지표 추출 3. 그룹별 구매 지표 구하기 4. 재구매율 5. Best Seller 6. Churn Rate(%) 5장 상품 리뷰 데이터를 이용한 리포트 작성 1. 데이터 생성 2. Division별 평점 분포 계산 3. 평점이 낮은 상품의 주요 Complain 4. 연령별 Worst Department 5. Size Complain 6. Clothing ID별 Size Review 6장 식품 배송 데이터 분석 1. 데이터 생성 2. Instacart Dataset 3. 지표 추출 4. 구매자 분석 5. 상품 분석 6. 다음 구매까지의 소요 기간과 재구매 관계 7장 UK Commerce 데이터를 이용한 리포트 작성 1. 데이터 생성 2. 국가별, 상품별 구매자 수 및 매출액 3. 특정 상품 구매자가 많이 구매한 상품은? 4. 국가별 재구매율 계산 5. 코호트 분석 6. 고객 세그먼트 7. 일자별 첫 구매자 수 8. 상품별 첫 구매 고객 수 9. 첫 구매 후 이탈하는 고객의 비중 10. 판매 수량이 20% 이상 증가한 상품 리스트(YTD) 11. 주차별 매출액 12. 신규/기존 고객의 2011년 월별 매출액 13. 기존 고객의 2011년 월 누적 리텐션 14. LTV(Life Time Value) 8장. 타이타닉 호 데이터 분석 1. 데이터 생성 2. 요인별 생존 여부 관계 3. EMBARKED 4. 탑승객 분석 5. 상관 분석(Correlation Analysis) 6. 데이터 분석 및 시각화 9장 R, Python 연동 1. Import CSV(turnover.csv) 2. MySQL과 R, Python 연동하기 3. 근무 시간과 직업 만족도의 관계(선형 회귀 분석) 4. Python 연동하기 5. SQL - Python, R 6. R vs Python |
4차 산업혁명의 많은 비즈니스가 각광받고 있다.
그 중심에는 '데이터'가 있다.
이전에도 있던 데이터였지만 그것을 어떻게 바라보고 분석하느냐에 따라 제품과 서비스가 달라진다.
이 책 'SQL로 맛보는 데이터 전처리 분석'은 데이터에 어떻게 다루는지를 보여주고 있다.
아직 많은 기업들이 엑셀과 같은 오피스 도구를 사용하여 데이터에 대한 분석을 하고 있다.
이는 데이터가 적거나 적절한 지표를 원할 경우에는 유용할 수도 있다.
하지만 데이터가 많고, 실시간으로 변하는 고객 지표, 다양한 분석을 원할 경우에는 별도의 데이터베이스를 사용해야 한다.
데이터베이스를 가지고 있다고 하더라도 데이터에서 어떻게 유의미한 자료를 추출할 수 있느냐는 별개의 문제다.
이 책은 데이터 전처리를 통한 유의미한 데이터 분석방법을 알려준다.
책은 크게 2부로 나눌 수 있다.
앞부분에서는 데이터를 추출하기 위한 방법으로 SQL 사용법을 알려준다.
가장 기본적이고, 많이 사용하고, 그리고 데이터를 다루기 위한 가장 중요한 것이다.
SQL만을 전문적으로 다루는 직업이 있을 정도로 난이도가 있지만, 이 책에서는 가장 기본적인 내용들을 쉽게 설명해 주고 있다.
뒷부분은 SQL을 사용하여 어떻게 유의미한 자료를 추출할 수 있는지를 보여준다.
실제 비즈니스에서는 아래와 같은 지표들을 많이 요구한다.
이런 요구에 대한 실용적인 해결방법을 알려주고 있기에 실무에도 많은 도움이 될 것이다.
아래처럼 해당 요청에 대한 데이터를 어떻게 추출할 수 있는지 SQL 쿼리까지 친절하게 설명하고 있다.
마지막에는 데이터 분석 프로그램으로 가장 각광받고 있는 Python과 R을 간단하게 소개하고, 실제 데이터 추출방법까지 보여준다.
데이터 분석에 깊은 관심이 있다면 참고하여 공부하면 좋을 것 같다.
데이터에 관심이 있거나, SQL을 쉽게 배우고 싶은 분들에게는 좋은 선택이 될 것이다.
SQL에 대한 설명을 이 책보다 쉽게 이해하는 책은 보지 못한 것 같다.
전문용어가 거의 없고, 일반인들도 쉽게 이해할 수 있게 되어 있다.
이 책은 개발자에게도 좋지만, 원하는 데이터를 마음껏(?) 보고 싶은 기획자나 마케터에게도 상당히 유용할 것 같다.
기타 SQL 책과 다르게
예제 중심으로 집필이 되어있습니다.
현업에서 많이 사용되는 지표들이 소개 되어있고
해당 지표들을 출력할 수 있는 실습 예제가 있어 많은 도움이 되었습니다.
특히 데이터 분석 과정을 전반적으로 다루는데
여기에 각 언어가 어떻게 사용되는지 정리되어 있습니다.
감을 잡는데 많은 도움이 되었습니다.
소스 코드도 제공이 되어 SQL Workbench에서 실습하기에 편리 했습니다.
데이터 분석이나 SQL (데이터 조회 목적)에 처음 입문하시는 분들에게 추천 드립니다.
이 책은 SQL 을 이용하여 다양한 케이스의 데이터를
어떻게 뽑아낼 것인지에 초점이 맞춰진 책이다.
mysql 을 이용해서 설명하고 있다.
이 책을 읽어볼 사람으로 가장 추천하는 사람은
1. SQL 공부를 금방 마치고 이에 관하여 다음 단계로 넘어가고 싶은사람.
2. SQL 을 사용한지 오래 되어서 감각을 되 살리고 싶은 사람
3. SQL 의 사용 패턴이 너무 굳어져서 이를 확장하고 싶은 사람
정도가 되겠다.
또 이 책이 맞지 않은 사람은
1. SQL 을 처음 접해보는 사람.
2. 데이터베이스 설계나 운영을 어떻게 하는지 궁금한 사람
이 되겠다.
이 책은 기본적으로 SQL 의 응용편이라 할 수 있기 때문에 위 2가지 이유를 가지고
본 도서를 접하는 사람은 실망감을 가지게 될 것이다. 그리고 응용편의 책인 만큼
기본적으로 친절한 책은 솔직히 아니다. 초심자 수준의 사람이 본 책을 읽을때
많은 부분에서 당황스러움을 느낄거라고 생각한다.
하지만 이 책은 여러면에서 SQL 을 실습하거나 데이터 분석의 다양하고 직접적인 사례를
통해 데이터 분석이 어떻게 이루어지는지 SQL 을 어떻게 더 응용할 수 있는지에 대한 길을 확실히 알려준다. 그런 면에서 여러 사람들에게 추천하고 싶다.
특히 8장 타이타닉 호 데이터 분석은 이 책의 하이라이트라고 할 수 있는데,
주어진 데이터를 어떻게 활용할 수 있는지, 이를 위한 SQL 은 어떻게 작성할 수 있는지에
대해서 이전에 연습했던 것을 총 망라하여 활용하기 때문에 데이터 분석이나 SQL을 더
적극적으로 활용하고 싶은 사람에게는 인내심을 가지고 꼭 한번 학습해 보라고 권하고 싶다.
또한 데이터 분석을 처음으로 시도 하는 사람들이 있는 데이터를 가지고 분석을 위한
새로운 데이터 세트를 구성하는데 어려움을 겪는 경우가 종종 있는데 이 책의 설명을
잘 따라서 실습을 해 보면 이 부분에 대한 궁금증이나 어려움을 해소하는데 큰 도움을
받을 수 있다고 생각한다.
각 장마다 새로운 분석 기법이 나올때 마다 간단하게 설명이 되어 있는데
데이터 분석에 대한 호기심을 자극하기에 충분하다고 여겨진다.
다만, 간단하게 설명하는 수준이라서 궁금한 사람에게는 더 깊은 내용의 공부가 필요하다.
하지만 바로 SQL 로 예제가 나오기 때문에 간단한 설명을 충분히 보충하고도 남는다고 생각한다.
이 책의 아쉬운 점은 편집적인 구성인데
시작하자마자 3장 1절의 예제 데이터 셋을 전부 받아서 구성해 놓고 이 책을 읽기를 권하고 싶다.
SQL 예제를 각 장마다 넣으라는 설명이 있고 3장 1절에서 전체 예제 데이터 셋을 구성하는
설명이 있는데 이게 읽을때 가끔 헷갈리게 하는 부분이 있다. 그냥 3장 1절의 예제 데이터 셋을 구성하고 각 책에서 나오는 예제 데이터셋 설명 방법은 무시하고 읽는게 좋다.
약간의 예제 오타는 있지만 책의 중반부 이후에 몇개 나오는 수준이라 책을 충분히 따라 했다면
넘어갈 수 있는 수준인 것 같다. 예제 SQL 실행 화면의 이미지가 책에 실려 있는 것들이 있는데
실제 예제 실행 화면과 완전히 일치하지 않는 경우가 있기는 하나 학습하기에 문제가 있는 수준은 아니다.
데이터 분석에 대하여 궁금증이 있는 사람, 자신의 SQL 을 다루는 능력을 한단계 더 상승 시키고
싶은 사람들에게 한번쯤 읽어보고 학습할 만한 책이라고 생각한다.