|
현대 사회에서의 삶이라는 것은 많은 경우 데이터를 사용한다. 아침에 듣는 날씨 정보, 도착지까지의 지도 정보, 다음 버스나 지하철 시간, 카톡, 온라인 쇼핑 등 매일 우리는 데이터 속에서 살아가고 있다. '하버드 비즈니스 리뷰' 잡지는 앞으로 가장 매력적인 직업 중에 하나가 바로 데이터 사이언티스트라고 언급했다. 데이터로 먹고 사는 직업도 있을 정도이고 위에서 언급했다시피 이미 삶에 깊숙이 들어와 있는 데이터에 대해서 우리는 얼마나 그러한 데이터를 살펴보고 이해하고 잘 활용하고 있는가? 본 책은 데이터 사이언스 분야의 입문책으로서 활용하기 좋은 책으로 보인다. 데이터와 관련된 기본 개념들을 하나씩 천천히 그림까지 곁들여서(!) 친절하게 입문할 수 있도록 도와준다. 예를 들면, 데이터를 분석하기 전에 먼저 사용할 데이터에 대해서 그 대상과, 속성, 척도를 파악해야 한다고 한다, 언급된 예시를 그대로 가져오자면 앙케이트 조사를 통해서, 대상 -> A시에 거주 중인 주민 100명 속성 -> 개인별 지역 커뮤니티 활동 여부 추후 마을에 대한 생각 척도 -> 질문1과 4는 선택지 번호, 질문 2와 3은 실제 수치 이런 식으로 구체적으로 예시로 독자가 쉽게 이해할 수 있게 해 준다.
기본 개념의 설명부터 시작해서, 특정 문제를 해결하기 위한 데이터 수집, 준비, 분석 및 예측 등에 대해서 친절하게 설명을 해 준다. 마지막으로 한 가지 흥미롭게 본 점은 바로 데이터 윤리이다. 이미 데이터가 삶의 일부가 되어버린 상황에서 이를 어떻게 활용하는지도 사람이 직접 결정할텐데 이 부분에 대해서는 생각해보지 않았던 점이다. 종합적으로 결론을 내리자면 본 책은 데이터 사이언스의 입문책으로 활용하기에 충분히 좋고 입문자에게 친절한 책으로 보인다. 조금 어려울 수도 있는 내용들을 다양한 그림과 그래프 등을 활용해서 쉽게 이해를 돕는 점, 윤리를 다룬다는 점, 그리고 AI와 관련된 설명까지 등의 이유로 책의 가치를 좋게 평가하고 싶다.
--- YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다
|
|
안녕하세요. 책 제목에 입문이 있는 만큼, 저처럼 초보 입문자를 위한 책이예요^^
데이터 사이언스란 무엇일까?
세상은 이제 데이터를 거치지 않고서는 살 수가 없죠. 세상에는 이미 무수한 데이터가 존재하고, 그걸 나에게 맞게 필요한 정보로 적절하게 가공하는 것이 현대 직장인에게 중요한 능력이 된 듯 하구요. 예전에 주먹구구식으로 행사 뒤에 만족도 평가 설문지 작업을 진행했었는데, 책을 읽으면서 정말 막무가내로 했었구나 하고 반성도 했답니다 ㅋㅋㅋ 그때 미리 알고 있었다면 더 좋았을 것을 ㅋㅋㅋㅋㅋㅋ
|
|
우리는 알게 모르게 다양한 데이터에 둘러싸여서 일상 생활을 하고 있다. 특히 AI가 발전하면서 머신 러닝에서도 데이터의 양이 많아야 더욱 정확한 결과를 도출하기도 하고, 챗 GPT도 버전이 올라갈수록 파라미터의 양이 기하급수적으로 늘어나고 그로 인해 더욱 사람같이 대화할 수 있게 된다.
'데이터'의 가치가 올라가면서 자연스레 데이터를 다루는 과학이 생겨나고 이를 '데이터 사이언스'라고 한다. 사실 데이터 사이언스가 무엇인지에 대한 정설은 없다고 한다. 저자에 따라 다루는 방법, 내용 등이 다양하다. 이 책에서는 데이터 사이언스 개요와 기본적인 사고방식을 일러스트와 도표를 사용해 독자에게 쉽게 설명한다. 그래서 시각적으로 이해하기 쉽고, 구체적인 수학적 이론이나 기술 등을 설명하지는 않기에 이 책은 데이터 사이언스의 '입문을 위한 입문서'라고도 할 수 있다. 그래서 이 책을 선택하게 되었다.
'데이터'의 가치가 올라가면서 '데이터 사이언스'를 공부하고 싶은데 기초부터 쉽게 공부하고 싶어서, 눈에 보이지 않는 개념을 구체화 시켜서 보고 싶어서 <그림으로 배우는 데이터 사이언스 입문> 을 선택하여 읽어보았다. 책에도 적혀있지만 어려운 수식을 사용하고 있지 않아, 데이터 사이언스는 궁금하지만 수식에 약한 사람에게 추천할 만한 책이다.
책은 총 7장으로 구성되어 있다. 데이터 사이언스의 개념, 데이터는 무엇인지, 데이터 읽기와 분류, 데이터 예측, 데이터 윤리, 데이터 사이언스와 AI까지 기본적인 내용은 대부분 다루고 있다. 처음부터 그림이 많은 부분을 차지하고 있어서 부담없이 읽을 수 있는 것이 좋다. 우리의 일상 생활 속 데이터가 차지하고 있는 부분을 확인할 수 있다.
중요한 내용은 하이라이트 처리가 되어 있어서 눈에 잘 띈다. 순서도, 그래프, 도표, 그림 등 다양한 표현방식으로 설명을 하고 있어 이해가 쉽고, 그래프의 의미도 꼼꼼하게 적어놓아 알아보기 쉽다. 보통 공학 책은 그래프만 덩그라니 그려져있고 설명글은 동떨어진 위치에 있어서 의미를 파악하기 어려웠는데, 이건 바로 옆에 설명되어 있으니 이해하기 좋다.
어려운 수식은 없지만 수식이 나오기는 한다. 꼭 필요한 경우 방정식이 나오지만 간단한 식이기도 하고, 각 변수의 의미를 잘 표시해 놓아서 좋다.
수식이 나오면서 조금 공부하며 읽어야 했지만, 앞에 데이터에 대한 설명과 데이터 해석의 공정을 소개하는 부분은 이전에 수업을 들었던 적이 있어서 기억을 되새기는 기회가 되었다. 동영상 수업으로 들어서 그냥 넘겼던 부분이 책에 비슷하게 정리가 되어 있어서 복습하는 느낌이 들어 좋았다. 책으로 되어 있으니 내가 원할 때 또 찾아보며 반복해서 공부할 수 있을 것 같다.
AI와 데이터 사이언스에 대한 내용이 나오고 부록으로 Excel 로 배우는 데이터 해석이 나온다. 데이터와 데이터 사이언스, AI와 관련된 기초적인 내용들은 모두 담고 있으면서 그림을 많이 이용하여 쉽고 지루하지 않게 구성되어 좋았다. 데이터 사이언스가 무엇인지 궁금하여 기초적인 내용을 알고 싶으면 이 책을 먼저 보면 좋을 것 같다.
* 'YES24 리뷰어클럽 서평단 자격으로 작성한 리뷰입니다' |
|
현대 사회에서는 TV, 휴대전화, 컴퓨터, POS, IoT 기기 등을 사용해서 데이터를 끊임없이 교환합니다. 일상생활에서 우리는 데이터와 데이터를 활용한 결과를 소비하는 입장으로, 데이터로부터 가치를 창조하는 생산(제공)자 입장도 될 수 있습니다. 이렇게 데이터의 가치가 상승하는 세상에서 살고 있으며 이를 위해 데이터를 알고 활용할 수 있는 능력을 갖춰야 합니다.
이 책은 데이터 및 데이터 사이언스와 관련하여 개요와 기본적인 사고방식을 삽화와 도표를 사용해 쉽게 설명하고 있습니다. 데이터는 작성 방법이나 취급하는 방법이 다를 수 있고 이에 따라 의미와 해석도 달라질 수 있습니다. 따라서 이러한 대략적 내용을 파악하기 위한 그림책이라고 할 수 있습니다.
책에는 내용을 다음과 같이 다루고 있습니다. 1장에서는 데이터와 데이터 사이언스에 대한 개요를, 2장에서는 데이터의 타입 및 특징에 따른 수집 방법을 자세히 알아봅니다. 3장부터 5장까지는 데이터를 읽고 분류하고 이를 기반으로 예측하는 해석에 대해 다루며, 6장은 데이터 윤리 7장은 머신러닝과 AI에 대해 훑어봅니다. 또한 데이터 사이언스를 체험할 수 있도록 Excel로 간단한 계산을 들어 이에 대응하는 함수나 분석 툴을 사용하는 방법에 관해서도 설명해 줍니다.
내용 중 사례를 들 때 휴대전화로 LINE(메신저)이나 메일로 소통하는 부분이 나온다던가 비빅데이터 및 기계학습이라는 용어를 사용해서 저자가 일본 분이라는 것이 실감 났습니다. 또한 중요한 부분에는 노란색 바탕으로 강조표시한 것이 읽기 좋았습니다. 내용을 그림으로 알기 쉽게 설명해 주고 있지만 아이들이 읽기에는 무리가 있는 내용이기에, 데이터 사이언스에 입문하고자 하거나 기존 개념을 쉽게 정리하려는 인원에게 좋을 것 같습니다.
|
|
바야흐로 빅데이터, 인공지능의 시대이다. 학교에서도, 회사에서도 빅데이터, DX, AI를 외치고 R이나 Python 중 하나 다루지 못하면 시대에 도태되는 문맹으로 취급받기 일쑤이다. 그런데 이런 언어를 배워본 사람이면 누구나 의문이 들 것이다. 근데 이걸 어디다, 어떻게, 왜? 써야 하는 것일까?? 사실 언어 교육시 잠깐잠깐 통계나 데이터 관련 이야기들이 나오지만, 언어 학습 위주이다 보니 단편적으로만 간략히 소개되는 경우가 많다. 그래서 궁금증이 많이 생기게 되는데, 나같은 그런 사람들을 위해 좋은 책이 나와 소개하고자 한다. '그림으로 배우는 데이터 사이언스 입문'은 데이터란 무엇인가부터 데이터를 어떻게 이해하고 가공, 분류할지, 그리고 예측하는지에 대해 아주 상세히, 쉽게 잘 소개되어 있다. 우리가 데이터를 활용하고자 하는 목적은 어떤 것에 대해 직관적이 아닌 데이터 기반의 예측을 하고자 함이며, 그러기 위해선 데이터를 분석해야 하는데 데이터 분석은 데이터를 분류 및 가공해서 도식화 등을 하고, 여기서 패턴들을 찾아내는 것임을 이야기한다. 또한 데이터 분석을 위해선 데이터의 종류에 따라 분석방법이 다르므로 데이터의 종류를 설명하고 어떤방법을 쓰면 좋을지 알려주는 식이다. 사실 시대가 원체 빠르게 변화하다 보니 많은 일들이 이런식인 것 같다. 머리와 꼬리가 바뀌어 데이터가 뭔지도 모른채 등떠밀려 데이터 처리에 대해서만 공부하게 되는. 나도 그렇게 떠밀려 오다가 이번 책을 통해 한번 정리함으로써 중심을 잡은 것 같다. 제목은 데이터 사이언스 입문이지만, 데이터에 관심있거나 활용할 일이 있다면 한번 읽어볼 것을 권한다. |
|
4차산업혁명 도래 후 데이터 사이언스, 인공지능은 이제 흔한 용어가 되었다. 요즘은 한술 더 떠 chatGPT가 나오더니 이제는 바드에서 한글과 일어를 지원해서 네이버와 카카오가 위기를 겪게 될 것이라는 우려기사까지 나오고 있다. 이제는 인공지능이나 데이터 사이언스를 모르면 기사의 일부를 이해하지 못하는 시대가 도래하고 있는 것이다. 하지만 나도 숱하게 겪었던 어려움 중 하나는 데이터 사이언스를 공부하고 싶어 강의나 교육을 들어보면, 대부분 개념이나 전체적인 틀에 대한 설명보다는 파이썬, R 등 언어적인 기법에 치중되어 있다는 점이다. 급해서 또는 교육 여건상 짧은 컨텐츠나 시간 안에 많은 걸 담아야 하다보니 실무에 관련된 이야기를 더 할수밖에 없겠지만, 이게 어느정도 지나고 보면 근데 이걸 왜 여기서 하는거지? F를 하고 싶은데 앞에 뭘 해야 F를 할 수 있지 하고 책을 뒤적이는 나를 발견하게 된다. 그런의미에서 어려운 언어에 대한 설명 하나 없이 개념원리적인 설명위주의 데이터 사이언스 책이 출간되었다. 바로 데이터 사이언스 입문이라는 책으로, 아주 쉽고 간단명료하게 데이터 사이언스의 개념과 순서들에 대해 잘 설명해주고 있다. 입문이라는 제목과 같이 깊이가 얉을 것 같기도 하지만 굉장히 세심꼼꼼하게 영역을 커버하였기 때문에 중간중간 처음 듣는 개념이나 방법을 알게 되기도 했다. 어려운 각종 언어와 모듈 설명에만 치중된 책들로 공부하는데 지쳤다면, 반드시 이 책을 한번쯤은 열어볼 것을 권한다. |