2016년 다보스포럼에서 4차산업혁명을 처음 언급한 이후로 인공지능, 사물인터넷, 빅데이터 등의 새로운 패러다임이 확산되었고, 이제 7년밖에 되지 않았는데 이런 단어들은 초등학교 저학년도 아는 일반적인 용어가 되었다. 그 중에서도 인공지능은 이제 우리 생활에 밀접하게 연관되어 있고 우리가 만나는 교육컨텐츠들도 인공지능 기반으로 서비스 되는 것들이 상당하다. 지난 1월 MS에서 발표한 챗GPT도 요즘 매우 핫하다. 사람이 말하는 어투로 질문하면 사람이 대답해 주는 것과 같은 문장으로 우리에게 설명해 준다. 내용적으로 보면 학습이 부족하거나 검증되지 않은 내용들도 많기 때문에 이용자들의 주의가 필요하지만, 교육계에서도 토론회까지 급하게 열며 논의 중일 정도로 뜨겁니다. 이렇게 우리가 이용하는 대부분의 것들에 적용되어지는 인공지능, 우리는 제대로 이해해야 그 적용 및 활용 또한 확장해서 고민해 볼 수 있을 것이다. '인공지능'이라는 용어는 익숙해 졌지만, 그 개념으로 들어가면 공부할 것들이 많다. 확률과 통계와 같은 수학적 개념은 당연하고, 미적분과 같은 이과생들의 영역에 대한 학습도 필요하다. 그리고, 수학적 백그라운드가 있어도 이제는 인공지능의 학습 방법을 이해해야 한다. 나는 개인적으로 대학은 문과계열을, 대학원은 공학계열 인공지능을 전공하였다. 문과출신으로서 인공지능에 대한 개념 이해가 필요해서 시중에 나와 있는 책들을 많이 살펴 보았었는데 수학적 백그라운드가 부족해서 인지 늘 어려움이 있었다. 지금 생각해 보면 설명 방식이 불친절했던 것도 있는 것 같다. #JPUB #제이펍출판사 #그림으로배우는StatQuest머신러닝강의 이왕이면 쉽게 설명한 책, 그림으로 표현한 책들을 찾고 있다가 좋은 책을 발견하였다. 제이펍 출판사의 <그림으로 배우는 StatQuest 머신러닝 강의> 이다. #조시스타머 #JoshStarmer #머신러닝유튜브 #StatQuesat 조시스타머는 통계, 데이터 과학, 머신러닝 분야에서 유명한 과학자이다. 머신러닝 유튜브 'StatQuesat with Josh Starmer'를 운영 중이고, 구독자수가 2023년 2월 기준으로 88만 7천명이 넘는다. 채널에 들어가 보면 알겠지만, 문장으로의 기술보다는 시각화하여 설명해주는 특징이 있다. 인공지능 분야 중에서도 외부에서 주어지는 데이터를 기반으로 스스로 학습하는 머신러닝 분야에 대해 알려주는 채널이다. 인공지능분야는 용어를 나열하고 하나하나 정의해 보라고 하면 말문이 막히는 분야이기도 하다. 그만큼 개념 정립에 시간이 걸린다. 어려운 개념을 쉽게 설명할 줄 아는 그는 진짜로 아는 사람이다. 90만에 가까운 구독자가 인정하는 전문가이지 않는가
표지부터 만화책을 보는 것 같다. BAM~~ 원시인과 공룡이 대화하며 으쌰으쌰 응원 하려나 보다. 그림책처럼 가로로 넓적하다. 머신러닝 기초부터 신경망까지 머신러닝의 최고레벨까지 다루고 있다. 목차에서 보다시피 그림이 친근하다고 해서 내용은 가볍지 않다. 이책은 초보자 부터 중급 수준의 머신러닝 학습자를 위한 내용을 담고 있다. 머신러닝을 처음 배우는 사람들에게 편안하게 다가가기 위해 저자가 상당한 마음을 썼음을 알 수 있다. 머신러닝의 기본개념을 알고 싶은 사람부터터 동작 알고리즘을 이해하고 싶은 사람들에게 적합하다.
저자 조시스타머는 재미있는 사람임에 틀림 없다. 애기들조차도 좋아하는 공룡을 그리며 한장한장 따라오라고 말한다. 딱딱함을 벗어 던지고 그래프와 화살표로 설명한다. 아니나 다를까, 뒷부분에 모델 성능 평가하기 파트에 가니 노래까지 만드셨다. 키워드는 민감도, 특이도, 정밀도, 재현율!! QR코드 찍어보니 유튜브로 연결되고 저자의 노래도 감상할 수 있다. 너무 너무 재미있어서 웃음이 빵 터져버렸다. 보통의 애정으로는 만들어 질 수 없는 노래다. 머신러닝하면 앞으로 조시스타머님이 생각나면서 기분이 좋아질 것 같은 느낌이다. 음식도 기억으로 선호하듯이 책도 비슷한 것 같다. 기억의 감정이 좋으면 지식의 담은 낮아진다. 이 책은 머신러닝 이해를 위한 기초 개념부터 탄탄하게 이해할 수 있도록 구성되어져 있다. 예를 들어 통계기본 개념 파트를 보면 히스토그램이 나온다. 설명하는 순서를 보면, 먼저 히스토그램의 주요개념을 다룸에 있어서 먼저 이슈를 제시한다. " 많은 측정값에 숨겨진 트렌드를 찾아내고 싶다" 이를 알아내기 위한 방법을 제시하고 히스토그램이 관련 인사이트를 발견하기에 유용한 도구라고 설명한다. 그 다음에 자세히보기 파트에서 측정값들의 확률까지 예측할 수 있음을 전개한다. 머신러닝 알고리즘은 크게 지도학습과 비지도학습으로 나뉜다. 이와 관련하여 분류, 회귀, 군집화, 차원축소 등의 개념 이해가 필요한데 이 모두를 다루고 벡터분류와 신경망까지 다루고 있다. 내가 생각할 때 이 책은 완전 초보용은 아니다. 적어도 기본 개념을 알고 있는 사람이 읽으면 머신러닝 지식 트리를 체계화하는데 상당하게 도움이 될 같다. 그럼에도 입문자들에게도 이 책을 함께 보라고 이야기하고 싶다. 왜냐하면 그림으로 설명해 주는 책이 흔하지 않고 무엇보다 유튜브 채널을 통해서 흥미롭게 다가갈 수 있고 공부하다가 어려운 부분을 만났을 때 긍정적 마인드도 전환할 수 있기 때문이다. 인공지능 분야 서적은 대부분 두꺼운데 <그림으로 배우는 StatQuest 머신러닝 강의>는 상대적으로 얇으면서도 핵심 키워드를 이해할 수 있도록 했다. 머신러닝을 공부하는 사람들은 이 책 옆에 끼고 시각화 하면 이해도가 높아지리라 생각한다. |
"<yes24 리뷰어 클럽>"활동을 위해서 책을 제공받아 작성된 서평입니다. ![]() ![]() 제목 : 그림으로 배우는 StatQuest 머신러닝 강의 - 책의 내용 및 구성1. 유명 해외 머신러닝 강의 유튜버(조시 스타머) 의 강의들을 묶어 책으로 엮음. 2. '통계/머신러닝/딥러닝 개념을 세상에서 가장 쉽고 재미있게 알려주는 책' 이라고 밝히고 있으며, 아주 기초적인 내용에서부터 신경망 같은 고급 주제들까지 다루고 있음. 3. 12개의 챕터, 약 280p로 구성 4. 제목에서도 드러나 있듯이 모든 내용 설명이 그림(그래프, 차트 포함)으로 구성되어 있으며, '노말사우르스'와 '스탯스콰치'라는 등장인물들이 대화하며 궁금증을 풀어나가는 형식으로 진행
- 책에서 눈에 띄는 점1. 처음부터 끝까지 그림으로 시작하고 그림으로 끝나는 구성이기 때문에 약간 어려운 개념을 설명하더라도 글로 읽는것보다 지루하지 않고, 조금 더 빠른 이해를 도와주는 점 2. 모든 설명에 그림이 들어가 있기 때문에 약간 복잡하고 지저분한 느낌이 들지만, 화살표로 어떤 설명을 하고 있고 어떻게 진행해야 하는지 알려주기 때문에 내용을 간편하게 진행할 수 있음.
- 총평근 몇 년동안 IT 책을 꽤나 많이 봤다고 생각했는데, 이런 종류의 책은 처음이다. 마치 어렸을 적 동화책을 보던 느낌이랄까? 딱 구성이 그런식이다. 그런데 동화는 뭔가 틀이 딱 잡혀있지만 이 책은 약간 중구난방에 어지러운 느낌이다. 화살표로 어떻게 내용을 진행해야 하는지 알려준 것은 그나마 다행인듯 싶다. 머신러닝이나 딥러닝을 제대로 배운적이 없기 때문에 내용이 훌륭하다 어떻다 라고는 평가를 내리지 못하겠다. 하지만 유튜브에서 약 90만의 구독자를 가진 머신러닝 유튜버라는 점에서 이미 검정된 것이나 마찬가지가 아닐까 싶다. 중구난방에 어지러운 느낌이라는 단점도 있지만, 가벼운 마음으로 머신러닝/딥러닝을 공부하고자 하는 사람에게 이 책은 아주 훌륭한 책이지 않을까 싶다. 흰 배경과 검은 글자가 수두룩하고 그래프를 몇개 던저주고 그것을 해석하는 책은 아무리 숙련된 사람이라도 쉽지 않을 것이기 때문이다. 위에서 '동화' 라고 표현한 만큼 그림이 빠지는 페이지가 없다. 조금 긍정적으로 생각하면 재미있는 책(?)이지 않을까 싶다. 등장인물들의 대화 형식으로 진행을 하는 방식이다보니 진지하게 앞 내용을 기억해서 기나긴 문장을 해석해야 하는 다른 책들에 비해 심심할 때 가벼운 마음으로 읽어나가도 좋지 않을까 싶다. |
이 책은 “The StatQuest Illustrated Guide To Machine Learning”라는 제목으로 이미 머신러닝 커뮤니티에서 화제를 끌었던 책이다. 비록 원서를 아직 접하지는 못했지만 워낙 그 인기가 대단하였기에 기회가 된다면 꼭 읽고 싶었던 책이었는데 이렇게 번역본으로 책을 접할 수 있어 다행이다. 이 책은 통계 분야에서는 확률분포, 베이즈, 회귀, p-value 등의 개념 그리고 머신러닝 분야에서는 신경망, SVM 등의 기초 개념들을 다루지만 무엇하나 등한시 할 수 없는 AI분야에서 가장 흔하게 활용되는 더불어 그림의 비중이 많은 다른 책들이 트리나 선형회귀 수준의 설명에 그치고 있는데 반해 이 책은 그보다 심화된 과정인 SVM과 신경망의 핵심 원리인 경사하강법이나 오차역전파법에 이르는 한 차원 뛰어넘은 고급 개념도 다룬다. 고작 300페이지 정도의 그림 책으로 이런 고급 지식들을 다룬다는 것은 저자의 자신감의 방증이기도 하다. 실력과 전달력이 항상 비례하는 것은 아니기에 이 짧은 분량으로 통계와 머신러닝에서 활용되는 주요 개념을 글자나 수식이 가득한 책보다 이 책이 얼마나 어이없는 책인지 또 얼마나 위대한 책인지 한장으로 요약하자면 이 책에 등장한 악보 한페이지를 예로 들 수 있겠다. 민감도, 특이도, 정밀도, 재현율의 개념을 녹인 노래인데 친절하게도 QR코드도 수록되어있어 노래도 직접 들어볼 수 있다. 이름만큼이나 혼동스러운 이 혼동행렬의 개념을 나름 중독성있게 부르다 보면 의외로 혼동행렬을 다룰때 사고가 확장되는 느낌 그리고 이해의 폭이 넓어지는 경험이 가능하다. 그렇기 때문에 이 책은 AI분야 종사자라면 이 책을 읽는 독자의 수준은 제각각이겠지만 다양한 위치에서 다양한 형태로 이 책은 분명 도움을 줄 수 있을거라 생각한다. AI분야에 문외한인 생초보들에게는 앞으로의 항해에 튼튼한 선박과 정확한 나침반을 준비할 기회를 얻을 수 있을 것이다. AI의 입문자에게는 수식과 글자가 가득한 책으로도 한 단계 나아가 개념을 이해하고자 코딩 및 실험을 했음에도 여전히 개념이 이해되지 않는 내용이 이해되는 놀라운 경험을 할 것이다. AI의 고수들도 다 자신만의 전문 영역은 세분화되기에 모든 개념을 확실히 알고 있다 장담하긴 어렵다. 설사 이 책이 전달하는 내용을 모두 다 알고 있는 고수들도 있겠지만 대부분 리더의 위치에 있을 가능성이 크기에 의사소통에 있어 곤욕을 치를 가능성이 크다. 자신이 알고 있는 것들을 모르는 이들에게 전달하는데 있어 발생하는 소음과 잡음을 해소하는데 그들을 이해시키는데 이 책은 큰 도움이 될 것이라 생각한다. 비록 AI 기술에 전문적인 학습을 원하지 않는 CEO나 기획자들도 이 책 정도의 개념만 익히고 있으면 보다 로우 레벨 의사소통에 진입하기 쉬워질 것이다. AI와 전혀 무관한 일반인들도 요즘 핫한 AI 기술이 어떤 원리로 돌아가고 있는지 앞으로 AI를 활용하여 어떤 비즈니스 성과를 달성할지 이해하는데에도 큰 도움이 될 것이다. 허무맹랑한 상상을 펴는 것 보다는 현재 AI 기술이 어떤 원리에 근간을 두는지 파악함으로써 현실적으로 AI를 스스로를 위해 더욱 잘 활용할 수 있을 것이다. AI와 무관한 진로나 꿈을 가진 학생들도 마찬가지이다. 자신들이 가진 학교에서 배운 것들을 무기삼아 어떻게 수익 혹은 진로에 적용할 수 있는지 고민하는데 이 책은 꽤 신선한 창의성을 불어 넣을 수 있을 것이다. 마치 책 말미에 수록된 미분의 연쇄과정을 잘 이해하여 AI의 오차역전파를 만드는 일과 같은 업적을 이룰 수 있을지도 모른다. 책의 한 장 한 장이 전부 주옥같지만 모두 다 소개할 순 없어 읽으면서 AI의 학습이라는 용어를 가장 잘 표현한 그림이다. 아래 그림에서 초록색 선은 머신러닝이 학습한 규칙이다. 파란색 새로운 점이 들어왔을 때 이를 얼마나 잘 예측하는지는 실제값과의 차이를 통해서 파악할 수 있다. 초록색은 이른바 과적합이 된 상황으로 너무 학습데이터에 적합하게 모델을 생성한 나머지 새로운 데이터에 대한 성능의 정확성이 떨어지는 상태이다. 11번 그림처럼 오차를 모두 합하여 전체오차가 적은 모델이 좋은 모델로 평가할 수 있음을 알 수 있다. 즉, 검은색 직선이 보다 성능이 우수하다. 이를 바탕으로 교차검증을 쉽게 이해할 수 있다. 학습 데이터의 일부를 테스트 데이터로 활용함으로써 오차가 최소화하는 과정을 선택하는 방법을 단순히 그림 몇장으로 쉽게 이해할 수 있다. 그동안 관련 개념은 수없이 많이 읽어왔지만 머릿속에 남은 핵심 개념은 이 책의 그림 몇장과 일치한다. 아직 학습, 과적합, 교차검증에 약간 혼선이 있는 입문자라면 이 책을 통해 확실히 이해할 수 있음에 놀랄 것이다. 또, 아무리 어려운 지식일지라도 이를 모두 이해한 고수의 머릿속에는 핵심 개념 몇가지만 자리잡고 있다. 모든 것을 이해할 수 있는 핵심 열쇠 개념이나 그림은 전체지식의 극히 일부인데 이 책은 그 극히 일부인 엑기스를 잘 담아내고 있는 책이라 볼 수 있다. 통계에서 다루는 기본 개념들도 마찬가지다. 확률분포를 저마다의 통계서적마다 주저리 주저리 정의하고 있지만 한번에 이해시켜주는 책은 아직 본 적이 없다. 정의는 대충 그런가보다 하고 넘어간 뒤 수많은 실험과 프로그래밍을 통해 아 결국 이거 하나 알려고 배운거구나라는 생각을 하게 되는데 그 이거 하나가 바로 아래 그림이다. 결국은 확률 분포를 이용하여 이 히스토그램에서 측정값이 하나도 없음에도 대략 파란색 선에 위치하겠구나 정도를 파악하기 위함이다. 이를 분포 중 가장 기초 개념인 이항분포로 예를 들고 있는데 이 역시 수식이 가지는 기호 하나하나가 무엇인지 자세히 설명하고 직접 숫자까지 대입해본다면 그리 어렵지 않음을 알게 될 것이다. 고수 한 명이 알때까지 하나하나 작은 기호 하나 놓치지 않고 설명한다면 무엇이 크게 어려울까? 이렇게 이해하고 나면 나중에 N명 중 2명이 호박파이를 좋아할 확률이 궁금한 상황이 온다면 자연스레 이항분포가 떠오를 것이다. P-value를 다룬 페이지 또한 마찬가지인데 이제껏 P-value를 이렇게 쉽게 설명한 이는 본 적이 없다. 고수님들 중에서도 P-value에 대한 설명을 부탁하면 잠시나마 난색을 표한다. 그나마 잘 설명을 해도 좋은 예제 하나가 있어야 한다. 이 책은 부록의 질도 결코 무시할 수 없다. 부록 말미에는 미분이 등장한다. 수학 교과서도 이렇게 만든다면 이해 못하는 학생이 2배 이상은 줄어들지 않을까? 미분은 결국 순간 변화율이다. x가 N만큼 변화할 때 y는 얼마만큼 변할지, 또 그 비율은 어떨지를 분석하기 위한 기법이다. 이 미분에는 연쇄법칙이 존재하는데 이를 활용하면 학습 결과의 수치를 자동으로 보정하는 오차역전파법에 적용할 수 있다. 수학 배워서 거스름돈 거스를 때나 쓰지 언제쓰냐고 비방할 것이 아니라 이 책의 이런 좋은 개념들을 바탕으로 진정 어디에 쓸지 고민해볼 수 있다면 세상에 등장하지 않았던 |
책 표지부터 정말 아기자기하다. 한번 펴보고 싶은 느낌이 든다....! 공룡들이 triple bam 이라고 외치는 부분을 찾게되기도... 먼저, 내용 구성은 머신러닝 기초와 통계(특히 데이터 사이언스 관련된) 기초에 대한 내용으로 구성이 되어있다. 내용 하나하나가 중요하고 기본이 되는 내용들이라, statquest의 내용들 중 중요한 요소들만 골라서 편집한 느낌이다. (책에서 statquest 유투브 강의에 대해서도 언급해서 구경해봤는데, 생각보다 내용도 이것저것 있고 자료도 최근 몇일전에도 올라온 내용이 있어서 놀랐다. 심심할때마다 기초용으로 보기에 좋아보인다 ) 내용은 글보다 그림이 많고, 과정을 시각적으로 시뮬레이션 하는 방식으로 설명이 되어있어서 동작방식에 대해 더 와닿았다.
머신러닝이 뭔지, 교차검증, 통계기본지식(확률, 확률분포,오차개념, p값 등), 경사하강법, 로지스틱회귀, 나이브 베이즈 등등... 뒷면및 목차에 다 적히지 않았지만 목차 내용에 필요한 추가 내용들도 많이 다루고 있다.
그 과정에서 나오는 수식에 대해서도 설명을 해주긴하는데, 일부 식들은 유도까지는 하지 않고 식에 대해 설명해주고 계산을 해보는 방식으로 결과를 보여준다. 궁금한경우엔 찾아보면 될 것 같다.
과정을 step by step으로 보여주고, 각 요소가 어떻게 영향을 주는지에 대해 자세한 설명을 하기위해 많은 노력을 기울인 것 같다.
처음 머신러닝을 접하시는분들이 이정도만 알고있어도 다음 스탭으로 넘어가기 쉽지않을까 싶다. 특히 시뮬레이션 되어있어서 이해하기가 쉬우니 좋은 것 같다.
|
Part 1:
출판사로부터 도서를 제공받아 직적 읽고 작성한 후기에요. |