확장메뉴
주요메뉴


소득공제
미리보기 공유하기

이보다 더 쉬울 수 없는 자바 머신러닝 with Weka

: 코딩의 압박에서 벗어나는 새로운 머신러닝 예제 학습

리뷰 총점10.0 리뷰 2건 | 판매지수 540
[IT 기획전] IT, 모두의 교양
박해선 저자의 머신러닝/딥러닝 패스
[단독]『혼자 공부하는 파이썬』 개정판 출간
내일은 개발자! 코딩테스트 대비 도서전
[단독] 에듀윌 IT 자격증 기획전 - 가장 빠른 합격출구 EXIT
소장가치 100% YES24 단독 판매 상품
YES24 트윈링 분철 : 인서트라벨/스티커 택1 증정
쇼핑혜택
현대카드
1 2 3 4 5

품목정보

품목정보
출간일 2021년 01월 29일
쪽수, 무게, 크기 616쪽 | 173*230mm
ISBN13 9791165920432
ISBN10 1165920433

이 상품의 태그

책소개 책소개 보이기/감추기

웹을 넘어 모바일로 전환될 때 Java가 큰 역할을 했듯이,
데이터 분석에도 Java는 큰 역할을 할 것으로 예상됩니다

더 이상 머신러닝을 무시하거나 무서워할 필요가 없습니다. 이제는 머신러닝을 어디에 적용할지를 고민해야 할 때입니다. 머신러닝 분야는 현재 파이썬이나 R이 상대적으로 강세이지만, 향후 iOS와 같이 파이썬, R과 Java가 양립하면서 확대될 것으로 예상됩니다.

이 책의 최종 목적은 도메인 전문가와 IT 종사자 간에 협업 체계를 구축하는 것입니다. 설계와 코딩 모두 구현할 수 있도록 UI와 API를 제공하는 Weka를 통해 실무에 적용해도 전혀 손색이 없는 예제를 제공합니다.

소스코드 다운로드
https://github.com/bjpublic/weka

목차 목차 보이기/감추기

Chapter 01 Why: Weka를 사용하는 이유
1.1 왜 데이터 분석인가? 임계의 가시화
1.2 왜 자바 머신러닝인가? Web → 모바일 → 분석(?)
1.3 왜 Weka인가? 무료/쉽고/신속 적용 가능
1.3.1 장점: 무료/쉽고/신속 적용 가능
1.3.2 단점: 메모리 문제, 무료 s/w 한계, 한글 인코딩
1.4 먼저 알아야 할 2개 지표(정분류율, 상관계수)

Chapter 02 What: 설치 프로그램
2.1 jre/jdk(Open JDK)
2.2 Weka 3.8.3 또는 Weka 3.9.3
2.3 Eclipse
2.4 다운로드 자료 강의 활용

Chapter 03 What: Weka 3.9.3
3.1 Weka
3.1.1 DIKW 관점 활용(why)
3.1.2 Weka 소개(what)
3.1.3 본서 구성(how)
3.1.4 학습 기대 효과(IF)
3.2 학습 방법 예시
3.2.1 실습: LinearRegression 알고리즘, regression_outliers.csv/arff 데이터셋
3.2.2 KnowledgeFlow 설계
3.2.3 Explorer 실습
3.2.4 Java 프로그래밍: W5_L1_OutlierWithCSV.java

Chapter 04 How: Weka 사용(전반)
4.1 인트로: arff 포맷, 필터링, 알고리즘, 시각화
4.1.1 소개
4.1.2 KnowledgeFlow
4.1.3 Explorer 사용
4.1.4 Datasets 살펴보기
4.1.5 분류 알고리즘 학습하기
4.1.6 필터 사용하기
4.1.7 Dataset을 시각화로 확인하기
4.2 모델평가
4.2.1 모델평가를 먼저 설명하는 이유
4.2.2 분할검증(Holdout): 훈련 데이터와 테스트 데이터를 처음부터 나눠서 검증한다
4.2.3 RandomSeed: 무작위로 데이터를 훈련과 테스트 데이터로 나눠 검증한다
4.2.4 가장 성능이 낮은 ZeroR 알고리즘보다 정분류율이 높은지 비교한다
4.2.5 n Cross-Validation: 훈련 및 테스트 데이터를 균등 분할하여 교차검증한다
4.3 결측값(pitfall)과 이상값(pratfall) 처리
4.4 초등 분류 알고리즘
4.4.1 OneR: 모든 목표변수는 단 한 개 속성으로 결정된다
4.4.2 NaiveBayes - 모든 속성을 중시함
4.4.3 J48: 대중적인 의사결정나무 But 과적합은 운명
4.4.4 IBk: k 군집 거리 측정 알고리즘, 적정 군집수 선별이 목적이다
4.5 중등 분류 학습 알고리즘
4.5.1 Boundary Visualizer: 2개 속성의 의사 결정 경계를 시각화한다
4.5.2 M5P: 선형회귀분석과 의사결정나무 분석을 동시에 학습한다
4.5.3 회귀 분류 1: 모든 숫자 속성을 선으로 분석한다(목표변수가 2가지의 경우)
4.5.4 회귀 분류 2: 모든 숫자 속성을 선으로 분석한다(목표변수가 3가지 이상의 경우)
4.5.5 로지스틱 회귀분석: 모 아니며 도의 구분을 알아낸다
4.5.6 서포트 벡터머신: SVM, 데이터 군집을 얼마나 떨어뜨릴 것인가?
4.5.7 앙상블 학습: 과적합을 피하기 위해 여러 알고리즘 결과를 투표로 선별한다

Chapter 05 IF: 전반부 정리
5.1 후반부에서 배울 것들

Chapter 06 What: 후반부 시작
6.1 전반부 복습
6.2 Experimenter(원시적인 AI)
6.2.1 기본 개념
6.2.2 통계적 유의미성 개념
6.2.3 분류 알고리즘 비교: 비교 자동화 = 원시적 A
6.2.4 Command Line Interface 및 JavaDoc
6.3 Weka 빅데이터(Big Data)

Chapter 07 How: Weka 사용(후반)
7.1 ROC(성능 판별 추가 지표)
7.2 텍스트마이닝
7.2.1 StringToWordVector
7.2.2 FilteredClassifier
7.2.3 MultiFilter
7.2.4 NaiveBayesMultinomial
7.3 이산화
7.3.1 비지도 이산화
7.3.2 지도 이산화
7.4 비지도 학습 연관/군집분석
7.4.1 지도 학습 vs. 비지도 학습
7.4.2 의사결정나무 비교
7.4.3 연관분석 기초
7.4.4 연관분석 응용
7.4.5 군집분석 개념
7.4.6 군집분석 평가
7.5 속성 선택과 결과 집중(개입)
7.5.1 중요 속성 기여도 선별(기초)
7.5.2 중요 속성 기여도 선별(응용)
7.5.3 라벨 결과 가중치 개입
7.6 인공신경망(딥러닝)
7.6.1 WekaDeeplearning4j(why)
7.6.2 Weka 패키지(what)
7.6.3 WekaDeeplearning4j 실습(how)
7.6.4 WekaDeeplearning4j 결론(if)
7.7 추가적인 성능 향상 기법
7.7.1 학습곡선
7.7.2 성능 최적화
7.7.3 arff 파일 추가 소개
7.7.4 학습 알고리즘(모델) 재사용

Chapter 08 IF: 후반부 정리

저자 소개 (1명)

출판사 리뷰 출판사 리뷰 보이기/감추기

이 책의 특징
- 머신러닝을 아는 도메인 전문가와 코딩을 아는 자바 개발자 간 협업 체계 구축
- 코딩 없는 머신러닝이 가능한 Weka 학습
- Weka Explorer, Experimenter, Knowledge Flow 사용을 통한 상호 유기적인 연계

이 책이 필요한 독자
- 코딩을 모르는 도메인 전문가 및 머신러닝 기획자
- Java 실무 1년 이상 개발자
- Weka Experimenter, Knowledge Flow 사용법 습득을 원하는 분

인터넷과 모바일 혁명이 도래하면서 수많은 IT 시스템들이 탄생했고 상당한 IT 시스템들이 Java로 구축되었습니다. R과 파이썬으로 구축된 데이터 분석 모듈이 Java에서 돌아가기 위해서는 이기종 간의 데이터 연동이 필요하고 구축 비용이나 투입되는 인력도 더 많이 소요될 것입니다. 그렇다고 java로 구축된 IT 시스템을 버리고 파이썬으로 고치는 것은 천문학적인 비용이 들어갈 수 있습니다.

Weka는 다양한 UI를 제공하고 코딩을 몰라도 기본적인 머신러닝이 가능하며, 설계 후에 머신러닝을 배포하고 시스템에 체계화하기 위한 Java 코딩까지 가능하도록 해줍니다. 앞으로 데이터 분석에서 코딩이란 보이지 않는 장벽 때문에 개발자들이 과도한 작업 시간을 강요받지 않도록, 이 책이 Java로 순조롭게 데이터 분석 기술을 전달할 수 있는 환경을 만들기를 기대합니다.

회원리뷰 (2건) 리뷰 총점10.0

혜택 및 유의사항?
[서평] 이보다 더 쉬울 수 없는 자바 머신러닝 with Weka 내용 평점5점   편집/디자인 평점5점 r******1 | 2021.04.24 | 추천0 | 댓글0 리뷰제목
이 책의 저자인 자바라머신러닝 님은 19년 동안 정보화 기획, 구축, 진단 업무를 수행하였고 스몰 데이터 분석을 실무에 적용하고 있다 12년간 IT 시스템 구축과 운영을 담당하였고 5년간 정보화 전략, 예산, 조직을 담당하는 기획 업무를 거쳐 2년간 데이터 분석으로 실제 사회의 문제점을 찾아내고 개선하는 진단 업무를 수행하였다 저자는 다양한 SNS 활동과 강의등을 통해 Weka;
리뷰제목


이 책의 저자인 자바라머신러닝 님은 19년 동안 정보화 기획, 구축, 진단 업무를 수행하였고 스몰 데이터 분석을 실무에 적용하고 있다

12년간 IT 시스템 구축과 운영을 담당하였고 5년간 정보화 전략, 예산, 조직을 담당하는 기획 업무를 거쳐 2년간 데이터 분석으로 실제 사회의 문제점을 찾아내고 개선하는 진단 업무를 수행하였다


저자는 다양한 SNS 활동과 강의등을 통해 Weka 라는 자바 머신러닝 소프트웨어를 우리나라에 알리는데 힘을 쓰고 있다


https://blog.naver.com/bulleten

https://www.youtube.com/playlist?list=PLizzKP3uIZ6vU16-xyg-_u0oxX5rDCfsg

https://www.inflearn.com/course/%EC%9E%90%EB%B0%94-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-weka#

https://www.inflearn.com/course/%EC%9E%90%EB%B0%94-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-weka-%EC%A4%91%EA%B8%89#

https://github.com/javaramachinelearning


Weka 란?

WEKA라는 종류의 새가 있으며 WEKA를 검색하면 조류와 함꼐 결과가 나오기도 한다


WEKA 는 (Waikato Environment for Knowledge Analysis)의 약자로

뉴질랜드 Waikato 대학교에서 개발하고 배포하는 무료 소프트웨어이다


WEKA는 1999년 부터 꾸준히 버전업이 이루어졌고 현재 WEKA 버전은 3.95까지 공개 되었다


https://waikato.github.io/weka-wiki/downloading_weka/


현재 다운로드 가능한 안정화 버전은 3.8.5 버전으로 확인되고 있으며 Windows, Mac OS, Linux 와 다른 플랫폼까지 모두 지원하며

JDK 11에서 원활하게 구동이 가능하다고 한다


Java 기반으로 구축된 S/W이므로 설치하고 실행하기 위해서는 기본적으로 JRE가 필요하다

다운로드는 weka-wiki 를 참조하여 각 플랫폼에 맞게 다운로드하여 설치 하면된다


Weka 학습법


Waikato 대학에서 FutureLearn MOOC 에서 3개 과목으로 WEKA를 소개하며

강의내용 기준으로 초급, 중급, 고급으로 나뉠 수 있다


초급은 2013년, 중급 2014년, 고급 2016년 MOOC으로 알려지게 되었고 Youtube 에서도 동일한 내용이 공개되어 있다

MOOC와 YouTube의 차이점은 MOOC은 교육과정이다 보니 강의 후 QUIZ가 포함되는데 강의에서 부족한 부분을 QUIZ에서 보충할 수 있다는 정도이다

FutureLearn MOOC은 페이스북 계정만 있으면 1회 무료수강이 가능하나 유료수강으로 전환하면 재수강 및 수료증 발급이 이루어진다


초급 과정은 35개 강좌, 91개 activity 으로 기본적인 WEKA 기능을 소개한다

데이터마이닝개념, WEKA 소개 및 사용법, 데이터 불러오기, 데이터 필터링, 분류기 실행(학습), 분류기 평가, 시각화 사용법 등

기계학습을 위한 WEKA의 기본기능을 소개한다

주로 의사결정나무 분류기를 위주로 설명하고 회귀분석/SVM/앙상블 분석등, 이상값/누락값 필터링 등을 소개 한다


futurelearn mooc url: https://www.futurelearn.com/courses/data-mining-with-weka

YouTube url: https://youtube.com/playlist?list=PLm4W7_iX_v4NqPUjceOGd-OKNVO4c_cPD


중급과정은 아직 MOOC 수강을 하지 않았으나 YouTube 내용을 보면 총 30개 강좌으로 구성되어 있고

초급과정의 기능을 바탕으로 WEKA를 실무적용시 필요한 기능들을 소개한다

대용량 데이터 처리, 텍스트 데이터(자연어) 분류, 연관분석, 군집분석, 학습곡선 처리, 인공신경망 처리, 변수선택 최적화, 데이터마이닝을 위한 학습변수 최적화 등을 다룬다


futurelearn mooc url: https://www.futurelearn.com/courses/more-data-mining-with-weka

YouTube url: https://www.youtube.com/playlist?list=PLm4W7_iX_v4OMSgc8xowC2h70s-unJKCp


고급과정은 총 38개 강좌, 102개 activity 으로 흥미로운 주제를 다룬다.

기계학습의 꽃 시계열분석 방법, 실시간 데이터스트림 분석 (MOA), 이미징 분류, R 과 Python 을 연동한 weka 실습, Python 에서 weka 모듈 실습 등을 주제로 weka의 기계학습을 위한 확정성을 소개한다


futurelearn mooc url: https://www.futurelearn.com/courses/advanced-data-mining-with-weka

YouTube url: https://www.youtube.com/playlist?list=PLm4W7_iX_v4Msh-7lDOpSFWHRYU_6H5K


저자의 블로그에서 해당 강의를 한글로 포스팅 해놓았으니 블로그를 방문해서 참조해보도록 하자


구현

머신러닝 자체는 어렵지 않게 구현할 수 있다

다만 머신러닝을 어디에 적용하고 어떻게 효과를 창출하는 고민이 없다

코딩이라는 과대포장된 진입장벽으로 진정 데이터를 활용하고자 하는 도메인 전문가들이 코딩없이 쉽게 먼신러닝에 접근할 수 있다

WEKA를 실무에 적용하기 전에 이론역량을 공고히 하고자 한다

새로운 것을 익숙키 위해 실무경험을 축적하는 것도 좋지만 남을 가르친다는 개념으로 접근하면 스스로 공부하면서 자연적으로 정리가 된다


문서내용을 살펴보면 각 기능에 대한 설명은 아래와 같이 나와있다


- Explorer: 가장 기본적인 환경으로 데이터를 넣어 전처리 및 학습을 시키고 결과를 볼 수 있는 환경이다

- Experimenter: 학습 계획간에 실험 및 통계적 테스트를 수행하게 해주는 환경이다

- KnowledgeFlow: 기본적으로 Explorer와 같은 기능을 제공하나, drag-and-drop 형식의 인터페이스를 제공하며 Incremental Learning (데이터를 순차적으로 넣어 다단계로 학습하는 기법) 을 지원한다

- Workbench: 위의 다른 메뉴들의 기능을 모두 담았고 사용자가 perspective 형식으로 나눠서 볼 수 있다

- Simple CLI: 말 그대로 GUI가 아닌 커맨드라인 인터페이스로 weka 커맨드를 실행할 수 있는 환경이다


결국 Experimenter를 제외하고 기본적인 뼈대 기능은 다 Explorer로 할 수 있다


weka는 자바 라이브러리, 그러니까 API를 제공한다.

여기 https://weka.sourceforge.io/doc.dev/overview-summary.html

로 가면 문서를 볼 수 있다


서평

책에서는 주로 WEKA 툴을 이용해서 머신러닝 알고리즘을 구현해보는 방향으로 진행된다


책을 집필하는 시점에서 WEKA 의 최신 버전은 3.9.3 이였기 때문에 3.9.3 버전으로 책의 내용이 집필되어 있다


Weka로 JAVA 기반으로 머신러닝을 진행하므로 기존에 JAVA 언어가 익숙하고 JAVA 개발자라면 훨씬 익숙하게 머신러닝 알고리즘을 바로 적용해볼 수 있는 장점이 있다


책과 함께 저자의 WEKA 인프런 강의를 함께 보면서 진행하면 매우 이해가 빠를 거라고 생각된다

저자가 블로그에 포스팅하고 강의로 찍은 내용을 기본으로 책이 집필된 것이라

강의의 내용이 책에 나와있는 내용과 거의 비슷하다


Chapter 04 HOW: Weka 사용(전반) ~ 05까지 Weka 머신러닝 툴의 Exploer 를 사용해서 Datasets 을 이용해 모델평가와

결측값(pitfall)과 이상값(pratfall)처리


초등분류 알고리즘

- OneR: 모든 목표변수는 단 한 개 속성으로 결정된다

- NaiveBayes: 모든 속성을 중시함

- J48: 대중적인 의사결정나무 But 과적합은 운명

- IBk: k 군집 거리 측정 알고리즘, 적정 군집수 선별이 목적이다


중등분류 알고리즘

- Boundary Visualizer: 2개 속성의 의사 결정 경계를 시각화한다

- M5P: 선형회귀분석과 의사결정나무 분석을 동시에 학습한다

- 회귀 분류 1: 모든 숫자 속성을 선으로 분석한다(목표변수가 2가지의 경우)

- 회귀 분류 2: 모든 숫자 속성을 선으로 분석한다(목표변수가 3가지 이상의 경우)

- 로지스틱 회귀분석: 모 아니며 도의 구분을 알아낸다

- 서포트 벡터머신: SVM, 데이터 군집을 얼마나 떨어뜨릴 것인가?

- 앙상블 학습: 과적합을 피하기 위해 여러 알고리즘 결과를 투표로 선별한다


에 대해 학습하고


Chapter 06 ~ 08 후반부에서는 전반부에서 학습한 내용을 복습하고

Experimenter(원시적인 AI)와 Weka 빅데이터, ROC(성능 판별 추가 지표), 텍스트마이닝, 이산화, 비지도 학습 연관/군집 분석,

속성 선택과 결과 집중(개입), 인공신경망(딥러닝), 추가적인 성능 향상 기법에 대해 공부한다


WEKA 를 이용해 JAVA로 머신러닝을 매우 쉽게 구현하고 학습해볼 수 있어서 매우 좋았고

별도의 API로도 구현해볼 수 있어서 매우유용한 것 같다

앞으로 개발하면서 필요시에 적절히 활용해볼 생각이다


총평

JAVA 개발자다 보니 아무래도 JAVA 개발을 하다보면 JAVA로 된 라이브러리를 활용해 머신러닝을 구현해보고 싶을 때도 있는데

주로 머신러닝 알고리즘을 구현하기 위한 라이브러리는 대부분 파이썬 기반이다 보니 불가피하게 파이썬 언어로 구현해야 될 수 도 있는데

WEKA를 활용하면 적절히 JAVA 언어로 머신러닝 알고리즘을 구현해볼 수 있을 것 같다

WEKA로 머신러닝 알고리즘을 구현해보고 개발 시에 적절히 활용해보고 싶은 JAVA 개발자들에게 이 책을 적극 추천한다

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
이보다 더 쉬울 수 없는 자바 머신러닝 with Weka 리뷰 내용 평점5점   편집/디자인 평점5점 i******n | 2021.03.02 | 추천0 | 댓글0 리뷰제목
  재작년부터 과제 프로젝트로 빅데이터와 머신러닝 제안이 이어져서 당시에는 마지못해...라는 심정으로 맨땅에 헤딩하듯이 공부를 했던 기억이 있습니다. 때마침 빅데이터 기반 IoT 시스템 구축 프로젝트를 진행해야 했고, 빅데이터 시스템은 삼성 브라이틱스 기반이었습니다. 처음 접하긴 했지만 앞서 이론 공부를 했던게 도움이 많이 되긴 했습니다. Brightics studio 그;
리뷰제목

 

재작년부터 과제 프로젝트로 빅데이터와 머신러닝 제안이 이어져서 당시에는 마지못해...라는 심정으로 맨땅에 헤딩하듯이 공부를 했던 기억이 있습니다. 때마침 빅데이터 기반 IoT 시스템 구축 프로젝트를 진행해야 했고, 빅데이터 시스템은 삼성 브라이틱스 기반이었습니다. 처음 접하긴 했지만 앞서 이론 공부를 했던게 도움이 많이 되긴 했습니다.

Brightics studio

그러면서 왜 오픈 소스 진영에서는 GUI 기반 머신 러닝 툴이 없을까, 그리고 많은 머신러닝/딥러닝 프레임워크가 텐서플로우/케라스, 파이토치, 싸이킷런과 같은 파이썬 기반이어서 많은 IT 시스템이 자바를 기반으로 구성되어 있는데, 왜 자바 기반의 머신러닝 프레임워크가 없을까...라는 의문으로 weka라는 오픈 소스 머신러닝 툴을 알게 되었고, 관련 도서를 찾아보다가 “자바 머신 러닝 마스터 - 실무 중심의 자바 기반 머신 러닝 활용법” 도서 학습을 했습니다. 도서 내용은 머신 러닝 이론에 대해서 심도있는 다뤘기 때문에 내용의 깊이는 있었으나, 그 내용을 받아들이기에는 본인 자신의 지식 깊이가 얕아서 학습 진행이 더디고 결국 중단한 기억 또한 있습니다. weka를 자세히 배워보고 싶었으나 weka 보다는 머신러닝 이론에 도서 내용이 중점이 있다보니 맞지가 않았던 것이지요.

이번에 “이보다 더 쉬울 수 없는 자바 머신러닝 with Weka” 도서 리뷰를 하면서 이전의 실패를 재차 반복하지는 않을까 반신반의를 하면서 학습을 했습니다. 서문에서 제가 이전에 가졌던 물음에 대한 대답을 얻을 수 있었습니다. 물론 현실과 단점, 그리고 의구심도 여전히 있습니다.

Weka

Weka는 Explorer, Experimenter, KnowledgeFlow, Workbench, Simple CLI의 어플리케이션을 제공합니다.

Weka Launcher

Explorer가 기본 어플리케이션으로, KnowledgeFlow 를 통해서는 드래그 앤 드롭 방식으로 사용이 가능합니다. Brightics와 마찬가지로 KnowledgeFlow UI 메뉴를 통해서 데이터를 분석하는 flow를 만들면서 또한 Explorer를 통해서 java 코딩을 직접 구현할 수 있는 환경을 제공합니다.

물론 사용툴과 비교하여 문제점도 솔직하게 나타나 있습니다.

KnowledgeFlow

도서 전체적으로는 전반부와 후반부로 구성되어 있고 전반부에서는 데이터셋 및 분류 알고리즘 학습, 그리고 시각화를 다루고 있습니다. 도서 부제가 "코딩의 압박에서 벗어나는 새로운 머신러닝 예제 학습"인 만큼 KnowledgeFlow를 사용하게 되면 이는 분명히 맞는 말입니다. 그리고 학습기의 flow와 UI를 보게되면 상당히 직관적으로 구성할 수 있다는 것을 알 수 있습니다.

그런데 KnowledgeFlow를 사용하는 것이 손에 익숙하기 전까지는 툴 사용이 쉬워보이진 않습니다. 이미 Brightics studio 사용을 하면서 느꼈던 것인데, UI 메뉴가 너무 많다보니 찾는게 일이어서 계속 연습하는 것이 필요하더군요. 어떤 툴이든 처음이 힘든 법이지요. ^^

메뉴 사용에 대한 flow가 기입되어 있어서 따라하면 되지만, 도서 편집적인 측면에서 컬러 사용이 제한적으로 되어 이 부분이 좀 아쉽더군요. 또한 소스코드 경우 폰트 사이즈와 함께 들여쓰기 간격 조절을 하여 페이지 우측에 번호나 추가 주석이 배치했다면 좀 더 독자 이해도를 높이는데 도움이 되었을거라 생각됩니다.

그리고 아래와 같이 “증분 분류 평가”라고 하면 입문자 레벨의 지식으로 어떤 도서는 증분 분류를 포함하는 경우가 있는데, 이를 접하지 않는 경우도 있을 테니 참고할 수 있는 사이트 링크를 두면 어떨까란 생각이 들었습니다.

전처리 : 필터사용

분할검증(Holdout)

후반부에서는 ROC(성능 판별 추가 지표)를 시작으로 텍스트 마이닝을 다룹니다. 그리고 비지도 학습 연관/군집분석이 이어집니다.

  • 7.4 비지도 학습 연관/군집분석
  • 7.4.1 지도 학습 vs. 비지도 학습
  • 7.4.2 의사결정나무 비교
  • 7.4.3 연관분석 기초
  • 7.4.4 연관분석 응용
  • 7.4.5 군집분석 개념
  • 7.4.6 군집분석 평가

마지막으로 7장에서 WekaDeeplearning4j를 소개하고 있습니다. deeplearning4j API를 통해서2개 이상의 은닉층을 사용하는 딥러닝 학습이 가능합니다.

MLP를 통한 Iris 붓꽃 데이터 분류가 실습 예제로 이어집니다. WekaDeeplearning4j를 사용한 딥러닝 예제를 찾아보니 저자분께서 운영하시는 기술 블로그 내용도 검색이 되어 참고하면 좋을거 같습니다. - https://m.blog.naver.com/bulleten/221715741302

자바머신러닝 HOW 웨카 (Weka)? MORE WEEK5. 인공신경망-wekadeeplearning4j - 예제(2) Mnist (숫자 이미지) 분석

도서는 weka 프레임워크 실사용에 대해서 상당히 자세한 내용을 포함하고 있습니다. 그렇다고 해서 머신러닝에 대한 이론이 부족하다는 생각이 들지는 않습니다. 분류, 회귀, 지도/비지도, 평가, 앙상블, 부스팅, … 등 머신 러닝 도서에서 다루고 있는 대부분의 내용을 weka를 통해서 실습까지 이어지는 충실한 내용으로 구성되어 있습니다.

저자분께서 weka에 대한 유투브와 인프런 동영상 강의, 기술 블로그를 운영하고 계시기 때문에 도서와 연계하여 보시기를 추천 드립니다.

  • https://www.youtube.com/channel/UCRljFggcdS5ua8qThe94oeg
  • https://www.inflearn.com/users/@javaraml
  • https://m.blog.naver.com/bulleten/221715741302

 

 

댓글 0 이 리뷰가 도움이 되었나요? 공감 0
  •  쿠폰은 결제 시 적용해 주세요.
1   27,900
뒤로 앞으로 맨위로 aniAlarm