이미 소장하고 있다면 판매해 보세요.
|
1장. IT를 위한 머신러닝
__IT의 역사적 도전 과제 극복 __엄청나게 많은 데이터 처리 __자동화된 이상 탐지의 출현 __비지도 ML 대 지도 ML __이상 탐지를 위한 비지도 ML 사용하기 ____특이에 관해 정의하기 ____정상 상태 학습하기 ____확률 모델 ____모델 학습하기 ____디트랜드 ____특이성에 대한 점수화 ____시간 요소 __데이터 프레임 분석에 지도 ML 적용하기 ____지도 학습 과정 __요약 2장. 활성화와 운영화 __기술 요구 사항 __일래스틱 ML 기능 활성화 ____자체 관리형 클러스터에서 ML 활성화 ____클라우드에서 ML 활성화 - 일래스틱서치 서비스 __운영화의 이해 ____ML 노드 ____작업 ____시계열 분석에서 데이터 버킷팅 ____일래스틱 ML에 데이터 공급 ____제공하는 인덱스 ______.ml-config ______.ml-state-* ______.ml-notification-* ______.ml-annoataions-* ______.ml-stats-* ______.ml-anomalies-* ____이상 탐지 오케스트레이션 ____이상 탐지 모델 스냅숏 __요약 3장. 이상 탐지 __기술 요구 사항 __일래스틱 ML 작업 유형 __탐지기 해부 ____함수 ____필드 ____partition 필드 ____by 필드 ____over 필드 ____공식(formula) __이벤트 비율의 변화 탐지 ____카운트 함수 탐색 ____다른 카운트 함수 ______논제로 카운트 ______디스팅트 카운트 __메트릭 값에서 변화 탐지 ____메트릭 함수 ______min, max, mean, median과 metric ______varp ______sum, not-null sum __고급 탐지기 함수의 이해 ____레어(rare) ____프리퀀시 레어(frequency rare) ____정보 내용(information content) ____지오그래픽(geographic) ____시간 __범주형 피처로 분석 분할 ____분할 필드 설정 ____partition과 by_field를 사용한 분할의 차이점 ____이중 분할에 한계가 있을까? __시간 분석과 모집단 분석의 이해 __비정형 메시지 범주화 분석 ____범주화에 훌륭한 후보가 되는 메시지 유형 ____범주화에 사용되는 프로세스 ____범주 분석 ____범주화 작업 예제 ____범주화 사용을 피해야 하는 경우 __API를 통한 일래스틱 ML 관리 __요약 4장. 예측 __기술 요구 사항 __예언과 대비되는 예측 __예측 사용 사례 __작업의 예측 이론 __단일 시계열 예측 __예측 결과 검토 __다중 시계열 예측 __요약 5장. 결과 해석 __기술 요구 사항 __일래스틱 ML 결과 인덱스 보기 __이상 징후 점수 ____버킷 수준 스코어링 ____정규화 ____인플루언서 수준 점수 ____인플루언서 ____레코드 수준 점수 __결과 인덱스 스키마의 세부 정보 ____버킷 결과 ____레코드 결과 ____인플루언서 결과 __다중 버킷 이상 징후 ____다중 버킷 이상 징후 예제 ____다중 버킷 스코어링 __예측 결과 ____예측 결과 쿼리 __결과 API ____결과 API 엔드포인트 ____전체 버킷 조회 API ____범주 조회 API __사용자 정의 대시보드와 캔버스 워크패드 ____대시보드 “임베디블” ____TSVB에서 이상 징후 주석 ____캔버스 워크패드 사용자 정의 __요약 6장. ML 분석에 기반한 얼러팅 __기술 요구 사항 __얼러팅 개념 이해 ____모든 이상 징후가 얼럿일 필요는 없다 ____실시간 얼러팅에는 타이밍이 중요하다 __ML UI에서 얼럿 작성 ____샘플 이상 탐지 작업 정의 __샘플 작업에 대한 얼럿 생성 ____실시간 이례적인 행위 시뮬레이션 ____얼럿 수신과 검토 __와치(watch)로 얼럿 만들기 ____레거시 기본 ML 와치의 구조 이해 ______trigger 섹션 ______input 섹션 ______condition 섹션 ______action 섹션 ____사용자 정의 와치는 몇 가지 고유한 기능을 제공할 수 있다 ______연결된 입력과 스크립트 내의 조건 ______연결된 입력 간에 정보 전달 __요약 7장. AIOps와 근본 원인 분석 __기술 요구 사항 __AIOps 용어의 이해 __KPI의 중요성과 한계 이해 __KPI를 넘어서 __더 나은 분석을 위한 데이터 조직화 ____이상 탐지 데이터피드에 대한 사용자 정의 쿼리 ____수집 시 데이터 강화 __컨텍스트 정보 활용 ____분석 분할 ____통계적 인플루언서 __RCA를 위해 모든 것을 통합 ____가동 중단 배경 ____상관관계와 공유된 인플루언서 __요약 8장. 다른 일래스틱 스택 앱에서 이상 탐지 __기술 요구 사항 __일래스틱 APM의 이상 탐지 ____APM에 대한 이상 탐지 활성화 ____APM UI에서 이상 탐지 작업 결과 조회 ____데이터 인식기를 통한 ML 작업 생성 __로그 앱의 이상 탐지 ____로그 카테고리 ____로그 이상 징후 ____메트릭 앱의 이상 탐지 __업타임 앱의 이상 탐지 __일래스틱 시큐리티 앱의 이상 탐지 ____사전 구축된 이상 탐지 작업 __탐지 얼럿으로서의 이상 탐지 작업 __요약 9장. 데이터 프레임 분석 소개 __기술 요구 사항 __변환하는 방법 학습 ____왜 변환이 유용한가? ____변환 작업의 내부 구조 ____전자 상거래 주문을 분석하기 위해 변환 사용 ____더 고급 수준의 피벗과 집계 구성 탐색 ____배치 변환과 연속 변환의 차이점 발견 ____연속 변환을 사용해 소셜 미디어 피드 분석 __고급 변환 구성에 페인리스 사용 ____페인리스 소개 ____변수, 연산자, 제어 흐름 ____함수 __파이썬과 일래스틱서치로 작업하기 ____파이선 일래스틱서치 클라이언트에 대해 간략하게 둘러보기 ____일런드의 개발 목적 이해 ____일런드와 함께하는 첫걸음 __요약 __더 읽어보기 10장. 아웃라이어 탐지 __기술 요구 사항 __아웃라이어 탐지의 내부 작동 이해 ____아웃라이어 탐지에 사용하는 4가지 기술 이해 ______거리 기반 기술 ______밀도 기반 기술 __피처 영향력 이해 ______각 점에 대한 피처 영향력은 어떻게 계산하는가? ____아웃라이어 탐지는 이상 탐지와 어떻게 다른가? ______확률 모델 기반 대 인스턴스 기반 ______점수화 ______데이터 특성 ______온라인 대 배치(batch) __실제 아웃라이어 탐지 적용 __Evaluate API로 아웃라이어 탐지 평가 __아웃라이어 탐지를 위한 하이퍼파라미터 조정 __요약 11장. 분류 분석 __기술 요구 사항 __분류: 데이터에서 훈련된 모델로 ____데이터에서 분류 모델 학습 ____피처 엔지니어링 ____모델 평가 __분류의 첫 걸음 __분류의 내부 구조: 그래디언트 부스트 의사결정 트리 ____의사결정 트리 소개 ____그래디언트 부스트 의사결정 트리 __하이퍼파라미터 __결과 해석 ____분류 확률 ____분류 점수 ____피처 중요도 __요약 __더 읽어보기 12장. 회귀 __기술 요구 사항 __회귀 분석을 사용해 주택 가격 예측 __회귀를 위한 의사결정 트리 사용 __요약 __더 읽어보기 13장. 추론 __기술 요구 사항 __훈련된 모델 API 및 파이썬을 사용해 훈련된 머신러닝 모델을 검사하고 가져오며 내보내기 __훈련된 모델 API 살펴보기 ____훈련된 모델 API와 파이썬을 사용해 훈련된 모델 내보내기와 가져오기 __추론 프로세서와 인제스트 파이프라인 이해하기 ____인제스트 파이프라인에서 누락되거나 손상된 데이터 처리 ____예측에 대한 더 많은 통찰력을 얻기 위한 추론 프로세서 구성 옵션 사용하기 __일런드를 사용해 외부 모델을 일래스틱서치로 가져오기 ____일런드에서 지원하는 외부 모델에 대해 알아보기 ____scikit-learn의 DecisionTreeClassifier로 훈련하고 일런드를 사용해 일래스틱서치로 가져오기 __요약 부록. 이상 탐지 팁 __기술 요구 사항 __분할 작업 대 비분할 작업의 인플루언서 이해하기 __단측함수를 유리하게 사용하기 __기간 무시하기 ____예정된 (알려진) 시간 윈도 무시하기 ______캘린더 이벤트 생성 ______원하는 타임프레임을 무시하기 위해 데이터피드 중지 및 시작 ____예기치 못한 시간 윈도를 사후에 무시하기 ______작업의 복제와 과거 데이터의 재실행 ______작업을 이전 모델 스냅숏으로 되돌리기 __사용자 정의 규칙과 필터 유리하게 사용하기 ____사용자 정의 규칙 만들기 ______“하향식” 얼러팅 철학에 대한 사용자 지정 규칙의 장점 __이상 탐지 작업 처리량에 관한 고려 사항 __사용 사례의 과도한 엔지니어링 방지하기 __런타임 필드에서 이상 탐지 사용하기 __요약 |
Rich Collier
Camilla Montonen
Bahaaldine Azarmi
바할딘 아자미의 다른 상품
최중연의 다른 상품
|
◈ 이 책에서 다루는 내용 ◈
◆ 일래스틱 스택에서의 머신러닝 상용 기능 활성화하기 ◆ 다양한 유형의 이상 징후를 탐지하고 예측하기 ◆ IT 운영, 보안 분석 및 기타 사용 사례에 효과적인 이상 탐지 적용하기 ◆ 사용자 정의 뷰, 대시보드 및 사전 경고에서 일래스틱 머신러닝의 결과 활용하기 ◆ 실시간 추론을 위한 지도 머신 러닝(supervised machine learning) 모델 훈련과 배포하기 ◆ 일래스틱 머신러닝 활용을 위한 다양한 팁과 트릭 알아보기 ◈ 이 책의 대상 독자 ◈ 머신러닝 전문가나 맞춤형 개발에 의존하지 않고 일래스틱서치 데이터에 대한 통찰력을 얻으려는 데이터 전문가를 대상으로 한다. 머신러닝을 관측 가능성(Observability), 보안(Security) 및 분석(Analytics) 애플리케이션과 통합하려는 경우에도 유용하다. 이 책을 최대한 활용하려면 일래스틱 스택에 대한 실무 지식이 필요하다. ◈ 이 책의 구성 ◈ 1장, 'IT를 위한 머신러닝'에서는 IT와 보안 운영에서 수동적인 데이터 분석의 역사적 과제에 대한 도입과 배경 입문서 역할을 한다. 내부에서 일어나는 일을 본질적으로 이해하기 위해 일래스틱 머신러닝의 작동 이론에 대한 개요를 포괄적으로 제공한다. 2장, '활성화와 운영화'에서는 일래스틱 스택에서 머신러닝을 활성화하는 방법을 설명하고 일래스틱 머신러닝 알고리듬의 작동 이론도 자세히 살펴본다. 또한 일래스틱 머신러닝의 물류 운영도 자세히 다룬다. 3장, '이상 탐지'에서는 시계열 분석의 핵심인 자동화된 비지도(unsupervised) 이상 탐지 기술을 자세히 설명한다. 4장, '예측'에서는 일래스틱 머신러닝의 정교한 시계열 모델을 단순한 이상 탐지 이상의 용도로 사용하는 방법을 설명한다. 예측 기능을 통해 사용자는 미래의 추세와 행동을 추정해 용량 계획과 같은 사용 사례를 지원할 수 있다. 5장, '결과 해석'에서는 이상 탐지 및 예측 결과를 완전히 이해하고 시각화, 대시보드 및 인포그래픽에서 장점을 활용하는 방법을 소개한다. 6장, 'ML 분석에 기반한 얼러팅'에서는 이상 탐지를 더욱 실행 가능하게 만들기 위해 일래스틱 얼러팅의 사전 알림 기능을 머신러닝으로 파악한 통찰력과 통합하는 다양한 기술을 설명한다. 7장, 'AIOps와 근본 원인 분석'에서는 일래스틱 머신러닝을 활용해 이질적인 데이터 소스 데이터를 전체적으로 검사하고 분석해서 분석가에게 상관관계 뷰를 제공하는 레거시 접근 방식 측면에서 한 발 더 나아간 방법을 살펴본다. 8장, '다른 일래스틱 스택 앱에서 이상 탐지'에서는 데이터 분석에 가치를 부여하기 위해 일래스틱 스택 내의 다른 앱에서 이상 탐지를 활용하는 방법을 알아본다. 9장, '데이터 프레임 분석 소개'에서는 데이터 프레임 분석의 개념을 설명하고, 시계열 이상 탐지와는 어떻게 다른지, 일래스틱 머신러닝으로 데이터를 로드, 준비, 변환 및 분석하기 위해 사용자가 사용할 수 있는 도구를 다룬다. 10장, '아웃라이어 탐지'에서는 일래스틱 머신러닝과 함께 데이터 프레임 분석의 아웃라이어 탐지 분석 기능을 살펴본다. 11장, '분류 분석'에서는 일래스틱 머신러닝과 함께 데이터 프레임 분석의 분류 분석 기능을 다룬다. 12장, '회귀'에서는 일래스틱 머신러닝과 함께 데이터 프레임 분석의 회귀 분석 기능을 소개한다. 13장, '추론'에서는 “추론”을 위해 (실제로 조작 가능한 방식으로 출력 값을 예측하기 위해) 훈련된 머신러닝 모델에 대한 사용법을 살펴본다. 14장, '부록: 이상 탐지 팁'에서는 다른 장에서는 잘 맞지 않는 다양한 실용적인 조언을 담았다. 이러한 유용한 정보는 일래스틱 ML을 최대한 활용하는 데 도움이 될 것이다. ◈ 옮긴이의 말 ◈ 인간의 능력만으로는 검색이 불가능할 수준으로 누적돼 가는 데이터 세상에서, IT 회사들은 어떻게 하면 비용 효율적으로 시스템의 문제를 빠르게 식별할 수 있는가를 고민한다. 이를 해결하고 로그, 메트릭 같은 다양한 데이터 소스로부터 시스템을 관찰하기 위해 다양한 전문 도구들을 사용하고 있다. 또한 경험에 의지해 인간이 예측 가능한 범위 내에서 다양한 대시보드와 얼러팅으로 모니터링 활동을 한다. 하지만 애플리케이션 아키텍처는 전통적인 모놀로식(Monolithic)에서 마이크로서비스(Microservice)화돼 가고, 애플리케이션을 운영할 인프라는 쿠버네티스와 같은 컨테이너 환경으로 빠르게 옮겨 가고 있다. 이렇듯 시스템 환경은 점점 더 복잡해지고 관찰해야 할 데이터의 양과 종류도 점점 더 늘고 있다. 그로 인해 우리는 수집한 수많은 데이터 중 대부분을 관찰하지 못한 채 버리고 있다. 인간의 힘만으로 그 모든 데이터를 처리하기에는 우리의 삶은 너무 짧고 세상은 너무 빠르게 변화하고 있다. 이미 머신러닝이라는 단어는 유행하다 못해 주변에서도 쉽게 들을 수 있는 흔한 용어가 됐고 데브옵스(DevOps)라는 합성어를 따서 에이아이옵스(AIOps)라는 단어도 유행하고 있다. AI와 무관한 내가 소속된 조직에서도 몇 년째 에이아이옵스라는 용어를 사용하는 작은 조직이 있을 정도로 이제 이 에이아이옵스도 흔한 용어가 돼 가고 있다. 시스템을 운영하기 위해 인간이 아닌 기계에 의존해 데이터를 분석하고 시스템에 잠재된 문제를 발굴하거나 서비스의 이상을 감지해야만 하는 상황에 이르게 된 것이다. 『일래스틱 스택을 이용한 머신러닝』(에이콘, 2020)의 개정판인 이 책은 일래스틱 스택이 제공하는 안정적인 머신러닝 피처를 활용해 로그, 메트릭과 같은 데이터소스로부터 이상을 감지하는 방법인 일래스틱 스택을 처음 사용하는 사용자도 쉽게 이해하고 따라할 수 있도록 자세하게 설명한다. 또한 그간 새로 추가된 다양한 피처도 예제와 함께 상세하게 소개하고 있다. 특히 새로 추가된 데이터 프레임 피처는 도큐먼트를 엔티티 중심의 인덱스로 변환해 아웃라이어, 분류, 회귀 분석 영역까지 확장 가능해졌으며, 일래스틱서치의 새로운 네이티브 클라이언트인 일런드(Eland)가 일래스틱서치에 저장된 데이터를 파이썬의 강력한 데이터 분석 생태계와 쉽게 연결되도록 해줬다. 이러한 새로운 피처를 실질적인 예제와 함께 하나씩 배워 현업에 적용해볼 수 있도록 풀어 설명한 이 책이 데이터의 늪에 빠진 개발자와 운영자에게 구원의 손길이 될 수 있기를 바란다. |