이 상품은 구매 후 지원 기기에서 예스24 eBook앱 설치 후 바로 이용 가능한 상품입니다.
|
1부. 데이터, 알파 팩터, 포트폴리오1장. 트레이딩용 머신러닝: 아이디어에서 주문 집행까지__투자업계에서 머신러닝의 부상____전자 거래에서 고빈도 매매(HFT)까지____팩터 투자와 스마트 베타 펀드____알고리듬 개척자는 인간보다 우위에 있다____머신러닝과 대체 데이터____크라우드 소싱 거래 알고리듬__머신러닝 기반 전략의 설계와 실행____데이터의 소싱과 관리____알파 팩터 리서치에서 포트폴리오 관리까지____전략 백테스팅__트레이딩을 위한 머신러닝: 전략과 사용 사례____알고리듬 트레이딩의 진화____거래를 위한 머신러닝 사용 사례__요약2장. 시장 데이터와 기본 데이터: 소스와 기법__시장 데이터는 시장 환경을 반영한다____시장 미시 구조: 기본 지식____트레이딩 방법: 여러 종류의 주문____트레이딩 장소: 거래소에서 다크풀까지__고빈도 데이터로 작업____나스닥 주문 호가창으로 작업____FIX 프로토콜을 활용한 거래의 통신____나스닥 토탈뷰-잇치 데이터 피드____틱에서 바로: 시장 데이터 정규화 방법____AlgoSeek 분 바: 주식 호가와 거래 데이터__시장 데이터에 대한 API 접근____판다스를 이용한 원거리 데이터 접근____yfinance: 데이터를 야후! 파이낸스로부터 스크레이핑____퀀토피안____집라인____퀀들____기타 시장 데이터 공급자__기본 데이터 작업 방법____재무제표 데이터____기타 기본 데이터 소스__판다스를 이용한 효율적 데이터 저장__요약3장. 금융을 위한 대체 데이터: 범주와 사용 사례__대체 데이터 혁명__대체 데이터의 원천____개인____비즈니스 프로세스____센서__대체 데이터 평가를 위한 기준____신호 내용의 질____데이터의 질____기술적 측면__대체 데이터 시장____데이터 제공업체와 사용 사례__대체 데이터로 작업____오픈테이블 데이터 스크래핑____어닝 콜 트랜스크립트 스크래핑과 파싱__요약4장. 알파 팩터 리서치__알파 팩터 실무: 데이터부터 시그널까지 __알파 팩터 공학____수십 년간의 팩터 연구를 바탕으로 구축____모멘텀과 심리: 추세는 당신의 친구다____가치 팩터____변동성과 규모 이례 현상__우량주 팩터____수익률을 예측하는 알파 팩터 공학____판다스와 넘파이를 사용한 팩터 공학____칼만 필터를 사용한 알파 팩터의 잡음 제거____웨이블릿을 이용한 잡음 데이터의 전처리 방법__시그널에서 트레이딩으로: 백테스트를 위한 집라인____단일 팩터 전략을 백테스트하는 방법____다양한 데이터 소스의 팩터 결합__알파렌즈를 사용한 시그널과 잡음의 분리 ____미래 수익률과 팩터 분위수의 생성 ____팩터 5분위수에 의한 예측 성과____정보 계수____팩터 회전율 __알파 팩터 리소스____기타 알고리듬 트레이딩 라이브러리__요약5장. 포트폴리오 최적화와 성과 평가__포트폴리오 성과를 측정하는 방법____단일 숫자로 위험 수익 트레이드오프 포착____적극적 운용의 근본 법칙__포트폴리오 위험과 수익률 관리하는 방법____현대 포트폴리오 관리의 진화____평균 분산 최적화 ____평균 분산 최적화의 대안____리스크 패리티____리스크 팩터 투자____계층적 리스크 패리티 __집라인으로 트레이딩과 포트폴리오 관리____신호 생성과 거래 실행 계획 수립____평균 분산 포트폴리오 최적화 구현__파이폴리오를 이용한 백테스팅 성과 측정____수익률과 벤치마크 입력 생성____표본 외 수익률로 전진 분석__요약2부. 트레이딩을 위한 ML: 기본6장. 머신러닝 프로세스__데이터로부터 머신러닝이 작동하는 방법 ____도전 과제: 알고리듬을 작업에 매칭____지도학습: 예제에 의한 학습____비지도학습: 유용한 패턴의 발견____강화학습__머신러닝 워크플로____기본 설명: k-최근접 이웃____문제의 구성: 목적과 성과 측정____데이터의 수집과 준비____특성 탐험, 추출, 특성 공학____ML 알고리듬 선택____모델 설계와 조정____모델 선택을 위한 교차 검증의 활용____파이썬으로 교차 검증을 구현하는 방법____금융에서 교차 검증의 문제____사이킷런을 이용한 파라미터 조정과 옐로우브릭__요약7장. 선형 모델: 리스크 팩터에서 수익률 예측까지__추론에서 예측까지__베이스라인 모델: 다중 선형 회귀 모델____모델을 만드는 방법____모델을 훈련하는 방법____가우스-마르코프 정리____통계적 추론을 수행하는 방법____문제를 진단하고 해결하는 방법__실제로 선형 회귀를 실행하는 방법____statsmodels를 활용한 최소 자승법____sklearn을 활용한 확률적 경사 하강법(SGD)__선형 요인 모델을 구축하는 방법____CAPM에서 파마-프렌치 5 요인 모델까지____위험 요인 입수____파마-맥베스 회귀 분석__수축 방법을 사용한 선형 회귀 규제화____과적합을 방지하는 방법____리지 회귀 분석의 작동 방식____라쏘 회귀 분석의 작동 방식__선형 회귀로 수익률을 예측하는 방법____모델 특성과 선도 수익률 준비____statsmodels를 사용한 선형 OLS 회귀 분석____사이킷런을 이용한 선형 OLS 회귀____사이킷런을 이용한 리지 회귀 분석____sklearn을 이용한 라쏘 회귀 분석____예측 신호의 품질 비교__선형 분류____로지스틱 회귀 모델____statsmodels로 추론을 수행하는 방법____가격 움직임을 로지스틱 회귀 분석으로 예측__요약8장. ML4T 작업 흐름: 모델에서 전략 백테스트까지__ML 기반 전략의 백테스트 방법__백테스트의 단점과 이를 회피하는 방법____데이터를 올바르게 얻기____시뮬레이션을 올바르게 수행____통계량을 올바르게 얻기__백테스트 엔진 작동법____벡터화 대 이벤트 기반 백테스트____주요 구현 측면__백트레이더: 로컬 백테스트용 유연한 도구____백트레이더의 세레브로 구조의 주요 개념____실제에서 백트레이더를 사용하는 방법____백트레이더 요약과 다음 단계__집라인: 퀀토피안이 만든 확장 가능한 백테스트____강건한 시뮬레이션을 위한 캘린더와 파이프라인____분 데이터를 사용해 자체 번들 인제스트____파이프라인 API: ML 시그널 백테스트____백테스트 중 모델을 훈련하는 방법____노트북 사용법__요약9장. 시계열 모델__진단과 특성 추출을 위한 분석 도구____시계열 패턴의 분해____롤링 윈도우 통계량과 이동 평균____자기 상관계수의 측정__정상성 진단과 회복____정상성을 얻기 위한 시계열 변환____단위근의 처리 방법____시계열 변환의 실제 적용__일변량 시계열 모델____자기 회귀 모델의 구축____이동 평균 모델의 구축____ARIMA 모델 구축과 확장____매크로 펀더멘털 예측____시계열 모델을 활용한 변동성 예측__다변량 시계열 모델____방정식 체계____벡터 자기 회귀(VAR) 모델 ____VAR 모델을 활용한 매크로 펀더멘털 예측__공적분: 공통 추세를 가진 시계열____엥글-그레인저 2단계 방법____요한센 우도 비율 테스트__공적분을 활용한 통계적 차익 거래____같이 움직이는 자산 쌍을 선택하는 방법____페어 트레이딩 실제 구현____전략 백테스트 준비____백트레이더를 이용한 전략 백테스트____확장: 개선 방법__요약10장. 베이지안 머신러닝: 동적 샤프 비율과 페어 트레이딩__베이지안 머신러닝 학습법____경험적 증거에서 가정을 업데이트하는 방법____정확한 추론: 최대 사후 확률 추정____결정론적 및 확률론적 근사 추론__PyMC3를 사용한 확률 프로그래밍____테아노를 이용한 베이지안 머신러닝____PyMC3 워크플로: 경기 침체 예측__트레이딩을 위한 베이지안 머신러닝____성과 비교를 위한 베이지안 샤프 비율____페어 트레이딩을 위한 베이지안 롤링 회귀 분석____확률 변동성 모델__요약11장. 랜덤 포레스트: 일본 주식 롱/숏 전략__결정 트리: 데이터로부터의 규칙 학습____트리의 결정 규칙 학습과 적용____결정 트리의 실용적 사용법____과대적합과 규제화____하이퍼파라미터의 조정__랜덤 포레스트: 트리의 신뢰성을 높인다____앙상블 모델의 성과가 더 좋은 이유____배깅____랜덤 포레스트를 구축하는 방법____랜덤 포레스트의 학습과 조정____랜덤 포레스트를 위한 특성 중요도____아웃오브백 테스트____랜덤 포레스트의 장점과 단점__일본 주식에 대한 롱/숏 시그널____데이터: 일본 주식____LightGBM을 사용한 ML4T____전략: 집라인을 이용한 백테스트__요약12장. 거래 전략 강화__시작하기: 적응형 부스팅____에이다부스트 알고리듬____에이다부스트를 사용해 월별 가격 변동 예측__그래디언트 부스팅: 대부분의 작업을 위한 앙상블____GBM 모델을 훈련하고 조정하는 방법____사이킷런으로 그래디언트 부스팅을 사용하는 방법__XGBoost, LightGBM, CatBoost 사용____알고리듬 혁신이 성능을 향상시키는 방법__부스팅을 사용한 롱/숏 거래 전략____LightGBM과 CatBoost로 시그널 생성____블랙박스의 내부: GBM 결과를 해석하는 방법____부스팅 앙상블에 기반을 둔 전략 백테스팅____학습한 교훈과 다음 단계__일중 전략을 위한 부스팅____고빈도 데이터를 위한 특성 공학____LightGBM으로 분 단위 빈도 시그널____거래 시그널 품질 평가__요약13장. 비지도학습을 활용한 데이터 기반 리스크 팩터와 자산 배분__차원 축소____차원의 저주____선형 차원 축소____매니폴드 학습: 선형 차원 축소__트레이딩을 위한 PCA____데이터 주도형 리스크 팩터____고유 포트폴리오__군집화____k-평균 군집화____계층적 군집화____밀도 기반 군집화____가우시안 혼합 모델__최적 포트폴리오를 위한 계층적 군집화____계층적 리스크 패리티의 작동 원리____ML 트레이딩 전략을 사용한 HRP 백테스트__요약3부. 자연어 처리14장. 트레이딩을 위한 텍스트 데이터: 감성 분석__텍스트를 이용한 머신러닝: 언어에서부터 특성까지____텍스트 데이터 작업의 주요 과제____자연어 처리 워크플로____응용 사례__텍스트에서 토큰으로: NLP 파이프라인____spaCy와 textacy를 이용한 NLP 파이프라인____TextBlob을 사용한 자연어 처리__토큰 계산: 문서 단어 행렬____단어 주머니 모델____sklearn을 사용한 문서 단어 행렬(DTM) ____핵심적인 교훈__트레이딩을 위한 자연어 처리____나이브 베이즈 분류기____뉴스 기사 분류____트위터와 옐프 데이터를 사용한 감성 분석__요약15장. 토픽 모델링__잠재 토픽 학습: 목적과 접근법____잠재 의미 인덱싱____sklearn을 이용한 LSI의 구현 방법____장점과 제약점__pLSA____sklearn을 이용한 pLSA의 구현 방법____장점과 제한점__LDA____LDA의 원리____LDA 토픽 평가____sklearn을 이용한 LDA의 구현 방법____pyLDAvis를 이용한 LDA 결과의 시각화____Gensim을 사용한 LDA의 구현 방법__실적 발표 콜을 위한 토픽 모델링____데이터 전처리____모델 훈련과 평가____실험 실행__금융 뉴스를 위한 토픽 모델링__요약16장. 어닝 콜과 SEC 공시 보고서를 위한 단어 임베딩__단어 임베딩이 의미를 인코딩하는 방법____신경 언어 모델이 문맥에서 사용법을 배우는 방법____word2vec: 확장 가능한 단어와 구분 임베딩____의미론적 산술을 활용한 임베딩 평가 __사전 훈련된 단어 벡터를 사용하는 방법____GloVe: 단어 표현을 위한 글로벌 벡터__금융 뉴스를 위한 사용자정의 임베딩____전처리: 문장 인식과 앤그램____텐서플로 2를 이용한 스킵그램 아키텍처____텐서보드를 사용해 임베딩 시각화____Gensim으로 임베딩을 더 빠르게 훈련하는 방법__SEC 공시 문서를 이용한 트레이딩을 위한 word2vec____전처리: 문장 인식과 앤그램____모델 훈련__doc2vec 임베딩을 사용한 감성 분석____옐프 감성 데이터에서 doc2vec 입력 생성____doc2vec 모델 훈련____문서 벡터로 분류기 훈련____학습한 교훈과 다음 단계__새로운 개척자: 사전 훈련된 트랜스포머 모델____어텐션은 당신이 필요한 모든 것____BERT: 좀 더 보편적인 언어 모델을 지향____텍스트 데이터에 대한 트레이딩: 교훈과 다음 단계__요약4부. 딥러닝과 강화학습17장. 딥러닝__딥러닝: 무엇이 새롭고 왜 중요한가____계층적 구조가 고차원 데이터의 문제을 완화한다____표현 학습으로서의 DL____DL의 ML과 AL와의 연관성__신경망의 설계____단순 순전파 신경망 구조____주요 설계 선택____심층 신경망의 규제화____더 빠른 훈련: DL을 위한 최적화____요약: 주요 하이퍼파라미터를 조정하는 방법__파이썬을 이용해 처음부터 신경망을 구축하는 방법____입력층____은닉층____출력층____순전파____교차 엔트로피 비용 함수____파이썬을 사용해 역전파를 구현하는 방법__인기 있는 딥러닝 라이브러리____GPU 가속화의 활용____텐서플로 2를 사용하는 방법____텐서보드 사용법____파이토치 1.4 사용법____다른 옵션__롱/숏 전략을 위한 NN의 최적화____일 수익률을 예측하기 위한 특성 공학____NN 구조 프레임워크 정의____NN을 조정하한 설계 옵션 교차 검증____예측 성능 평가____앙상블 시그널을 기반으로 하는 전략의 백테스트____결과를 더욱 개선하는 방법__요약18장. 금융 시계열과 인공위성 이미지를 위한 CNN__CNN이 그리드 같은 데이터를 모델링하는 방법____수작업 코딩부터 데이터의 학습 필터까지____합성곱층의 요소 연산 방법____CNN 아키텍처의 진화: 주요 혁신__인공위성 이미지와 물체 인식을 위한 CNN____LeNet5: 산업용 애플리케이션을 갖춘 최초의 CNN____알렉스넷: 딥러닝 연구의 재점화____전이학습: 적은 데이터로 더 빠른 훈련____객체 탐지와 분할____실제 객체 탐지__시계열 데이터용 CNN: 수익률 예측____1차원 합성곱이 있는 자기 회귀 CNN____CNN-TA-2D 형식의 시계열 군집화__요약19장. 순환 신경망__RNN의 작동 원리____순환 주기로 계산 그래프 펼치기____시간을 통한 역전파____대안적 순환 신경망 구조____심층 RNN의 설계____장기 의존성 학습 시 문제점____GRU__텐서플로 2를 이용한 시계열을 위한 RNN____일변량 회귀: S&P 500 예측____시계열 데이터를 RNN용 형태로 변환____적층 LSTM: 주가 움직임과 수익률 예측____매크로 데이터에 대한 다변량 시계열 회귀__텍스트 데이터를 위한 RNN____감성 분류를 위한 LSTM과 단어 임베딩____사전 학습된 단어 벡터를 이용한 감성 분석____SEC 보고서 임베딩으로부터 수익률 예측__요약20장. 조건부 위험 요인과 자산 가격 결정을 위한 오토인코더__비선형 특성 추출을 위한 오토인코더____선형 차원 축소 일반화____이미지 압축을 위한 합성곱 오토인코더____규제화된 오토인코더로 과적합 관리____노이즈 제거 오토인코더로 손상된 데이터 수정____시계열 특성을 위한 Seq2seq 오토인코더____변분 오토인코더로 생성 모델링__텐서플로 2로 오토인코더 구현____데이터를 준비하는 방법____단층 순전파 오토인코더____희소성 제약 조건이 있는 순전파 오토인코더____심층 순전파 오토인코더____합성곱 오토인코더____오토인코더 노이즈 제거__거래를 위한 조건부 오토인코더____주식 가격과 메타데이터 정보 습득____예측 자산 특징 계산____조건부 오토인코더 아키텍처 만들기____교훈과 다음 단계__요약21장. 합성 시계열 데이터를 위한 적대적 생성 네트워크__GAN으로 합성 데이터 생성____생성 모델과 판별 모델 비교____적대적 훈련: 사기의 제로섬 계임____GAN 아키텍처 ZOO의 급속한 진화____이미지를 위한 GAN 애플리케이션과 시계열 데이터__텐서플로 2를 사용해 GAN을 빌드하는 방법____생성자 네트워크 빌드____판별자 네트워크 생성____적대적 훈련 프로세스 설정____평가 결과__합성 금융 데이터를 위한 TimeGAN____특성과 시간에 걸쳐 데이터를 생성하는 방법 학습____텐서플로 2를 사용한 TimeGAN 구현____합성 시계열 데이터의 품질 평가____교훈과 다음 단계__요약22장. 심층 강화학습: 트레이딩 에이전트의 구축__RL 시스템의 구성 요소____정책: 상태에서 행동으로 전이____보상: 행동으로부터 학습____가치 함수: 장기적으로 최적 선택____모델 기반 대 모델 프리: 도약 전에 보기?__RL 문제의 해법____RL 문제 풀이의 주요 문제점____RL 문제를 푸는 근본적인 방법__동적 계획 문제 풀기____유한 MDP____정책 반복____가치 반복____일반화된 정책 반복____파이썬을 이용한 동적 계획__Q-러닝: 바둑에서 최적 정책 찾기____탐험 대 활용 트레이드오프: ε-탐욕 정책____Q-러닝 알고리듬____파이썬을 이용한 Q-러닝 에이전트 훈련법__OpenAI Gym을 사용한 심층 강화학습____신경망을 이용한 가치 함수의 근사____딥 Q-러닝 알고리듬과 확장____OpenAI GYM 소개____텐서플로2를 이용한 DDQN의 구현____간단한 트레이딩 에이전트 작성____사용자 정의 OpenAI 트레이딩 환경을 설계하는 방법____Deep Q-learning on the stock market____얻은 교훈__요약23장. 결론과 다음 단계__학습에서 얻은 주요 요점과 교훈____데이터는 가장 중요한 단일 재료____도메인 전문 지식: 잡음으로부터 시그널의 구별____ML은 데이터로 문제를 풀기 위한 도구 모음이다____백테스트의 과적합을 주의하라____블랙박스 모델에서 통찰력을 얻는 방법__실전 트레이딩을 위한 ML____데이터 관리 테크놀로지____ML 도구____온라인 트레이딩 플랫폼__결론부록. 알파 팩터 라이브러리__TA-Lib에서 구현된 공통 요인 알파____핵심 구성 요소: 이동 평균____중첩 연구: 가격과 변동성 추세____모멘텀 지표____거래량과 유동성 지표____변동성 지표____기본 위험 요인__정형화된 알파에 대한 월드퀀트의 탐구____횡단면 및 시계열 함수____정형화된 알파 표현식__이변량 및 다변량 요인 평가____정보 계수와 상호 정보량____특성 중요도와 SHAP 값____비교: 각 지표에 대한 Top 25 특성____금융 성과: 알파렌즈
|
Stefan Jansen
이기홍의 다른 상품
홍창수의 다른 상품
|
[이 책에서 다루는 내용]◆ 투자와 트레이딩 문제를 푸는 머신러닝 기법 구현◆ 시장, 기본, 대체 데이터를 활용한 알파 팩터 연구◆ 지도학습, 비지도학습, 강화학습 모델 설계◆ 판다스, 넘파이와 Scikit-learn을 이용한 포트폴리오 위험과 성과 최적화◆ 머신러닝 모델을 Quantopian 플랫폼 위에서 실전 트레이딩 전략으로 통합◆ 신뢰성 있는 시계열 백테스트 방법으로 전략 평가◆ 케라스, 파이토치와 텐서플로를 사용한 딥신경망 설계와 평가◆ 강화학습을 이용한 OpenAI Gym에서의 트레이딩 전략 개발[이 책의 대상 독자]금융시장에 대한 이해와 트레이딩 전략에 관심이 있는 애널리스트, 데이터 과학자, ML 엔지니어라면 이 책이 도움이 될 것이다. 또한 ML을 활용해 더 나은 의사결정을 내리고자 하는 투자 전문가로서 가치도 찾을 수 있다. 소프트웨어와 ML에 대한 배경지식이 있는 경우 이 영역에 대한 소개자료를 생략할 수 있다. 마찬가지로 전문 지식이 투자에 관한 것이라면 이 책이 제공하는 다양한 배경의 금융 맥락 일부 또는 전부를 잘 알고 있을 것이다. 이 책은 독자가 매우 역동적인 이 영역을 계속 배우고 싶어 한다고 가정한다. 이를 위해 깃허브(GitHub) 저장소 내의 각 장에 대해 README 파일에 연결된 수많은 학술 참고 자료와 추가 자료를 책의 끝에 제공한다. 파이썬(Python) 3과 넘파이, 판다스, SciPy와 같은 과학 컴퓨팅 라이브러리를 사용하는 것이 편할 것이며, 계속해서 다른 많은 자료를 얻을 수 있을 것을 기대한다. ML과 사이킷런에 대한 경험이 도움이 되겠지만 기본 워크플로를 간략하게 다루고 격차를 메꾸거나 더 깊이 파고들려면 다양한 리소스를 참조하길 바란다. 마찬가지로 금융과 투자에 기본 지식이 있다면 용어를 더 쉽게 사용할 수 있을 것이다.[이 책의 구성]ML이 트레이딩 전략의 설계와 실행에 가치를 더할 수 있는 방법을 종합적으로 소개한다. 데이터 소싱과 전략 개발 프로세스의 다양한 측면과 ML 과제에 대한 다양한 솔루션을 다루는 4개의 부로 구성돼 있다. 1부에서는 머신러닝을 활용하는 트레이딩 전략 전반에 걸쳐 관련된 기본적인 측면을 다룬다. 1장, ‘트레이딩용 머신러닝: 아이디어에서 주문 집행까지’에서는 ML이 거래에서 중요한 이유와 방법을 요약하고 투자 프로세스를 설명하며, ML이 가치를 높일 수 있는 방법을 간략히 설명한다. 2장, ‘시장 데이터와 기본 데이터: 소스와 기법’에서는 거래소 제공 틱 데이터와 보고된 재무 정보를 포함해 시장 데이터를 소싱하고 활용하는 방법을 다룬다. 3장, ‘금융을 위한 대체 데이터: 범주와 사용 사례’에서는 폭발적으로 증가하는 수의 출처와 공급자를 평가하기 위한 범주와 기준을 설명한다. 4장, ‘금융 특성 공학: 알파 팩터 리서치’에서는 예측 시그널을 포착하는 데이터 변환을 생성하고 평가 프로세스와 팩터 성과를 측정하는 방법을 설명한다. 5장, ‘포트폴리오 최적화와 성과 평가’에서는 전략의 실행에 따른 포트폴리오를 관리, 최적화, 평가하는 방법을 소개한다.2부에서는 근본적인 지도학습과 비지도학습 알고리듬이 엔드투엔드 워크플로의 맥락에서 트레이딩 전략에 어떻게 정보를 제공할 수 있는지 설명한다. 6장, ‘머신러닝 프로세스’에서는 ML 모델의 예측 성과를 체계적으로 수립, 훈련, 튜닝, 평가하는 방법을 개략적으로 설명함으로써 단계를 설정한다. 7장, ‘선형 모델: 리스크 팩터에서 수익률 예측까지’에서는 선형 회귀와 로지스틱 회귀를 추론과 예측에 사용하는 방법과 규제화를 사용해 과적합 위험을 관리하는 방법을 설명한다. 8장, ‘ML4T 작업 흐름: 모델에서 전략 백테스팅까지’에서는 지금까지 별도로 다룬 ML4T 워크플로의 다양한 구성 요소를 통합한다. 9장, ‘시계열 모델’에서는 벡터 자기 회귀 모델뿐 아니라 변동성 예측에 대한 ARCH/GARCH 모델을 비롯한 일변량 및 다변량 시계열 진단과 모델을 다룬다. 10장, ‘베이지안 머신러닝: 동적 샤프 비율과 페어 트레이딩’에서는 확률적 모델과 마르코프 체인 몬테카를로(MCMC) 샘플링 및 변분 베이즈 방법이 대략적인 추론을 어떻게 용이하게 하는지 제시한다. 11장, ‘랜덤 포레스트: 일본 주식 롱/숏 전략’에서는 통찰력과 예측을 위한 비선형 트리 기반 모델을 구축, 훈련, 조정하는 방법을 설명한다. 12장, ‘거래 전략 강화’에서는 그래디언트 부스트(Gradient Boost)를 소개하고 고성능 훈련과 예측을 위해 XGBoost, LightBGM, CatBoost 라이브러리를 사용하는 방법을 보여준다. 13장, ‘비지도학습을 활용한 데이터 기반 리스크 팩터와 자산 배분’에서는 알고리듬 거래를 위해 차원 축소와 군집화를 사용하는 방법을 설명한다. 3부는 텍스트 데이터에 초점을 맞추고 대체 데이터의 핵심 출처에서 고품질 시그널을 추출하기 위한 최첨단 비지도학습 기법을 도입한다. 14장, ‘트레이딩을 위한 텍스트 데이터: 감성 분석’에서는 텍스트 데이터를 수치형으로 변환하는 방법을 보여주고 감성 분석을 위한 2부의 분류 알고리듬을 대규모 데이터 세트에 적용한다. 15장, ‘토픽 모델링’에서는 비지도학습을 사용해 많은 문서를 요약한 주제를 추출하고 분류 모델의 특성으로 텍스트 데이터를 탐색하거나 주제를 사용하는 좀 더 효과적인 방법을 제공한다. 16장, ‘어닝 콜과 SEC 공시 보고서를 위한 단어 임베딩’에서는 신경망을 사용해 기존 텍스트 특성보다 의미론적 콘텍스트를 훨씬 더 잘 포착하고 텍스트 데이터에서 거래 시그널을 추출하는 매우 유망한 방법을 나타내는 단어 벡터 형태의 최신 언어 특성을 학습한다.4부에서는 딥러닝과 강화학습을 소개한다. 17장, ‘딥러닝’에서는 4부에서 사용할 가장 인기 있는 딥러닝 프레임워크인 텐서플로 2와 파이토치(PyTorch)를 소개한다. 18장, ‘금융 시계열과 인공위성 이미지를 위한 CNN’에서는 대규모의 비정형 데이터를 활용하는 분류 작업을 위해 매우 강력한 합성곱 신경망(CNN)을 다룬다. 19장, ‘순환 신경망’에서는 순환 신경망(RNN)이 어떻게 시퀀스 대 시퀀스 모델링에 유용한지 보여준다. 이는 예측할 일변량 시계열과 다변량 시계열을 포함한다. 20장, ‘조건부 위험 요인과 자산 가격 결정을 위한 오토인코더’에서는 고차원 데이터의 비선형 압축을 위한 오토인코더를 다룬다. 21장, ‘합성 시계열 데이터를 위한 적대적 생성 네트워크’에서는 딥러닝에서 흥미로운 발전 중 하나를 소개한다. 22장, ‘심층 강화학습: 트레이딩 에이전트의 구축’에서는 강화학습이 환경에 대응해 의사결정을 최적화하는 방법을 배우는 에이전트의 설계와 훈련을 어떻게 허용하는지 설명한다. 23장, ‘결론과 다음 단계’에서는 학습한 교훈을 요약하고, 계속해서 학습하고 트레이딩 전략을 수립하고자 취할 수 있는 몇 가지 단계를 개략적으로 설명한다. 부록, ‘알파 팩터 라이브러리’에서는 거의 200개의 인기 있는 금융 특성을 나열하고 근거를 설명하며, 이러한 특성을 계산하는 방법을 보여준다.[지은이의 말]이 글을 읽고 있다면, 여러분은 아마 투자 산업을 포함한 많은 산업에서 머신러닝(ML)이 전략적인 역량이 됐다는 것을 알고 있을 것이다. ML의 부상과 밀접한 관련이 있는 디지털 데이터의 폭발은 특히 투자에 강력한 영향을 미치고 있으며, 이미 정교한 모델을 사용해 정보를 처리해 온 오랜 역사를 갖고 있다. 이러한 추세는 계량 투자를 새로운 방식으로 접근할 수 있게 만들었으며, 재량적 거래 전략과 알고리즘 거래 전략 모두에 대한 데이터 과학의 수요를 증가시키고 있다.자산클래스 간 거래 범위는 주식과 국채에서 상품과 부동산에 이르기까지 광범위하다. 이는 매우 광범위한 새로운 대체 데이터 소스가 시장 위와 그 밖의 데이터, 과거에 대부분의 분석 노력의 중심에 있었던 기초 데이터와 관련될 수 있음을 시사한다. 머신러닝이나 데이터 과학을 성공적으로 적용하려면 개인 또는 팀 차원의 통계 지식, 컴퓨터 기술과 도메인 전문 지식이 통합돼야 한다. 다시 말해 올바른 질문을 하고, 답을 제공할 수 있는 데이터를 식별하고 이해하며, 결과를 얻기 위한 광범위한 도구를 배포하고, 올바른 결정을 내리는 방식으로 이를 해석하는 것이 필수다. 따라서 이 책은 머신러닝의 투자 및 트레이딩 영역에 대한 통합적 관점을 제공한다.[옮긴이의 말]금융시장의 흐름을 이해하려면 시장 데이터, 공시, 뉴스, SNS 등 수많은 요인을 분석해야 합니다. 데이터를 효율적으로 관리하기 위해 금융시장에서도 점차 머신러닝과 딥러닝 기술이 사용되고 있으며, 트레이딩 분야에도 활용도가 높아진 상황입니다. 이 책은 머신러닝과 딥러닝 기술을 이용해 알고리즘 트레이딩의 아이디어에서 실행까지 전반적인 프로세스에 초점을 맞춰 서술하고 있는 이 분야의 바이블이 될 수 있는 좋은 안내서입니다. 2판의 새로운 내용은 저자가 말했듯 더 많은 알파 팩터 사례를 소개하고 있으며, 최신 금융 딥러닝 논문에서 발표된 중요한 내용을 꼼꼼히 구현했다는 점이 특징입니다. 실제로 각 장의 내용을 상당 부분 고쳐가며 개정판 수준으로 설명해 초기에 생각했던 번역 기간보다 8개월 정도가 더 소요됐습니다. 1판보다 번역 품질을 높이려고 했고, 의역으로도 이해가 쉽지 않은 부분은 각주를 많이 달아 독자의 이해를 높이려고 노력했습니다. - 홍창수최근에 일부 계량 금융학자들이 서클을 이루면서 AI와 금융을 융합하려고 노력하고 있다. 이 책의 저자 스테판 젠슨도 이러한 노력에 상당한 공헌을 하고 있으며, 새로운 AI의 흐름을 적극 반영하고자 1판을 개정한 2판을 출간했다. 이 책은 머신러닝의 전통 이론에서 최신 이론뿐 아니라 최신 딥러닝을 금융에 응용하는 부분도 다루고 있어 계량 금융과 머신러닝의 금융 응용에 관심 있는 사람들에게 특히 도움이 될 것이다. 1판에서의 실험적인 내용들이 2판에서는 많이 정립돼 독자들이 더욱 체계적으로 접근할 수 있을 것이다. 특히 2020년, 일각에서 상당한 공헌을 하던 퀀토피안(Quantopian)이 문을 닫으면서 계량 금융 커뮤니티에 커다란 충격을 줬는데, 많은 학자와 실무 경험자가 모여 혁신적이면서도 실전적인 연구와 작품들을 만들어내고 있던 상황이라 충격은 더욱 컸다. 특히 이들이 만든 라이브러리인 집라인(zipline)과 파이폴리오(pyfolio)는 실제 선진 대형 자산운용사에서 사용하는 수준을 과시하고 있었으므로 이들이 사장되는가 하는 아쉬움이 많았다. 심지어 이 책의 초판도 이들을 광범위하게 사용하고 있어 개정판에서는 어떻게 전개할지 궁금하기도 했다. 놀랍게도 저자는 자체적으로 집라인을 개선한 집라인 리로디드(zipline reloaded)를 만들어내 모든 내용을 살렸을 뿐 아니라 최신 파이썬 버전에서도 잘 작동하게 만들어 다시금 계량 금융 커뮤니티에 집라인 열풍을 일으키는 큰 공헌을 했다(참고로 요즘 핫한 인터넷 증권사인 알파카(Alpaca)와 인터랙티브 브로커(InteractiveBroker)와 같은 증권사가 거래 API에 최근 집라인을 사용할 수 있도록 하고 있다). 저자의 이런 노력에 찬사를 보내며, 지속적인 개발이 이뤄지기를 바란다. 마지막으로 저자도 언급하듯이 방대한 내용인 만큼 모든 내용을 자세히 다루기는 힘들어 핵심 요점 위주로 서술돼 있으며 오히려 저자의 깃허브에 있는 노트북에 많은 내용을 실었다는 것을 다시 한번 상기시키고 싶다. 이 책을 통해 이론과 실전이 통합된 최첨단의 고급 계량 금융의 여정을 즐기기를 바란다. - 이기홍
|