"머신러닝을 사용하고 싶지만, 많은 시간을 투자할 수는 없다." 산업계나 다른 분야의 연구원들로부터 너무나 자주 듣는 말이다. 이에 따라 머신러닝에 대한 핸드 프리 솔루션에 대한 수요로 최근 자동머신러닝(AutoML) 분야가 생겨났으며, 이 책은 이 분야에 대한 최초의 종합 가이드다.
나는 지난 2014년 자동 통계학 프로젝트를 시작으로 머신러닝 자동화에 많은 관심이 있다. 머신러닝 자동화를 위해서는 전체 머신러닝과 데이터 분석 파이프라인의 모든 측면을 자동화하도록 노력해야 한다. 여기에는 데이터 수집 및 실험 설계 자동화, 데이터 정제 및 결측 데이터 대체 자동화, 특성 선택 및 변환 자동화, 모델 발견, 평가 및 설명 자동화, 계산 자원 할당 자동화 등이 포함된다. 그 외에도 하이퍼파라미터 변수 최적화 자동화, 추론 자동화, 모델 모니터링 및 이상 탐지 자동화 등이 있다. 우리는 이 모든 것을 자동화하고자 한다. 완전한 자동화는 과학 연구에 동기를 부여하고 장기적인 엔지니어링 목표를 제공할 수 있지만, 실제로는 대부분의 것을 반자동화하고 필요에 따라 루프에서 점차적으로 인간의 개입을 제거하기를 원할 것이다. 그 과정에서 목표로 한 모든 자동화를 수행하려고 하면 머신러닝을 좀 더 체계적이고 효율적으로 수행할 수 있는 강력한 툴을 개발할 수 있다. 만약 우리의 최종 목표인 자동화에 성공하지 못하더라도 이는 충분히 가치 있는 목표다.
하지만 이 책에서 보여주듯이 현재 AutoML은 여러 과제에서 인간 머신러닝 전문가보다 뛰어나다. 이러한 추세는 우리가 발전하고 연산이 점점 더 저렴해질수록 더욱 심화될 것으로 보인다. 따라서 AutoML은 앞으로 지켜봐야 할 주제 중 하나임이 분명하다. 지금은 AutoML에 참여하기에 좋은 시기이며, 이 책은 좋은 출발점이 될 것이다. 이 책에는 AutoML에 필요한 최신 기술(하이퍼파라미터 최적화, 메타러닝 및 신경망 구조 검색)이 포함되어 있으며, 기존 AutoML 시스템에 대한 심도 있는 논의를 제공하고, 2015년 이후 개최된 일련의 대회에서 AutoML의 최신 기술을 철저히 평가한다. 따라서 이 책을 현장에서 시작하고자 하는 머신러닝 연구자 및 AutoML 툴의 이면에 있는 방법을 이해하고자 하는 실무자에게 적극 추천한다.
- 주빈 가라마니 (Zoubin Ghahramani, 미국 샌프란시스코, 케임브리지대학교 교수, Uber 수석 과학자)