통계학자이면서 가르치는 일도 하고 있는 RStudio의 R 개발자다. 그는 데이터과학 분야야말로 산업 분야와 학계 전반에 기여할 큰 가능성이 잠재되어 있다고 말한다. 가렛은 라이스 대학교의 해들리 위크햄 연구실에서 박사학위를 받았다. 인식론적 과정을 통해 데이터과학의 근원적인 부분에 대해 연구했고, 주의적이고 인식론적인 관심사가 어떻게 데이터분석에 영향을 주는지 알아보았다. 데이터과학을 공부하면서 그가 맛보았던 좌절감과 불필요한 과정을 다른 사람들이 겪지 않도록 돕는 일에 매우 열심이다. 박사학위 논문을 마치기도 전에 벌써 레볼루션 애널리틱스에서 잘나가는 기업들을 대상으로 R과 데이터분석을 교육하는 일을 시작했다. 그는 구글, 이베이, 로슈를 비롯한 다른 많은 기업에서 교육을 진행해왔고, 현재 RStudio를 사용하는 유용한 노하우를 더 이해하기 쉽도록 교육 커리큘럼을 개발하는 일을 한다. 교육과 관련된 일 외에도, 가렛은 임상 실험 연구, 법률 연구, 재무 분석을 하며 시간을 보낸다. 물론 R 소프트웨어도 개발 중이다. 날짜/시간 값을 파싱하고, 쉽게 다루고, 산술 연산까지 가능하게 하는 R 패키지 lubridate를 공동 개발했다. 그리고 ggplot2의 확장 패키지인 ggsubplot을 개발했다.
역자 : 이준용
KAIST에서 전자공학박사 학위를 마치고, 일본과 미국에서 박사 후 연구원으로 일하고 있다. 일본 ATR IRC 연구소에서 인간 로봇상호작용에 관한 연구에 참여했으며, 이후 미국 아이오와 주립대학에서는 Metabolic Pathway와 관련한 데이터베이스를 구축하는 일을 했다. 현재 미국 퍼시픽 노스웨스트 국립 연구소에서 박사 후 연구원으로 일하고 있다. 평소 인공지능과 빅데이터 기술에 관심이 많고, 데이터를 다루는 일을 많이 하면서 R 이외에도 다양한 프로그램 언어를 사용하고 있다.
제대로 된 데이터분석을 하려면 프로그래밍을 배워야 한다. 데이터과학을 위해서 컴퓨터 사용이 필수라는 사실에 이견을 다는 사람은 없을 것이다. 그러므로 기존 프로그램의 GUI 사용법을 배우든 프로그래밍 언어를 배우든 둘 중 하나는 해야 한다. 가렛과 나는 프로그래밍 기술이야 말로 데이터를 다루는 모든 사람에게 필수라는 강한 신념을 가지고 있다. 간편하긴 하지만 GUI는 근본적으로 제약이 많다. 왜냐하면 양질의 데이터분석을 위해 반드시 필요한 다음 3가지 요소를 방해하기 때문이다.
- 재현성(Reproducibility) : 과거 분석을 그대로 재현할 수 있는지 나타내며 좋은 연구를 위해 결정적이다. - 자동화(Automation) : 데이터가 (늘 그렇듯) 변하더라도 빠르게 다시 분석을 해낼 수 있는 능력을 말한다. - 정보 전달(Communication) : 코드는 그저 텍스트다. 이메일이나 구글, 스택 오버플로 등 많은 곳을 통해 쉽게 주고받을 수 있으며, 또한 배우면서 도움을 받기도 쉽다.
프로그래밍을 겁내지 마라! 정확한 동기와 의지만 있다면 누구나 배울 수 있다. 이 책은 여러분의 동기를 북돋아 줄 것이다. 그냥 참고서와는 다르다. 직접 해 볼 수 있는 3가지 프로젝트를 중심으로 구성되어 있다. 이 프로젝트를 통해 R 프로그래밍의 기초부터 코드 벡터화, 스코핑, S3 기법과 같은 중급 내용까지 다루게 된다. 실제로 해 보는 것이 배우는 데 가장 효과적인 방법이다. 왜냐하면 상황과는 아무 상관없이 무턱대고 기능들만 외우는 것보다는 실제로 주어진 어떤 문제를 해결하기 위해 기능들을 하나씩 익혀나갈 수 있기 때문이다. 단순히 읽는 것이 아니라 직접 하면서 체득하게 될 것이다. 프로그래밍을 배우다 보면 좌절을 맛보게 될 것이다. 새로운 언어를 배우는 것이기 때문에 유창하게 구사하기 위해서는 시간이 필요한 것이다. 그렇다고 좌절하기 위해 태어난 사람은 없지 않은가! 좌절은 차분히 궁리해 볼 긍정적인 신호다. 좌절은 뇌가 좀 쉬고 싶다는 것, 그만하고 쉽고 재미있는 것을 하고 싶다고 예기하는 것일 뿐이다. 몸짱이 되려면 몸이 좀 불평하더라도 몸을 몰아붙여야 한다. 만약 프로그래밍을 더 잘 하고 싶다면 뇌를 다그칠 필요가 있다. 좌절이 몰려올 때 그것을 기억하고, 기지개를 한 번 크게 켜자. 매일 조금씩 자신을 밀어붙이길 바란다. 곧 자신감 넘치는 프로그래머가 되어 있을 것이다. 이 책은 친구처럼 친절하고 서로 대화하듯 살아 있다. 나나 가렛을 직접 만나 배우는 것 다음으로 R 프로그래밍을 배우기에 가장 좋은 방법일 것이다. 내가 그랬듯, 즐겁게 읽어 나가기 바란다.