지은이 서문
내가 통계분석 프리 소프트웨어 R을 만난 것은 대학교 2학년 때로, ‘통계 소프트웨어를 사용해보자’는 주제의 강의에서 R(당시 버전은 1.0.0)을 다룬 것이 계기가 되었다. 그 당시 R을 공부하면서 참고가 될 만한 책을 찾았지만 별로 도움이 되는 것이 없었다. 그래서 직접 다방면으로 조사해서 정리한 것이 이 책의 바탕이 되는 내용이다. 나 자신이 통계를 잘 아는 것도 아니고 소프트웨어를 잘 아는 것도 아니어서 R을 배우는 데 고생이 많았다. 그래서 앞으로 R을 공부하는 사람들이 나처럼 고생하지 않았으면 하는 마음을 이 책에 담았다.
R은 통계계산과 그래픽스를 위한 언어 환경이다. 이 정도라면 시중에 얼마든지 있지만, 놀랍게도 R은 프리 소프트웨어다. 더구나 GNU 라이선스로 공유하거나 변경할 수 있는 자유가 보장된 프리 소프트웨어다. 그리고 R에는 다양한 통계기법과 세련된 프로그래밍 언어 체계, 작성하기 쉽고 높은 품질의 결과물을 얻을 수 있는 그래픽스 환경이 준비되어 있으며 패키지 형태로 기능을 더 확장할 수 있다.
이뿐이라면 R은 ‘통계를 전문으로 하는 사람만 사용하는 소프트웨어’라는 인상을 받을지도 모르겠다. 하지만 R은 통계분석은 물론, 간단한 계산에서 수치계산, 프로그램이나 시뮬레이션, 단순한 그래프에서 복잡한 그래픽스까지 소화할 수 있는 소프트웨어다. R은 결코 ‘통계를 전문으로 하는 사람만 사용하는 소프트웨어’가 아니다. 여기에 입각해서 다음 네 가지를 목표로 이 책을 집필했다.
* 초보자도 읽을 수 있는 풍부한 해설의 R 입문서를 만든다(R 입문).
* R에서는 통계뿐만 아니라 수치계산이나 프로그래밍도 간단히 실행할 수 있음을 보여 준다(R 입문).
* 방대한 R의 정보량을 가능한 한 체계를 세워서 정리한다(R 팁).
* 그래픽스 관계를 자세히 설명한다(R 팁).
R을 이용한 통계분석 책은 아주 많이 출판되어 있다. 그런 책을 읽는 데 필요한 지식은 무엇일까? 다른 책에서 지면에 할애하기 어려웠던 내용은 무엇일까? 이런 생각을 하면서 책을 집필했다. R의 숙련도에 맞게 읽을 수 있도록 이 책은 크게 2부로 구성되어 있다. R을 사용한 적이 없는 사람이나 초보자는 우선 ‘R 입문’을 읽어 보자. 그리고 어느 정도 R에 익숙해지면 ‘R 팁’으로 나아가도 좋다. 또한, 학습 목적이 그대로 목차 항목에 잘 나타나 있으므로 목차를 사전처럼 사용할 수도 있다.
이 자리를 빌려 많은 분께 감사의 말을 전해야겠다. 우선 이 책을 집필하도록 계기를 주신 군마대학 나카자와 미나토 선생님께 감사드린다. 또한, 이 책의 원 소스인 ‘R-Tips’ 홈페이지를 관리하고 대리 운영해 주신 중앙농업종합연구센터의 타케자와 쿠니오 선생님께는 정말 큰 신세를 졌다. 몇 년 전 대학을 졸업할 때 운영하던 R 관련 홈페이지인 ‘R-Tips’를 접으려고 했을 때 수고를 마다치 않고 대신 운영해 주신 분이 타케자와 선생님이었다. 그때 ‘R-Tips’를 맡아 주지 않았다면 내가 지금 이렇게 책을 집필하는 일은 없었을 것이다. 깊이 감사드린다.
다음으로 이 책의 초판을 집필할 때 ‘R-Tips’의 오류 수정과 교정을 해 주신 군마대학 아오키 시게노부 선생님과 나카마 에이지 씨에게도 감사 말을 전한다. 아오키 선생님은 통계적 내용에서부터 그야말로 맞춤법 검사 수준의 교정까지 해주셨다. 또한, 나카마 씨는 책에 대해 여러 조언을 해 주셨을 뿐 아니라 R 설치법에 관한 성가신 질문에도 기분 좋게 응대해 주셨다. 가까이는 책의 방향을 제시해 주신 칸사이대학 아키 시게오 선생님과 원고에 대해 본질적인 조언에서부터 오류 수정까지 도와준 카네코 마사유키 선배께 감사드린다. Mac용 R 설치법은 하마사키 타카시 선배에게, Linux용 R 설치법은 오오하마 준지에게 배웠다. 다음에 만나면 술 한 잔 사지요. 그리고 아내 쿄오코, 이제 책만 쓰지 않고 조금은 집안일도 도울게...
마지막으로 일본에서 R 보급에 힘써 오신 도쿄공업대학 마세 시게루 선생님, 'RjpWiki'를 운영하시면서 R의 일본어화 작업을 통합하고 계시는 츠쿠바대학의 오카다 마사후미 선생님, 개정판 출간 시에 검토를 흔쾌히 맡아 글자 하나부터 본문에 대한 주석, R에 관한 지도까지 세심하게 감수해 주신 타카시나 토모미 선생님께 깊이 감사드린다.
_후나오 노부오
옮긴이 서문
어느덧 가을이 지나고 겨울이 성큼 다가왔습니다. 엊그제는 벌써 첫눈이 내리더군요. 추운 겨울바람을 맞고 나서야 오래 전에 맡아둔 책이 마무리되어 세상에 나오게 되었습니다. 내내 마음에 걸려 마음에 짐처럼 남았던 일이었는데, 해를 넘기기 전에 이렇게 매듭짓게 되어 무척 기쁩니다.
번역 작업을 하다 보면 잇달아 접하게 되는 책들이 어떤 분야와 관련하여 유행하는 기술이거나 서로 보완하는 책일 때가 있습니다. 예를 들어 아이폰이 국내에 들어오고 한동안 xcode 환경에서의 앱 개발이나 모바일 기기의 성장에 따른 전자책 제작이나 업무 활용에 관한 책이 많이 나왔습니다. 당시 저 역시도 그런 종류의 책을 번역했습니다. 그리고 비교적 최근에 번역했던 기계학습, 빅데이터 관련 서적과 이 책에서도 그런 연관성을 느낄 수 있었습니다.
매순간 어마어마하게 만들어지는 정보의 홍수 속에서 오늘날 데이터 분석과 통계, 그리고 그 데이터에서 새로운 의미를 찾아내는 데이터마이닝의 중요성은 점점 커지고 있습니다. 오픈소스로서 무료로 제공되는 R은 이런 통계 분석, 시뮬레이션 등에 뛰어난 소프트웨어입니다. 부끄럽지만 전 이 책을 접하기 전까지 통계니 분석이니 하는 건 이공계 분야에서나 쓰는 거라는 편견이 있었을 정도로 이 분야와 R에 관해 잘 모르고 있었습니다. 이 책을 통해 R에 대해 알게 되고 코드를 하나하나 따라해 보기 시작한 지 이제 겨우 일 년 남짓 된 정도지만 이 책의 특징을 조금 이야기해 보겠습니다.
이 책은 저자가 R을 공부하면서 인터넷에 공개한 자료를 다시 정리해서 책으로 엮어낸 것으로 크게 입문편과 팁편으로 나뉘어 있습니다. 저자는 자신이 공개했던 방대한 자료들을 집필 의도에 맞게 훌륭하게 재구성했습니다. 또한 학습 목적을 목차 항목에 그대로 반영해서 어느 정도 익숙해지면 목차를 사전처럼 사용할 수 있게 하여 학습 편의성도 높였습니다. R을 처음 다루는 사람도 쉽게 접근할 수 있는 간단한 계산을 시작으로 흥미를 유발할 수 있는 예제로 채워져 있으므로 따라 하다 보면 어느새 자연스럽게 R 프로그래밍에 익숙해질 것입니다.
무엇보다 구체적인 예제를 통해 직접 코드를 실행하고 곧바로 눈으로 확인할 수 있는 점은 학습하는 입장에서나 번역하는 입장에서 재미를 더해 주는 큰 장점입니다. 실제로 비전공자인 저도 번역을 하는 과정에서 모든 내용을 실습해 볼 수 있었고 결과를 바로 확인할 수 있어서 지루하지 않게 번역을 마칠 수 있었습니다. R을 새롭게 배우고자 하시는 분들도 아마 저와 비슷한 경험을 하실 수 있으리라 생각합니다.
현재 시중에 나와 있는 SPSS나 SAS 등의 입문, 활용서의 종류와 양에 비교하면 R에 관한 책은 아직 많이 부족한 편입니다. 이 책의 원서 역시 꽤 오래 전에 나온 책이고 그 동안 관련 서적들이 많이 나온 것으로 알고 있지만 한국어로 옮겨진 책은 많지 않습니다.
R은 오픈소스를 기반으로 하고 있으므로 다양한 분야에서 축적된 경험과 아이디어를 바탕으로 사용자가 스스로 패키지를 개발하고 공개하면서 발전을 거듭하고 있습니다. 사용자는 자신에게 필요한 패키지를 찾아서 사용할 수도 있고 직접 만들어낼 수도 있습니다. 뛰어난 그래픽 기능과 이런 유연한 패키지 확장성에 힘입어 R은 점점 넓은 범위에서 활용될 것입니다. 아직 R과 관련된 한글 문서는 많지 않은 편이지만, 한글 기반 사용자가 늘어나고 자신의 경험과 지식을 나눈다면 한글로 된 자료도 빠르게 늘어나리라 예상해 봅니다.
학습 과정에서 설명이 미흡하거나 더 많은 예제를 살펴보고 싶을 때는 인터넷에서 공개된 수많은 자료를 찾아볼 수 있습니다. 가장 많은 정보가 있는 곳은 물론 프로젝트 홈페이지(http://www.r-project.org/)로 바이너리, 패키지, 각종 문서, 소스코드 및 R에 관련된 책의 목록 등을 찾아볼 수 있습니다.
R-iHELP 프로젝트 사이트(http://korea.gnu.org/gnustats/lang.html )에서는 매뉴얼을 비롯해서 한글로 번역되거나 새로 만들어진 많은 유용한 정보를 얻을 수 있습니다. 예를 들어 ‘R 스터디 가이드(http://korea.gnu.org/gnustats/tutorial/part1/tutorial.pdf)’와 같은 튜토리얼에서는 한글 자료 처리 예제나 로케일 설정 등에 관해 잘 설명되어 있습니다. 또한, 패키지와 함수 사용법에 관해 정리된 ‘R을 이용한 데이터 분석 실무’나 ‘R을 이용한 빅데이터 분석’ 등이 있으며, 그 밖에도 여러 주제의 문서가 소개되어 있어 학습에 큰 도움을 얻을 수 있습니다.
끝으로 매번 좋은 책의 번역을 맡겨 주시는 한빛미디어에 감사드립니다. 그리고 짧지 않은 시간 동안 여러 책을 함께 작업하고 도움을 주셨던 한동훈님, 원고의 많은 오류를 꼼꼼하게 잡아 주시고 어색한 문장을 다듬어주신 한빛미디어 김상민 편집자님께 감사드립니다. 그 밖에도 좋은 책으로 세상에 나올 수 있게 힘써 주신 모든 분들께도 깊이 감사드립니다. 또한 번역 과정 내내 곁에서 힘이 되어준 가족과 조언해 준 친구에게 지면을 통해 특별히 감사의 마음을 전합니다.
_김성재
--- 본문 중에서