이 책의 저자들은 이 분야의 선구자들로 수년간 빅데이터로부터 실질적인 가치를 얻기 위한 기업들의 노력에 보탬이 되어왔다. 하둡, 임팔라, 하이브, 스파크의 사용자일 뿐만 아니라 오픈 소스 커뮤니티를 통해 이 프로젝트의 형태와 역량을 기업 환경에 맞추어 개선하는 데 적극적으로 도움을 주고 있다.
기업 환경에서 플랫폼을 운영하면서 데이터와 관련된 새로운 도전과제들이 생겨났다. 지금까지는 한 달이나 한 분기 정도의 데이터는 충분히 오랫동안 저장하고 검색할 수 있었지만 이제는 수십 년 혹은 수 세기의 데이터를 저장할 수 있다. 이렇게 큰 양적인 차이는 질적인 차이로 이어졌다. 한 세기의 데이터를 다루려면 어떤 새로운 애플리케이션을 개발해야 할까? 지금 여러분 앞에 놓인 이 책은 기업용 빅데이터 플랫폼을 개발하는 여러분이 품은 이런 질문에 대한 답을 찾기 위한 안내서다.
- 마이크 올슨(Mike Olson) (클라우데라(Cloudera)의 설립자이자 최고 전략책임자(CSO))
업계에서 가장 경험이 많은 4인의 빅데이터 실무자들이 저술한 역작이다. 기술 및 문화적 측면을 모두 아울러 기업용 하둡 시스템을 구축하는 방법과 지식을 학습하고자 한다면 이 책이야말로 최고의 선택이다.
- 톰 화이트(Tom White) (아파치 하둡 커미터, 『하둡 완벽 가이드』 저자)
『엔터프라이즈 데이터 플랫폼 구축』은 데이터의 라이프 사이클 과정에서 데이터를 진정으로 활용할 수 있게 하는 데이터의 연계 기술을 다루고 있습니다. 데이터 관리는 생성 지점인 엣지에서 AI까지 어디서나, 조직 전체가 데이터 중심의 의사결정을 내릴 수 있게 해줘야 합니다. 이것이 엔터프라이즈 데이터 클라우드 플랫폼의 요구입니다. 귀사의 데이터는 안녕하십니까? 그 해답을 이 책에서 찾아보세요.
- 강형준 (클라우데라코리아 지사장)
『엔터프라이즈 데이터 플랫폼 구축』은 이런 하둡 에코 시스템을 어떻게 구축하고 관리할 것인지를 알려주는 책입니다. 현재 많은 기업들이 클라우드 플랫폼을 운영하고 있고, 클라우드 업체마다 쉽게 관리가 가능한 하둡 플랫폼을 제공해서 예전보다 하둡 플랫폼을 관리하는 노력이 줄어들었기 때문에, 과연 이렇게 상세하게 알아야 할까 하는 의문이 들 수도 있습니다. 하지만 아직도 금융권이나 정부 기관등 법적으로 클라우드 플랫폼을 제대로 사용할 수 있는 분야가 많으며, 아주 큰 기업들은 온프레미스라고 부르는 자신들의 IDC에서 서비스를 운영하기 때문에, 이런 지식은 여전히 필요합니다.
- 강대명 (beNX 엔지니어)
이 책에서는 데이터 플랫폼 전반에 대해 각 분야별 전문가들이 다뤄야 할 고급 지식들을 알기 쉽게 그림으로 나타내어 데이터 플랫폼에 대해 깊이 알지 못하는 개발자나 엔지니어도 쉽게 이해할 수 있도록 잘 설명합니다. 또한 높은 성능뿐만 아니라 보안 및 안정성 등과 관련된 많은 기능들을 갖추고 있어 빅데이터 플랫폼 기술의 표준으로 자리잡은 하둡에 대해서도 심도 있게 다루며, 아울러 퍼블릭 클라우드 상에서의 데이터 플랫폼 솔루션들까지 상세히 설명합니다. 빅데이터와 관련된 일을 하는 모든 이의 필독서로 추천합니다.
- 고승범 (SKT 데이터 플랫폼 팀, 『카프카, 데이터 플랫폼의 최강자』 저자)
『엔터프라이즈 데이터 플랫폼 구축』의 강점은 하둡 클러스터의 도입, 구축, 운영에 대해 실무에서 필요한 고려사항과 가이드를 모두 다룬다는 점입니다. 또한 하둡 엔지니어가 네트워크, 운영체제, 하둡 에코시스템, 데이터 관리 등 다방면에 걸쳐 고민해야 하는 기술뿐만 아니라, 해당 전문 엔지니어와 협의해야 하는 세부 주제 또한 잘 정리되어 있습니다. 무엇보다도 이 책은 클라우데라에서 CDH를 개발한 저자진이 직접 저술함으로써, 그들이 경험한 기술 고려사항부터 현장 경험과 노하우까지 모두 흡수할 수 있는 멋진 ‘데이터 플랫폼’ 실무서입니다.
- 김태완 (한국오라클 빅데이터 엔지니어, http://taewan.kim/)
하둡이 시장에 나온 지 오랜 시간이 지났고, 많은 조직에서 적극적으로 활용하는 기술로 자리를 잡았다. 각자의 환경과 목적에 맞는 컴포넌트를 활용하고 있다고는 하지만, 아쉽게도 현장에서는 기술 격차가 크게 존재한다. 이 책은 클라우드 기술까지 포괄하여 물리적인 아키텍처를 자세히 다룬다는 점에서, 엔터프라이즈급 규모를 운영하는 조직에 큰 도움이 될 것이다. 또한 상세하고 빈틈없는 설명으로, 하둡에 대한 기초적인 이해와 집중해야 하는 요소에 대한 인덱스 역할을 제공한다.
- 이태윤 (카카오 데이터플랫폼팀 팀장)