확장메뉴
주요메뉴


닫기
사이즈 비교
소득공제
머하웃 완벽 가이드

머하웃 완벽 가이드

: 하둡에 딱 맞는 빅데이터를 활용한 기계학습

리뷰 총점10.0 리뷰 1건
베스트
IT 모바일 top100 3주
정가
38,000
판매가
34,200 (10% 할인)
구매 시 참고사항
eBook이 출간되면 알려드립니다. eBook 출간 알림 신청
분철서비스 시작 시 알려드립니다. 분철서비스 알림신청

품목정보

품목정보
발행일 2012년 11월 01일
쪽수, 무게, 크기 552쪽 | 975g | 188*235*35mm
ISBN13 9788979149609
ISBN10 8979149603

책소개 책소개 보이기/감추기

목차 목차 보이기/감추기

저자 소개 관련자료 보이기/감추기

저자 : 션 오웬 Sean Owen
9년째 소프트웨어 엔지니어로 일하고 있으며, 대부분 기간을 구글의 모바일 웹 검색 개발에 썼다. 2008년부터는 아파치 머하웃 기계학습 프로젝트의 프라이머리 커미터로 참여하고 있으며 머하웃 컨설턴트로 일하고 있다.
저자 : 로빈 애닐 Robin Anil
2008년 구글 썸머오브코드의 아파치 머하웃 프로젝트에 참여했다. 2009년에 머하웃 커미터가 되었으며, 구글에서 소프트웨어 엔지니어로 일한다.
저자 : 테드 더닝 Ted Dunning
현재 MapR 테크놀러지의 수석 애플리케이션 아키텍트로 아파치 머하웃 프로젝트의 커미터이며 PMC 멤버다. 머하웃의 군집, 분류, 행렬 분해 알고리즘 개발에 공헌했으며 MusicMatch(현재의 야후! 뮤직)와 Veoh 추천 시스템의 수석 아키텍트로 ID 분석을 통한 사기 적발 시스템을 개발했다.
저자 : 엘렌 프리드만 Ellen Friedman
생화학 박사이면서 경험이 많은 작가로, 생화학 분야의 연구 경력은 물론 분자생물학, 약학, 지구과학과 같은 폭넓은 주제에 대한 글을 쓰고 있다.
역자 : 안태성
컴퓨터시스템 응용기술사이다. 대학교에서 전자공학과 정보통계학을 공부했으며, 비정형 텍스트 분석 분야에서 16년째 일하고 있다. 기계번역, 음성인식 관련 기업에서 SW 연구 개발을 담당했으며, 한국어형태소분석기, 한일기계번역엔진 등 다양한 자연어 처리 SW를 직접 개발했다. 2003년에는 복합문서 객체 검색엔진의 개발 공로로 정보통신부 장관상을 받기도 했다. 현재는 비정형 콘텐츠 분석 SW 전문 업체인 솔트룩스의 창업 멤버로 텍스트 마이닝, 시맨틱웹 SW R&D와 고객 기술 자문을 담당하고 있다.

책 속으로 책속으로 보이기/감추기

빅데이터가 IT 업계에서 화두입니다.
빅데이터에 관한 여러 가지 정의가 있겠지만, 일반적으로 빅데이터는 기존 시스템으로는 처리하기 매우 어려운 수준의 동적인 대용량 데이터를 의미합니다. 이런 빅데이터를 효과적으로 처리하려면 비용이나 관리 등 다양한 측면에서 분산된 시스템 여러 대가 필요합니다.
‘구슬이 서말이어도 꿰어야 보배’라는 옛말이 있듯이, 모은 빅데이터를 잘 분석하고 의미 있는 정보를 뽑아낼 수 없다면 아무런 의미가 없습니다. 효과적인 빅데이터 분석에 대한 관심이 자연스럽게 기계학습으로 이어지는 현상은, 짧지 않은 기간 동안 검색, 텍스트 마이닝 분야에서 일해온 저에게는 매우 고무적입니다.
빅데이터 분야에서 오픈소스의 활약이 놀랍습니다. 특히 ‘빅데이터의 처리 기반은 하둡’이라는 공식이 IT 분야 전반에 자리매김하고 있습니다. 하둡을 중심으로 구축된 에코시스템은 기존 SW 업계에도 많은 영향을 주고 있습니다. 이제는 상용 SW도 빅데이터 처리를 위해 하둡을 지원하는 게 기본이 되었습니다.
머하웃은 하둡 위에서 동작하는 아파치 오픈소스 기계학습 라이브러리입니다. 범용적인 기계학습 라이브러리답게 텍스트 분석은 물론 다양한 공학 분야에도 활용할 수 있습니다.
물론 높은 품질과 생산성을 자랑하는 기존의 훌륭한 기계학습 솔루션이 존재하고 많은 소/중 규모의 분석 프로젝트에서는 이런 솔루션이 오히려 더 적합한 것도 사실입니다. 그럼에도 머하웃이 관심을 끄는 이유는 높은 분석 품질보다는 수십억 단위의 빅데이터를 분산 환경으로 처리하는 하둡의 맵리듀스 기반에서 바로 쓸 수 있기 때문입니다.
기계학습은 전통적인 수학, 통계학, 소프트웨어 과학의 교차점에 있습니다. 통계학을 사용해 데이터로부터 해석된 무언가를 기계가 배울 수 있도록 처리해 데이터에서 유용한 분석 결과를 만들어 냅니다. 기존 기계학습 책은 통계 수식과 학술적인 내용이 대부분이라서 전공자가 아닌 일반 SW 엔지니어가 학습하기 쉽지 않았습니다. 하지만 이 책은 개념적인 이론 설명과 구현 코드를 적절하게 배분하여 일반 SW 개발자도 기계학습을 쉽게 학습하고 활용할 수 있는 실질적인 지침을 제공합니다.
이 책을 이해하려면 고등학생 시절에 배웠던 수학 지식이 약간 필요합니다. 부록에 포함된 벡터, 행렬에 관한 내용을 미리 참고해보는 것도 좋을 것입니다. 이해하기 어려운 통계 용어는 되도록 이해하기 쉽게 고쳐 번역했지만, 학계에서 통용되는 용어는 혼선을 방지하기 위해 그대로 사용했습니다.
기계학습은 참으로 매력적인 분야입니다. 데이터를 기계가 잘 학습할 수 있도록 준비하고 데이터의 특징을 가르치는 역할은 궁극적으로 기계가 아닌 사람이 하기 때문입니다. 그뿐만 아니라 데이터에서 뽑아낼 특성과 분석 알고리즘의 선택과 적용에 따라 그 결과가 매우 달라지기 때문에 엔지니어의 숙련도와 축적된 경험이 반드시 필요한 분야이기도 합니다. 데이터 엔지니어링이 아닌 데이터 사이언스라고 부르는 이유도 어쩌면 이런 경험치가 반영된 것이 아닌가 합니다.
시스템을 구현하기 전에 먼저 여러분이 처리해야 할 데이터를 주의 깊게 관찰하기 바랍니다. 빅데이터 분석을 위해서 머하웃 같은 대용량 분석 SW와 하둡 인프라를 준비해야겠지만, 분석의 방향성을 결정하는 몫은 시스템이 아닌 여러분의 것이기 때문입니다. 빅데이터가 지나가는 IT 유행어일지도 모릅니다. 하지만 우리가 처리해야 할 데이터는 지금도 기하급수적으로 늘어나고 있다는 건 분명합니다.
끝으로 이 책의 출판을 결정하고 기회를 주신 한빛미디어의 배용석 부장님, 끝까지 빨간펜 역할을 해주신 최현우 과장님, 번역 작업을 위해 주말을 기꺼이 양보해 준 사랑하는 가족에게 고마움을 전합니다.
_안태성
---「옮긴이의 글」 중에서

출판사 리뷰 출판사 리뷰 보이기/감추기

추천평 추천평 보이기/감추기

"머하웃의 기계학습에 대한 실질적인 토론"
- 이사벨 드로스트 (아파치 머하웃 공동 창시자)

"복잡한 주제를 이해하기 쉽게 썼다"
- 릭 와그너 (레드햇의 선임 연구원)

"빠르게 머하웃을 익힐 수 있다"

데이빗 그로스만 (일리노이 공과대학 컴퓨터 공학과 부교수)

회원리뷰 (1건) 회원리뷰 이동

한줄평 (0건) 한줄평 이동

  등록된 한줄평이 없습니다!

첫번째 한줄평을 남겨주세요.

배송/반품/교환 안내

배송 안내
반품/교환 안내에 대한 내용입니다.
배송 구분 예스24 배송
  •  배송비 : 무료배송
포장 안내

안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다.

고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다.

목적 : 안전한 포장 관리
촬영범위 : 박스 포장 작업

  • 포장안내1
  • 포장안내2
  • 포장안내3
  • 포장안내4
반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법
  •  고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음

    단, 당일 00시~13시 사이의 주문은 취소 수수료 면제

  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에
따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
  • 절판 상태입니다.
뒤로 앞으로 맨위로 공유하기