확장메뉴
주요메뉴


닫기
사이즈 비교
소득공제
하이 퍼포먼스 스파크

하이 퍼포먼스 스파크

[ 2019년 대한민국학술원 우수학술도서 선정도서 ] 제이펍-I♥Cloud -16이동
리뷰 총점7.0 리뷰 2건
베스트
IT 모바일 top100 2주
정가
28,000
판매가
25,200 (10% 할인)
구매 시 참고사항
eBook이 출간되면 알려드립니다. eBook 출간 알림 신청
분철서비스 시작 시 알려드립니다. 분철서비스 알림신청

품목정보

품목정보
발행일 2018년 05월 31일
쪽수, 무게, 크기 376쪽 | 188*245*18mm
ISBN13 9791188621248
ISBN10 1188621246

책소개 책소개 보이기/감추기

목차 목차 보이기/감추기

저자 소개 (3명)

책 속으로 책속으로 보이기/감추기

아파치 스파크는 일반화된 병렬 처리로 데이터를 다룰 수 있는 수단을 제공하는 오픈소스 프레임워크다. 즉, 동일한 고수준의 스파크 함수들로 크기와 구조가 다른 여러 가지 데이터에 대해 서로 다른 데이터 처리 작업을 수행할 수 있다. 스파크는 그 자체로는 데이터 저장 솔루션은 아니다. 스파크는 스파크 JVM(자바 가상 머신) 위에서 연산을 수행하는 것뿐이며 이 JVM은 스파크 애플리케이션이 실행되고 있는 동안만 지속된다. 스파크는 하나의 단일 머신 위에서 한 JVM만으로도 실행할 수 있다(로컬 모드). 물론 그보다는 분산 저장 시스템(예: HDFS, 카산드라(Cassandra), S3)과 클러스터 매니저가 함께 쓰이는 경우가 대부분이다.
--- p. 9

데이터 조인(join)은 많은 파이프라인에서 중요한 부분이며 스파크 코어와 SQL은 본질적으로 동일한 타입의 조인을 지원한다. 조인은 매우 일상적으로 쓰이는 강력한 수단이지만 대규모의 네트워크 전송이 필요하거나 처리량의 한계를 넘어서는 데이터세트를 만들어야 하는 경우가 생기므로 특별한 고려가 필요하다.1 SQL 옵티마이저와 달리 DAG 옵티마이저는 연산 순서를 재정렬하거나 필터를 푸시다운하는 능력이 없기 때문에 코어 스파크에서는 연산 순서의 고려가 더욱 중요하다.
--- p. 81

다른 훌륭한 분산 처리 도구들처럼, 특히 데이터를 머신에 재분배해야 하는 넓은 트랜스포메이션 같은 연산을 정의하고 병렬화하는 데에는 키/값 쌍을 쓰는 방식에 크게 의존한다. 언제든지 그룹 연산을 원하거나 머신 간의 데이터 순서를 변경하고 싶을 때 ―통계를 집계하거나 고객 데이터를 병합하는 등― 스파크의 키/값 기능은 작업을 쉽게 병렬화해 주므로 유용하다. 스파크는 자체적으로 튜플을 키/값 기반으로 RDD에 쓸 수 있도록 구성된 함수들의 클래스인 PairRDDFunctions을 제공한다. 이 PairRDDFunctions 클래스는 암묵적 변환을 통해 사용할 수 있으며1, 조인과 집계 연산에 대한 대부분의 스파크 메서드를 갖고 있다.
--- p. 137

단위 테스트(unit test)는 복잡한 종속성을 지닌 (데이터 소스 같은) 기능을, 가끔은 가짜 의존성을 만들어서라도(mock out) 그런 데에 의존하는 작은 컴포넌트들을 테스트하는 데 중점을 맞춘다. 단위 테스트는 통합 테스트보다는 보통 훨씬 빠르게 시도하고 끝낼 수 있으며 개발 과정 중에 빈번하게 사용된다. 만약 리팩토링을 하고자 한다면 스파크랑 연관된 부분들을 특별히 고려하지 않고 코드의 많은 부분을 테스트할 수 있다. 코드의 나머지 부분들은 라이브러리들이 그 과정을 단순화해 줄 것이다.
--- p. 220

스파크의 어큐뮬레이터를 작업 검증에 사용할 수도 있다. 어큐뮬레이터의 일반적인 사용법은 데이터를 처리할 때 잘못된 레코드의 개수를 헤아리는 것이다. 이런 어큐뮬레이터를 단순히 디버깅 용도로만 쓰는 것 이상으로 자동화된 검증 도구 세트의 한 부분을 담당하게 할 수 있다. 118페이지의 ‘어큐뮬레이터’에서 설명한 것처럼 스파크 어큐뮬레이터는 자주 (또한 예측이 힘들 정도로) 값을 중복 계산하여 업데이트할 수 있기 때문에 모든 검증 규칙을 상대적으로 작성할 필요가 있다(예: 전체 레코드 대비 잘못된 레코드의 비율).
--- p. 237

회원리뷰 (1건) 회원리뷰 이동

한줄평 (1건) 한줄평 이동

총 평점 4.0점 4.0 / 10.0

배송/반품/교환 안내

배송 안내
반품/교환 안내에 대한 내용입니다.
배송 구분 예스24 배송
  •  배송비 : 무료배송
포장 안내

안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다.

고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다.

목적 : 안전한 포장 관리
촬영범위 : 박스 포장 작업

  • 포장안내1
  • 포장안내2
  • 포장안내3
  • 포장안내4
반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법
  •  고객만족센터(1544-3800), 중고샵(1566-4295)
  •  판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간
  •  출고 완료 후 10일 이내의 주문 상품
  •  디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품
  •  중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용
  •  고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임
  •  직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음

    단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제

    •  오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소
    •  오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소
  •  직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음

    단, 당일 00시~13시 사이의 주문은 취소 수수료 면제

  •  박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유
  •  소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우
  •  소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등
  •  복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집
  •  소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우
  •  디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우
  •  eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가
  •  중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우
  •  LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등)
  •  시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우
  •  전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상
  •  상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에
따른 배상
  •  대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리
  • 절판 상태입니다.
뒤로 앞으로 맨위로 공유하기