이미지 검색을 사용해 보세요
검색창 이전화면 이전화면
최근 검색어
인기 검색어

소득공제 베스트셀러
데이터 엔지니어링 디자인 패턴
데이터 수집부터 품질, 오케스트레이션, 관찰 가능성까지 반복되는 문제를 해결하는 70가지 패턴 전략
베스트
OS/데이터베이스 76위 OS/데이터베이스 top20 1주
가격
35,000
10 31,500
YES포인트?
1,750원 (5%)
5만원 이상 구매 시 2천원 추가 적립
결제혜택
카드/간편결제 혜택을 확인하세요

이미 소장하고 있다면 판매해 보세요.

  •  해외배송 가능?
  •  문화비소득공제 신청가능

상세 이미지

책소개

목차

CHAPTER 1 데이터 엔지니어링 디자인 패턴 소개
_1.1 디자인 패턴이란 무엇인가?
_1.2 기존 디자인 패턴만으로 충분한가?
_1.3 일반적인 데이터 엔지니어링 패턴
_1.4 이 책에서 사용된 사례
_1.5 요약

CHAPTER 2 데이터 수집 디자인 패턴
_2.1 전체 적재
패턴 #01: 전체 로더
_2.2 증분 적재
패턴 #02: 증분 로더
패턴 #03: 변경 데이터 캡처
_2.3 복제
패턴 #04: 패스스루 복제기
패턴 #05: 변환 복제기
_2.4 데이터 컴팩션
패턴 #06: 컴팩터
_2.5 데이터 준비
패턴 #07: 준비 마커
_2.6 이벤트 주도
패턴 #08: 외부 트리거
_2.7 요약

CHAPTER 3 오류 관리 디자인 패턴
_3.1 처리할 수 없는 레코드
패턴 #09: 데드 레터
_3.2 중복된 레코드
패턴 #10: 윈도 중복 제거
_3.3 지연 데이터
패턴 #11: 지연 데이터 탐지기
패턴 #12: 정적 지연 데이터 통합기
패턴 #13: 동적 지연 데이터 통합기
_3.4 필터링
패턴 #14: 필터 인터셉터
_3.5 내결함성
패턴 #15: 체크포인터
_3.6 요약

CHAPTER 4 멱등성 디자인 패턴
_4.1 덮어쓰기
패턴 #16: 빠른 메타데이터 정리기
패턴 #17: 데이터 덮어쓰기
_4.2 갱신
패턴 #18: 병합기
패턴 #19: 상태 저장 병합기
_4.3 데이터베이스
패턴 #20: 키 기반 멱등성
패턴 #21: 트랜잭션 기반 작성자
_4.4 불변의 데이터셋
패턴 #22: 프록시
_4.5 요약

CHAPTER 5 데이터 가치 디자인 패턴
_5.1 데이터 강화
패턴 #23: 정적 조이너
패턴 #24: 동적 조이너
_5.2 데이터 데코레이션
패턴 #25: 래퍼
패턴 #26: 메타데이터 데코레이터
_5.3 데이터 집계
패턴 #27: 분산 집계기
패턴 #28: 로컬 집계기
_5.4 세션화
패턴 #29: 증분 세션화 처리기
패턴 #30: 상태 저장 세션화 처리기
_5.5 데이터 정렬
패턴 #31: 빈 팩 정렬기
패턴 #32: 선입 선출 정렬기
_5.6 요약

CHAPTER 6 데이터 흐름 디자인 패턴
_6.1 시퀀스
패턴 #33: 로컬 시퀀서
패턴 #34: 독립된 시퀀서
_6.2 팬인
패턴 #35: 정렬된 팬인
패턴 #36: 비정렬 팬인
_6.3 팬아웃
패턴 #37: 병렬 분할
패턴 #38: 배타적 선택
_6.4 오케스트레이션
패턴 #39: 단일 실행기
패턴 #40: 동시 실행기
_6.5 요약

CHAPTER 7 데이터 보안 디자인 패턴
_7.1 데이터 제거
패턴 #41: 수직 파티셔너
패턴 #42: 제자리 덮어쓰기
_7.2 접근 제어
패턴 #43: 테이블에 대한 세밀한 접근자
패턴 #44: 자원에 대한 세밀한 접근자
_7.3 데이터 보호
패턴 #45: 암호화기
패턴 #46: 익명화기
패턴 #47: 의사 익명화기
_7.4 연결성
패턴 #48: 비밀 포인터
패턴 #49: 비밀 없는 커넥터
_7.5 요약

CHAPTER 8 데이터 스토리지 디자인 패턴
_8.1 파티셔닝
패턴 #50: 수평 파티셔너
패턴 #51: 수직 파티셔너
_8.2 레코드 구성
패턴 #52: 버킷
패턴 #53: 정렬기
_8.3 조회 성능 최적화
패턴 #54: 메타데이터 강화기
패턴 #55: 데이터셋 구체화기
패턴 #56: 매니페스트
_8.4 데이터 표현
패턴 #57: 정규화기
패턴 #58: 역정규화기
_8.5 요약

CHAPTER 9 데이터 품질 디자인 패턴
_9.1 품질 확보
패턴 #59: 감사-쓰기-감사-배포(AWAP)
패턴 #60: 제약 조건 적용자
_9.2 스키마 일관성
패턴 #61: 스키마 호환성 적용자
패턴 #62: 스키마 마이그레이터
_9.3 품질 관찰
패턴 #63: 오프라인 옵서버
패턴 #64: 온라인 옵서버
_9.4 요약

CHAPTER 10 데이터 관찰 가능성 디자인 패턴
_10.1 데이터 탐지기
패턴 #65: 흐름 중단 탐지기
패턴 #66: 스큐 탐지기
_10.2 시간 탐지기
패턴 #67: 지연 탐지기
패턴 #68: SLA 위반 탐지기
_10.3 데이터 계보
패턴 #69: 데이터셋 추적기
패턴 #70: 세밀한 추적기
_10.4 요약

APPENDIX 디자인 패턴 요약

저자 소개2

바르토시 코니에치니

관심작가 알림신청
 

Bartosz Konieczny

2010년부터 개발을 시작해 현재 프리랜서 데이터 엔지니어로 활동하고 있다. 엔지니어링 전반에 깊은 관심을 갖고 있다. 커리어 전반에 걸쳐 주요 퍼블릭 클라우드 서비스와 함께 아파치 스파크(Apache Spark), 아파치 플링크(Apache Flink), 아파치 에어플로(Apache Airflow), PostgreSQL, 델타 레이크(Delta Lake) 등 다양한 오픈 소스 기술을 활용하며 세션화, 데이터 수집과 정제, 순서가 있는 데이터 처리, 데이터 마이그레이션 등 폭넓은 데이터 엔지니어링 과제를 해결해 왔다.
RSQUARE의 DATA 기술 팀 팀장이자 데이터 엔지니어로, 열정적인 동료들과 함께 여러 가지 데이터 과제를 수행하고 있다. SK AX 클라우드 컴퓨팅 기술 팀 및 클라우드 아키텍트 유닛을 거쳐, CNCITY에너지 AI 솔루션 팀에서 데이터 엔지니어로 근무했다. 다양한 분야의 데이터에 관심이 많으며 글쓰기를 좋아한다.

김인범의 다른 상품

품목정보

발행일
2026년 01월 30일
쪽수, 무게, 크기
408쪽 | 730g | 183*235*16mm
ISBN13
9791175790117

출판사 리뷰

처음부터 다시 만들 필요는 없다
답은 이미 패턴에 있다

데이터 엔지니어링에서도 디자인 패턴은 이제 선택이 아닌 필수적인 사고 도구로 자리 잡고 있습니다.
이 책은 소프트웨어 엔지니어링 분야에서 검증된 디자인 패턴 개념을 데이터 엔지니어링으로 확장해, 이 영역에서 디자인 패턴이 무엇을 의미하는지부터 차근차근 설명합니다.
데이터 수집을 출발점으로 오류 관리와 멱등성, 재시도와 백필 시나리오까지 실제 파이프라인에서 반드시 마주치는 문제를 설계 관점에서 살펴봅니다. 이어 데이터 가치를 창출하기 위한 데이터 결합과 흐름 설계, 보안과 스토리지 전략을 통해 파이프라인을 조직 전체의 데이터 아키텍처로 확장하는 방법을 다룹니다. 또한 데이터 품질과 관찰 가능성 패턴을 통해 문제를 사전에 감지하고, 신뢰할 수 있는 데이터 시스템을 구축하는 접근법을 제시합니다.
각 장은 특정 기술에 대한 설명이 아니라, 반복적으로 등장하는 문제와 그에 대한 검증된 해결 구조에 초점을 맞춰 환경이 달라져도 적용 가능한 기준을 제공합니다.
이 책을 통해 독자는 복잡한 데이터 파이프라인을 보다 체계적으로 사고하고, 상황에 맞는 설계 결정을 내리는 데 필요한 데이터 엔지니어링 디자인 패턴의 핵심을 익힐 수 있습니다.

추천평

이 책은 데이터 엔지니어링 디자인 패턴의 미래를 제시하는 획기적인 작품으로, 모든 데이터 전문가가 반드시 읽어야 할 필독서입니다. GoF(Gang of Four)의 Design Patterns이 소프트웨어 설계의 기준을 세웠다면, 이 책은 데이터 엔지니어링 분야에서 그에 버금가는 중요성을 지닙니다. - 스콧 헤인스 (『Delta Lake: The Definitive Guide』 공저자)
데이터 엔지니어링은 종종 같은 문제를 반복해서 해결하는 일처럼 느껴집니다. 저자는 이 책을 통해 그런 인식을 완전히 바꿔 놓았습니다. 멱등성부터 오류 처리, 데이터 관찰 가능성까지 폭넓게 다루며, 재사용 가능하고 검증된 디자인 패턴으로 탄력적인 데이터 파이프라인을 구축하는 완벽한 가이드를 제시합니다. - 아디 폴락 (콘플루언트 이사)
이 책은 데이터 수집부터 관찰 가능성까지의 전 과정을 70가지 표준 디자인 패턴으로 체계화했습니다. '멱등성' '데이터 가치' 등 실무 기법을 명확히 정의하여 엔지니어링 문제 해결의 기준을 제시하며, 단계별 트레이드오프를 미리 검토하게 하여 고민을 덜어줍니다. 특히 코드 예제와 도커 환경을 제공해 디자인 패턴을 즉시 실무에 적용할 수 있도록 도와줍니다. 표준화된 패턴으로 팀 내 기술 언어를 통합하고 아키텍처의 완성도를 높이고 싶은 엔지니어에게 이 책을 추천합니다. - 김시온 (네이버 웹툰 데이터 엔지니어)
하나의 장비 안에 머물던 데이터를 넘어, 빅데이터 시대에는 상상할 수 없을 만큼 방대한 데이터를 다루게 되었습니다. 여러 곳에 흩어진 데이터를 수집하고 가공해 의미 있는 결과를 만들어 내는 일은 이제 매우 복잡하고 까다로운 과제입니다.

이 책은 데이터를 어떻게 다루고, 상황에 맞게 가공하며, 시간의 흐름에 따라 어떻게 진화시켜야 하는지를 중심으로 데이터 처리 파이프라인 전반을 다룹니다. 빠르게 변하는 환경 속에서도 기준이 될 수 있는 원칙을 ‘패턴’으로 정리해, 데이터 엔지니어링의 본질에 집중할 수 있도록 안내합니다. - 윤병조 (소프트웨어 개발자)
현업 데이터 엔지니어의 관점에서 수집, 오류 관리, 멱등성, 품질, 관찰 가능성까지 데이터 파이프라인에서 반복적으로 마주치는 핵심 요소들을 ‘패턴’으로 정리한 실무형 레퍼런스입니다. 기술 스택과 무관하게 재사용할 수 있는 트레이드오프와 주의점을 중심으로 설명과 예제를 구성해, 데이터 파이프라인 설계 시 의사결정의 속도와 품질 기준을 동시에 끌어올려 주는 필수 지침서입니다. - 이동규 (데이터 엔지니어)

리뷰/한줄평12

리뷰

9.8 리뷰 총점

한줄평

10.0 한줄평 총점

클린봇이 부적절한 글을 감지 중입니다.

설정
31,500
1 31,500