| 이 책은 관찰 가능성(observability) 엔지니어링을 주제로 하여, 단순한 모니터링과의 차이점을 심도 있게 탐구한다. 저자는 어떻게 관찰 가능성이 기술적 문제를 해결하고 시스템 이해를 증진시키는 데 중요한 역할을 하는지를 설명합니다. 특히 데이터독(Datadog)과 같은 도구를 사용하여 마이크로서비스와 분산 시스템을 효율적으로 모니터링하는 방법에 대해 설명하면서, 단순한 메트릭스로는 파악하기 어려운 복잡한 문제들을 어떻게 쉽게 발견하고 해결할 수 있는지를 보여준다. 이 책은 데브옵스 엔지니어 뿐만 아니라 백엔드 엔지니어에게도 유용하다. 저자는 이미 구축된 솔루션을 사용하는 것을 권장하지만, Pinpoint와 같은 강력한 무료 툴을 사용하는 방법도 제시한다. 이러한 툴들이 기술적으로 어떻게 작동하는지 이해한다면 사용자는 더 빠르게 적응하고 이를 효율적으로 활용할 수 있게 된다. 책은 신뢰할 수 있고 실행 가능한 알람 설정의 중요성을 강조하며, 이는 독자에게 많은 공감을 불러일으킨다. 전반적으로 이 책은 관찰 가능성의 중요성과 실행에 대한 실질적인 지식을 제공함으로써, 기술 스택을 최적화하려는 모든 개발자에게 필수적인 추천드리는 자료입니다. |
|
이 책은 현대 소프트웨어 개발과 운영 환경에서 날로 그 중요성이 커지고 있는 ‘관찰 가능성(Observability)’에 대해 포괄적이고 심도 있게 다루고 있다. 총 5개의 PART로 구성된 이 책은 관찰 가능성의 기본 개념부터 실제 적용 방법, 그리고 조직 문화에 미치는 영향까지 광범위한 내용을 체계적으로 설명하고 있다. 개념의 명확한 정립관찰 가능성의 개념을 명확히 정의하고, 기존의 모니터링과의 차이점을 상세히 설명하고 있어 관찰 가능성이 왜 현대 소프트웨어 시스템에서 필수적인지를 이해하는데 도움이 된다. 실용적인 접근OpenTelemetry와 같은 실제 도구를 활용한 구현 방법을 상세히 다루고 있다. 현대적인 소프트웨어 개발 트렌드와의 연계클라우드 네이티브 환경, 마이크로서비스 아키텍처 등 현대적인 소프트웨어 개발 트렌드와 관찰 가능성의 연관성을 잘 설명하고 있다. 관찰 가능성이 현대 소프트웨어 개발 생태계에서 어떤 역할을 하는지 이해할 수 있다. 데이터 기반 문제 해결 접근법 소개관찰 가능성을 통해 수집된 데이터를 활용한 문제 해결 방법을 상세히 설명하고 있어 실제 상황에서 데이터를 어떻게 해석하고 활용할 수 있는지에 대한 아이디어를 얻을 수 있다. SLO 개념서비스 수준 목표(SLO)와 같은 실용적인 개념을 소개하고, 이를 관찰 가능성과 연계하여 설명하고 있다. 관찰 가능성이 실제 비즈니스 목표와 어떻게 연결되는지 이해하는데 도움이 되었다. 조직 문화와의 연계관찰 가능성을 조직에 도입하고 확산시키는 방법에 대해 상세히 다루고 있다. 이는 기술적인 측면뿐만 아니라 조직 문화의 변화까지 고려한 포괄적인 접근 방식이다. 새로운 기술이나 방법론 등을 도입할 때는 조직에서 저항이 있을 수 밖에 없는데 이런 부분까지 고려한 점이 좋았다. 사례 연구의 풍부한 활용Parse, 슬랙, 허니컴과 같은 실제 기업들의 사례를 통해 관찰 가능성의 실제 적용 사례와 그 효과를 통해 실제 기업에서 어떻게 적용되는지에 대해 이해할 수 있어 좋았다. 효율적인 데이터 스토리지, 샘플링 전략관찰 가능성 시스템의 효율적인 데이터 관리와 처리에 대해 다루고 있다. 데이터 스토리지에 대한 요구사항을 분석하고, 시계열 데이터베이스의 한계점을 설명하며, 허니컴 리트리버 사례를 통해 효율적인 데이터 저장 및 쿼리 전략을 소개한다. 데이터 수집 최적화를 위한 다양한 샘플링 전략을 다루며, 고정 확률, 트래픽 기반, 콘텐츠 기반 등의 접근 방식과 이들의 코드 구현 방법을 설명한다. 원격 측정 파이프라인 관리에 초점을 맞추어, 파이프라인의 주요 속성과 관리 과제를 논의하고, 슬랙의 사례 연구를 통해 실제 적용 사례를 보여준다. 또한 오픈소스 대안과 구축 vs 구매 결정에 대한 고려사항을 제시한다. 이를 통해 대규모 관찰 가능성 시스템 구축에 필요한 핵심 기술적 고려사항들을 알아볼 수 있다. 앞으로의 전망 제시관찰 가능성의 과거와 현재를 분석하고, 미래의 발전 방향에 대해서도 논의하고 있다. 이는 독자들이 장기적인 관점에서 관찰 가능성을 이해하는 데 도움을 준다. 비즈니스 가치관찰 가능성이 단순히 기술적인 도구가 아니라 비즈니스에 실질적인 가치를 제공할 수 있음을 강조하고 있다. 기술 결정권자들에게 관찰 가능성 도입의 필요성을 설득하는 데 도움이 될것 같다.
이 리뷰는 한빛미디어의 나는 리뷰어다 이벤트를 통해 책을 제공받아 작성했습니다. |
목차.Part 1 관찰 가능성으로 가는 길Chapter 1. 관찰 가능성이란?Chapter 2. 관찰 가능성과 모니터링의 디버깅은 어떻게 다를까?Chapter 3. 관찰 가능성 없이 확장하며 배운 교훈Chapter 4. 관찰 가능성은 어떻게 데브옵스, SRE, 클라우드 네이티브를 연결하는가Part 2 관찰 가능성 기초Chapter 5. 정형화된 이벤트: 관찰 가능성의 기본 구성 요소Chapter 6. 이벤트를 추적으로 연결하기Chapter 7. OpenTelemetry를 이용한 계측Chapter 8. 관찰 가능성 확보를 위한 이벤트 분석Chapter 9. 관찰 가능성과 모니터링 공존Part 3 팀을 위한 관찰 가능성Chapter 10. 관찰 가능성 사례 적용하기Chapter 11. 관찰 가능성 주도 개발Chapter 12. 신뢰성을 위한 SLO의 활용Chapter 13. SLO 기반 알람 대응과 디버깅Chapter 14. 관찰 가능성과 소프트웨어 공급망Part 4 규모에 맞는 관찰 가능성 시스템 구축Chapter 15. 투자 회수 관점에서 본 구축과 구매Chapter 16. 효율적인 데이터 스토리지Chapter 17. 샘플링: 비용과 정확성 모두를 위한 선택Chapter 18. 파이프라인을 이용한 원격 측정 관리Part 5 관찰 가능성 문화의 확산Chapter 19. 관찰 가능성 비즈니스 사례Chapter 20. 관찰 가능성의 이해관계자와 조력자Chapter 21. 관찰 가능성 성숙도 모델Chapter 22. 관찰 가능성의 미래들어가며.안녕하세요? 정리하는 개발자 워니즈입니다. 이번시간에는 데브옵스 엔지니어를 위한 실전 관찰 가능성 엔지니어링이라는 책을 리뷰를 해보려고합니다. 필자도 현재 DevOps Engineer로 로 근무한지 꽤 됐습니다. 데브옵스의 범주가 워낙 넓고 각 회사마다의 일하는 문화도 상이한데요. 여러가지 분야가 있겠지만 SRE영역에 관심이 많습니다. SRE는 데브옵스를 구현하여 실제 운영상의 많은 부분 안정화에 기여하는 역할을 한다고 생각하고있습니다. 자연스럽게 서비스 안정화를 고려하다보니 모니터링, 로그 수집, 어플리케이션 성능영역에 관심이 많아졌습니다. 이 책은 필자가 궁금해하던 영역을 모두 해소하게 해주는 책인것 같습니다. 관측 가능성 이란 시스템 내부를 살펴보지 않고도 연관 정보많으로 문제를 예방하고, 문제 발생시에는 손쉽게 유발 원인을 찾아 나갈 수 있도록 보조하는 장칠라고 생각합니다. 그럼 본격적으로 각 장마다의 어떤 이야기를 담고 있는지 서평해보겠습니다. ![]() Part 1. 관찰 가능성으로 가는 길이 파트에서는 옵저버빌리티에 대한 개념영역이라고 보면 될것 같습니다. 처음 접하는 사람에게는 관찰 가능성이 어떤 의미인지를 알 수 있습니다. 관찰 가능성은 엔지니어가 원격 측정 데이터를 유연한 방법을 통해 자유자재로 다루도록 해줌으로써, 예상치 못한 방식으로 발생한 모든 이슈의 근본적인 원인을 찾을 수 있다라고 되어있습니다. 이 파트에서 카디널리티, 디멘셔널리티에 대해서도 설명을 하고 있습니다. *카디널리티 : * 데이터베이스에서 카디널리티는 한 집합에 포함된 데이터 값의 고유성을 말합니다. 높은 카디널리티는 완전히 고유한 값들이 열에 많이 포함되어 있다는 것을 의미합니다. 디멘셔널리티 : 디멘셔널리티는 데이터의 키 개수에 관한 것입니다. 어떤 한 데이터에 대해서 시간, 앱, 호스트, 사용자, 엔드포인트, 상태로 정의된 스키마를 예로 들 수 있습니다. Parse라고 하는 기업사례를 들어가며 관찰 가능성 없이 애플리케이션을 확장하며 배운 교육에 대해서도 기술하고있습니다. 직접적인 사례를 들어 설명하니 좀 더 와 닿는 부분이 있어서 좋았습니다. Part2. 관찰 가능성 기초이 파트에서는 기술적인 측면에서 관찰 가능성을 깊이 살펴보고 관찰 가능한 시스템에서 특정 요구사항이 필요한 이유를 세부적으로 기술하고 있습니다. 비정형, 정형 이벤트에 대해서 설명하고, 이러한 데이터 형식은 나중에 분석을 하근ㅇ하게 해주는 원격 측정 정보를 위한 기본 데이터 형식이라는것을 설명합니다. 필자가 특히나 관심있게 본 분산 추적 개념에 대해서도 소개를 합니다. 예제코드까지 첨부되어 설명을 이해하기 쉽게 기술해두었습니다. 그리고 이러한 분산 추적이 가능하게 도와주는 OpenTelemetry라는 라이브러리에 대해서도 소개를 하고 있습니다. Part3. 팀을 위한 관찰 가능성1-2파트까지는 관측 가능성의 개념, 기술적 이해 그리고 이슈를 디버깅할 수 있는 패턴에 대해서 기술했다면, 이 파트부터는 여러 조직의 관찰 가능성 도입을 촉진시킬 수 있는 사회적, 문화적 변화에 초점을 맞추어 기술하고있습니다. 관찰 가능성을 처음 도입할 떄 팀이 직면하는 여러가지 공통적인 어려움에 대해서 기술하고있습니다. 막상 이 책이 좋았던 점이 여기에 있습니다. 단순히 옵저버빌리티에 대해서 소개하는 것이 아니라 사례를 기반으로 설명하고있고 실질적인 적용에 대해서 설명을 하고 있습니다. 관찰 가능성을 적용한 이후에는 각 개발자 혹은 운영자 입장에서 일하는 방식의 변화까지도 일으킨다고 기술되어있습니다. 현대 어플리케이션에서는 이러한 내용이 반드시 필요로 하기에 좋은 내용으로 다가왔습니다. 특히 요즘 필자가 관심을 갖고 있는 서비스 수준 목표(SLO) 대해서도 설명을 해주고있습니다. SLO와 SLI에 대한 설명 그리고 Budget을 통한 알림 관리등에 대해서 실제로 적용해볼 만한 내용들이 다수 기재되어있어서 너무 도움이 많이 되었습니다. Part4. 규모에 맞는 관찰 가능성 시스템 구축이 파트에서는 관찰 가능성이 성공적으로 채택되어 적절한 규모로 적용되면 무슨일이 일어나는지에 대해서 소개하고있습니다. 관찰 가능성을 위한 솔루션들은 시중에 많이 나와있습니다. 물론 오픈소스로도 제공을 해주고있고 상용툴도 다수 존재합니다. 관찰 가능성 솔루션을 외부에서 구매할 것인지 아니면 직접 구축할 것인지 의사 결정을 내리는 과정에 대해서도 소개가 되어있습니다. 특히나 대규모로 관찰 가능성 시스템을 운영하면 수집되는 모든 정보들을 저장할 저장소를 구성하는 방법도 필요하고 많은 양의 원격 측정 데이터를 관리하는 부담도 있는데 이런부분들에 대해서도 해소할 방법에 대해서 소개가 잘 되어있다고 생각합니다. Part 5. 관찰 가능성 문화의 확산관찰 가능성의 이론부터 기술적 이해, 팀을 위한 관찰 가능성 그리고 규모에 맞는 시스템 구축까지 설명이 이어졌습니다. 이 파트에서는 마지막으로 관찰 가능성이란 하나의 기술 혹은 단어가 아닌 그 이상의 의미를 지니고 문화로 이해를 하고있습니다. 이러한 문화가 어떻게 조직내 전파가 될 수 있을지에 대해서 소개하고있습니다. 관찰 가능성의 관행을 채택했을 때의 이점을 소개하며 책의 내용은 마무리 됩니다. 마치며..필자가 데브옵스 엔지니어 이면서 동시에 SRE에 대해서 관심이 많아서인지 책의 기본적인 내용들은 무리 없이 읽을 수 있었습니다. 더군다나 사례기반으로 설명이 되어있고 중간 중간 각 기업들에 디테일한 내용까지 섞여있어서 이해하는데 많은 도움이 되었습니다. 다만, 실질적으로 관찰 가능성을 도입하고자 했을 때 명확한 지침이라던지 예시를 좀더 활용했다면 좋았을 것 같다는 생각을 했습니다. 다소 이론적인 부분도 있고 텍스트 위주의 설명이다보니 내용을 잘 모르는 독자에게는 어려움으로 다가갈수도 있다는 생각을 해봤습니다. 책을 모두 읽고 난 뒤에는 관찰 가능성에에 대해서 좀 더 이해할 수 있는 계기가 되었습니다. 본 포스팅은 “한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.” |
|
"한빛미디어 < 나는리뷰어다 > 활동을 위해서 책을 제공받아 작성된 서평입니다." |