언어 조사 기관 글로벌 랭귀지 모니터(Global Language Monitor)에 따르면 현재 등록된 영어 단어 수는 1,076,043.4개 정도입니다. 하지만 영어를 유창히 구사하는 일반 성인이 아는 단어는 고작 2만~3.5만 개 수준에 불과합니다. 모든 단어를 다 알지 못한다고 해서 ‘유창하지’ 못하다고 할 수 있을까요? 그렇지 않습니다. 파이썬 같은 프로그래밍 언어를 배우는 것은 영어 같은 언어를 배우는 것에 매우 유사합니다.
--- p.17, 「1장 | 파이썬 시작하기」중에서
파이썬의 공식 스타일 지침에 따르면 변수 이름은 ‘가독성을 위해 소문자 단어로, 단어가 여러 개일 때는 각 단어를 언더스코어로 구분’하여 작성해야 합니다. 이 책도 이 규칙을 따릅니다. 프로그래밍의 세계에는 두 종류의 규칙이 있습니다. 반드시 따라야 하는 규칙과 따르도록 권장하는 관례죠. 여기서 관례란 사용자 커뮤니티가 명시적 또는 암묵적으로 코드를 작성하는 표준적인 방법을 합의한 결과입니다. 그 목표는 바로 다른 사람의 코드를 쉽게 읽고, 이해하고, 공유하기 위함입니다. 변수에 이름을 붙이는 지침 또한 이런 관례이며, 따르는 것이 좋습니다.
--- p.80, 「2장 | 파이썬의 기본기 1」중에서
파이썬에서 들여쓰기는 매우 중요합니다. 파이썬에서는 코드를 들여쓰기 할 때 탭(탭 키) 또는 네 번의 공백 문자(네 번의 스페이스 바)가 사용되곤 합니다. 어느 것을 써야 하는지는 개발자들 사이에서 오랜 논쟁거리입니다. 만약 탭과 공백을 혼용해서 들여쓰기를 하면 실행 시 오류가 발생합니다. 대부분의 개발자들은 현실적인 대안으로, 텍스트 편집기가 탭을 네 개의 공백으로 자동 변환하도록 설정하곤 합니다. 그리고 VS Code 편집기는 이와 같은 자동 변환을 기본적으로 수행합니다.
--- p.112, 「3장 | 파이썬의 기본기 2」중에서
코딩에는 ‘기술 부채(technical debt)’라는 중요한 개념이 있습니다. 완벽하지 못한 코드의 작은(때로는 큰) 문제가 쌓여 발생하는 문제로, 비효율적인 코드, 가독성이 떨어지는 코드, 유연성을 갖추지 못한 코드 등의 문제가 여기 포함됩니다. 지속적으로 유사한 기능의 코드를 작성하다 보면 완벽하지 못한 코드의 사소한 문제가 기술 부채로 쌓이고, 결국 언젠가는 그 부채를 ‘청산’해야 하는 시점이 도래합니다. 따라서 여러분이 작성한 코드를 되돌아보고, 개선의 여지가 있다면 이를 수정(리팩터링)하는 것이 좋습니다.
--- p.187~188, 「4장 | 파이썬의 기본기 3」중에서
5장에서는 파이썬으로 데이터 관련 작업을 하는 데 필요한 기본적인 도구를 배웁니다. 먼저 지금껏 사용해온 콘솔이나 명령줄보다 파이썬과 훨씬 풍부하게 상호작용을 하도록 해주는 주피터 노트북(Jupyter Notebook)을 배웁니다. 그다음으로 가장 인기 있는 데이터 분석용 패키지인 판다스(pandas)를 다룹니다. 판다스로 다양한 유형의 데이터를 읽고 쓰는 법, 나중에 작업을 이어나가거나 공유할 목적으로 데이터를 디스크에 저장하는 법을 차례로 배웁니다.
--- p.253, 「5장 | 파이썬으로 데이터 다루기」중에서
데이터를 다루는 사람들 사이에선 날짜에 대한 인식이 나쁜 편입니다. 그 이유는 날짜를 다루는 작업이 꽤 고통스러울 정도로 까다롭기 때문입니다. 데이터 과학자의 기분을 망치는 가장 빠른 방법은 여러 시간대로 표현된 날짜를 포함한 데이터세트를 처리해달라고 부탁하는 것이라는 말이 있을 정도죠. 좋은 소식은 판다스가 이 작업을 꽤 쉽게 만들어준다는 것입니다. 한 가지 기억해두세요. 판다스에서는 dt에 접근하여 모든 날짜/시간에 관한 기능을 사용할 수 있습니다.
--- p.319, 「6장 | 데이터 탐색, 변형, 그리기」중에서
판다스에는 테이블을 조합하는 수많은 방법이 존재합니다. 어느 것을 사용해야 할지 갈피를 잡기 어려울 정도죠. 하지만 대부분의 방법으로 얻는 결과물은 거의 같습니다(테이블 조합이 그만큼 중요하다는 증거로 받아들여도 좋습니다). 초심자에게는 테이블 조합이라는 주제만으로도 충분히 복잡하니 다른 대안까지 살펴보며 혼란을 겪을 필요는 없습니다. 따라서 이번 절은 한 가지 방법으로 조인(join; 병합)을 골라서 다룹니다.
--- p.364, 「7장 | 여러 데이터세트 다루기」중에서
이제 마지막 주제인 취합(aggregation)을 배울 준비가 됐습니다. 조인과 함께 취합은 판다스가 제공하는 가장 유용한 기능입니다. 여러 열을 조합하고 일부 요약 통계를 계산하는 모든 경우에 유용하게 쓰입니다. 엑셀 피벗 테이블의 강화된 버전쯤으로 볼 수 있습니다.
--- p.394, 「8장 | 데이터 취합하기」중에서
신규 상품을 어느 매장에 언제(연도) 출시하면 좋을지 데이터로 답을 구해보고자 합니다. 혹시 이 질문과 지금까지 우리가 풀어온 질문의 차이를 눈치챘나요? 지금까지 질문의 대부분은 데이터의 맥락에서 표현됐습니다. 따라서 데이터로 답을 구할 방향이 명확했죠. 하지만 이번 질문은 어떻게 데이터로 풀어야 할지가 분명하지 않습니다. 따라서 문제를 데이터의 맥락에서 다시 정의할 필요가 있습니다.
--- p.424, 「9장 | 연습 문제」중에서