이 상품은 구매 후 지원 기기에서 예스24 eBook앱 설치 후 바로 이용 가능한 상품입니다.
|
1장. 헬스케어 개론1.1 헬스케어란 무엇인가?1.1.1 헬스케어 비용1.1.2 헬스케어 기술의 진보와 질병1.1.3 인간의 수명 연장과 기대1.1.4 현대인의 고질병인 걱정과 두려움, 스트레스1.1.5 환자 정보와 프라이버시 보호1.2 헬스케어의 종류와 최신 기술 트렌드1.2.1 디지털 헬스케어의 종류1.2.2 최신 기술 트렌드 및 사례1.3 헬스케어 기업들의 특징1.4 헬스케어 빅데이터란 무엇인가?1.4.1 헬스케어 빅데이터 분석의 위치1.5 향후 전망마치며2장. 빅데이터 분석, 알고리듬, 머신러닝, 인공지능 개론2.1 빅데이터 분석2.1.1 빅데이터와 정보의 중요성2.1.2 빅데이터 분석2.1.3 빅데이터 분석가와 데이터 과학자2.1.4 빅데이터 처리 과정2.2 알고리듬2.3 인공지능, 머신러닝, 딥러닝2.3.1 머신러닝의 3가지 학습 방법2.3.2 ChatGPT향후 전망마치며3장. 파이썬 설치 및 환경 구축하기3.1 파이썬 설치하기3.2 IPython 알아보기3.3 주피터 랩 알아보기3.3.1 주피터 랩 설치3.3.2 주피터 노트북의 명령 모드 3.4 VSCode를 주피터처럼 사용하기3.5 데이터 분석용 필수 라이브러리 설치하기3.5.1 NumPy3.5.2 pandas3.5.3 matplotlib3.5.4 scikit-learn3.5.5 statsmodels3.6 권장 시스템마치며4장. 파이썬 기본 문법과 빌트인 자료형 알아보기4.1 파이썬 문법4.1.1 주석4.1.2 함수4.1.3 익명 함수: 람다 함수4.1.4 흐름 제어문4.2 자료형4.2.1 리스트 4.2.2 튜플 4.2.3 딕셔너리4.2.4 집합마치며5장. NumPy 알아보기5.1 파이썬 리스트와 배열5.2 NumPy 알아보기5.3 ndarray(다차원 배열 객체) 다루기5.3.1 생성하기5.3.2 표준 데이터 타입5.3.3 속성: 차원 수와 모양새, 데이터 타입5.3.4 전치5.3.5 인덱싱과 슬라이싱5.3.6 배열 모양새 바꾸기5.3.7 팬시 인덱싱5.3.8 배열의 산술 연산5.3.9 배열 합치기 및 나누기5.3.10 조건문으로 배열 추출하기(데이터 마스킹) 5.4 유니버설 함수5.4.1 대표적인 단항 유니버설 함수5.4.2 대표적인 이항 유니버설 함수5.4.3 합, 평균, 표준편차, 분산, 누적값 구하기5.4.4 난수 생성하기5.4.5 그 외 유니버설 함수5.5 배열 정렬하기5.6 배열 집합 메서드5.7 저장하기 및 불러오기5.8 1차원 배열로 변형하기5.9 브로드캐스팅5.10 구조화된 배열5.11 그 외 유용한 함수마치며6장. pandas 알아보기6.1 데이터 타입6.2 시리즈 6.2.1 딕셔너리로부터 시리즈 생성하기6.2.2 명시적 인덱싱과 암묵적 인덱싱6.2.3 조건문으로 배열 추출: 마스킹 6.2.4 벡터 연산6.2.5 그 외6.3 데이터프레임 6.3.1 전치 6.3.2 슬라이싱6.3.3 슬라이싱으로 역순 정렬하기6.3.4 마스킹6.3.5 데이터 연산하기6.4 누락된 데이터 다루기6.4.1 결측치 관련 메서드6.4.2 결측치 데이터 조사하기6.4.3 결측치 데이터 추출하기6.4.4 결측치 집계 구하기6.4.5 결측치를 특정값으로 채워넣기6.4.6 결측치 데이터 처리하기6.4.7 결측치 제거하기6.5 Index 6.5.1 멀티(계층적)인덱스6.5.2 인덱스로 데이터 접근하기6.5.3 인덱스 설정 및 해제하기6.5.4 간단한 집계 및 통계6.6 데이터 합치기6.6.1 concat 함수6.6.2 append 메서드6.6.3 insert 메서드6.6.4 merge 함수와 메서드6.6.5 join 메서드6.6.6 combine 메서드6.6.7 combine_first 메서드6.6.8 update 메서드6.7 집계 및 통계 구하기6.7.1 rolling 및 expanding 메서드6.8 groupby 메서드6.8.1 aggregate/agg 메서드6.8.2 filter 메서드6.8.3 apply 메서드6.8.4 map 메서드6.8.5 applymap 메서드6.8.6 transform 메서드6.9 상관관계 및 공분산 구하기6.9.1 corr 메서드6.9.2 corrwith 메서드6.9.3 cov 메서드6.10 중복, 유일 요소 다루기6.11 데이터 피벗과 피벗테이블 구하기6.11.1 pivot 메서드6.11.2 pivot_table 함수와 메서드6.11.3 melt 메서드6.12 문자열 다루기6.12.1 정규표현식6.13 query 및 eval 메서드6.13.1 query 메서드6.13.2 eval 메서드6.14 시계열 데이터 다루기6.14.1 date_range 함수6.14.2 DatetimeIndex 만들기6.14.3 PeriodIndex 만들기6.14.4 TimedeltaIndex 만들기6.14.5 리샘플링하기6.14.6 shift 및 tshift 메서드6.15 카테고리(범주형) 데이터 다루기6.16 파일로부터 읽어오기 및 저장하기6.16.1 파일로부터 읽어오기6.16.2 파일로 저장하기6.17 그 외 메서드와 속성마치며7장. 데이터 수집과 전처리하기7.1 데이터 전처리에 앞서7.2 데이터 수집하기7.2.1 웹 크롤링7.2.2 DBMS로부터 CSV 파일 만들기7.3 데이터 전처리7.3.1 정제하기7.3.2 정규표현식으로 치환하기7.3.3 열 선택해서 수정하기마치며8장. 사례#1-데이터를 시각화해 보기8.1 MySQL 테이블에서 CSV 파일 추출하기8.1.1 MySQL shell 접속하기8.1.2 MySQL 사용자 권한 부여하기8.1.3 쿼리 결과를 CSV 파일로 저장하기8.2 히트맵 그래프로 시각화해 보기8.2.1 CSV 파일 내용 살펴보기8.2.2 시각화해 보기8.2.3 여러 그래프를 만들어 보기8.2.4 일부 데이터 제외한 그래프 만들어 보기마치며9장. 사례#2-시계열 데이터 다루기9.1 쿼리 결과를 CSV 파일로 저장하기9.2 시계열 데이터 시각화9.2.1 데이터의 정제9.2.2 활동지수 평가 함수 만들기9.2.3 10분 단위로 그룹화하기9.2.4 1시간 단위로 그룹화하기9.2.5 1일 단위로 그룹화하기9.3 1일 데이터 시각화9.3.1 데이터 정제 및 시각화9.3.2 그래프를 4개로 나열하기마치며10장. 사례#3-누적 막대그래프와 회귀 분석해 보기10.1 CSV 파일 살펴보기10.2 센서 29개의 한 달간 상태별 집계 데이터 시각화10.3 특정 센서의 활동 누적 데이터 비교10.4 주의와 낙상의 상관관계10.5 주의와 낙상 회귀 분석해 보기마치며11장. 자동화 및 웹 대시보드 만들어 보기11.1 배치 프로그램이란?11.2 구글 파이어베이스 다루기11.2.1 파이어베이스 실시간 DB 프로젝트 설정하기11.2.2 분석한 데이터를 파이어베이스 실시간 DB에 업로드하기11.3 웹 대시보드 만들기11.3.1 자바스크립트에서 파이어베이스 연동하기11.3.2 라인 차트 그래프 만들기11.3.3 누적 막대그래프 만들기11.4 자동화 시스템 구축하기11.4.1 크론탭으로 자동화하기11.4.2 파이썬 scheduler 라이브러리로 자동화하기11.4.3 윈도우 작업 스케줄러로 자동화하기마치며
|
|
이 책에서 다루는 내용-헬스케어와 빅데이터, AI(인공지능) 개론-IPython, 주피터 노트북, VSCode 사용법-파이썬의 기본 문법-NumPy 라이브러리 사용법-데이터 분석의 핵심 pandas 라이브러리 사용법-사례에 기초한 데이터 수집과 전처리-DBMS로부터 분석 대상 데이터를 파일로 추출-사례에 기초한 시계열 데이터 정제 및 분석, 그룹화, 시각화-사용자 정의 함수로 데이터 분석 고도화-자동화를 위한 배치 프로그램 작성 및 크론탭, scheduler 라이브러리 사용법-간단한 웹 대시보드 제작이 책의 대상 독자컴퓨터공학 전공자 및 보건 의료 종사자, 카드사, 보험사 직원 등으로, 파이썬을 활용한 빅데이터 분석 경험이 풍부하지 않은 사람을 대상으로 한다. 파이썬 지식이 부족한 독자들도 쉽게 따라올 수 있도록 구성했다.-파이썬으로 빅데이터를 분석하고 싶은 입문자-시계열 데이터를 다양한 기법으로 분석, 그룹화, 시각화하기를 원하는 독자-실제 IT기업에서 빅데이터 분석 및 시각화를 어떻게 구현하는지 궁금한 독자-상업용 빅데이터 분석과 자동화 시스템 구축, 웹 대시보드를 만들고 싶은 독자-파이썬의 기초부터 pandas 라이브러리 사용법 레퍼런스가 필요한 독자이 책의 구성처음 책을 기획할 때에는 사례 중심으로 책을 구성하고, 파이썬 문법 및 pandas에 대해서는 간략하게 다룰 계획이었다. 그러나 책을 집필하는 과정에서 다른 서적의 pandas 내용에 대한 불만족감이 생겨, 이 책이 분석 업무를 수행할 수 있는 완결된 가이드가 되도록 NumPy와 pandas를 상세하게 다루게 됐다. 다만, matplotlib은 이번에는 포함하지 않았다. matplotlib의 사용 방법은 어렵지 않아, 다른 서적이나 인터넷 자료를 참조하면 충분할 것이다.지은이의 말저자는 2021년에 헬스케어 IT 벤처기업 빅헤브솔루션㈜을 창업해 기술 개발을 총괄하고 있다. 업무를 수행하면서 빅데이터 분석 및 시각화 관련 컨설팅 및 구축 의뢰를 종종 받게 되며, 고객들의 주요 고충은 다음과 같다.-파이썬이 어렵다.-numpy와 pandas에 대한 이해가 부족하다.-데이터 정제 방법이 막연하다.-데이터 시각화 방법을 잘 모르겠다.-보고서 및 논문 작성 시, 데이터 정제 및 분석에 많은 시간이 소요된다.-사이렌케어(저자가 근무하는 회사의 헬스케어 솔루션 상표, 호메로스가 지은 오디세이아 책 속 세이렌 자매에 영감을 받아, 솔루션 이름을 사이렌케어로 지었다) 데이터 가운데 의미 있는 정보만 요약 추출하고 싶다.저자 역시 헬스케어 빅데이터 분석 및 시각화 개발 과정에서 파이썬에 기초한 빅데이터 분석 및 머신러닝 책을 다수 읽었다. 하지만 헬스케어 분야에 특화된 유용한 책을 찾기는 어려웠다. 특히 헬스케어 빅데이터 관련 서적의 저자 대부분은 컴퓨터공학 전공자가 아닌 의료 종사자였고, 이들 저서는 데이터 처리 알고리즘 및 시각화에 관해 상세하게 다루지 않았고, 대부분 의료 관련 내용으로 채워져 있었다. 특히 예제 코드를 주목해 살펴볼 때, 인터넷에 공개된 데이터를 예시로 사용해 데이터 정제 및 조작, 그리고 일부 시각화에 그치는 경우가 많았으며, 실제 업무에 큰 도움이 되지 않았다.저자의 아내는 국내 유명 경제연구소에서 연구원으로 근무하는 경제학 박사인데, 때때로 빅데이터 분석 및 딥러닝 구현 방법에 관해 저자에게 조언을 구한다. 이럴 때마다 저자는 참고할 만한 서적 또는 웹사이트를 소개해준다. 아내는 바쁜 경제학자들도 쉽게 이해하고 따라갈 수 있는, 표보다는 차트가 많고 일목요연하게 정리된 책이 필요하다고 강조했다. 또한, 저자의 고객 중 보험사 및 병원 의료진, 카드사 직원들로부터도 파이썬을 이용한 분석 방법에 관한 많은 질문을 받았다. 이에 저자는 컴퓨터 전문가가 아닌 분들도 현업에서 파이썬을 이용해 쉽게 빅데이터 분석과 시각화를 할 수 있는 책을 출판하기로 결심했다.최근 헬스케어 분야는 IoT(Internet of Things, 사물인터넷)에서 IoB(Internet of Bodies, 신체인터넷) 영역까지 확대되는 중이다. 따라서 피보호자의 움직임 및 활동 정보에 기초한 분석 내용을 다루는 이 책이 관련 분야 종사자들에게 도움이 될 것이라 생각한다. 이와 더불어, 주변 사람들의 의견을 충분히 참고해 여러 책을 참조하지 않아도 헬스케어 빅데이터 분석이 가능하도록 책을 구성했다. 또한, 이 책 하나만으로 입문자와 중간 수준의 파이썬 데이터 분석가들이 분석 업무를 수행할 수 있게 작성했다. 이 책이 독자들의 본업에 도움이 되기를 바란다.
|