품목정보
발행일	2017년 02월 10일
쪽수, 무게, 크기	592쪽 \| 18825035mm
ISBN13	9788960779532
ISBN10	8960779539

더보기

이 상품의 태그

#데이터마이닝

컨버티드: 마음을 훔치는 데이터분석의 기술

16,020원 (10%)

'컨버티드: 마음을 훔치는 데이터분석의 기술' 상세페이지 이동

바로 시작하는 태블로

27,000원 (10%)

'바로 시작하는 태블로' 상세페이지 이동

데이터 마이닝

45,000원 (0%)

'데이터 마이닝' 상세페이지 이동

데이터 분석으로 배우는 파이썬 문제 해결

23,850원 (10%)

'데이터 분석으로 배우는 파이썬 문제 해결' 상세페이지 이동

R을 이용한 데이터 처리&분석 실무

32,400원 (10%)

'R을 이용한 데이터 처리&분석 실무' 상세페이지 이동

데이터 마이닝 개념과 기법

45,000원 (10%)

'데이터 마이닝 개념과 기법' 상세페이지 이동

인공지능 개념 및 응용

30,000원 (0%)

'인공지능 개념 및 응용' 상세페이지 이동

잡아라! 텍스트 마이닝 with 파이썬

15,300원 (10%)

'잡아라! 텍스트 마이닝 with 파이썬' 상세페이지 이동

어반 컴퓨팅

45,000원 (10%)

'어반 컴퓨팅' 상세페이지 이동

파이썬으로 데이터 마이닝 시작하기

18,900원 (10%)

'파이썬으로 데이터 마이닝 시작하기' 상세페이지 이동

빅데이터 마이닝

36,000원 (10%)

'빅데이터 마이닝' 상세페이지 이동

소셜 웹 마이닝 2판

27,000원 (10%)

'소셜 웹 마이닝 2판' 상세페이지 이동

비즈니스를 위한 데이터 과학

25,200원 (10%)

'비즈니스를 위한 데이터 과학 ' 상세페이지 이동

빅데이터 분석을 위한 데이터마이닝 방법론

25,000원 (0%)

'빅데이터 분석을 위한 데이터마이닝 방법론' 상세페이지 이동

데이터 마이닝 Data Mining

43,200원 (10%)

'데이터 마이닝 Data Mining' 상세페이지 이동

데이터마이닝

35,000원 (0%)

'데이터마이닝' 상세페이지 이동

Microsoft SQL Server 2000 데이터 마이닝

20,700원 (10%)

'Microsoft SQL Server 2000 데이터 마이닝' 상세페이지 이동

1장. 데이터 마이닝 1.1 데이터 마이닝이란? 1.2 데이터 마이닝의 통계적 한계점 1.3 알아두면 유용한 사실들 1.4 이 책의 개요 1.5 요약 1.6 참고문헌 2장. 맵리듀스와 새로운 소프트웨어 스택 2.1 분산 파일 시스템 2.2 맵리듀스 2.3 맵리듀스를 사용하는 알고리즘 2.4 맵리듀스의 확장 2.5 통신 비용 모델 2.6 맵리듀스에 대한 복잡도 이론 2.7 요약 2.8 참고문헌 3장. 유사 항목 찾기 3.1 근접 이웃 탐색의 응용 3.2 문서의 슁글링 3.3 집합의 유사도 보존 요약 3.4 문서의 지역성 기반 해싱 3.5 거리 측정 3.6 지역성 기반 함수의 이론 3.7 기타 거리 측정법들을 위한 LSH 함수군 3.8 지역성 기반 해시 응용 분야 3.9 높은 유사도 처리 방법 3.10 요약 3.11 참고문헌 4장. 스트림 데이터 마이닝 4.1 스트림 데이터 모델 4.2 스트림 데이터의 표본추출 4.3 스트림 필터링 4.4 스트림에서 중복을 제거한 원소 개수 세기 4.5 모멘트 근사치 4.6 윈도 내에서의 카운트 4.7 감쇠 윈도 4.8 요약 4.9 참고문헌 5장. 링크 분석 5.1 페이지랭크 5.2 페이지랭크의 효율적인 연산 5.3 주제 기반 페이지랭크 5.4 링크 스팸 5.5 허브와 권위자 5.6 요약 5.7 참고문헌 6장. 빈발 항목집합 6.1 시장바구니 모델 6.2 시장바구니와 선험적 알고리즘 6.3 메인 메모리에서 더 큰 데이터 집합 처리하기 6.4 단계 한정 알고리즘 6.5 스트림에서 빈발 항목 개수 세기 6.6 요약 6.7 참고문헌 7장. 클러스터링 7.1 클러스터링 기법의 개요 7.2 계층적 클러스터링 7.3 k평균 알고리즘 7.4 CURE 알고리즘 7.5 비유클리드 공간에서의 클러스터링 7.6 스트림을 위한 클러스터링과 병렬 처리 7.7 요약 7.8 참고문헌 8장. 웹을 통한 광고 8.1 온라인 광고와 관련된 주제들 8.2 온라인 알고리즘 8.3 조합 문제 8.4 애드워즈 문제 8.5 애드워즈 구현 8.6 요약 8.7 참고문헌 9장. 추천 시스템 9.1 추천 시스템 모델 9.2 내용 기반 추천 9.3 협업 필터링 9.4 차원 축소 9.5 넷플릭스 챌린지 9.6 요약 9.7 참고문헌 10장. 소셜 네트워크 그래프 마이닝 10.1 소셜 네트워크 그래프 10.2 소셜 네트워크 그래프 클러스터링 10.3 커뮤니티의 직접적 발견 10.4 그래프 분할 10.5 겹치는 커뮤니티 찾기 10.6 유사순위 10.7 삼각형의 개수 세기 10.8 그래프의 이웃 특징 10.9 요약 10.10 참고문헌 11장. 차원 축소 11.1 고윳값과 고유벡터 11.2 주성분 분석 11.3 특이 값 분해 11.4 CUR 분해 11.5 요약 11.6 참고문헌 12장. 대규모 머신 러닝 12.1 머신 러닝 모델 12.2 퍼셉트론 12.3 서포트 벡터 머신 12.4 최근접 이웃 학습 12.5 학습 방식의 비교 12.6 요약 12.7 참고문헌

더보기

저자 소개 관련자료 보이기/감추기

저 자 소 개

저자 : 쥬어 레스코벡(Jure Leskovec)
스탠퍼드 대학교(Stanford University) 컴퓨터학과의 부교수로 재직 중이다. 주요 연구 분야는 대규모 소셜 네트워크 및 정보 네트워크 마이닝이다. 대규모 데이터, 웹과 온라인 미디어에 기인한 문제들에 관심이 많다. 이와 관련된 연구로 마이크로소프트 학술상(Microsoft Research Faculty Fellowship), 알프레드 P.슬론 학술상(the Alfred P.Sloan Fellowship), 오카와 재단 학술상(Okawa Foundation Fellowship)과 다수의 최고 논문상을 수상했다. 또한 스탠퍼드 네트워크 분석 플랫폼(SNAP, Stanford Network Analysis Platform)(http://snap.stanford.edu)과 수억 개의 노드 및 수십억 개의 에지(edge)를 갖는 대형 네트워크로 쉽게 확장 가능한 범용 네트워크 및 그래프 마이닝을 고안했다. 트위터에서 @jure로 그를 팔로우할 수 있다.

저자 : 아난드 라자라만(Arand Rajaraman)
실리콘 밸리를 본사로 둔 여러 회사의 기업가, 벤처 자본가이면서 학자다. 아마존닷컴(Amazon.com)이 인수한 정글리(Junglee)와 월마트(Walmart)가 인수한 코스믹스(Kosmix)라는 스타트업의 창업자기도 하다. 벤처 캐피탈 회사인 밀리웨이즈 랩(milliways Labs)과 캄브리언 벤처스(Cambrian Ventures)의 초기 창립 파트너로서, 다수의 촉망받는 회사들의 초기 투자자였던 경험이 있다. 최근까지 월마트 글로벌 이커머스(Walmart Global eCommerce)의 부사장을 역임했으며, @WalmartLabs의 공동 책임자로서 소셜, 모바일, 커머스 융합에 힘써왔다. 학계에서는 데이터베이스 시스템, 월드와이드웹, 소셜 미디어의 융합과 관련된 연구에 관심을 두고 있다. 그의 연구 논문은 ACM SIGMOD 및 VLDB의 10년 회고 우수 논문상을 비롯해 권위 있는 학회에서 여러 차례 수상했다. 또한 아마존 메커니컬 터크(Amazon Mechanical Turk)의 공동 창안자이기도 하며, 크라우스소싱(crowdsourcing)의 개념을 고안해낸 당사자다. 트위터(@anad_raj)에서 그를 팔로우할 수 있다.

저자 : 제프리 데이비드 울만(Jeffrey David Ullman)
스탠퍼드 W. 애셔먼(Stanford W. Ascherman) 컴퓨터학과 (명예)교수며 현재 그래디언스(Gradiance)의 CEO다. 데이터베이스 이론, 데이터 마이닝, 정보 구조를 활용한 교육이 주요 관심 연구 주제다. 그는 데이터베이스 이론 분야의 창시자 중 한 명으로서, 추후 데이터베이스 이론가가 된 세대 전체 학생들을 지도한 박사이자 고문이었다. 최근에는 커누스상(Knuth Prize)(2000), 시그모이드 E. F. 코드 혁신상(Sigmod E. F. Codd Innovations award)(2006)을 수상했다. 또한 그는 ‘자동화 및 언어 이론 분야의 토대 구축과 이론적 컴퓨터 과학으로의 중대한 공헌’을 발표해 2010 IEEE 존 폰 노이만 메달(John von Neumann Medal)을 (존 홉크로프트(John Hopcroft)와 함께) 공동으로 수상했다.

역자 : 박효균
한동대학교 전산전자공학부를 졸업했다. 2009년부터 6년간 네이버 데이터 정보 센터에서 하둡과 데이터 엔지니어링 업무를 수행했다. 이후 네이버 랩스에서 머신 러닝을 이용해 IoT 센서 데이터를 분석했고, 현재는 네이버 검색에서 통합 검색 모델링을 담당하고 있다.

역자 : 이미정
성균관대 전자전기컴퓨터공학부를 졸업하고, 한동대학교 정보통신공학 석사학위를 이수했다. 삼성전자 LSI 사업부 기술개발실에 근무했으며, 오라클 미들웨어 사업부에서 컨설턴트로 활동했다. 현재는 MDS 테크놀로지 DAS 사업부에서 세일즈 엔지니어로 재직 중이다. 에이콘출판사에서 출간한 『PIG를 이용한 빅데이터 처리 패턴』(2014), 『Splunk 6 핵심 기술』(2015)을 번역했다.

더보기

출판사 리뷰 출판사 리뷰 보이기/감추기

이 책에서 다루는 내용 - 대규모 데이터를 처리할 수 있는 병렬 알고리즘을 만드는 툴인 분산 파일 시스템과 맵리듀스(map-reduce) - 민해시(minhash)와 지역성 기반 해시(locality-sensitive hash) 알고리즘의 핵심 기술 및 유사도 검색(similarity search) - 매우 빨리 입력돼 즉각 처리하지 않으면 유실되는 데이터를 다루는 데 특화된 알고리즘과 데이터 스트림 처리 - 구글의 페이지랭크(PageRank), 링크 스팸 탐지, 허브와 권위자(hubs-and-authorities) 기법을 포함하는 검색 엔진 기술 - 연관 규칙(association rule), 시장바구니 모델(market-baskets), 선험적 알고리즘(A-Priori Algorithm)과 이를 개선한 기법들 및 빈발 항목집합(frequent-itemset) 마이닝 - 대규모 고차원 데이터 집합을 클러스터링하는 알고리즘 - 웹 애플리케이션과 관련된 두 가지 문제인 광고와 추천 시스템 - 소셜 네트워크 그래프처럼 매우 큰 구조의 분석과 마이닝을 위한 알고리즘들 - 특이 값 분해(singular value decomposition)와 잠재 의미 색인(latent semantic indexing) 및 차원 축소(dimensionality reduction)를 통해 대규모 데이터에서 중요한 속성을 도출해내는 기법들 - 퍼셉트론(perceptron), 서포트 벡터 머신(support vector machine), 경사 하강(gradient descent) 같은 대규모 데이터에 적용 가능한 머신 러닝 알고리즘 이 책의 대상 독자 데이터베이스와 웹 기술을 선도하는 학자들이 쓴 이 책은 학생과 실무자 모두를 위한 필독서다. 다음의 과정을 익힌 독자들에게 적합한 책이다. - SQL 및 관련 프로그래밍 시스템을 주제로 하는 데이터베이스 시스템 입문 - 2학년 수준의 자료구조, 알고리즘, 이산수학 - 2학년 수준의 소프트웨어 시스템, 소프트웨어 엔지니어링, 프로그래밍 언어 지은이의 말 이 책은 여러 해 동안 스탠퍼드(Stanford)에서 진행된 아난드 라자라만(Anand Rajaraman)과 제프 울만(Jeff Ullman) 두 교수의 강의 교육 자료에서 시작됐다. ‘웹 마이닝’이라는 제목의 CS345A 강의는 고급 대학원 과정으로 개설되긴 했지만, 우수한 학부생들도 관심을 갖게 되었고 참여가 가능했다. 이후 쥬어 레스코벡(Jure Leskovec) 교수가 스탠퍼드에 부임하게 되면서 상당히 많은 내용이 개편됐다. 그는 네트워크 분석 강의 CS224W를 새로 신설했고, CS246으로 이름이 바뀐 CS345A의 자료를 보완했다. 또한 세 교수는 대규모 데이터 마이닝 프로젝트 강의 CS341을 개설했다. 이 책은 위 세 가지 강의 자료를 바탕으로 만들어졌다. 옮긴이의 말 이제는 빅데이터라는 용어 자체만큼이나, 그 용어의 식상함을 논하는 것조차 식상하게 느껴지는 시대가 되었다. 그러나 이 책은 허식 없이 매우 현실적인 접근 방식으로 데이터마이닝 기법을 빅데이터에 적용하는 방법을 설명하고 있다. 각 기법을 메모리에 담을 수 있는 경우와 메모리에 담을 수 없는 경우로 나누어 친절하게 해법을 알려준다. 서서히 데이터 과학 분야는 관련 업계의 통계학자나 엔지니어가 갖춰야 할 선택적인 ‘지식’이 아닌, 필수적인 ‘상식’이 되어가고 있다. 어쩌면 우리는 미래의 상식을 공부하기 위해 이 책을 펼친 것인지도 모른다. 이 책은 통계학과 데이터 마이닝, 그리고 컴퓨터 공학을 동시에 다루고 있음에도, 이 세 분야를 자세하고도 조화롭게 서술하고 있다. 덕분에 대학 교재(http://www.mmds.org/)임에도 불구하고 실무에 도움이 될 정도로 내용에 깊이가 있다는 장점이 있다. 동시에, 통계학자와 엔지니어 모두에게 어려운 책이 돼버렸다는 단점도 있다. 따라서 이 책을 공부하는 데 도움이 되는 팁을 먼저 공유하고자 한다. 1. 원서는 아래 URL에서 무료로 다운로드할 수 있다. 역서만으로 잘 이해가 되지 않는 부분이 있다면, 해당 부분을 원서에서 찾아 반복해서 세 번 정도 차분하게 읽어보기 바란다. http://infolab.stanford.edu/~ullman/mmds/bookL.pdf 2. 아무래도 대학 교재이다 보니, 전개 방식이 연역적이며 딱딱한 편이라서 이해가 어려울 수 있다. 각 절의 앞부분을 이해하지 못했더라도, 일단 빠르게 읽고 넘어간 후 예제를 보기 바란다. 예제를 읽고 나서 다시 앞부분의 이론을 보면 이해가 쉬울 것이다. 통계학자와 엔지니어는 각기 다른 관점으로 데이터 과학이라는 분야에 접근한다. 통계학자들은 신뢰구간과 불확실성 측정에 관심이 많은 반면, 프로그래머들은 머신 러닝을 통한 재빠른 구현과 그 결과에 더 관심을 두는 편이다. 이를 정리하기 위해 조시 윌스(https://twitter.com/josh_wills/)는 이렇게 말했다. “데이터 과학자란 통계학을 남들보다 잘 알고 있는 소프트웨어 공학자, 그리고 소프트웨어 공학을 남들보다 잘 알고 있는 통계학자를 말한다.” 하지만 이것만으로 분석가의 자질을 논하기에는 뭔가 부족하다. 현업에서 데이터를 분석하다 보면, 무엇보다도 그 데이터 도메인에 대한 지식과 분석 노하우가 가장 중요하다는 사실을 느끼게 된다. 그리고 해당 도메인을 잘 이해하기 위해서, 때로는 인문학적 소양이 필요한 시점이 오기도 한다. 이론이나 기술보다는 데이터 자체의 품질과 양이 더 중요하며, 그 데이터에서 가치를 만들어내는 것은 결국 분석가의 자질에 달렸다. - 박효균 빅데이터에서 ‘빅’이 의미하는 양만큼 실제로 엄청난 대규모 데이터들이 생성됨에 따라 이들을 처리하고 분석하기 위한 요구사항들이 늘어갔으며, 어느 하나의 기술로 이를 해결할 수는 없었으므로 학문 간 통합은 필수적이었다. 학문 간 통합에 대한 시도는 오래 전부터 있어왔으나, 지금처럼 그 시도가 빛을 발하는 시기는 없었던 듯하다. 통계학과 전산학, 데이터 마이닝이라는 학문의 기초가 수학이라는 점을 고려해보면, 이들 간의 통합을 통해 난제를 해결하고 있는 지금의 현상은 어쩌면 필연적인 결과인지도 모른다. 이를 가능하게 한 기술로서 하둡Hadoop을 언급하지 않을 수 없다. 이 책의 번역에 한창 열을 올리고 있을 때와 비교하면 하둡의 인기가 예전만 하지 못한 것이 사실이지만, 그 누구도 빅데이터 처리의 핵심 기술이며 지금도 여전히 그러한 하둡의 중요성과 영향력을 부인하지는 못할 것이다. 이 책이 맵리듀스MapReduce를 기반으로 데이터 처리 방법을 설명하는 이유가 바로 이것이다. 통계, 전산, 데이터 마이닝 기법에 대한 학문적 기초가 없다면 갑자기 등장하는 생소한 용어들에 멈칫하게 될 순간이 많을 것이다. 그럴 때마다 해당 용어를 찾아 내용을 이해한 후 넘어가는 것도 좋고, 일단 전체적인 맥락을 이해한 후 세부적인 용어들을 정리하는 것도 좋다. 어찌 됐든 빅데이터 마이닝을 위해 이 책을 펼친 독자 여러분을 응원하며, 이를 통해 한 단계 성장하는 학생, 엔지니어, 실무자가 되길 바란다. 역자로서 용어 선택에 고심이 많았다. 통계학은 그렇다 치더라도 전산학과 데이터 마이닝에서 사용되는 용어 대부분은 한글로 번역했을 때 의미가 퇴색되거나 더 어려워지는 경우가 많았기 때문이다. 따라서 한글을 우선으로 하되, 해당 용어가 실무에서 영어로 더 많이 사용된다면 굳이 한글로 번역하지 않고 음역했다. ‘clustering’을 ‘클러스터링’으로 번역한 예가 대표적이다. 실무에서는 아무도 ‘클러스터링’을 ‘군집화’라고 하지 않는다. - 이미정

회원리뷰 (0건) 회원리뷰 이동

리뷰 쓰기

혜택 및 유의사항?

등록된 리뷰가 없습니다!

첫번째 리뷰어가 되어주세요.

한줄평 (0건) 한줄평 이동

한줄평 쓰기

혜택 및 유의사항?

등록된 한줄평이 없습니다!

첫번째 한줄평을 남겨주세요.

배송/반품/교환 안내

배송 안내

반품/교환 안내에 대한 내용입니다.
배송 구분	예스24 배송 배송비 : 무료배송
포장 안내	안전하고 정확한 포장을 위해 CCTV를 설치하여 운영하고 있습니다. 고객님께 배송되는 모든 상품을 CCTV로 녹화하고 있으며, 철저한 모니터링을 통해 작업 과정에 문제가 없도록 최선을 다 하겠습니다. 목적 : 안전한 포장 관리 촬영범위 : 박스 포장 작업

반품/교환 안내

상품 설명에 반품/교환과 관련한 안내가 있는경우 아래 내용보다 우선합니다. (업체 사정에 따라 달라질 수 있습니다)

반품/교환 안내에 대한 내용입니다.
반품/교환 방법	고객만족센터(1544-3800), 중고샵(1566-4295) 판매자 배송 상품은 판매자와 반품/교환이 협의된 상품에 한해 가능합니다.
반품/교환 가능기간	출고 완료 후 10일 이내의 주문 상품 디지털 콘텐츠인 eBook의 경우 구매 후 7일 이내의 상품 중고상품의 경우 출고 완료일로부터 6일 이내의 상품 (구매확정 전 상태)
반품/교환 비용	고객의 단순변심 및 착오구매일 경우 상품 반송비용은 고객 부담임 직수입양서/직수입일서중 일부는 변심 또는 착오로 취소시 해외주문취소수수료 20%를 부과할수 있음 단, 아래의 주문/취소 조건인 경우, 취소 수수료 면제 오늘 00시 ~ 06시 30분 주문을 오늘 오전 06시 30분 이전에 취소 오늘 06시 30분 이후 주문을 익일 오전 06시 30분 이전에 취소 직수입 음반/영상물/기프트 중 일부는 변심 또는 착오로 취소 시 해외주문취소수수료 30%를 부과할 수 있음 단, 당일 00시~13시 사이의 주문은 취소 수수료 면제 박스 포장은 택배 배송이 가능한 규격과 무게를 준수하며, 고객의 단순변심 및 착오구매일 경우 상품의 반송비용은 박스 당 부과됩니다.
반품/교환 불가사유	소비자의 책임 있는 사유로 상품 등이 손실 또는 훼손된 경우 소비자의 사용, 포장 개봉에 의해 상품 등의 가치가 현저히 감소한 경우 : 예) 화장품, 식품, 가전제품, 전자책 단말기 등 복제가 가능한 상품 등의 포장을 훼손한 경우 : 예) CD/LP, DVD/Blu-ray, 소프트웨어, 만화책, 잡지, 영상 화보집 소비자의 요청에 따라 개별적으로 주문 제작되는 상품의 경우 디지털 컨텐츠인 eBook, 오디오북 등을 1회 이상 다운로드를 받았을 경우 eBook 대여 상품은 대여 기간이 종료 되거나, 2회 이상 대여 했을 경우 취소 불가 중고상품이 구매확정(자동 구매확정은 출고완료일로부터 7일)된 경우 LP상품의 재생 불량 원인이 기기의 사양 및 문제인 경우 (All-in-One 일체형 일부 보급형 오디오 모델 사용 등) 시간의 경과에 의해 재판매가 곤란한 정도로 가치가 현저히 감소한 경우 전자상거래 등에서의 소비자보호에 관한 법률이 정하는 소비자 청약철회 제한 내용에 해당되는 경우
소비자 피해보상	상품의 불량에 의한 반품, 교환, A/S, 환불, 품질보증 및 피해보상 등에 관한 사항은 소비자분쟁해결기준(공정거래위원회 고시)에 준하여 처리됨
환불 지연에 따른 배상	대금 환불 및 환불 지연에 따른 배상금 지급 조건, 절차 등은 전자상거래 등에서의 소비자 보호에 관한 법률에 따라 처리