인공지능은 분자생물학과 함께 다른 분야의 과학자들이 “가장 참여하고 싶은 분야”로 자주 언급된다. 물리학을 배우는 학생이라면 멋진 착안을 갈릴레오나 뉴턴, 아인슈타인 등의 선배 과학자들이 이미 차지했다고 느낄 것이다. 반면 인공지능 분야에는 아인슈타인이나 에디슨이 평생에 걸쳐 이룩할 만한 업적들이 아직 많이 남아 있다. 현재 인공지능은 일반적인 분야(학습과 인지)에서부터 구체적인 분야(체스 두기, 수학 정리 증명, 시 쓰기, 복잡한 도로에서 자동차 운전하기, 질병 진단 등)에 이르기까지 대단히 다양한 하위 분야를 포괄한다. 인공지능은 모든 지적 과제에 연관된다. 그런 만큼 진정으로 보편적인 분야라 할 수 있다.
_1권 1쪽
앨런 튜링(Alan Turing)이 제안한 튜링 검사(Turing Test)는 지능의 만족스러운 실천적 정의를 제공하기 위해 고안된 것이다. 인간 조사자가 글로 쓴 질문에 대해 컴퓨터가 글로 답을 했을 때, 만일 그 답이 컴퓨터가 제출한 것인지 아니면 인간이 제출한 것인지 인간 조사자가 구분하지 못한다면 그 컴퓨터는 튜링 검사를 통과한 것이다. 제26장에서는 이 검사를 좀 더 자세히 설명하고, 이 검사를 통과한 컴퓨터가 정말로 지능적인지도 논의한다. 일단 지금은 엄격히 적용된 검사를 통과할 수 있도록 컴퓨터를 프로그래밍하려면 많은 작업이 필요하다는 점만 짚고 넘어가자.
_1권 3쪽
이제는 감지 시스템(시각, 청각, 음성 인식 등등)이 환경에 대한 완벽하게 믿을 만한 정보를 제공하지는 못한다는 인식이 널리 받아들여지고 있다. 따라서 추론과 계획 수립 시스템은 반드시 불확실성을 처리할 수 있어야 한다. 에이전트 관점의 또 다른 중요한 결과는, 인공지능이 제어이론과 경제학처럼 에이전트를 다루는 다른 분야와 좀 더 가깝게 접촉하게 되었다는 점이다. 최근 로봇 자동차 제어의 진보는 더 나은 감지기, 감지의 제어이론적 통합, 위치 결정과 지도 작성, 그리고 일정 정도의 고수준 계획 수립 같은 다양한 접근방식들의 혼합에 의한 것이다.
_1권 33쪽
메커니즘 설계의 예로는 싼 항공권 경매, 컴퓨터들 사이의 TCP 패킷 라우팅, 인턴들을 병원들에 배정하는 방법 결정, 로봇 축구 선수들을 하나의 팀으로써 협동하게 만들기 등이 있다. 1990년대에 몇몇 나라에서는 메커니즘 설계가 학술적 연구 주제 차원을 넘어서서, 여러 주파수 대역의 방송 권한에 대한 경매 문제에 실제로 적용되었다. 그런 문제에서는 메커니즘 설계가 잘못되면 수억 달러의 잠재적 수익이 날아갈 수 있다. 형식적으로, 하나의 메커니즘은 (1) 에이전트가 채택할 수 있는 허용 가능한 전략들의 집합을 서술하는 언어, (2) 게임의 에이전트들이 선택한 전략에 대한 정보를 모으는, 중앙 에이전트(center agent)라고 부르는 개별적인 하나의 에이전트, (3) 모든 에이전트에게 알려지는, 에이전트들의 전략 선택들이 주어졌을 때 중앙 에이전트가 각 에이전트에게 부여할 이익을 결정하는 데 사용하는 결과 규칙(outcome rule)으로 이루어진다.
_2권 244쪽
지금까지 다양한 기계 학습 기법을 소개하고, 각각에 대해 간단한 학습 과제의 예도 제시했다. 이번 절에서는 실용적인 기계 학습의 두 가지 측면을 고찰한다. 하나는 손으로 쓴 숫자를 인식하는 법을 배우고 그것을 이용해서 예측 성과를 최대한 뽑아내는 능력을 갖춘 알고리즘을 찾는 것에 관련된 것이고, 또 하나는 모든 것에 관여하는, 자료의 획득, 정리, 표현에 관한 것이다. 후자는 적어도 알고리즘 공학만큼이나 중요한 측면이다.
_2권 331쪽
주어진 문제에 적합한 방법 하나를(또는 여럿을) 선택해야 한다는 점에는 변함이 없다. 최고의 방법을 찾아내는 어떤 확실한 규칙은 없지만, 대략적인 지침은 존재한다. 이산적인 자질들이 많고 그중 다수가 문제와 무관할 것이라고 믿는다면, 의사결정 트리가 좋은 선택이다. 비매개변수적 방법들은 자료는 많고 사전 지식은 없을 때, 그리고 적절한 자질들을 찾는 데 그리 신경을 쓰고 싶지는 않을 때 좋다(단, 자질들이 20개 이하라고 할 때). 그러나 비매개변수적 방법으로 얻은 함수 ?는 대체로 실행 시간이 긴 경향이 있다. 자료 집합이 아주 크지 않다면, 제일 먼저 시도해 보기에 가장 좋은 방법은 지지 벡터 기계로 간주된다.
_2권 335쪽
웹에는 수 조 페이지 분량의 정보가 있는데, 대부분 자연어로 된 것이다. 지식 획득(knowledge acquisition)을 수행하고자 하는 에이전트는 사람이 사용하는 애매하고 지저분한 언어를 이해해야(부분적으로나마) 한다. 이번 장에서는 텍스트 분류, 정보 조회, 정보 추출 같은 구체적인 정보 탐색 과제들의 관점에서 자연어 처리 문제를 조사한다. 이런 과제들을 해결할 때 한 가지 공통분모는, 언어 표현들의 확률분포를 예측하는 모형인 언어 모형(language model)들을 사용한다는 것이다.
_2권 457쪽
텍스트 분류 과제는 어떤 텍스트가 주어졌을 때 그것이 미리 정해진 부류들 중 어떤 부류에 속하는지 판단하는 것이다. 텍스트 분류의 대표적인 예는 언어 식별과 장르 분류이다. 또한, 영화나 제품의 평이 긍정적인지 부정적인지 분류하는 정서 분석(sentiment analysis)과 이메일 메시지가 스팸인지 아닌지 분류하는 스팸 검출(spam detection)도 텍스트 분류에 속한다.
_2권 463쪽
---본문 중에서