지식을 미디어상에 실현하기 위해서는 어떤 방법으로든 지식을 정리해서 표현할 필요가 있다. 예컨대, 과학연구로 얻어진 지식을 학술논문으로 실현하는 경우에는 실험 혹은 관찰데이터를 정리하고 이론치와 비교해 결론을 도출한 후 그것을 연구의 목적, 방법, 결과, 결론의 순으로 집필한다. 또한 매스컴의 취재에서 얻은 지식을 신문기사로 실현하는 경우에는 정치, 경제, 사회, 예능 등으로 분류하고 다른 기사와의 관계를 감안하여 길이를 정해 본문(또는 개요)을 쓰고 그 위에 제목을 붙인다. 개인이나 조직이 보유하고 있는 지식을 웹페이지로 실현하는 경우에는 메인페이지와 그 이후 페이지의 구성, 각 페이지 내 항목의 배치, 글자체, 글자크기, 글자색 등을 결정해 본문과 제목을 기술하며, 항목 간이나 웹페이지 간의 링크를 만들고 사이트맵을 작성한다. 이와 같이 지식을 미디어상에 실현하기 위한 정리와 표현을 지식의 조직화라고 하며, 조직화된 지식을 지식자원이라 한다. --- p.13
자유어에는 다의어가 많아 색인어와 검색어가 형태상으로는 일치하더라도, 즉 같은 용어라도 다른 의미로 사용되는 경우가 있다. 예컨대, ‘빅뱅’이라는 용어는 원래는 우주론에서 사용되었던 용어지만 금융 빅뱅이라고 사용되기도 한다. 우주론의 빅뱅에 관한 지식자원을 검색할 생각으로 ‘빅뱅’이란 검색어를 입력하면 금융에 관한 지식자원도 검색될 수 있다. 통제어를 사용하는 경우에는 동의어뿐만 아니라 어의도 통일해두면 이 문제를 해결할 수 있다. --- p.32-33
최종적으로는 각 레코드 작성기관의 레코드 작성목적이나 필요성, 기본적인 제약조건을 충족시키는 방향으로 레코드를 구성하는 데이터항목이 결정되지만, 동시에 타 기관과 데이터항목을 공통화시킨다는 표준화의 관점도 고려해야 한다. 표준화는 이용자의 편의를 도모하며, 레코드의 교환이나 공유로 레코드 작성처리의 효율성과 경제성을 추구한다는 두 가지 의미를 가지고 있다.
이용자 편의란 여기에서는 이해하기 쉬운 레코드를 가리키며, 액세스하는 레코드(또는 이들의 집합인 메타데이터 데이터베이스)마다 데이터항목이 크게 다르면 그때마다 이용자에게 적절한 이해와 해석이 강요되어 이용자의 편의를 훼손하게 된다. 즉, 이용자는 항상 여러 종류의 메타데이터나 메타데이터 데이터베이스를 이용하고 있다는 점을 전제해야 한다. --- p.70
상호배타적인 구분을 위해서는 한 번의 구분에 하나의 구분원리만을 적용할 필요가 있다. 상호배타적인 구분을 지키면서 복수의 구분원리를 적용하기 위해서는 그것들을 별도로 적용한 후 조합해야 한다. 조합방식에는 두 가지가 있는데, 그 하나는 구분원리를 독립적으로 적용하는 방법이다(구분원리의 조합방식에 대해서는 다음 절에서 설명한다). 앞의 예는 소설을 미스터리인지 아닌지로 구분하고, 한편으로는 SF인지 SF가 아닌지로 구분한다. 그리고 양쪽의 구분지를 조합한다. 그렇게 하면 미스터리이면서 SF이기도 한 소설의 구분지가 생긴다. 미스터리형 SF소설은 이 구분지에만 들어가고 복수의 구분지에 들어가는 일은 없다. 이와 같이 복수의 구분원리를 별도로 적용하여 이들을 조합하면 상호배타적인 구분지가 생긴다. --- p.202
수집하는 용어의 넓이는 해당 영역의 범위를 어디까지 포함시킬 것인가에 달려 있다. 예컨대, 환경 문제 시소러스를 작성하려고 할 때 환경 문제의 어느 부분을 다룰 것인가를 결정해야 한다. 사회적 측면만을 다룰 것인가, 아니면 물리적·화학적·생물학적 측면도 포함할 것인가, 인간의 환경 문제만을 다룰 것인가, 아니면 다른 생물에 대한 영향이나 지구 전체에 대한 영향 등도 포함할 것인가를 결정해야 한다. 이처럼 해당 영역의 범위를 결정한다 해도 거기에 포함할 수 없는 부분의 용어를 전적으로 무시해도 좋다는 것은 아니다. (중략) 범위가 결정되면 그 범위에 들어가는 용어는 망라적으로 수집한다. 특정 하위 영역의 용어는 필요 이상으로 많고 그 밖의 하위 영역에서는 필요 용어가 수록되지 않는 일이 없도록 균형을 생각하여 수집해야 한다.
--- p.241-242