사이버 공해 (정보 공해)
 공해 Pollution란 무엇인가? 백과사전/국어사전의 정의는 다음과 같다.

인간의 생산활동과 소비과정에서 환경이라는 자원의 사용, 파괴, 소모로 인해 불특정 다수에게 건강과 생활환경에 침해를 주는 재해현상 [다음 백과사전]
또는
산업이나 교통의 발달에 따라 사람이나 생물이 입게 되는 여러가지 피해, 자동차의 매연, 공장의 폐수, 여러 종류의 쓰레기 따위로 인하여 공기와 물이 더렵혀지고 자연환경이 파괴되는 문제 따위 [다음 국어사전]

 현재 "생태계 파괴 원인 = 공해"라는 등식이 성립한다. 전통적으로 천재지변도 생태계를 파괴한다. 그러나, 인재에 의한 천재지변에는 많은 비난 여론이 따르지만, 자연적인 천재지변은 대체로 숙명으로 받아들인다. (물론 그런 숙명에도 맞설려는 시도가 줄곳 이어지고 있지만...) 앞의 백과사전/국어사전의 정의를 요약하자면 공해란 '인간의 활동의 비정상적인 부산물로 인한 환경 파괴' 정도로 요약할 수 있을 것같다. 같은 논리를 웹생태계에 적용해보면, 웹생태계의 공해 (또는 정보 공해, 사이버 공해)란 사이버 스페이스에서의 인간의 활동이나 그에 따른 부산물들로 인한 웹생태계의 파괴 정도로 정의내릴 수 있다. 이런 정보공해의 종류에 대해서는 '웹생태계 파괴자들' 편에서 이미 개관하였다. 앞에서 공해를 정의할 때, '비정상'적이라는 용어를 사용하였다. 자연의 한 구성요소로써 정상적인 인간 활동의 부산물들 (인간의 신진대사 등에서 발생하는)에 대해서는 특별히 공해라는 표현을 쓰지 않는다. 그러나 비정상적인 부산물들을 특히 공해라고 말한다. 비정상적이라는 말은, 자연에서 얻어지는 것이 아닌 인공합성물 (공장 등에서 발생하는 화학 오염물질 등)이나 "과도한" 생활 쓰레기 등을 지칭한다. 이런 관점에서 웹생태계에서의 공해를 재정의하면, 인공합성물에 해당하는 경우로는 인신공격이나 허위사실 유포 등의 위법/범법 컨텐츠, 개인의 사생활을 해치는 컨텐츠, 성인 도박 등의 미풍양속을 해치는 컨텐츠 등의 악성 게시물들이 이에 해당될 수 있으며, 후자의 과도한 생활쓰레기에 해당되는 경우는 불필요한 (때론 혐오스럽고 아름답지 못한) 정보의 홍수 (대량 중복)를 들 수가 있다. 그런데, 이번 포스팅에서는 특히 (불필요한) 정보의 중복문제에 초점을 맞추려 한다.

 같은 정보가 끊임없이 재생산되어서 사용자들에게 제공된다면 그 정보의 건전성 및 유익성과 무관하게 사용자들은 공해로 인식한다. 만약 당신이 구글이나 다음 등의 검색에서 '공해'를 검색한 경우, 모든 검색결과가 위키피디어에서 제공하는 (또는 위키피디어의 것을 복제한) 공해에 대한 사용자 정의만으로 이루어졌다면 어떻게 되겠는가? 분명 위키피디어의 정의는 유용한 정보이지만, 나머지의 똑같은 정보는 더 이상 정보로써의 효용가치가 없고 쓰레기 정보가 된다. 또는 당신이 조회한 특정 게시물이 불필요한/무의미한 단어들의 반복으로만 이루어졌다면, 또는 상업/낚시성 메일이 계속 온다면 이 또한 정보공해로 인식할 것이다. 그렇다면, 이런 중복성 공해를 해결할 방법은 없을까? 후자에서 예시로 든 악성 중복 공해의 경우 게시자의 자발성과 신뢰성에 의존할 수 밖에 없거나 시스템 (스팸 필터링 시스템이나 사용자들의 자정 노력/신고 활동 등)에 의해서 제거 또는 제재하는 것 외에는 특별한 방법이 없는 듯하니, 논의의 대상에서 제외하고 본 포스팅에서는 유용한 정보의 중복 문제에 초점을 맞춘다. 

 (유용한) 정보의 중복의 대표적인 사례는 '펌질'로 알려진 '스크랩'이다. 초기의 인터넷 포털 등에서는 활성화를 위해서 스크랩 행위를 권장했던 측면을 부인할 수가 없다. 그리고, 특별히 웹문서의 품질을 평가할 수 있는 방법이 없기 때문에 (이전 포스팅의 페이지랭크나 추천시스템도 웹문서 품질을 보증해주지는 못한다), 사람들에 의해서 판단된 정보의 질, 즉 스크랩의 회수,에 따른 웹문서의 품질평가라는 달콤한 유혹으로 현재도 인터넷 포털들은 스크랩 행위의 부당/부정성에 대해서 강력하게 제재를 가하지 못하는 딜레마에 빠져있기도 하다. (국내에서는 대표 포털인 네이버가 가장 큰 오명 (펌로그)을 받고 있지만, 다음에서도 비슷한 현상이 부각되지 않았을 뿐이고, 네이트의 사이월드의 경우 스크랩 행위를 소셜네트워킹이라는 미명 아래 장려했던 정책이다.) 스크랩 행위를 조금 더 옹호하자면, 1) 웹문서의 품질 평가의 지표로 활용될 수가 있다 2) 유용한 웹문서의 대중화/전달에 기여한다 등으로 요약될 수 있지만, 1) 정보의 과도한 중복 문제 뿐만 아니라 2) 웹문서의 저작권 침해와 3) 애초 웹문서에 포함되었던 비밀정보 (개인정보 등)의 무분별한/의도치 않은 공개 등의 더 큰 문제점들이 있다.

 정보/지식의 유틸리티화
 논조가 이상하게 보일 수도 있으나, 이런 중복/스크랩의 문제를 해결하기 위한 방법으로 (온전한) 스크랩을 제시하려 한다. 해결책으로 제시하는 스크랩은 현재의 무분별란 '펌질'이 아니라, 정보/지식의 유틸리티화를 통한 정보 (전달)의 규격화/인프라화, 정보의 재사용, 그리고 정보의 자원화를 뜻한다. 구체적인 논의에 앞서 유틸리티 utility (public utility)란 전기, 상하수도, 도시가스 등과 같이 개인이 생산, 관리하기가 어려운 자원/시설 등의 공공재로써, 개인의 사용량에 따라서 금액을 차등 지불하는 방식을 취한다. 그래서 정보/지식의 유틸리티화란 거대한 정보/지식 아카이브 (위키피디어와 같은)를 구축하여 누구던지 이 지식 아카이브에 접근해서 정보를 열람하고 (규격화) 정보를 재정의 및 활용하고 (재사용) 또 경우에 따라서 지식사용량/가치에 따른 정보료를 제공하는 (자원화)를 뜻한다. 

 먼저, 정보 (전달)의 규격화란 단순히 누구나 자유롭게 열람할 수 있는 인터페이스 및 권한을 부여하는 것 뿐만 아니라, 이런 유틸리티 지식/정보를 활용하는 방법에서의 (사용) 규칙/가이드라인 등의 제반사항의 규격화의 의미를 내포한다. 일례로, CCL (Creative Commons) 등의 저작권 표시 규정을 준수한다거나 모든 정보를 전부 스크랩해서 자신의 공간에 넣는 것이 아니라 내용의 일부 (시작부분 또는 요약정보 등)만을 자신의 공간에 제시하고 나머지 정보에 대해서는 원문을 링크해주는 방식 등을 취하는 것이다. 이런 스크랩의 사회적/암묵적 합의의 도축과 규칙의 제정, 그리고 이런 합의된 규칙의 시스템화하는 것 등이 정보의 규격화이다. 

 두번째로, 정보의 재사용은 앞서 제시한 합의된 규칙 내에서 지식 아카이브의 정보를 자유롭게 활용하는 것을 뜻한다. 즉, 지식 아카이브의 정보를 자유롭게 열람 및 자신의 공간에 일부 삽입할 때, 원저작자 및 출처를 명확히 밝히고 원문전체가 아닌 요약정보만 삽입하는 등으로 정보를 재사용해야 한다. 그리고, 일부 사설 아카이브의 정보를 이용할 경우 (개인 블로그나 단체의 카페/사이트 등)에도 앞서 말한 요약정보이용 및 출처 명시 등의 규약을 따르는 것뿐만 아니라, 원저작물에 포함된 프라이버시 (개인정보)를 함부로 누설하지 않는다는 등의 자기 규제도 필요하다. Note: 정보의 재사용은 정보의 복재와 구별된다. 정보의 복재는 단순히 원문 내용의 일부나 전부를 카피해서 자신의 공간에 옮겨놓는 것이지만, 이 포스팅에서 제시하는 정보의 재사용은 원문의 내용을 참조하는 것이다. 즉, 단순히 원문의 텍스트가 옮겨지는 것이 아니라, 원문의 내용을 조회할 수 있는 코드가 심겨지는 것이다. 예를 들어, 이 포스팅의 시작부분에 다음 백과/국어사전에서 제공하는 공해의 정의를 단순 복사/복재하여 사용하였다. 위의 정의는 이 포스팅의 일부로 단순히 옮겨진 것이다. 그러나 정보의 재사용 프레임워크에서는 자바스크립트와 같은 코드가 포스팅에 심겨져서 다음 백과/국어사전의 내용을 단순히 현재 화면에 보여주는 것이다. 구글의 애드센스블로그 위젯 등과 같은 형태의 참조형 디스플레이라고 생각하면 된다.

 마지막으로, 정보의 자원화는 필요시 원저작자에게 저작행위에 대한 대가를 지불하는 것이다. 현재 정품 도서나 음반을 구입하는 적극적인 정보이용료의 제공이 대표적인 사례가 될 수가 있다. 웹생태계에서도 보고서나 다양한 문서/템플릿 등을 구입해서 열람하는 것도 이런 정보 자원화의 일원이고, 위키피디어 등의 지식아카이빙 작업 지원을 위한 도네이션을 하는 방법도 있다. 그리고, 지식 정보료는 단순히 통화단위로의 과금 뿐만 아니라, 오픈소싱과 같이 기존 정보를 더욱 유익한 정보로 재가공해서 타인들도 자유롭게 활용할 수 있도록 재공유/재유틸리티화하는 행위 등을 포괄한 개념이다.

 우리는 웹생태계에 이미 많은 지식을 보유하고 있으며 앞으로 계속 추가해나갈 것이다. 그렇지만 무분별하게 중복된 내용들이 존재한다면 이는 정보의 유용성을 넘어 정보의 공해로 받아들여질 것이다. 그리고 사회적 합의를 어기면서까지 이루어지는 정보의 중복은 더욱 큰 문제점이다. 새로운 대안으로 (공공재) 지식/정보에 대해서는 아카이빙, 자유 접근, 이용 규칙 준수, 정당한 정보료 제공 등의 지식/정보 유틸리티화를 제안한다.

 ** 전기, 상하수도, 가스 등의 현물 유틸리티는 전통적으로 좋은 사업 기반이 되었고, 최근 인터넷의 발전과 함께 데이터 스토리지나 웹 서비스/애플리케이션 등의 정보 인프라 유틸리티는 현재의 각광받는 사업 분야이다. 같은 맥락에서 정보/지식 자체의 유틸리티도 앞으로 유망한 사업 분야임에 틀림없다.