이전 "
인터넷과 민주주의"라는 포스팅을 통해서 현재 사이버 스페이스에 존재하는 다양한 (명시적) 추천 시스템을 개괄하였다. 그런 추천 시스템들은 민주적 속성과 비민주적 속성을 동시에 가지고 있다고 말했다. 이 포스팅에서는 이런 추천 시스템에 대해서 더 자세히 알아보고, 어떻게 하면 이런 추천 시스템이 지속가능하고 보편적이 될 것인가에 대해서 논하겠다. 단순히 웹 생태계에 존재하는 다양한 정보나 정보 출처들에 대한 랭킹을 정하는 문제에 대해서 다루는 다양한 글들이 존재한다. 본 포스팅에서는 그런 일반적인 웹문서의 랭킹에 초점을 맞춘 글이 아님을 미리 밝혀둔다.
추천 시스템의 종류: 명시적 vs 암묵적 vs 하이브리드
다음에서 활용중인 다양한 추천 시스템들...
추천 시스템을 채택/활용한 많은 서비스들을 우리는 이미 많이 사용하고 있다. 대표적인 경우가 다음의 아고라에서 글의 논지에 대한 찬/반 투표, 블로거뉴스의 추천제도나 tvPot의 와우포인트, 인터넷 서점에서의 개별 도서의 사용자 리뷰 점수, 메카니즘은 조금 다르지만 뉴스기사나 블로그/게시판의 글들에 다는 댓글 시스템, 게시판의 목록에서 특정 게시글을 선정해서 조회하는 행위라던가 검색 결과에서 특정 문서/이미지 등을 선별해서 확인하는 행위, 마음에 드는 문서들을 스크랩한다거나 하이퍼링크를 걸어두는 행위, 관심이 있는 사이트를 자신의 RSS 목록에 추가하여 구독한다거나 링크 목록 (통하는 블로그나 친구 목록 등 포함)에 웹사이트를 등록하는 행위, 딜리셔스에 태깅을 하거나 개인 브라우저에 북마킹을 하는 것, 때로는 특정 문서를 개인 하드디스크에 저장을 한다거나 프린트하는 것, 그리고 특정 문서를 조회하는데 소요되는 시간 등도 모두 추천 시스템의 일종인 것이다. 찬/반 투표, 추천제, 포인트제와 같이 사용자들이 명시적으로 추천하는 행위가 드러나는 경우를 명시적 추천 시스템 Explicit Feedback이라 하고, 검색페이지에서 특정 결과를 조회한다거나 북마킹을 하는 등의 행위를 암묵적 추천 시스템 Implicit Feedbak이라 한다. 물론, 댓글을 달거나 스크랩을 하는 행위 등은 명시성과 암묵성의 중간 정도에 위치한 하이브리드 추천 시스템이라 불러도 될 것같다. 경우에 따라서 암묵적 추천 행위가 더 흔히 발생해서 많은 누적 데이터들이 존재하는 경우도 있지만, 때론 사용자들의 행동 패턴을 쉽게 잡아낼 수가 없어서 이런 암묵적 데이터를 모으기 힘든 경우도 있다. 그리고, 그런 행위들을 분석하는 방법이 쉽지가 않기 때문에, 일단 이 포스팅에서 암묵적 추천 시스템에 대해서는 논외로 하겠다. (물론, 추후에 암묵적 추천 시스템에 대한 더 구체적인 사례와 분석 방법 등에 대해서 다룰 예정이다. 본인이 회사에서 담당하고 있는 많은 업무들이 이런 암묵적 추천 피드백을 분석하는 내용이기 때문에, 그리고 실제로 그런 분석결과가 서비스에 많이 반영되어 있기 때문에, 이 내용을 그냥 넘어갈 수는 없는 노릇이다. 그리고, 옆의 그림은 현재 다음 내의 여러 서비스에서 활용하고 있는 다양한 추천시스템의 예시를 보여주고 있다. 순서대로, 다음 아고라의 찬/반 투표, 블로거뉴스의 추천제, tvPot의 와우포인트제, 신문기사의 이메일송신/프린트/스크랩 시스템이다. 앞의 3개의 경우 명시적 추천시스템의 대표적인 예시가 될 것이고, 마지막의 스크랩의 경우 명시성에 대한 구분이 조금 모호하다. 스크랩 회수나 이메일 공유 등의 회수를 명시적으로 기입해서 정보로 활용하기 때문에 명시적이라 볼 수도 있지만, 일반적으로 collaborative filtering에서는 북마킹을 한다거나 프린트를 하는 등의 행위를 암묵적 추천으로 간주한다.
명시적 추천 시스템의 작동에 따른 구분
앞 단락에서는 추천의 명시성에 따른 추천 시스템을 구분하였다면, 이번 단락에서는 명시적 추천 시스템에서 추천 점수 관리 방법에 따라서 어떤 종류의 추천 시스템이 있는지에 대해서 간단히 설명하려 한다. 첫째, 가장 대표적인 추천 방법은 블로거뉴스나 digg.com에서 사용하듯이 1/0 방식의 추천이다. 즉, 문서의 내용 (주제, 논지, 디자인 등의 모든 또는 일부)이 마음에 드는 경우에 추천 버튼을 누름으로써 해당 포스팅은 포인트가 증가하고, 그렇지 않는다면 현 상태로 머무르게 되고 시간이 지남에 따라서 자연스럽게 퇴출되는 형태를 취한다. 와우포인트도 이름과 형태는 조금 달라보이지만, 1/0 추천의 대표적인 사례로 볼 수가 있다. 두번째의 경우는 +1/0/-1 방식의 추천이다. 대표적인 사례가 아고라 토론에서 찬/반 투표를 예로 들 수가 있다. 이런 경우 마음에 드는 문서의 경우 찬성 (+1) 추천을 하지만, 반대 의견이거나 또는 (극단저으로 표현해서) 문서의 존재 가치가 없다고 판단되는 경우 반대 (-1) 추천을 한다. 물론, 평이한 문서에 대해서는 추천을 하지 않음으로써 자연스럽게 0의 값을 가지게 된다. 그러나, 일반적으로 조회수에 대한 추천수의 비율에 따른 문서의 품질을 평가할 수 있기 때문에 0의 추천이란 일종의 반대 추천으로도 볼 수가 있다. 방향성을 가진다는 측면에서 1/0 방식보다 진화된 추천으로 볼 수가 있다. 일반적으로 +1/-1을 각각으로 구분해서 찬성베스트/반대베스트로 운영을 할 수도 있고, (찬성 - 반대)에 따른 운영, 또는 (찬성 + 반대)에 따른 운영 (호응도) 등의 다양한 운영이 가능하다. 세번째 추천 시스템 역시 1/0의 발전된 형태로 N/.../1/0 방식의 추천이다. 보통 도서, 상품, 판매자 등에 대한 비뷰/평을 적을 때 점수제 시스템에서 많이 이용되고 있다. 보통의 경우 N은 5나 10점 스케일로 운영된다. (N값은 magic number (7)에서 벗어나지 않는 것이 좋다.) 이 시스템의 장점으로는 찬성의 정도를 숫자로 표시할 수 있다는 점이다. 그렇지만, 이론적으로 최하점수가 0점이지만, 실제 서비스 운영 단계에서 최하점수가 1점이라 헛점이 있다. 즉, 1/0에서는 추천하지 않으면 단순히 0점으로 가정할 수 있으나, N//0의 경우에는 추천하지 않는다는 것이 단순히 0점이라고 가정할 수가 없다. (예를들어, 상품을 구매해서 사용하기 전에는 (실제) 평점을 매길 수가 없다.) 그래서, 총점/평점을 집계할 때, 단순 조회인 0의 추천이 집계가 반영되지 않는 경우가 대부분이다. 1/0에서도 추천 버튼을 두번이상 누름으로써 N/0 방식으로 구현이 가능하지만, 추천의 신뢰성이나 민주성을 위해서 보통 1회로 한정짓는 경우가 많다. 네번째로 볼 수 있는 형태는 +1/0/-1과 N//0 방식의 합쳐진, +N//0//-N의 추천 방식이다. N//0의 방식에서는 마음에 들지 않는 문서의 경우 평가를 하지 않거나 1점 등의 낮은 점수를 부여하겠지만, +N//-N 방식에서는 품질이 낮은 경우 명시적으로 마이너스 (-) 점수를 부여할 수가 있다.