Sustainable Web EcoSystem (SubEco)

'분류 전체보기'에 해당되는 글 17건

카테고리 없음 | Posted by Bahniesta 2009. 7. 8. 19:03

[도서추천] The New Influencers 링크의 경제학, by Paul Gillin

이전 포스팅에서, 지속가능한 웹생태계 SubEco의 주요 동인 중에 하나로 '자발성'을 제시한 적이 있다. 그런 측면에서 현재 웹생태계에서 '블로그'만큼 자발성의 매체는 없는 것같다. 물론, 다른 다양한 게시판/커뮤니티 활동이나 사진/동영상 등의 UCC 물들이 끊임없이 저작되고 배포/공유되고 있다지만 블로그에 비해서 상징성이 조금 떨어지는 것같다. 그리고, 최근에 들어서는 소셜 미디어 Social Media의 측면에서 블로그의 기능 및 역할에 대한 관심도 커진 상태이다. 그런데 하나의 매체가 영향력이 커지면서 의례 따라오는 것이 상업성인 것같다. 최근의 다음뷰에서 블로거들에 의해서 논쟁된 주제도 과도한 블로그상업성이었음을 상기할 필요가 있다. 특히, 블로그에 접속했을 때 가장 먼저 보이는 그리고 화면 전체를 뒤덮은 광고들을 볼 때마다 글에 대한 흥미를 잃어버린 사람은 본인 뿐만은 아니라 생각한다. 구글의 애드센스니 다음의 애드클릭스니 뭐 이런 종류의 우발적 클릭에 의한 돈벌이보다는 좀더 체계적인 그리고 창의적인 돈벌이 수단으로 블로그를 이용하면 좋겠다는 생각을 항상 가지고 있었다. 블로거의 생각인 본문보다 더 많은 광고들로 인한 상업성 부각 또는 순수성 상실이라는 부작용이 없는 돈벌이에 대한 충분한 고민을 해볼 시점이다. 광고가 노출되지 않으면서 블로그를 통해서 돈을 벌 수가 있다면...

그런 측면에서 '링크의 경제학'은 현재 블로고스피어에서 발생하는 다양한 현상들을 제대로 보여주고 있다. (물론, 한권의 얇은 책이 모든 내용을 커버할 수는 없겠지만...) 특히, 마케팅의 관점에서 그리고 소셜미디어로써의 블로그를 잘 조명해주고 있다. 특히, 많은 블로거들이 관심을 가질만한 Earning from Blogging에 대한 창의적인 또는 우발적인 emergent 사례들을 많이 확인할 수가 있다.

링크의 경제학
카테고리	경제/경영
지은이	폴 길린 (해냄출판사, 2009년)
상세보기

저작자표시 비영리 변경금지

Resources | Posted by Bahniesta 2009. 5. 4. 01:27

[도서추천] The GridLock Economy 소유의 역습: 그리드락, by Michael Heller

오늘 추천하는 책은 사회에 존재하는 다양한 소유권의 파편화 현상을 다룬 책이다. 직접적으로 지속가능성이라던가 그린 이코노미 등과는 관련성이 적지만, 본문에서 잠시 다루고 있는 특허 및 저작권 등의 사유재산 보호차원의 활동들이 어떻게 지속가능한 성장을 방해하고 있는지에 대해서 생각할 수 있는 좋은 기회를 제공해주고 있다. 특허제도의 시작이 개인의 사유재산을 보호해줌으로써 개인이 가지고 있는 창의적인 생각들을 대중에게 발표할 수 있는 기회를 제공해주는 것에 있다. 비슷한 취지로 저작권의 보호 또한 개인의 창장물을 세상에 공표하면서 그 창작물에 대한 권리를 부여받는 것이다. 이런 제도 및 법의 취지에는 전혀 하자가 없지만, 책에서 다루듯이 때로는 부작용을 일으켜서 새로운 창작을 방해하는 경우가 허다하다. 책에서도 다루었듯이, 기존 음악들을 샘플링하고 리믹스를 한 음악들이 저작권 보호 차원에서 장려되지 못하는 현상이 발생한다. 리믹스된 음악은 분명 새로운 창작물이지만 기존 창작물에 걸려있는 저작권이라는 태그는 새로운 리믹스 현상을 방해하는 장애물로 작용하고 있다. 비슷한 사례는 특허 전쟁에서 더욱 명확히 드러난다. 특히, 제3세계의 빈곤 및 질병을 퇴치하기 위한 다양한 식품 및 의약 분야의 창조적 에너지가 특허라는 울타리 내에서 갖혀서 빛을 보지 못하는 경우가 허다하다. 단순히 경제 논리로만으로 해결할 수 없는 수많은 문제와 이슈들을 우리는 너무 쉽게 경제 논리라는 잣대를 들이대는 경우가 허다하다. 경제와 인권, 경제와 도덕, 경제와 X에 대해서 더 깊은 성찰과 반성 및 검토가 필요한 시점이다.

책에서 저작권이나 특허가 무시되어야 한다고 주장하는 것은 아니다. 그렇지만 더 큰 인류의 복지와 헤택을 위해서 때론 우회하는 방법이 제공되어져야 한다고 역설하고 있다. 책에서도 그리드락을 피하는 몇 가지 방법들을 제시하고 있지만 가장 큰 그리드락은 인간이 가진 욕심이 아닌가 한다. 내 것이기에 남이 사용할 수 없는 미사용 underuse 현상이나 모두의 것이기에 내가 마음대로 사용하는 과사용 overuse 현상은 모두 인간의 욕심이라는 프레임 안에서 해석해야 정당한 결론을 내릴 수 있을 것이다. 내 것이기 때문에 이웃과 공유하고 우리의 것이기 때문에 조심스럽게 사용할 수 있는 그런 미덕이 현대를 살아가는 우리들에게 절대적으로 필요하다.

지속가능을 위해서는 그리드락을 지헤롭게 해결해야 한다. 내가 만든 저작물의 저작권은 분명히 보호받아야 한다. 그렇지만 잠긴 (Locked) 보호가 아닌 열린 (Open) 보호가 되어져야 한다. (닫힌 Closed라는 표현을 굳이 사용하지 않았다.) 우리 사회에서 발견되는 많은 그리드락의 상태의 예제들은 책을 통해서 얻을 수 있다. 그와 함께 우리 사회에 존재하는 수많은 가능성, 즉 그리드오픈 상태의 예제들도 쉽게 접할 수가 있다. 특히 소프트웨어 분야에서는 GNU로 대표되는 오픈소싱운동이 개인의 사소한 권리를 포기함으로써 인류 전체의 권익에 기여하는 것을 우리는 이미 보고 있다. 그리고 그런 혜택을 이미 누리고 있다. 지금 우리가 쉽고 저렴하게 인터넷 환경을 구축할 수 있었던 원동력도 이런 오픈소싱의 결과물이다. WWW라는 웹의 탄생 신화를 통해서 우리는 이미 목격했다. 그리고 이를 지원하는 다양한 소프트웨어들 - 아파치, 톰캣, 자바, 이클립스, 마이에스큐엘, 등 - 이 웹생태계에서 그리드락이 해제된 상태를 여실히 보여주고 있다. 이미 웹생태계에서는 지속가능성의 세계로, 그리드락에서 그리드오픈의 세계로 향해가고 있다.

비단 이런 소프트웨에어서의 그리드오픈만으로는 충분치가 않다. 소프트웨어들이 웹을 구동하는 기본 인프라를 구성해주고 있다면, 이런 웹인프라를 완성시켜주는 다양한 정보/데이터들도 그리드오픈 상태로 되어져야 한다. 모든 저작물들에 대한 저작권을 부인하는 것이 아니다. 다양한 저작권-프리 저작물들이 많아졌으면 하는 바램일 뿐이다. 물론, 그런 저작권-프리 컨텐츠를 사용함에 있어서 그런 저작물을 만든 이들에게 항상 감사와 경의를 표시해야함도 잊어서는 안 된다. 그런 차원에게 일전의 포스팅을 통해서 "지식의 유틸리티화 Knut (Knowledge Utility)"를 주장한 바가 있다. 지식 및 그것의 생성에는 저작권이 부여되어져야 한다. 그렇지만 다양한 형태로 재활용될 여지는 남겨둬야 한다. 그 저작물들이 재가공해서 마치 자신의 것인양 배포하는 그런 얌체족들이 우려가 되는 시점이지만, 우리는 웹생태계에의 자생력과 자기정화능력을 신뢰해야 한다. 그렇지 않고서는 지속가능 웹생태계 SubEco는 단지 이상에 불과하다.

소유의 역습 그리드락
카테고리	경제/경영
지은이	마이클 헬러 (웅진지식하우스, 2009년)
상세보기

저작자표시 비영리 변경금지

Column & Opinion | Posted by Bahniesta 2009. 4. 18. 00:30

Sustainable and Universal Recommendation System (SURS) 민주화된 추천 시스템... (2)

지난 포스팅에서 현재 많이 이용되고 있는 다양한 (명시적) 추천 시스템의 종류를 소개하였다. 이 포스팅에서는 지난 글에 이어서, 더욱 중요한 이슈인 '지속가능한 보편 추천 시스템 SURS'에 대해서 생각을 정리하려 한다. 즉, SURS가 과연 무엇이며, 어떻게 SURS를 만들 것인가? 그리고 기존의 시스템의/과의 진화 및 조화 등에 대해서 글을 전개하려 합니다.

지속가능한 보편 추천 시스템 (SURS)

무엇이 지속가능한 보편 추천 시스템인가? 쉽게 접근해보자. 분명 '지속가능성'과 '보편성'은 다른 의미를 가졌지만, 본문에서는 같은 의미로 쓰일 수 있을 것같다. 물론 지속가능성은 시간축에서의 보편성을 많이 내포하고 있고, 보편성은 공간축에서의 지속가능성을 많이 내포하고 있다. 즉, 시대나 공간에 좌우되지 않는 그런 일반성을 말해주는 공통점이 있다. (일방성은 아이러니하게도 특수성도 내포하고 있다.) 시간축에서 본다면 현재 참인 것이 과거에도 참이었고, 미래에도 여전히 참인 것이다. 그리고 공간상으로 말해서 한국에서 참인 것이 미국이나 유럽에서도 참인 것이다. 그래서 SURS는 시간의 변화에도 일관성을 가져야하지만 공간이 바뀌어도 통일된 모습을 보여줘야 한다. 인터넷 공간으로 축소시킨다면, 예를 들어, 다음 블로거뉴스에서의 추천시스템이 다음 아고라에서의 찬/반시스템과 원론적으로 같은 역할, 기능, 구조, 디자인,... 을 해야 한다.

... 아직 글을 마치지 않았습니다.. 글을 적을 시간도 없고, 내용 전개도 어렵네요. 그래도, 앞으로 지속가능하고 보편적인 추천 시스템에 대해서 이 글을 업데이트함으로써 글을 계속 전갤할 예정입니다.

SURS (Sustainable and Universal Ranking System)이어야 한다...

추천시스템이 웹문서를 조회하는데 방해가 되면 안 된다..

SUD (Sustainable and Universal Design) or DfSU (Design for Sustainability and Universality)... 지속적이고 보편적인 디자인/설계...

저작자표시 비영리 변경금지

FreeTalks | Posted by Bahniesta 2009. 4. 10. 23:35

Never Say Don't Be Evil...

이미 많은 블로거들이 언급했던 문제를 다시 짚어보려고 한다. 바로 구글 YouTube 이야기다. 엠비 정권이 들어온 이후로 IT 정책에 대한 잡음이 많이 있었고, 그런 것 중에 하나가 일정 규모 이상의 인터넷 사이트들은 모두 실명제를 기본으로 해야한다는 정책이 있다. 미국의 많은 사이트들을 방문해 보면 알겠지만, 사이트에 가입하기 위해서는 기본적인 정보만 입력하면 된다. 보통 기본 정보라는 것도 이메일 주소 정도만 입력하고, 입력된 메일을 통해서 전달된 confirmation URL을 따라 들어가서 확인 절차만 거치면 사이트 가입이 완료된다. 물론, 가입 후에 개인의 취향에 따라서 자신의 이름이나 학력, 현재 직장 등의 프로필을 작성해서 채워넣는 구조로 되어있다. 우리가 잘 알고 있는 Google, Twitter, Facebook 등의 대부분의 사이트들이 그렇다. 이들 사이트들은 상업성이 조금 낮기 때문에 개인정보를 속이더라도 크리티컬한 문제를 일으키지 않을 것이다라는 견해를 밝힐 수도 있겠지만, 이베이나 아마존과 같은 상업에 초점을 맞춘 사이트들도 위와 같은 간소한 가입절차에는 큰 차이가 없다. 한국에서는 인터넷을 사용하기 위해서는 먼저 MS의 IE 브라우저를 사용해야 한다. (나같은 비우호 MS 친애플 성향의 사용자에게는 무덤과도 같은 곳이다.) 그리고 주민등록번호라던가 PIN같은 개인식별코드가 있어야 한다. 그리고 신용결제를 위해서 여러 보안프로그램을 설치해야 한다. (이들 대부분의 보안 프로그램들도 IE에서만 작동하는 것은 너무나 잘 알려진 사실이다.) 그러나 외국의 사이트들을 이용할 때는 개인식별정보라던가 신용카드 사용 등에 제약이 크지가 않다. 전통적으로 한국과 같은 e-신용카드보다는 수표문화에서 발달된 신용카드문화를 가지고 있기 때문에 신용카드 사용 패턴이 다른 점도 무시할 수는 없다. ... 이런 한국과 다른 문화 사회적 배경을 지닌 미국 회사 Google의 입장에서는 정부에서 일방적으로 추진하는 본인 실명확인제가 부담스러울 것이다. 미국 내에서는 정부에서 범죄 사실을 조사하기 위해서 정보공개를 요청한 것을 일언지하에 무시해버린 구글로써 미국 정부의 똘마니인 한국 정부의 무식한 드라이브에 순순히 응해주리라고 기대했던 것부터가 잘못의 시작이다. 여러 블로거들은 지금 구글의 실명제 거부 움직임에 대해서 찬사를 보내고 있다. 물론 본인도 '역시 구글이다'라는 생각을 가지고 있다. 일개 대한민국 정부보다 더 큰 회사인 구글, 그리고 물리적 세계보다 더 넓고 다양한 인터넷이라는 사이버 세상의 지배자의 모습을 본 것이다. 어떻게 보면 그들의 오만함을 직접 눈으로 확인하는 그런 사건인지도 모른다. 여기에서 한번 짚고 넘어가야할 사건이 있었다. 구글이 중국시장을 진출할 때, 중국 정부가 요구한 불용어들에 대한 검색조작을 받아들였다. 중국 시장의 규모와 중국 정부의 힘 앞에는 순한 양의 모습을 보여줬던 구글을 생각해봐야 한다. 물론 여전히 중국 시장에서 고전을 면치 못하고 있지만, 앞으로의 가능성만큼은 인정하고 있는 것같다. ... 그리고 한국 내에서 구글의 입지도 말이 아니다. 전 세계 70%이상의 검색시장을 장악하고 있지만 유독 동방의 작은 나라 대한민국에서는 토종 기업들에 고전을 면치 못하고 있다. 국내의 검색광고 시장도 시장개척자인 오버츄어에 맥을 못 추기고 있다. 지메일의 인기가 날로 늘어나고 있지만 그래도 대부분의 한국사람들은 한메일이나 네이버 등의 메일을 주로 이용하고 있고, 이 글을 시작하게 된 유투브도 혁신적인 기능들을 가지는 있다지만 국내의 다양한 서비스들에 고전을 면치 못하는 것도 사실이다. 한국에서 유투브 실명제 거부는 단순히 그들이 밝히듯이 표현의 자유를 위한 투쟁일까? 아니면 어차피 가능성도 낮은 시장에서 한 발 빼기인가? 만약, 중국 정부에서 실명제를 밀어붙인다면 구글이 중국정부의 요구를 일언지하에 무시할 것인가? ... 구글이 엠비 정부에 한방을 먹인 것은 분명 통쾌하지만 구글이 한국을 그리고 한국의 사용자를 생각하는 수준을 그대로 표출한 것은 아닌지 조심스럽게 검토해봐야 한다.

저작자표시 비영리 변경금지

Column & Opinion | Posted by Bahniesta 2009. 3. 26. 09:51

新 평판의 시대... Into the Neo-Ruputation Era (Internet & Reputation)

한국에서는 각종 리스트들 때문에 시끄럽다면, 미국에서도 또 하나의 리스트 - AIG의 고액 보너스 지급 명단 - 때문에 시끄럽다. 미하원에서는 50억달러 이상의 구제금융을 받은 기업들에 대해서, 25만달러 이상의 고액 보너스를 받는 경우 최대 보너스의 90%까지 세금으로 되돌려받는 법안이 이미 통과해서, 상원의 결정을 기다리고 있는 중에 있다. 그리고, 검찰 측에서는 이런 고액 보너스 지급자들에 대한 명단공개를 고려중이라는 소문도 자자하다. 그런 가운데 오늘 재미있는 기사가 하나 실렸다. 최고 고액 보너스를 받은 임원 10명 중 9명이, 그리고 금융사업 부분 임직원 중 보너스를 가장 많이 받은 20명 가운데서 15명이 보너스를 자진해서 반납하기로 의사를 밝혔다는 것이 기사의 요지였다. (관련기사보기) 이 기사를 보면서 머리 속에서 섬광처럼 스친 생각이 과학과 인터넷의 시대인 21세기가 깊어갈수록 과거 어느 시절보다 더 평판이라는 것이 사람들에게 중요해지고 있다는 것이다. 앞서 말한 AIG의 케이스도, 결국은 자신의 이름이 공개될 것이 두려워서 보너스 자진반납이라는 결론에 이르게 된 것이다. 그래서 21세기를 신평판의 시대라 부를만하다.

인터넷 공간에서 떠도는 많은 소문들이 결국은 평판이라는 이름으로 귀결될 수가 있다. 우리는 이미 많은 '~녀' 시리즈들을 알고 있다. 개똥녀, 똥습녀, 된장녀 등의 많은 ~녀 시리즈가 인터넷 공간에서 생겨서 가공되고 배포되고 있다. 이런 다양한 ~녀 시리즈에 대한 자세한 스토리를 다룰 필요는 없지만, 결론은 '평판의 시대'로의 진입했다는 것이다.

20/21세기에서 평판의 역할을 재조명해주는 사례로 방글라데시의 그라민은행을 들 수가 있다. 그라민 은행은 방글라데시의 대학교수 '무하마드 유누스'에 의해서 영세민들에게 소액대출을 제공해주는 기관이다. 그라민 은행의 주요 대출자들은 영세민들이다. 즉, 그들은 은행에서 대출을 받기 위해서 맡길 담보가 전혀 없다라는 점이다. 이런 환경에서 그라민 은행이 성공할 수 있었던 이유는 대출금을 제때 갚지 못하는 경우, 그들이 살고 있는 동네/지역 사람들에게 대출을 못 갚는 것에 대해서 공개적으로 알린다는 점이다. 대출금을 제대로 못 갚는다는 자존심을 건드리는 것이 그 무엇보다도 큰 담보 역할을 한 것이다. ~녀 시리즈가 그랬듯이, 그라민 은행의 성공 요인은 사람들이 자신의 평판에 그만큼 중요하게 생각한다는 점을 이용한 것이다. (결국, 그라민 은행의 성공은 무하마드 유누스에게 2006년 노벨 평화상이라는 영예를 안겨주었다.)

실생활의 클론 공간으로써 인터넷에서 ~녀 시리즈와 같은 평판이 실제하듯이, 웹생태계에 내재한 평판 Intrinsic Reputation도 존재한다. 웹의 기본 속성으로 민주성이라는 주장은 이미 이전 포스팅에서 말했지만, 그와 함께 웹생태계의 비민주성에 대해서도 이미 다루었다. 웹문서의 랭킹 (노출순위)이라는 것이 (대부분의 경우) 민주적인 방법으로 순위가 정해졌지만, 순위가 정해진 그 시점부터 더이상의 민주성을 기대할 수가 없도록 만드는 메커니즘이다. 웹문서의 랭킹을 결정하는 방법인 페이지랭크 PageRank만을 떼놓고 생각해보면, 모든 웹페이지들이 다른 웹페이지들을 링크를 걸어줌으로써 추천/투표에 참여하는 민주성이 바탕이 되지만, 영향력이 높은 웹페이지의 추천/투표가 더 큰 가중치를 갖는다는 것도 이미 알려져있다. 웹페이지의 영향력이라는 것도, 페이지랭크 초기에는 페이지랭크의 재귀계산을 통해서 얻어졌지만, 랭킹 알고리즘이 진화하면서 페이지랭크에 의한 영향력 산정의 영향력이 감소하고 있다. 어떠한 이유에서던 신뢰도가 높은 사이트에 등록된 글이나 평판좋은 저자/게시자의 글들이 가지는 영향력이 더 크지고 있는 것이 사실이다. 만약 뉴욕타임스의 어떤 컬럼니스트가 본인이 적고 있는 이글과 똑같은 글을 적어서 뉴욕타임스 컬럼에 실는다면, 본 포스팅이 가지는 의미는 갑자기 몇 갑절 증가할 것이 당연해진다. 뉴욕타임스라는 신뢰도 높은 사이트가 가지는 영향력과, 뉴욕타임스 기자/컬럼니스트라는 신뢰도 높은 저자가 가지는 영향력이 단순한 개인 블로그와 일개 개발자인 본인의 신뢰도 및 영향도보다 크다는 것은 사실이기 때문이다. 이런 신뢰도나 영향도를 현재의 포스팅의 프레임에 맞춘다면 '평판'이라고 요약할 수가 있다. 지금 SURS 1편를 적은 이후에, 2편을 준비 중에 있지만, 웹의 다양한 추천시스템들도 평판을 최대한 활용하고 있다. 다음 블로거뉴스 (다음뷰)의 오픈에디터들의 추천행위가 일반 대중들의 추천행위보다 높은 가중치를 받는다는 것도 주지의 사실이며, 다음 아고라에 어떤 유명인사 (또는 단체)가 글을 적는다면 평소보다 높은 관심을 받고 조회수를 기록하게 된다는 것도 우리는 이미 알고 있다. 물론 블로거뉴스에서도 이전 히스토리를 바탕으로 특정 블로거들의 글이 일반인, 특히 루키 블로거들,의 글보다 높은 관심을 받는다는 것도 경험상으로 알고 있다. 인터넷이라는 신평판 사회에서 각 개인의 평판이라는 것이, 이렇듯 글을 적을 때나 추천을 할 때, 또는 심지어 단순히 글을 조회할 때에도 영향을 미칠 수가 있다. 친구가 적은 글보기, 친구가 추천한 글 보기, 친구가 읽었던 글 보기... 등등의 소셜네트워킹을 이용한 미디오 배포행위도 일종의 친구라는 친밀감/동질성을 바탕으로 한 평판의 종류가 되고,... 그리고 앞으로 명사가 읽은/추천한 글 (기사) 보기와 같은 서비스도 조만간 등장할 것이다. 대표적인 경우가, 노전대통령이 본 기사들, 스티브잡스가 읽었던 기사들, 교황이 추천한 기사들과 같은 형태의 서비스가 오늘 바로 등장하더라도 전혀 이상하지 않다. 이 역시 조회자/추천자의 유명성이라는 평판에 기댄 서비스가 될 것이다.

분명 인터넷의 등장은 우리에게 익명성과 무한한 자유를 주었지만, 그와 함께 평판의 중요성을 다시 강조하고 있다. 인터넷의 시대는 평판의 시대이다. 평판이라는 것이 때로는 족쇄로 작용할 수도 있고, 영향력/유명성/신뢰성 등으로 작용할 수도 있다. 이 평판의 시대에 당신이 어떻게 적응하고 활용하고 가꾸느냐에 따라서 당신의 가치가 더욱 빛날수도, 또는 세상에서 잊혀질 수도 있다. 지속가능한 웹생태계란 그 속에서 숨쉬는 우리들의 평판 역시 지속가능한 형태로 보존해줄 수 있는 그런 환경이 아닐까 생각한다.

"신평판의 시대에 오신 것을 환영합니다. Welcome to Neo-Reputation Era."

저작자표시 비영리 변경금지

Column & Opinion | Posted by Bahniesta 2009. 3. 20. 02:19

Technical Perspective to Abusing... 조회수 조작과 이면기술에 대한 소고

** 본 포스팅은 2009년 3월 19/20일에 있었던 MBC의 100분토론 '공권력과 인권'에서 잠시 다루었던 다음 아고라의 특정게시판/게시물의 조회수 조작에 대한 소고, 및 이런 조회수 조작 어뷰징에 대한 기술적인 이야기만을 다룹니다. 일반 어뷰징, 특히 스팸,에 대한 내용은 아닙니다.

** 본 포스팅에서 제시한 내용들은 특정 업체에서 사용중인 방법에 대한 설명이 아닙니다. 대부분 상식적인 수준에서 추론된 내용이므로, 각 회사에서 실제 운영중인 방법이 아님을 미리 밝힙니다. 단순 참고용 설명이므로 오해가 없으시길 바랍니다.

서론

몇 일전에 경찰에서 다음 아고라의 특정 게시물의 조회수를 비정상적으로 높인 네티즌 3명을 인터넷 여론조작 협의로 압수수색을 단행했다는 기사가 나왔다 (관련 기사들). 그리고 어제/오늘 100분토론에서 고 장자연씨와 관련된 연예계의 비리/이면에 대한 충분한 준비가 되지 못한 상태여서, 위의 경찰의 과잉 선재 대응에 대해서 적법한 공권력의 투입인가 아니면 일반 국민들의 표현의 자유를 침해하는 인권유린인가에 대한 토론으로 주제를 급하게 바꾸었다. 토론의 도입부를 제대로 지켜보지 못했지만, 위의 인위적 조회수 조작에 대한 기술적인 내용을 좀 다룬 것같아서, 이와 관련된 몇 가지 이야기를 다루려고 한다.

조회수 조작 방법

특정 게시물의 조회수를 높인다는 의미는 일반인들에게 그 게시물이 많은 사람들의 관심을 받고 있는 거구나라는 착각을 일으킬 염려는 충분히 있다. 지난 SURS 포스팅에서 다룬 암묵적 추천의 한 형태로 조회수를 들 수가 있다. 그런 의미에서 조회수를 높인다는 행위는 어떻게 보면 기만행위일 수도 있다. 그렇지만, 본인의 다른 블로그의 한 포스팅에서 인위적으로 조회수를 높이는 행위는 역으로 글의 품질/랭킹요소를 낮출 수도 있음을 밝혔다. 즉, 게시물의 랭킹 모델에서 추천수, 조회수, 댓글수와 같은 숫자들이 높게 나오면 당연히 좋은/관심있는 게시물로 인정을 받을 수가 있지만, 전체 조회수에 대한 추천수의 비율과 같은 조회수 조작에 따른 상쇄효과도 있음을 밝혔다. 즉, 추천수가 증가하지 않는 단순한 조회수 증가는 글의 신뢰성에 상당한 침해를 받을 수가 있다는 요지이다. 어쨌던, 조회수 조작에 따른 효과 여부 (예, 여론조작여부, 다음에 대한 업무방해여부, 또는 표현의 자유여부) 등에 대해서는 다른 각계각층에서 다양한 의견을 개진할 것으로 보이니, 본 포스팅에서 더 깊이 다룰 필요도 없고 본인은 그런 능력도 없다. 그래서 본론인 어떻게 조회수를 조작하는가로 넘어가겠다.

조회수 조작의 방법은 간단하고 저렴한 것에서부터 복잡한 것에 이르기까지 다양하다. 가장 간단한 조회수 조작의 방법은 게시판의 글목록에서 해당 글을 계속 클릭해서 들어가는 것이다. 이런 조작에 들어가는 시간과 노력에 비하면 효과가 적을 수가 있는 원시적인 조회수 조작방법이 아닐까 생각한다. 여기에서 조금 진화한 모델이 가족/친구 등의 지인들을 동원해서 게시물을 계속 조회하는 방법이 있겠지만, 이는 단순히 참여 인원을 증가시킨 것 외에 특별할 것은 없는 것같다. 좀 더 진화를 한다면 해당 게시물에 대한 URL을 낚시성으로 메일을 보낸다거나 다른 게시판들에 도배를 해서 일반인들이 접속하도록 유도하는 방법도 있겠다. 두번째로 생각할 수 있는 방법은, 100분토론에서도 언급되었지만 현재 페이지에서 F5키를 눌러서 계속 reloading/refreshing을 시켜서 조회수를 높이는 방법도 있다. 보통 오락기의 버튼을 계속 누르고 있으면 연사기능이 작용하는 것과 같은 원리이다. 손으로 계속 누르고 있거나 동전을 키보드에 끼워넣는다거나 아니면 단순히 무거운 물건을 키보드에 올려놓는다거나 등의 기술적인 방법은 다양할 것이다. 이런 경우 보통 조회수 로그에 일정한 패턴 (시간간격)으로 기록이 남기 때문에 조작여부를 쉽게 판단 및 방어할 수 있을 것이다. (그러나 뒤에서 말하겠지만 개념적으로 쉽게 적발가능하지만, 기술적으로 어려운 점이 있다.) 그리고, 마지막으로 가장 진보된 형태는 조회수 조작 프로그램 또는 로봇을 사용하는 방법이다. 프로그램의 작동원리는 사람들이 해당 게시물을 계속 조회한다거나 리로딩시키는 방법과 특별히 다를 것은 없다. 단지 기계가 해당 페이지를 접속한다는 점만을 제외한다면. 그리고, 이런 프로그램들의 경우 조회 간격 (시간텀)을 임의로 조절할 수 있기 때문에, 수동적인 단순 리로딩보다는 찾아내기가 어렵다. (물론 불가능하다는 것은 아니다.) 이런 조작 프로그램을 이용하는 경우에 특히 문제가 되는 것은 좀비PC와 결합될 때이다. 좀비PC란 일반 컴퓨터들이 바이러스 또는 봇에 감염되어 사용자들이 사용하지 않는 휴면 상태에서 원격컴퓨터에 의해서 제어되어 마치 좀비와 같이 행동한다고 붙여진 이름이다. (나쁜 의미에서 좀비PC로 불리지만, 학계/연구 분야에서는 중앙집중식의 슈퍼컴퓨터를 대체시키는 분산/그리드 컴퓨팅 Distributed/Grid Computing의 한 형태로 많은 연구가 이루어지고 있는 분야이다.) 좀비PC들에 의해서 분산 공격을 받는다면 조회수 조작의 파급력도 커질 뿐만 아니라, 특정 IP에서의 공격이 아니기 때문에 조작을 적발하기가 더 어려워진다. (일반적으로 DDoS로 알려진 기술과 유사점을 보인다.)

어떻게 조회수 조작을 적발할 것인가?

조회수 조작이 위와 같이 간단하듯이, 역으로 조회수 조작을 적발하는 것도 간단하다. 즉, 특정 위치 (IP 등으로 추적)에서 특정 게시물을 상식 외로 많이 조회하는 경우를 조회수 조작으로 협의지으면 되는 것이다. 특히 조회의 간격 (시간텀)이 거의 일정하다는 추가적인 정보가 있다면 거의 확실한 물증이다. 또는, 평소와 달리 특정시간대에 특히 많은 조회가 몰렸다면 이런 경우도 조회수 조작으로 의심을 가질 수 있다. 특히 좀비PC와 봇에 의한 조작의 경우 접속IP와 시간텀이 다양하기 때문에 앞서 제시한 방법으로 쉽게 찾아낼 수가 없다. 뿐만 아니라 최근에는 사용자들의 IP 등을 임의로 변경해주는 프로그램 또는 업체들이 있기 때문에 상식선에서 조회수 조작을 찾아내기가 더욱 힘들어진다. 그래서 특정시간대에 비정상적으로 많은 조회가 이루어진다면 이런 경우에 한해서 조회수 조작을 의심할 수가 있다. 그러나 프로그램을 사용하는 경우, 접속/조회시간을 랜덤하게 변경하고 그 간격을 넓게 잡을 수 있기 때문에 이 방법에도 분명 한계가 있다. (그러나, 시간 간격을 넓게 잡는다면 조회수 조작의 효과가 없을테니...) 접속지역 (IP 등)도 속이고 접속방법도 속이고 접속시간간격도 속이는 등의 지능화된 조회수 조작이라면... 쉽게 찾기는 어려울 듯하다. 물론, 지난 몇일, 몇주, 몇달, 심지어 몇년 간의 누적 데이터를 분석한다면 전혀 불가능한 일은 아니지만, 뒤에서도 다루겠지만 실효성이 많이 떨어질 것이다.

조회수의 기록

위에서 말한 조회수의 조작을 찾아내기 위해서는 사용자들의 접속/조회에 대한 기록을 남겨둬야지 가능하다. 보통 로그 Log라는 파일의 형태로 사용자들의 행동 패턴이 기록에 남는다. 특히 Apache 웹서버를 사용하는 경우, 기본적으로 apache log가 서버에 남게 된다. 그렇지만 apache log는 가장 기본적인 최소한의 로그만을 남겨놓기 때문에 향후에 활용성이 많이 떨어지는 면이 있다. 이런 파일 형태 뿐만 아니라, 서비스의 시간을 줄이기 위해서 DB에 다양한 정보를 남기는 경우도 많이 있다. 파일형태의 로그의 경우 로그를 파싱해서 유용한 정보 (예, 특정인에 의한 조회수)를 찾아내는데 시간과 비용이 많이 들어가지면, DB형태의 로그는 구조화되어있을 뿐만 아니라 DB에서 제공해주는 다양한 집계 기능으로 유용한 정보를 쉽게, 그리고 빠르게 얻어낼 수 있는 장점이 있다. 그런데, DB라는 것이 모든 정보를 무한정으로 쌓아둘 수는 없다. 파일로그보다 더 많은 디스크 공간을 차지할 뿐만 아니라, 지나치게 큰 정보 (많은 columns)를 많이 (많은 rows) 가지고 있다면 DB의 퍼포먼스를 떨어뜨려서 처음에 가졌던 DB의 장점을 상쇄시키게 된다. 그런 점에서 현재 많은 회사/서비스들에서 실시간 서비스를 위해서 모든 접속/조회 정보를 DB에 누적해서 다시 조회/가공하는 방법은 그리 많이 사용하고 있지 않는다. 대신에, DB에서는 조회에 대한 메타정보만 기록을 하고 상세정보는 파일로그에 남기는 하이브리드 형태로 운영하는 경우가 많다. 예를 들어, 특정 게시물에 누군가가 접속/조회를 하면 view_cnt와 같은 변수의 값을 +1씩 증가시켜서 DB에 기록을 남겨두고, 그 사람의 접속기록 (접속 IP, 접속시간, referer 등)의 상세기록은 파일로 차곡차곡 쌓아두는 방법을 취하게 된다. 이렇게 되면, 실시간 서비스에서는 특정 게시물의 조회수 등을 빠르게 보여주고, 문제가 될 때만 파일로그의 상세 정보를 검사해보면 된다. 이런 하이브리드 형태의 로깅 운영의 부작용으로는, 특히 조회수 조작이라는 측면에서, 누가 언제 몇 번 조회/접속했는지에 대한 정보를 실시간으로 감시하기 어렵다는 점이다. 이런 측면에서 업체들에서 (실시간) 죄회수 조작을 막는 것이 거의 불가능하다고 주장하고 있다. 물론, 또다른 형태의 하이브리드 방법을 도입해서 적발/방어가 충분히 가능하지만 더 많은 비용이 소요되기 때문에 어려움이 있을 따름이다. 즉, 조회메타정보에 대한 DB와 상세한 파일로그와 함께, 상세한 조회정보를 DB에 한시적으로만 저장해두는 방법이 있다. 추측건데, 많은 업체들이 조회수 조작이라는 부작용 때문에 이런 형태로 실시간 대응 전략을 세웠으리라 본다. ... 이 단락을 요약하면, 분석의 용이성 및 신속성의 측면에서 DB를 활용하지만 DB에 저장될 수 있는 데이터의 용량에 한계가 있고 실시간 서비스를 위해서는 최소한의 데이터만을 DB로 남기고 있기 때문에 DB로그가 조회수 조작 대응에 실효성이 많이 떨어진다.

P.S.

앞에서 간단히 조회수 조작을 찾는 방법에 대해서는 이미 다루었다. 특정 IP를 사용하는 경우 또는 특정시간대에 활동하는 경우에 대해서 조회수 조작을 충분히 확인할 수가 있다. 그렇지만 이런 기본적인 방법 외에도 조회수 조작 적발 또는 조작된 조회수의 원상복구 등에 대해서도 다양한 전략들이 있을 것이다. 실시간으로 조회수 조작 사용자를 찾아서 해당 IP를 막는다는 등의 실시간 대응 뿐만 아니라, 시간이 경과한 후에 아파치로그 등을 분석해서 불필요한 조작된 조회수를 DB 메타정보에서 제거하는 후속 대응도 현재 운영중인 걸로 알고 있다. 재미있는 것은 후속대응으로 인해서 때로는 조회/추천수가 감소하는 경우도 존재할 수도 있다. 업체 측에 의한 조회/추천수 조작설 등의 다양한 음모론이 펼쳐질 여지가 충분히 있는 것같다. 그리고 또 다른 음모설에 대해서 언급하자면... 현재 다음 아고라 게시판과 같은 경우 여러 대의 컴퓨터를 병렬적으로 연결시킨 분산컴퓨팅을 활용하고 있다 (일반적으로 하나의 서비스를 위해서 최소 두대의 서버가 필요하다. 분산처리 뿐만 아니라, 서비스 백업을 위해서). 그래서 각 서버별로 별도의 로그기록을 남겨두고 있기 때문에, 실시간으로 모든 서버의 로그 데이터를 취합하기란 사실상 불가능하다. 이런 분산 데이터의 싱크 문제로 인해서 조회/추천수가 일시적으로 증가/감소하는 현상이 종종 발생할 수도 있다. (게임에서 잠시 랙이 걸리는 것과 같은 현상)

P.S.2

아파치로그에 대한 기술적인 내용은 생략은 생략하겠다. 사용자들의 IP, 접속시간, referer 등의 정보들이 보통 남게 된다. 아파치로그에 대한 자세한 사항은 아파치 홈페이지에서 참조하기 바랍니다.

저작자표시 비영리 변경금지

FreeTalks | Posted by Bahniesta 2009. 3. 15. 23:57

강제력이 자생력을 이길 것인가? Authority vs Spontaneity

** 본글은 FreeTalks라는 카테고리가 말해주듯이, 자유로운 생각을 담은 자유로운 글입니다.

사이버경찰청에 의한 접속불허 메시지

국내에 유명한 성인사이트가 하나 있다. 어떤 이들은 벌써 입술에 미소를 머금으며 이곳이 아닐까하는 상상을 펼쳤을 것이다. 그렇다. 많은 분들이 생각하고 계시는 그곳, 일명 'S사이트'이라는 성인사이트다. (유입경로가 이상한 것만 나와서 사이트 이름을 그냥 S로 변경함) 나름 열혈남아로써 가끔 접속해서 므흣한 감정을 가져본다는 것을 굳이 숨길 이유는 없을 것같다. 그런데, 작년부터인가 옆의 그림과 같이 사이버경찰청에 의해서 원래의 URL로는 접속이 막혀버렸다. 그래서 한동안 접속을 하지 못하고 아쉬움을 뒤로했었다. 그러다가 인터넷을 검색하게 되었다. 완전히 사이트가 폐쇄된 것인지 아니면 한국에서만 막혀버렸는지 등이 궁금하기도 했고, 완전 폐쇄가 아니면 어떻게라도 접속할 수 있는 방법이 있는지 등도 궁금했다. (국내서버에서 해외서버로의 이전에 관한 이야기는 2006년도 기사를 참조하기 바란다.) 그런데, 역시나 나와 비슷한 관심을 가진 많은 사용자들이 있었고, 우회접속방법에 대한 질문과 답변들이 다음 신지식에 여럿 눈에 띄었다. DNS Free 소프트웨어를 사용하는 방법이 있다던데, 필자는 Mac을 사용하기 때문에 국내의 비정상적인 인터넷 환경의 혜택을 제대로 누릴 수 없어서 잠시 좌절을 했지만, DNS Free라는 방법을 사용하지 않더라도 우회URL을 통해서 원래사이트로 접속할 수 있다는 것을 확인할 수 있었다. 그래서 한동안 혼자만의 은밀한 생활을 즐겼는데, 어느 순간엔가 그 우회URL에서도 위의 그림과 같은 똑같은 사이트폐쇄 메시지를 보여주었다. 한번의 경험이란 참으로 무섭다. 역시나 다시 인터넷을 뒤적거리니 속도면에서 신통찮지만 외국의 사이트를 우회하는 방법도 있었지만, 또 다른 우회URL도 확인할 수가 있었다. 이전의 URL과 비슷하지만 마지막 확장자만 조금 바뀐 그런 URL이었다. 그래서 또 다시 폐쇄 메시지가 나타나면 확장자를 바꾸어가면서 접속을 시도해보았고, 역시나 제대로 접속이 돼는 URL이 존재하는 것을 확인할 수가 있었다. 그런데 최근에는 더이상 우회URL에 바꿀 확장자가 없는 사태에 이러렀는데, 운영자는 친절하게도 앞으로 변경될 새로운 URL명을 공지해주었다. 그러고 보니, 일반적으로 사용하는 확장자의 개수는 십여개로 제한되어있지만, 새롭게 만들 수 있는 URL의 개수는 거의 무제한에 가깝다.

왜 이렇게 장황하게 서론을 적었느냐하면, 서론의 마지막에서 시사하듯이 경찰들이 강제로 특정 사이트를 폐쇄한다고 하더라도 그들의 행동을 비웃으면서 새로운 사이트를 무한대로 개설할 수가 있는 것이 오늘날의 인터넷 환경이다. 즉 강제력으로 사회 (웹생태계)를 정화시킬 수가 없다는 비극적인 결론에 이르게 된다. 인터넷 검색 회사 (물론, 공식적으로나 일반인들은 미디어 회사로 인식하지만)에서 양질의 문서들을 발굴하고 저질의 문서들을 제외시키는 작업을 담당하고 있는 본인으로써도 위의 경찰들이 느낄 좌절감을 항상 경험하고 있다. (구체적인 방법은 기밀이므로 따로 밝히진 않겠지만) 성인사이트를 폐쇄하는 경찰들의 노력과 유사하게 항상 그들의 뒷꽁무니만 쫓아다니면서 가능한 빨리 찾아내서 검색 결과에서 제외시키는 알고리즘을 개발하고 있다. 결론은 너무 뻔하게도 웹생태계의 정화는 강제력이나 물리력이 아닌 성숙한 시민의식의 고양이나 자발성 또는 자생력에 달려있다. (지금 현실 세계에서는 이상한 공권력이 잠시 이긴 것처럼 보이지만 궁극에는 시민들의 발상성과 민초들의 자생력이 승리한다. 손바닥으로는 자신의 눈만 가릴 뿐이다. 웹생태계에서도 당연하다.)

요지는 강제력의 한계와 자생력의 끈기다.

인터넷 음란물이나 저작권 위반과 같은 저질의 문서들이 주로 지인들과 자료(??)를 공유하기 위해서라는 순수한 목적을 가진 경우도 존재한다. 그렇지만 많은 경우 이런 미끼를 던져서 사람들을 유인해서 자신의 다른 목적 (소위 상업성)을 충족시키려는 경우가 많다. 그래서 인터넷 클린캠페인에서나 아니면 개별 인터넷업체에서 이런 위법적인 저작물들을 감시하는 활동을 대대적으로 벌인다. 클린캠페인의 많은 부분이 저작권 관련된 기관들의 압력이 있음이 당연하지만, 사설 인터넷 업체들의 경우 검색의 품질이 떨어지는 것을 두려워하고 있다. 그런데, 20세이상의 권장한 성인들의 권리는 어떻게 될 것인가?

저작자표시 비영리 변경금지

Column & Opinion | Posted by Bahniesta 2009. 3. 1. 23:28

Sustainable and Universal Recommendation System (SURS) 민주화된 추천 시스템... (1)

이전 "인터넷과 민주주의"라는 포스팅을 통해서 현재 사이버 스페이스에 존재하는 다양한 (명시적) 추천 시스템을 개괄하였다. 그런 추천 시스템들은 민주적 속성과 비민주적 속성을 동시에 가지고 있다고 말했다. 이 포스팅에서는 이런 추천 시스템에 대해서 더 자세히 알아보고, 어떻게 하면 이런 추천 시스템이 지속가능하고 보편적이 될 것인가에 대해서 논하겠다. 단순히 웹 생태계에 존재하는 다양한 정보나 정보 출처들에 대한 랭킹을 정하는 문제에 대해서 다루는 다양한 글들이 존재한다. 본 포스팅에서는 그런 일반적인 웹문서의 랭킹에 초점을 맞춘 글이 아님을 미리 밝혀둔다.

추천 시스템의 종류: 명시적 vs 암묵적 vs 하이브리드

다음에서 활용중인 다양한 추천 시스템들...

추천 시스템을 채택/활용한 많은 서비스들을 우리는 이미 많이 사용하고 있다. 대표적인 경우가 다음의 아고라에서 글의 논지에 대한 찬/반 투표, 블로거뉴스의 추천제도나 tvPot의 와우포인트, 인터넷 서점에서의 개별 도서의 사용자 리뷰 점수, 메카니즘은 조금 다르지만 뉴스기사나 블로그/게시판의 글들에 다는 댓글 시스템, 게시판의 목록에서 특정 게시글을 선정해서 조회하는 행위라던가 검색 결과에서 특정 문서/이미지 등을 선별해서 확인하는 행위, 마음에 드는 문서들을 스크랩한다거나 하이퍼링크를 걸어두는 행위, 관심이 있는 사이트를 자신의 RSS 목록에 추가하여 구독한다거나 링크 목록 (통하는 블로그나 친구 목록 등 포함)에 웹사이트를 등록하는 행위, 딜리셔스에 태깅을 하거나 개인 브라우저에 북마킹을 하는 것, 때로는 특정 문서를 개인 하드디스크에 저장을 한다거나 프린트하는 것, 그리고 특정 문서를 조회하는데 소요되는 시간 등도 모두 추천 시스템의 일종인 것이다. 찬/반 투표, 추천제, 포인트제와 같이 사용자들이 명시적으로 추천하는 행위가 드러나는 경우를 명시적 추천 시스템 Explicit Feedback이라 하고, 검색페이지에서 특정 결과를 조회한다거나 북마킹을 하는 등의 행위를 암묵적 추천 시스템 Implicit Feedbak이라 한다. 물론, 댓글을 달거나 스크랩을 하는 행위 등은 명시성과 암묵성의 중간 정도에 위치한 하이브리드 추천 시스템이라 불러도 될 것같다. 경우에 따라서 암묵적 추천 행위가 더 흔히 발생해서 많은 누적 데이터들이 존재하는 경우도 있지만, 때론 사용자들의 행동 패턴을 쉽게 잡아낼 수가 없어서 이런 암묵적 데이터를 모으기 힘든 경우도 있다. 그리고, 그런 행위들을 분석하는 방법이 쉽지가 않기 때문에, 일단 이 포스팅에서 암묵적 추천 시스템에 대해서는 논외로 하겠다. (물론, 추후에 암묵적 추천 시스템에 대한 더 구체적인 사례와 분석 방법 등에 대해서 다룰 예정이다. 본인이 회사에서 담당하고 있는 많은 업무들이 이런 암묵적 추천 피드백을 분석하는 내용이기 때문에, 그리고 실제로 그런 분석결과가 서비스에 많이 반영되어 있기 때문에, 이 내용을 그냥 넘어갈 수는 없는 노릇이다. 그리고, 옆의 그림은 현재 다음 내의 여러 서비스에서 활용하고 있는 다양한 추천시스템의 예시를 보여주고 있다. 순서대로, 다음 아고라의 찬/반 투표, 블로거뉴스의 추천제, tvPot의 와우포인트제, 신문기사의 이메일송신/프린트/스크랩 시스템이다. 앞의 3개의 경우 명시적 추천시스템의 대표적인 예시가 될 것이고, 마지막의 스크랩의 경우 명시성에 대한 구분이 조금 모호하다. 스크랩 회수나 이메일 공유 등의 회수를 명시적으로 기입해서 정보로 활용하기 때문에 명시적이라 볼 수도 있지만, 일반적으로 collaborative filtering에서는 북마킹을 한다거나 프린트를 하는 등의 행위를 암묵적 추천으로 간주한다.

명시적 추천 시스템의 작동에 따른 구분

앞 단락에서는 추천의 명시성에 따른 추천 시스템을 구분하였다면, 이번 단락에서는 명시적 추천 시스템에서 추천 점수 관리 방법에 따라서 어떤 종류의 추천 시스템이 있는지에 대해서 간단히 설명하려 한다. 첫째, 가장 대표적인 추천 방법은 블로거뉴스나 digg.com에서 사용하듯이 1/0 방식의 추천이다. 즉, 문서의 내용 (주제, 논지, 디자인 등의 모든 또는 일부)이 마음에 드는 경우에 추천 버튼을 누름으로써 해당 포스팅은 포인트가 증가하고, 그렇지 않는다면 현 상태로 머무르게 되고 시간이 지남에 따라서 자연스럽게 퇴출되는 형태를 취한다. 와우포인트도 이름과 형태는 조금 달라보이지만, 1/0 추천의 대표적인 사례로 볼 수가 있다. 두번째의 경우는 +1/0/-1 방식의 추천이다. 대표적인 사례가 아고라 토론에서 찬/반 투표를 예로 들 수가 있다. 이런 경우 마음에 드는 문서의 경우 찬성 (+1) 추천을 하지만, 반대 의견이거나 또는 (극단저으로 표현해서) 문서의 존재 가치가 없다고 판단되는 경우 반대 (-1) 추천을 한다. 물론, 평이한 문서에 대해서는 추천을 하지 않음으로써 자연스럽게 0의 값을 가지게 된다. 그러나, 일반적으로 조회수에 대한 추천수의 비율에 따른 문서의 품질을 평가할 수 있기 때문에 0의 추천이란 일종의 반대 추천으로도 볼 수가 있다. 방향성을 가진다는 측면에서 1/0 방식보다 진화된 추천으로 볼 수가 있다. 일반적으로 +1/-1을 각각으로 구분해서 찬성베스트/반대베스트로 운영을 할 수도 있고, (찬성 - 반대)에 따른 운영, 또는 (찬성 + 반대)에 따른 운영 (호응도) 등의 다양한 운영이 가능하다. 세번째 추천 시스템 역시 1/0의 발전된 형태로 N/.../1/0 방식의 추천이다. 보통 도서, 상품, 판매자 등에 대한 비뷰/평을 적을 때 점수제 시스템에서 많이 이용되고 있다. 보통의 경우 N은 5나 10점 스케일로 운영된다. (N값은 magic number (7)에서 벗어나지 않는 것이 좋다.) 이 시스템의 장점으로는 찬성의 정도를 숫자로 표시할 수 있다는 점이다. 그렇지만, 이론적으로 최하점수가 0점이지만, 실제 서비스 운영 단계에서 최하점수가 1점이라 헛점이 있다. 즉, 1/0에서는 추천하지 않으면 단순히 0점으로 가정할 수 있으나, N//0의 경우에는 추천하지 않는다는 것이 단순히 0점이라고 가정할 수가 없다. (예를들어, 상품을 구매해서 사용하기 전에는 (실제) 평점을 매길 수가 없다.) 그래서, 총점/평점을 집계할 때, 단순 조회인 0의 추천이 집계가 반영되지 않는 경우가 대부분이다. 1/0에서도 추천 버튼을 두번이상 누름으로써 N/0 방식으로 구현이 가능하지만, 추천의 신뢰성이나 민주성을 위해서 보통 1회로 한정짓는 경우가 많다. 네번째로 볼 수 있는 형태는 +1/0/-1과 N//0 방식의 합쳐진, +N//0//-N의 추천 방식이다. N//0의 방식에서는 마음에 들지 않는 문서의 경우 평가를 하지 않거나 1점 등의 낮은 점수를 부여하겠지만, +N//-N 방식에서는 품질이 낮은 경우 명시적으로 마이너스 (-) 점수를 부여할 수가 있다.

... 다음글에서 계속...

저작자표시 비영리 변경금지

Column & Opinion | Posted by Bahniesta 2009. 2. 21. 04:32

정보/지식의 재활용 Web EcoSystem & Recycling

사이버 공해 (정보 공해)

공해 Pollution란 무엇인가? 백과사전/국어사전의 정의는 다음과 같다.

인간의 생산활동과 소비과정에서 환경이라는 자원의 사용, 파괴, 소모로 인해 불특정 다수에게 건강과 생활환경에 침해를 주는 재해현상 [다음 백과사전]
또는
산업이나 교통의 발달에 따라 사람이나 생물이 입게 되는 여러가지 피해, 자동차의 매연, 공장의 폐수, 여러 종류의 쓰레기 따위로 인하여 공기와 물이 더렵혀지고 자연환경이 파괴되는 문제 따위 [다음 국어사전]

현재 "생태계 파괴 원인 = 공해"라는 등식이 성립한다. 전통적으로 천재지변도 생태계를 파괴한다. 그러나, 인재에 의한 천재지변에는 많은 비난 여론이 따르지만, 자연적인 천재지변은 대체로 숙명으로 받아들인다. (물론 그런 숙명에도 맞설려는 시도가 줄곳 이어지고 있지만...) 앞의 백과사전/국어사전의 정의를 요약하자면 공해란 '인간의 활동의 비정상적인 부산물로 인한 환경 파괴' 정도로 요약할 수 있을 것같다. 같은 논리를 웹생태계에 적용해보면, 웹생태계의 공해 (또는 정보 공해, 사이버 공해)란 사이버 스페이스에서의 인간의 활동이나 그에 따른 부산물들로 인한 웹생태계의 파괴 정도로 정의내릴 수 있다. 이런 정보공해의 종류에 대해서는 '웹생태계 파괴자들' 편에서 이미 개관하였다. 앞에서 공해를 정의할 때, '비정상'적이라는 용어를 사용하였다. 자연의 한 구성요소로써 정상적인 인간 활동의 부산물들 (인간의 신진대사 등에서 발생하는)에 대해서는 특별히 공해라는 표현을 쓰지 않는다. 그러나 비정상적인 부산물들을 특히 공해라고 말한다. 비정상적이라는 말은, 자연에서 얻어지는 것이 아닌 인공합성물 (공장 등에서 발생하는 화학 오염물질 등)이나 "과도한" 생활 쓰레기 등을 지칭한다. 이런 관점에서 웹생태계에서의 공해를 재정의하면, 인공합성물에 해당하는 경우로는 인신공격이나 허위사실 유포 등의 위법/범법 컨텐츠, 개인의 사생활을 해치는 컨텐츠, 성인 도박 등의 미풍양속을 해치는 컨텐츠 등의 악성 게시물들이 이에 해당될 수 있으며, 후자의 과도한 생활쓰레기에 해당되는 경우는 불필요한 (때론 혐오스럽고 아름답지 못한) 정보의 홍수 (대량 중복)를 들 수가 있다. 그런데, 이번 포스팅에서는 특히 (불필요한) 정보의 중복문제에 초점을 맞추려 한다.

같은 정보가 끊임없이 재생산되어서 사용자들에게 제공된다면 그 정보의 건전성 및 유익성과 무관하게 사용자들은 공해로 인식한다. 만약 당신이 구글이나 다음 등의 검색에서 '공해'를 검색한 경우, 모든 검색결과가 위키피디어에서 제공하는 (또는 위키피디어의 것을 복제한) 공해에 대한 사용자 정의만으로 이루어졌다면 어떻게 되겠는가? 분명 위키피디어의 정의는 유용한 정보이지만, 나머지의 똑같은 정보는 더 이상 정보로써의 효용가치가 없고 쓰레기 정보가 된다. 또는 당신이 조회한 특정 게시물이 불필요한/무의미한 단어들의 반복으로만 이루어졌다면, 또는 상업/낚시성 메일이 계속 온다면 이 또한 정보공해로 인식할 것이다. 그렇다면, 이런 중복성 공해를 해결할 방법은 없을까? 후자에서 예시로 든 악성 중복 공해의 경우 게시자의 자발성과 신뢰성에 의존할 수 밖에 없거나 시스템 (스팸 필터링 시스템이나 사용자들의 자정 노력/신고 활동 등)에 의해서 제거 또는 제재하는 것 외에는 특별한 방법이 없는 듯하니, 논의의 대상에서 제외하고 본 포스팅에서는 유용한 정보의 중복 문제에 초점을 맞춘다.

(유용한) 정보의 중복의 대표적인 사례는 '펌질'로 알려진 '스크랩'이다. 초기의 인터넷 포털 등에서는 활성화를 위해서 스크랩 행위를 권장했던 측면을 부인할 수가 없다. 그리고, 특별히 웹문서의 품질을 평가할 수 있는 방법이 없기 때문에 (이전 포스팅의 페이지랭크나 추천시스템도 웹문서 품질을 보증해주지는 못한다), 사람들에 의해서 판단된 정보의 질, 즉 스크랩의 회수,에 따른 웹문서의 품질평가라는 달콤한 유혹으로 현재도 인터넷 포털들은 스크랩 행위의 부당/부정성에 대해서 강력하게 제재를 가하지 못하는 딜레마에 빠져있기도 하다. (국내에서는 대표 포털인 네이버가 가장 큰 오명 (펌로그)을 받고 있지만, 다음에서도 비슷한 현상이 부각되지 않았을 뿐이고, 네이트의 사이월드의 경우 스크랩 행위를 소셜네트워킹이라는 미명 아래 장려했던 정책이다.) 스크랩 행위를 조금 더 옹호하자면, 1) 웹문서의 품질 평가의 지표로 활용될 수가 있다 2) 유용한 웹문서의 대중화/전달에 기여한다 등으로 요약될 수 있지만, 1) 정보의 과도한 중복 문제 뿐만 아니라 2) 웹문서의 저작권 침해와 3) 애초 웹문서에 포함되었던 비밀정보 (개인정보 등)의 무분별한/의도치 않은 공개 등의 더 큰 문제점들이 있다.

정보/지식의 유틸리티화

논조가 이상하게 보일 수도 있으나, 이런 중복/스크랩의 문제를 해결하기 위한 방법으로 (온전한) 스크랩을 제시하려 한다. 해결책으로 제시하는 스크랩은 현재의 무분별란 '펌질'이 아니라, 정보/지식의 유틸리티화를 통한 정보 (전달)의 규격화/인프라화, 정보의 재사용, 그리고 정보의 자원화를 뜻한다. 구체적인 논의에 앞서 유틸리티 utility (public utility)란 전기, 상하수도, 도시가스 등과 같이 개인이 생산, 관리하기가 어려운 자원/시설 등의 공공재로써, 개인의 사용량에 따라서 금액을 차등 지불하는 방식을 취한다. 그래서 정보/지식의 유틸리티화란 거대한 정보/지식 아카이브 (위키피디어와 같은)를 구축하여 누구던지 이 지식 아카이브에 접근해서 정보를 열람하고 (규격화) 정보를 재정의 및 활용하고 (재사용) 또 경우에 따라서 지식사용량/가치에 따른 정보료를 제공하는 (자원화)를 뜻한다.

먼저, 정보 (전달)의 규격화란 단순히 누구나 자유롭게 열람할 수 있는 인터페이스 및 권한을 부여하는 것 뿐만 아니라, 이런 유틸리티 지식/정보를 활용하는 방법에서의 (사용) 규칙/가이드라인 등의 제반사항의 규격화의 의미를 내포한다. 일례로, CCL (Creative Commons) 등의 저작권 표시 규정을 준수한다거나 모든 정보를 전부 스크랩해서 자신의 공간에 넣는 것이 아니라 내용의 일부 (시작부분 또는 요약정보 등)만을 자신의 공간에 제시하고 나머지 정보에 대해서는 원문을 링크해주는 방식 등을 취하는 것이다. 이런 스크랩의 사회적/암묵적 합의의 도축과 규칙의 제정, 그리고 이런 합의된 규칙의 시스템화하는 것 등이 정보의 규격화이다.

두번째로, 정보의 재사용은 앞서 제시한 합의된 규칙 내에서 지식 아카이브의 정보를 자유롭게 활용하는 것을 뜻한다. 즉, 지식 아카이브의 정보를 자유롭게 열람 및 자신의 공간에 일부 삽입할 때, 원저작자 및 출처를 명확히 밝히고 원문전체가 아닌 요약정보만 삽입하는 등으로 정보를 재사용해야 한다. 그리고, 일부 사설 아카이브의 정보를 이용할 경우 (개인 블로그나 단체의 카페/사이트 등)에도 앞서 말한 요약정보이용 및 출처 명시 등의 규약을 따르는 것뿐만 아니라, 원저작물에 포함된 프라이버시 (개인정보)를 함부로 누설하지 않는다는 등의 자기 규제도 필요하다. Note: 정보의 재사용은 정보의 복재와 구별된다. 정보의 복재는 단순히 원문 내용의 일부나 전부를 카피해서 자신의 공간에 옮겨놓는 것이지만, 이 포스팅에서 제시하는 정보의 재사용은 원문의 내용을 참조하는 것이다. 즉, 단순히 원문의 텍스트가 옮겨지는 것이 아니라, 원문의 내용을 조회할 수 있는 코드가 심겨지는 것이다. 예를 들어, 이 포스팅의 시작부분에 다음 백과/국어사전에서 제공하는 공해의 정의를 단순 복사/복재하여 사용하였다. 위의 정의는 이 포스팅의 일부로 단순히 옮겨진 것이다. 그러나 정보의 재사용 프레임워크에서는 자바스크립트와 같은 코드가 포스팅에 심겨져서 다음 백과/국어사전의 내용을 단순히 현재 화면에 보여주는 것이다. 구글의 애드센스나 블로그 위젯 등과 같은 형태의 참조형 디스플레이라고 생각하면 된다.

마지막으로, 정보의 자원화는 필요시 원저작자에게 저작행위에 대한 대가를 지불하는 것이다. 현재 정품 도서나 음반을 구입하는 적극적인 정보이용료의 제공이 대표적인 사례가 될 수가 있다. 웹생태계에서도 보고서나 다양한 문서/템플릿 등을 구입해서 열람하는 것도 이런 정보 자원화의 일원이고, 위키피디어 등의 지식아카이빙 작업 지원을 위한 도네이션을 하는 방법도 있다. 그리고, 지식 정보료는 단순히 통화단위로의 과금 뿐만 아니라, 오픈소싱과 같이 기존 정보를 더욱 유익한 정보로 재가공해서 타인들도 자유롭게 활용할 수 있도록 재공유/재유틸리티화하는 행위 등을 포괄한 개념이다.

우리는 웹생태계에 이미 많은 지식을 보유하고 있으며 앞으로 계속 추가해나갈 것이다. 그렇지만 무분별하게 중복된 내용들이 존재한다면 이는 정보의 유용성을 넘어 정보의 공해로 받아들여질 것이다. 그리고 사회적 합의를 어기면서까지 이루어지는 정보의 중복은 더욱 큰 문제점이다. 새로운 대안으로 (공공재) 지식/정보에 대해서는 아카이빙, 자유 접근, 이용 규칙 준수, 정당한 정보료 제공 등의 지식/정보 유틸리티화를 제안한다.

** 전기, 상하수도, 가스 등의 현물 유틸리티는 전통적으로 좋은 사업 기반이 되었고, 최근 인터넷의 발전과 함께 데이터 스토리지나 웹 서비스/애플리케이션 등의 정보 인프라 유틸리티는 현재의 각광받는 사업 분야이다. 같은 맥락에서 정보/지식 자체의 유틸리티도 앞으로 유망한 사업 분야임에 틀림없다.

저작자표시 비영리 변경금지

Column & Opinion | Posted by Bahniesta 2009. 2. 20. 19:33

인터넷과 민주주의 (페이지랭크를 중심으로) Democratizing the Internet (Focus on Google's PageRank)

지난 포스팅에서, 지속가능 웹생태계의 특징 또는 원동력으로 웹생태계의 민주성에 대해서 말했다. 흔히들 인터넷이라는 가상의 세계가 현실 세계에서의 민주주의를 확장시켰다고 말한다. 인터넷 게시판을 통해서 말하고 즐기는 자의 한계에서 벗어나서 그들의 현실 정치 참여에 대한 가능성은 지난해에 입증되었다. 2008년도의 대한민국은 미국산 쇠고기 개방 및 그 후의 촛불집회 등을 통해서 단순히 인터넷 공간에서만 활발히 활동하던 오타쿠적인 사람들의 방 밖으로의 엑소더스와 그 후 현실에서의 즐김의 문화를 만든 것은 인터넷 민주주의의 대표적인 사례연구로 남을 것이다. 인터넷 인간들의 실생활로의 확장은 역으로 인터넷 공간에서의 삶의 확장까지 이어졌다는 점도 주목해야 한다. 각설하고, 이 글에서는 인터넷의 확장이 민주주의 재도약에 어떤 역할을 하느냐에 대한 것이 아니다. 이 포스팅의 목적인 과연 인터넷 공간/웹생태계는 과연 민주적인가?에 대해서 논하고 싶다. 특히 현재 인터넷의 대표주자인 구글, 그리고 (아직까지는) 구글을 대표하는 웹문서 랭킹 알고리즘인 페이지랭크가 웹생태계에서의 민주주의를 구현했다고들 말한다. 과연 그런가?에 대해서 다시 생각해 볼 것이다. 뿐만 아니라, 대한민국 내의 여러 서비스에 적용된 민주적 추천시스템들 (아고라의 찬/반 투표나 블로거뉴스의 추천 등)이 과연 민주적으로 구현되었고, 그런 바탕에서 베스트 글들의 선정이 과연 정당한 결과인가 등에 대해서 논하려고 한다.

구글 페이지랭크와 인터넷 민주주의

페이지랭크의 설명예 (출처: 위키피디어)

구글의 페이지랭크 PageRank 알고리즘에 대한 기술적, 수학적, 또는 프로그래밍적인 설명을 굳이 이 공간에서 다시 다룰 필요는 없을 것같다. 간단히 개념적으로만 설명하자면, 많은 웹 문서들에 의해서 hyperlinked된 웹 문서는 그 중요도가 상대적으로 적게 링크된 문서들보다 높고, 또 상대적으로 중요한 웹 문서에 의해서 링크된 웹 문서가 그렇지 않은 것들보다 중요도가 높아진다는 것이 페이지랭크의 기본 구조이다. (참고로, 수리적으로 Stochastic Markov 모델과 Random Surfing 모델 등으로, 그리고 기술적으로는 MapReduce 알고리즘으로 알려진 분산처리기술로 대용량의 웹문서들 간의 상대적인 중요도가 구해지고 있다.) 그런데, 초기의 페이지랭크가 민주적이었다고 주장하는 이유는 앞서 설명했듯이 많은 문서들로 부터 링크된 (즉, 다른 문서들로부터 추천된 또는 투표된) 웹 문서의 중요도가 증가한다는 점이다. 즉, 많은 이들의 지지를 받아서 대표로 선출되는 방식이 현대의 대의 민주정치에서 대표을 선출하는 방식과 유사하다는 점이다. 그렇지만, 두번째 속성인 중요한 문서에 의해서 링크된 문서의 중요도가 증가한다는 점은 완벽한 평등을 제공해주지 못한다는 점을 보여준다. 어쩌면 그런 불평등이 현실의 모습 (힘있는 자들의 정치)을 더 잘 구현한 것도 사실이지만, 민주주의의 이상/평등과는 거리가 멀다. (물론, 웹생태계 파괴자들에 의한 정보의 왜곡은 분명 피해야 한다. 그런 점에서 악성 문서들의 투표권을 박탈하는 것은 어느 정도 일리가 있다.) ... 옆의 그림에서 보여지듯이 B와 C 사이의 상호추천도, 경우에 따라서 문제가 될 수가 있다. (악의가 없이) 친구끼리 서로 추천해주는 행위 자체는 큰 문제가 되지 않겠지만, 영향력이 있는 웹 문서들끼리 서로 카르텔을 형성해서 웹생태계에서의 부익부 빈익빈 현상이나 특수 이익집단이 발생할 가능성도 무시할 수 없다. 참고로, 현재의 구글검색에서 PageRank에 대한 의존도가 초기만큼은 크지가 않다. 즉, 구글 검색에서의 웹 문서 랭킹은 더이상 페이지랭크로 한정지을 수 없고, 구글랭크라고 불르는 편이 더 맞다. 그런 의미에서 페이지랭크가 웹생태계의 민주주의 구현이라는 초기의 신화는 어느 정도 재조정될 필요도 있다.

민주적 방법에 의한 웹 페이지들의 랭킹이라는 초기의 이상은 이제 사라졌지만, 여전히 인터넷 민주주의는 희망이 있다. 더 많은 웹 문서들이 생겨날 수록, 이전에 큰 영향력을 발휘하던 웹 문서들이 서서히 그 위력을 잃어갈 수도 있다. 그러나 인터넷에서 벌어지는 많은 현상들이 Power Law를 따르기 때문에 기존의 영향력있는 웹 문서들에 대한 선호 경향 Preferential Bias을 이용해서 네트워크의 허브로의 발전이 될 가능성이 높다는 점은 단순한 풀뿌리 민주주의를 구현하기에 어렵다는 점을 반증한다. 그래서 웹생태계의 (풀뿌리) 대중 민주화를 위해서는 기존의 (편중된) 영향력을 분산시키거나 대항할 수 있는 새로운 구조가 필요하다. 그런 대항력은 Sum of Power로 수식화되는 입장에서, 몇몇의 대규모 웹 소스들의 영향력을 상쇄시키기 위해서는 아주 많은 소규모 웹 소스들이 조직적으로 통합되어야 한다는 결론에 이르게 된다. 즉, 웹생태계에서의 진정한 민주성의 회복은 자발적 개인들의 참여와 협력에 의해서 이루어질 것이다.

명시적 추천 시스템

구글의 페이지랭크 알고리즘이 웹생태계의 암묵적 추천 시스템이라면, 다음 블로거뉴스이나 digg.com의 추천버튼이나 다음 아고라의 찬/반 버튼 등의 명시적 추천 시스템은 과연 민주적인가 비민주적인가도 생각해볼 필요가 있다. 일반 대중들 모두에게 추천버튼이 공개되어있고 추천에 참여할 수 있다는 점에서는 분명 민주적인 방법이다. 그렇지만 모든 대중들이 모든 웹문서들을 공평하게 조회할 수 있는 것이 아니라는 점에서 민주적인 것만 아니라고 할 수가 있다. 후자의 주장에서, 모든 대중이 공개된 모든 문서들을 볼 기회/권한이 없다는 것이 아니다. 그것보다는 어떤 기준들에 의해서 선별된 웹문서들만을 조회하고, 추천을 할 가능성이 높다는 점을 말하고 싶다. 즉, 블로거뉴스나 아고라에서 베스트글로 선정된 문서들은 그렇지 않은 문서들보다 조회 가능성, 그래서 추천 가능성이 상대적으로 높아진다는 점이다. 웹문서의 조회나 추천에서도 부익부빈익빈 현상이 벌어지고 있다는 점을 상기시키려는 것이다. 지난 암울했던 반세기를 거치면서, 우리 사회에 암묵적으로 받아들여진 개념으로 '평등'이라는 것은 사회/공산주의에 더 어울려서, 민주주의에 위배되는 속성으로 간주한다는 점이다. 분명히 해둘 점은 사회주의에서의 평등은 결과의 평등 (비약적으로 말해서, 모든 문서의 조회수와 추천수가 동일해야 한다)에 가깝지만, 민주주의에서의 평등은 기회의 평등 (즉, 모든 문서들이 열람 가능하지만 똑같은 수만큼 조회/추천할 필요는 없다)에 가깝다는 것이다. 각설하고, 그렇지만 현재의 웹생태계의 많은 서비스들이 기회의 평등을 제대로 구현하지는 못하고 있다. 기회의 불평등의 원인은 다양하다. 문서 제목 선택, 글쓰는 솜씨나 레이아웃, 주제의 시의/적정성 등과 같은 게시자의 능력이나 기존의 인맥이나 전문성 등과 같은 게시자의 명성/평판 등에 의한 (문서 열람) 기회의 불균등은 민주주의 사회에서 (경쟁의 개념으로 본다면) 당연한 것일 수도 있다. 그렇지만, 때로는 추천시스템의 구조적 취약성으로 인한 기회의 불균등도 존재한다. 가장 대표적인 경우가, 검색 결과의 상위에 노출된다거나 한 번 이상의 추천을 받은 웹문서의 경우 그렇지 않은 것들에 비해서 일반 대중들의 선택을 받을 가능성이 높아진다. 그래서 인위적인 부정클릭을 통한 추천수를 조작한다거나, 특정 키워드 (때로는 해당 웹문서와 관계가 없는 키워드)를 반복해서 검색엔진의 매칭점수를 높인다거나 거짓 하이퍼링크를 통해서 페이지랭크 값을 변형시키는 그런 시도들이 있었고, 여전히 성행하고 있다. 또 다른 경우는 웹문서의 중요도를 평가하는데 모든 추천자들의 추천이 동일한 영향력을 가지지는 않는다는 점이다. 이는 페이지랭크에서 중요하다고 판단된 문서들에 의해서 링크된 문서들이 더 큰 점수를 부여받는 것과 동일한 의미를 가지며, 또 페이지랭크에서 상호링크와 경우와 같이 일반적인 추천시스템에서도 친구들끼리 상호추천을 하는 등의 노이즈를 막을 방법이 없다는 점도 현재의 명시적 추천 시스템의 한계에 해당한다. (전자의) 일례로, 현재 다음의 블로거뉴스의 오픈에디터/열린편집자로 선정된 이들의 추천이 그렇지 않은 일반 대중들의 추천보다 베스트글을 선별하는데 더 큰 효과를 주는 것은 알려진 비밀이다. 그리고, 때로는 추천 시스템에서의 팬덤현상도 주의해야 하다. 특정 게시자의 명성에만 의존해서 그들의 웹문서의 내용과 상관이 없이 무조건 조회/추천을 하는 현상도 존재하며, 특정 주제에 대해서 웹문서에 선호추천을 하는 경우도 허다하다. 일례로, '미네르바'라는 아고라의 논객의 글에 대해서 팬덤현상을 일으킨 것도 부인할 수가 없다. (** 여전히 검찰/사법부의 이상한 행동은 여전히 이해불가이며, 웹생태계의 자정능력을 무시한 행위에 대해서는 여전히 의문부호를 던질 뿐이다. 미네르바 신드롬은 단지 팬덤현상이라는 측면에서 예로 든 것이다.)

인터넷의 기본은 정보를 담은 웹문서들과 그것을 저작하고 즐기는 인간들 사이의 유기적인 네트워크이다. 그렇지만 모든 피어 (peer, 웹문서 및 사용자)들이 모두 동일한 권한과 영향력을 가지고 있는 것이 아니다. 그래서 그들의 영향력이나 중요도 등을 판단하기 위해서 전통적인 TF/IDF를 이용한 Okapi BM25라던가 구글의 페이지랭크 (애스크의 엑스펄트랭크나 트러스트랭크 등 포함) 등의 웹문서 랭킹 알고리즘이 개발되기도 하고, 더 명시적으로 사람들의 추천행위를 이용한 웹문서의 중요도를 판단하는 알고리즘/시스템 등이 개발되고 있다. 보통의 경우, 이런 랭킹 알고리즘들이 충분히 민주적으로 웹문서들이나 또는 사용자들의 중요도/영향도를 측정해주지만, 실제 생활에서 민주주의가 왜곡되듯이 웹생태계에서의 이런 민주적 방법에 의한 웹문서 랭킹 방법도 왜곡을 현상을 보이기도 한다. 이런 왜곡현상을 방지 또는 최소화하기 위해서 인터넷 업체들에서 다양한 활동을 펼치고 있긴 하지만, 근본적으로 해소시키기 위해서는 웹생태계를 구성하는 우리 일반 사용자들의 이성적 활동 외에는 뽀죡한 방법이 없다.

글이 용두사미로 끝나는 감이 있지만, 웹생태계에서의 민주성을 해치는 행위는 나 자신의 자율성 및 민주성도 함께 해치는 행위가 될 것이며, 그 피해는 우리 모두에게 돌아올 것이다. 다음 포스팅은 웹생태계에서의 자원의 재활용 문제나, 지속가능한 추천시스템에 대해서 적을 예정이다. (그러나 그 때는 지금으로썬 알 수 없다.)

저작자표시 비영리 변경금지

Sustainable Web EcoSystem (SubEco)

'분류 전체보기'에 해당되는 글 17건

[도서추천] The New Influencers 링크의 경제학, by Paul Gillin

[도서추천] The GridLock Economy 소유의 역습: 그리드락, by Michael Heller

Sustainable and Universal Recommendation System (SURS) 민주화된 추천 시스템... (2)

Never Say Don't Be Evil...

新 평판의 시대... Into the Neo-Ruputation Era (Internet & Reputation)

Technical Perspective to Abusing... 조회수 조작과 이면기술에 대한 소고

강제력이 자생력을 이길 것인가? Authority vs Spontaneity

Sustainable and Universal Recommendation System (SURS) 민주화된 추천 시스템... (1)

정보/지식의 재활용 Web EcoSystem & Recycling

인터넷과 민주주의 (페이지랭크를 중심으로) Democratizing the Internet (Focus on Google's PageRank)

Category

Tag

Recent Post

Recent Comment

Recent Trackback

My Link

Archive

Calendar

티스토리툴바

« » 2024.12
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31