Sustainable Web EcoSystem (SubEco)

FreeTalks | Posted by Bahniesta 2009. 4. 10. 23:35

Never Say Don't Be Evil...

이미 많은 블로거들이 언급했던 문제를 다시 짚어보려고 한다. 바로 구글 YouTube 이야기다. 엠비 정권이 들어온 이후로 IT 정책에 대한 잡음이 많이 있었고, 그런 것 중에 하나가 일정 규모 이상의 인터넷 사이트들은 모두 실명제를 기본으로 해야한다는 정책이 있다. 미국의 많은 사이트들을 방문해 보면 알겠지만, 사이트에 가입하기 위해서는 기본적인 정보만 입력하면 된다. 보통 기본 정보라는 것도 이메일 주소 정도만 입력하고, 입력된 메일을 통해서 전달된 confirmation URL을 따라 들어가서 확인 절차만 거치면 사이트 가입이 완료된다. 물론, 가입 후에 개인의 취향에 따라서 자신의 이름이나 학력, 현재 직장 등의 프로필을 작성해서 채워넣는 구조로 되어있다. 우리가 잘 알고 있는 Google, Twitter, Facebook 등의 대부분의 사이트들이 그렇다. 이들 사이트들은 상업성이 조금 낮기 때문에 개인정보를 속이더라도 크리티컬한 문제를 일으키지 않을 것이다라는 견해를 밝힐 수도 있겠지만, 이베이나 아마존과 같은 상업에 초점을 맞춘 사이트들도 위와 같은 간소한 가입절차에는 큰 차이가 없다. 한국에서는 인터넷을 사용하기 위해서는 먼저 MS의 IE 브라우저를 사용해야 한다. (나같은 비우호 MS 친애플 성향의 사용자에게는 무덤과도 같은 곳이다.) 그리고 주민등록번호라던가 PIN같은 개인식별코드가 있어야 한다. 그리고 신용결제를 위해서 여러 보안프로그램을 설치해야 한다. (이들 대부분의 보안 프로그램들도 IE에서만 작동하는 것은 너무나 잘 알려진 사실이다.) 그러나 외국의 사이트들을 이용할 때는 개인식별정보라던가 신용카드 사용 등에 제약이 크지가 않다. 전통적으로 한국과 같은 e-신용카드보다는 수표문화에서 발달된 신용카드문화를 가지고 있기 때문에 신용카드 사용 패턴이 다른 점도 무시할 수는 없다. ... 이런 한국과 다른 문화 사회적 배경을 지닌 미국 회사 Google의 입장에서는 정부에서 일방적으로 추진하는 본인 실명확인제가 부담스러울 것이다. 미국 내에서는 정부에서 범죄 사실을 조사하기 위해서 정보공개를 요청한 것을 일언지하에 무시해버린 구글로써 미국 정부의 똘마니인 한국 정부의 무식한 드라이브에 순순히 응해주리라고 기대했던 것부터가 잘못의 시작이다. 여러 블로거들은 지금 구글의 실명제 거부 움직임에 대해서 찬사를 보내고 있다. 물론 본인도 '역시 구글이다'라는 생각을 가지고 있다. 일개 대한민국 정부보다 더 큰 회사인 구글, 그리고 물리적 세계보다 더 넓고 다양한 인터넷이라는 사이버 세상의 지배자의 모습을 본 것이다. 어떻게 보면 그들의 오만함을 직접 눈으로 확인하는 그런 사건인지도 모른다. 여기에서 한번 짚고 넘어가야할 사건이 있었다. 구글이 중국시장을 진출할 때, 중국 정부가 요구한 불용어들에 대한 검색조작을 받아들였다. 중국 시장의 규모와 중국 정부의 힘 앞에는 순한 양의 모습을 보여줬던 구글을 생각해봐야 한다. 물론 여전히 중국 시장에서 고전을 면치 못하고 있지만, 앞으로의 가능성만큼은 인정하고 있는 것같다. ... 그리고 한국 내에서 구글의 입지도 말이 아니다. 전 세계 70%이상의 검색시장을 장악하고 있지만 유독 동방의 작은 나라 대한민국에서는 토종 기업들에 고전을 면치 못하고 있다. 국내의 검색광고 시장도 시장개척자인 오버츄어에 맥을 못 추기고 있다. 지메일의 인기가 날로 늘어나고 있지만 그래도 대부분의 한국사람들은 한메일이나 네이버 등의 메일을 주로 이용하고 있고, 이 글을 시작하게 된 유투브도 혁신적인 기능들을 가지는 있다지만 국내의 다양한 서비스들에 고전을 면치 못하는 것도 사실이다. 한국에서 유투브 실명제 거부는 단순히 그들이 밝히듯이 표현의 자유를 위한 투쟁일까? 아니면 어차피 가능성도 낮은 시장에서 한 발 빼기인가? 만약, 중국 정부에서 실명제를 밀어붙인다면 구글이 중국정부의 요구를 일언지하에 무시할 것인가? ... 구글이 엠비 정부에 한방을 먹인 것은 분명 통쾌하지만 구글이 한국을 그리고 한국의 사용자를 생각하는 수준을 그대로 표출한 것은 아닌지 조심스럽게 검토해봐야 한다.

저작자표시 비영리 변경금지

Column & Opinion | Posted by Bahniesta 2009. 3. 26. 09:51

新 평판의 시대... Into the Neo-Ruputation Era (Internet & Reputation)

한국에서는 각종 리스트들 때문에 시끄럽다면, 미국에서도 또 하나의 리스트 - AIG의 고액 보너스 지급 명단 - 때문에 시끄럽다. 미하원에서는 50억달러 이상의 구제금융을 받은 기업들에 대해서, 25만달러 이상의 고액 보너스를 받는 경우 최대 보너스의 90%까지 세금으로 되돌려받는 법안이 이미 통과해서, 상원의 결정을 기다리고 있는 중에 있다. 그리고, 검찰 측에서는 이런 고액 보너스 지급자들에 대한 명단공개를 고려중이라는 소문도 자자하다. 그런 가운데 오늘 재미있는 기사가 하나 실렸다. 최고 고액 보너스를 받은 임원 10명 중 9명이, 그리고 금융사업 부분 임직원 중 보너스를 가장 많이 받은 20명 가운데서 15명이 보너스를 자진해서 반납하기로 의사를 밝혔다는 것이 기사의 요지였다. (관련기사보기) 이 기사를 보면서 머리 속에서 섬광처럼 스친 생각이 과학과 인터넷의 시대인 21세기가 깊어갈수록 과거 어느 시절보다 더 평판이라는 것이 사람들에게 중요해지고 있다는 것이다. 앞서 말한 AIG의 케이스도, 결국은 자신의 이름이 공개될 것이 두려워서 보너스 자진반납이라는 결론에 이르게 된 것이다. 그래서 21세기를 신평판의 시대라 부를만하다.

인터넷 공간에서 떠도는 많은 소문들이 결국은 평판이라는 이름으로 귀결될 수가 있다. 우리는 이미 많은 '~녀' 시리즈들을 알고 있다. 개똥녀, 똥습녀, 된장녀 등의 많은 ~녀 시리즈가 인터넷 공간에서 생겨서 가공되고 배포되고 있다. 이런 다양한 ~녀 시리즈에 대한 자세한 스토리를 다룰 필요는 없지만, 결론은 '평판의 시대'로의 진입했다는 것이다.

20/21세기에서 평판의 역할을 재조명해주는 사례로 방글라데시의 그라민은행을 들 수가 있다. 그라민 은행은 방글라데시의 대학교수 '무하마드 유누스'에 의해서 영세민들에게 소액대출을 제공해주는 기관이다. 그라민 은행의 주요 대출자들은 영세민들이다. 즉, 그들은 은행에서 대출을 받기 위해서 맡길 담보가 전혀 없다라는 점이다. 이런 환경에서 그라민 은행이 성공할 수 있었던 이유는 대출금을 제때 갚지 못하는 경우, 그들이 살고 있는 동네/지역 사람들에게 대출을 못 갚는 것에 대해서 공개적으로 알린다는 점이다. 대출금을 제대로 못 갚는다는 자존심을 건드리는 것이 그 무엇보다도 큰 담보 역할을 한 것이다. ~녀 시리즈가 그랬듯이, 그라민 은행의 성공 요인은 사람들이 자신의 평판에 그만큼 중요하게 생각한다는 점을 이용한 것이다. (결국, 그라민 은행의 성공은 무하마드 유누스에게 2006년 노벨 평화상이라는 영예를 안겨주었다.)

실생활의 클론 공간으로써 인터넷에서 ~녀 시리즈와 같은 평판이 실제하듯이, 웹생태계에 내재한 평판 Intrinsic Reputation도 존재한다. 웹의 기본 속성으로 민주성이라는 주장은 이미 이전 포스팅에서 말했지만, 그와 함께 웹생태계의 비민주성에 대해서도 이미 다루었다. 웹문서의 랭킹 (노출순위)이라는 것이 (대부분의 경우) 민주적인 방법으로 순위가 정해졌지만, 순위가 정해진 그 시점부터 더이상의 민주성을 기대할 수가 없도록 만드는 메커니즘이다. 웹문서의 랭킹을 결정하는 방법인 페이지랭크 PageRank만을 떼놓고 생각해보면, 모든 웹페이지들이 다른 웹페이지들을 링크를 걸어줌으로써 추천/투표에 참여하는 민주성이 바탕이 되지만, 영향력이 높은 웹페이지의 추천/투표가 더 큰 가중치를 갖는다는 것도 이미 알려져있다. 웹페이지의 영향력이라는 것도, 페이지랭크 초기에는 페이지랭크의 재귀계산을 통해서 얻어졌지만, 랭킹 알고리즘이 진화하면서 페이지랭크에 의한 영향력 산정의 영향력이 감소하고 있다. 어떠한 이유에서던 신뢰도가 높은 사이트에 등록된 글이나 평판좋은 저자/게시자의 글들이 가지는 영향력이 더 크지고 있는 것이 사실이다. 만약 뉴욕타임스의 어떤 컬럼니스트가 본인이 적고 있는 이글과 똑같은 글을 적어서 뉴욕타임스 컬럼에 실는다면, 본 포스팅이 가지는 의미는 갑자기 몇 갑절 증가할 것이 당연해진다. 뉴욕타임스라는 신뢰도 높은 사이트가 가지는 영향력과, 뉴욕타임스 기자/컬럼니스트라는 신뢰도 높은 저자가 가지는 영향력이 단순한 개인 블로그와 일개 개발자인 본인의 신뢰도 및 영향도보다 크다는 것은 사실이기 때문이다. 이런 신뢰도나 영향도를 현재의 포스팅의 프레임에 맞춘다면 '평판'이라고 요약할 수가 있다. 지금 SURS 1편를 적은 이후에, 2편을 준비 중에 있지만, 웹의 다양한 추천시스템들도 평판을 최대한 활용하고 있다. 다음 블로거뉴스 (다음뷰)의 오픈에디터들의 추천행위가 일반 대중들의 추천행위보다 높은 가중치를 받는다는 것도 주지의 사실이며, 다음 아고라에 어떤 유명인사 (또는 단체)가 글을 적는다면 평소보다 높은 관심을 받고 조회수를 기록하게 된다는 것도 우리는 이미 알고 있다. 물론 블로거뉴스에서도 이전 히스토리를 바탕으로 특정 블로거들의 글이 일반인, 특히 루키 블로거들,의 글보다 높은 관심을 받는다는 것도 경험상으로 알고 있다. 인터넷이라는 신평판 사회에서 각 개인의 평판이라는 것이, 이렇듯 글을 적을 때나 추천을 할 때, 또는 심지어 단순히 글을 조회할 때에도 영향을 미칠 수가 있다. 친구가 적은 글보기, 친구가 추천한 글 보기, 친구가 읽었던 글 보기... 등등의 소셜네트워킹을 이용한 미디오 배포행위도 일종의 친구라는 친밀감/동질성을 바탕으로 한 평판의 종류가 되고,... 그리고 앞으로 명사가 읽은/추천한 글 (기사) 보기와 같은 서비스도 조만간 등장할 것이다. 대표적인 경우가, 노전대통령이 본 기사들, 스티브잡스가 읽었던 기사들, 교황이 추천한 기사들과 같은 형태의 서비스가 오늘 바로 등장하더라도 전혀 이상하지 않다. 이 역시 조회자/추천자의 유명성이라는 평판에 기댄 서비스가 될 것이다.

분명 인터넷의 등장은 우리에게 익명성과 무한한 자유를 주었지만, 그와 함께 평판의 중요성을 다시 강조하고 있다. 인터넷의 시대는 평판의 시대이다. 평판이라는 것이 때로는 족쇄로 작용할 수도 있고, 영향력/유명성/신뢰성 등으로 작용할 수도 있다. 이 평판의 시대에 당신이 어떻게 적응하고 활용하고 가꾸느냐에 따라서 당신의 가치가 더욱 빛날수도, 또는 세상에서 잊혀질 수도 있다. 지속가능한 웹생태계란 그 속에서 숨쉬는 우리들의 평판 역시 지속가능한 형태로 보존해줄 수 있는 그런 환경이 아닐까 생각한다.

"신평판의 시대에 오신 것을 환영합니다. Welcome to Neo-Reputation Era."

저작자표시 비영리 변경금지

Column & Opinion | Posted by Bahniesta 2009. 3. 20. 02:19

Technical Perspective to Abusing... 조회수 조작과 이면기술에 대한 소고

** 본 포스팅은 2009년 3월 19/20일에 있었던 MBC의 100분토론 '공권력과 인권'에서 잠시 다루었던 다음 아고라의 특정게시판/게시물의 조회수 조작에 대한 소고, 및 이런 조회수 조작 어뷰징에 대한 기술적인 이야기만을 다룹니다. 일반 어뷰징, 특히 스팸,에 대한 내용은 아닙니다.

** 본 포스팅에서 제시한 내용들은 특정 업체에서 사용중인 방법에 대한 설명이 아닙니다. 대부분 상식적인 수준에서 추론된 내용이므로, 각 회사에서 실제 운영중인 방법이 아님을 미리 밝힙니다. 단순 참고용 설명이므로 오해가 없으시길 바랍니다.

서론

몇 일전에 경찰에서 다음 아고라의 특정 게시물의 조회수를 비정상적으로 높인 네티즌 3명을 인터넷 여론조작 협의로 압수수색을 단행했다는 기사가 나왔다 (관련 기사들). 그리고 어제/오늘 100분토론에서 고 장자연씨와 관련된 연예계의 비리/이면에 대한 충분한 준비가 되지 못한 상태여서, 위의 경찰의 과잉 선재 대응에 대해서 적법한 공권력의 투입인가 아니면 일반 국민들의 표현의 자유를 침해하는 인권유린인가에 대한 토론으로 주제를 급하게 바꾸었다. 토론의 도입부를 제대로 지켜보지 못했지만, 위의 인위적 조회수 조작에 대한 기술적인 내용을 좀 다룬 것같아서, 이와 관련된 몇 가지 이야기를 다루려고 한다.

조회수 조작 방법

특정 게시물의 조회수를 높인다는 의미는 일반인들에게 그 게시물이 많은 사람들의 관심을 받고 있는 거구나라는 착각을 일으킬 염려는 충분히 있다. 지난 SURS 포스팅에서 다룬 암묵적 추천의 한 형태로 조회수를 들 수가 있다. 그런 의미에서 조회수를 높인다는 행위는 어떻게 보면 기만행위일 수도 있다. 그렇지만, 본인의 다른 블로그의 한 포스팅에서 인위적으로 조회수를 높이는 행위는 역으로 글의 품질/랭킹요소를 낮출 수도 있음을 밝혔다. 즉, 게시물의 랭킹 모델에서 추천수, 조회수, 댓글수와 같은 숫자들이 높게 나오면 당연히 좋은/관심있는 게시물로 인정을 받을 수가 있지만, 전체 조회수에 대한 추천수의 비율과 같은 조회수 조작에 따른 상쇄효과도 있음을 밝혔다. 즉, 추천수가 증가하지 않는 단순한 조회수 증가는 글의 신뢰성에 상당한 침해를 받을 수가 있다는 요지이다. 어쨌던, 조회수 조작에 따른 효과 여부 (예, 여론조작여부, 다음에 대한 업무방해여부, 또는 표현의 자유여부) 등에 대해서는 다른 각계각층에서 다양한 의견을 개진할 것으로 보이니, 본 포스팅에서 더 깊이 다룰 필요도 없고 본인은 그런 능력도 없다. 그래서 본론인 어떻게 조회수를 조작하는가로 넘어가겠다.

조회수 조작의 방법은 간단하고 저렴한 것에서부터 복잡한 것에 이르기까지 다양하다. 가장 간단한 조회수 조작의 방법은 게시판의 글목록에서 해당 글을 계속 클릭해서 들어가는 것이다. 이런 조작에 들어가는 시간과 노력에 비하면 효과가 적을 수가 있는 원시적인 조회수 조작방법이 아닐까 생각한다. 여기에서 조금 진화한 모델이 가족/친구 등의 지인들을 동원해서 게시물을 계속 조회하는 방법이 있겠지만, 이는 단순히 참여 인원을 증가시킨 것 외에 특별할 것은 없는 것같다. 좀 더 진화를 한다면 해당 게시물에 대한 URL을 낚시성으로 메일을 보낸다거나 다른 게시판들에 도배를 해서 일반인들이 접속하도록 유도하는 방법도 있겠다. 두번째로 생각할 수 있는 방법은, 100분토론에서도 언급되었지만 현재 페이지에서 F5키를 눌러서 계속 reloading/refreshing을 시켜서 조회수를 높이는 방법도 있다. 보통 오락기의 버튼을 계속 누르고 있으면 연사기능이 작용하는 것과 같은 원리이다. 손으로 계속 누르고 있거나 동전을 키보드에 끼워넣는다거나 아니면 단순히 무거운 물건을 키보드에 올려놓는다거나 등의 기술적인 방법은 다양할 것이다. 이런 경우 보통 조회수 로그에 일정한 패턴 (시간간격)으로 기록이 남기 때문에 조작여부를 쉽게 판단 및 방어할 수 있을 것이다. (그러나 뒤에서 말하겠지만 개념적으로 쉽게 적발가능하지만, 기술적으로 어려운 점이 있다.) 그리고, 마지막으로 가장 진보된 형태는 조회수 조작 프로그램 또는 로봇을 사용하는 방법이다. 프로그램의 작동원리는 사람들이 해당 게시물을 계속 조회한다거나 리로딩시키는 방법과 특별히 다를 것은 없다. 단지 기계가 해당 페이지를 접속한다는 점만을 제외한다면. 그리고, 이런 프로그램들의 경우 조회 간격 (시간텀)을 임의로 조절할 수 있기 때문에, 수동적인 단순 리로딩보다는 찾아내기가 어렵다. (물론 불가능하다는 것은 아니다.) 이런 조작 프로그램을 이용하는 경우에 특히 문제가 되는 것은 좀비PC와 결합될 때이다. 좀비PC란 일반 컴퓨터들이 바이러스 또는 봇에 감염되어 사용자들이 사용하지 않는 휴면 상태에서 원격컴퓨터에 의해서 제어되어 마치 좀비와 같이 행동한다고 붙여진 이름이다. (나쁜 의미에서 좀비PC로 불리지만, 학계/연구 분야에서는 중앙집중식의 슈퍼컴퓨터를 대체시키는 분산/그리드 컴퓨팅 Distributed/Grid Computing의 한 형태로 많은 연구가 이루어지고 있는 분야이다.) 좀비PC들에 의해서 분산 공격을 받는다면 조회수 조작의 파급력도 커질 뿐만 아니라, 특정 IP에서의 공격이 아니기 때문에 조작을 적발하기가 더 어려워진다. (일반적으로 DDoS로 알려진 기술과 유사점을 보인다.)

어떻게 조회수 조작을 적발할 것인가?

조회수 조작이 위와 같이 간단하듯이, 역으로 조회수 조작을 적발하는 것도 간단하다. 즉, 특정 위치 (IP 등으로 추적)에서 특정 게시물을 상식 외로 많이 조회하는 경우를 조회수 조작으로 협의지으면 되는 것이다. 특히 조회의 간격 (시간텀)이 거의 일정하다는 추가적인 정보가 있다면 거의 확실한 물증이다. 또는, 평소와 달리 특정시간대에 특히 많은 조회가 몰렸다면 이런 경우도 조회수 조작으로 의심을 가질 수 있다. 특히 좀비PC와 봇에 의한 조작의 경우 접속IP와 시간텀이 다양하기 때문에 앞서 제시한 방법으로 쉽게 찾아낼 수가 없다. 뿐만 아니라 최근에는 사용자들의 IP 등을 임의로 변경해주는 프로그램 또는 업체들이 있기 때문에 상식선에서 조회수 조작을 찾아내기가 더욱 힘들어진다. 그래서 특정시간대에 비정상적으로 많은 조회가 이루어진다면 이런 경우에 한해서 조회수 조작을 의심할 수가 있다. 그러나 프로그램을 사용하는 경우, 접속/조회시간을 랜덤하게 변경하고 그 간격을 넓게 잡을 수 있기 때문에 이 방법에도 분명 한계가 있다. (그러나, 시간 간격을 넓게 잡는다면 조회수 조작의 효과가 없을테니...) 접속지역 (IP 등)도 속이고 접속방법도 속이고 접속시간간격도 속이는 등의 지능화된 조회수 조작이라면... 쉽게 찾기는 어려울 듯하다. 물론, 지난 몇일, 몇주, 몇달, 심지어 몇년 간의 누적 데이터를 분석한다면 전혀 불가능한 일은 아니지만, 뒤에서도 다루겠지만 실효성이 많이 떨어질 것이다.

조회수의 기록

위에서 말한 조회수의 조작을 찾아내기 위해서는 사용자들의 접속/조회에 대한 기록을 남겨둬야지 가능하다. 보통 로그 Log라는 파일의 형태로 사용자들의 행동 패턴이 기록에 남는다. 특히 Apache 웹서버를 사용하는 경우, 기본적으로 apache log가 서버에 남게 된다. 그렇지만 apache log는 가장 기본적인 최소한의 로그만을 남겨놓기 때문에 향후에 활용성이 많이 떨어지는 면이 있다. 이런 파일 형태 뿐만 아니라, 서비스의 시간을 줄이기 위해서 DB에 다양한 정보를 남기는 경우도 많이 있다. 파일형태의 로그의 경우 로그를 파싱해서 유용한 정보 (예, 특정인에 의한 조회수)를 찾아내는데 시간과 비용이 많이 들어가지면, DB형태의 로그는 구조화되어있을 뿐만 아니라 DB에서 제공해주는 다양한 집계 기능으로 유용한 정보를 쉽게, 그리고 빠르게 얻어낼 수 있는 장점이 있다. 그런데, DB라는 것이 모든 정보를 무한정으로 쌓아둘 수는 없다. 파일로그보다 더 많은 디스크 공간을 차지할 뿐만 아니라, 지나치게 큰 정보 (많은 columns)를 많이 (많은 rows) 가지고 있다면 DB의 퍼포먼스를 떨어뜨려서 처음에 가졌던 DB의 장점을 상쇄시키게 된다. 그런 점에서 현재 많은 회사/서비스들에서 실시간 서비스를 위해서 모든 접속/조회 정보를 DB에 누적해서 다시 조회/가공하는 방법은 그리 많이 사용하고 있지 않는다. 대신에, DB에서는 조회에 대한 메타정보만 기록을 하고 상세정보는 파일로그에 남기는 하이브리드 형태로 운영하는 경우가 많다. 예를 들어, 특정 게시물에 누군가가 접속/조회를 하면 view_cnt와 같은 변수의 값을 +1씩 증가시켜서 DB에 기록을 남겨두고, 그 사람의 접속기록 (접속 IP, 접속시간, referer 등)의 상세기록은 파일로 차곡차곡 쌓아두는 방법을 취하게 된다. 이렇게 되면, 실시간 서비스에서는 특정 게시물의 조회수 등을 빠르게 보여주고, 문제가 될 때만 파일로그의 상세 정보를 검사해보면 된다. 이런 하이브리드 형태의 로깅 운영의 부작용으로는, 특히 조회수 조작이라는 측면에서, 누가 언제 몇 번 조회/접속했는지에 대한 정보를 실시간으로 감시하기 어렵다는 점이다. 이런 측면에서 업체들에서 (실시간) 죄회수 조작을 막는 것이 거의 불가능하다고 주장하고 있다. 물론, 또다른 형태의 하이브리드 방법을 도입해서 적발/방어가 충분히 가능하지만 더 많은 비용이 소요되기 때문에 어려움이 있을 따름이다. 즉, 조회메타정보에 대한 DB와 상세한 파일로그와 함께, 상세한 조회정보를 DB에 한시적으로만 저장해두는 방법이 있다. 추측건데, 많은 업체들이 조회수 조작이라는 부작용 때문에 이런 형태로 실시간 대응 전략을 세웠으리라 본다. ... 이 단락을 요약하면, 분석의 용이성 및 신속성의 측면에서 DB를 활용하지만 DB에 저장될 수 있는 데이터의 용량에 한계가 있고 실시간 서비스를 위해서는 최소한의 데이터만을 DB로 남기고 있기 때문에 DB로그가 조회수 조작 대응에 실효성이 많이 떨어진다.

P.S.

앞에서 간단히 조회수 조작을 찾는 방법에 대해서는 이미 다루었다. 특정 IP를 사용하는 경우 또는 특정시간대에 활동하는 경우에 대해서 조회수 조작을 충분히 확인할 수가 있다. 그렇지만 이런 기본적인 방법 외에도 조회수 조작 적발 또는 조작된 조회수의 원상복구 등에 대해서도 다양한 전략들이 있을 것이다. 실시간으로 조회수 조작 사용자를 찾아서 해당 IP를 막는다는 등의 실시간 대응 뿐만 아니라, 시간이 경과한 후에 아파치로그 등을 분석해서 불필요한 조작된 조회수를 DB 메타정보에서 제거하는 후속 대응도 현재 운영중인 걸로 알고 있다. 재미있는 것은 후속대응으로 인해서 때로는 조회/추천수가 감소하는 경우도 존재할 수도 있다. 업체 측에 의한 조회/추천수 조작설 등의 다양한 음모론이 펼쳐질 여지가 충분히 있는 것같다. 그리고 또 다른 음모설에 대해서 언급하자면... 현재 다음 아고라 게시판과 같은 경우 여러 대의 컴퓨터를 병렬적으로 연결시킨 분산컴퓨팅을 활용하고 있다 (일반적으로 하나의 서비스를 위해서 최소 두대의 서버가 필요하다. 분산처리 뿐만 아니라, 서비스 백업을 위해서). 그래서 각 서버별로 별도의 로그기록을 남겨두고 있기 때문에, 실시간으로 모든 서버의 로그 데이터를 취합하기란 사실상 불가능하다. 이런 분산 데이터의 싱크 문제로 인해서 조회/추천수가 일시적으로 증가/감소하는 현상이 종종 발생할 수도 있다. (게임에서 잠시 랙이 걸리는 것과 같은 현상)

P.S.2

아파치로그에 대한 기술적인 내용은 생략은 생략하겠다. 사용자들의 IP, 접속시간, referer 등의 정보들이 보통 남게 된다. 아파치로그에 대한 자세한 사항은 아파치 홈페이지에서 참조하기 바랍니다.

저작자표시 비영리 변경금지

Sustainable Web EcoSystem (SubEco)

Never Say Don't Be Evil...

新 평판의 시대... Into the Neo-Ruputation Era (Internet & Reputation)

Technical Perspective to Abusing... 조회수 조작과 이면기술에 대한 소고

Category

Tag

Recent Post

Recent Comment

Recent Trackback

My Link

Archive

Calendar

티스토리툴바

« » 2024.12
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31