| 구글의 페이지랭크 엿보기 |
|
|
| Written by 검색마스터 | |
| 2011년 09월 05일 (월) | |
|
구글의 페이지랭크 엿보기 오랫동안 인터넷 검색엔진들은 순위를 매길 때 각 웹페이지들의 내부 정보를 이용했다. 홈페이지 제작자가 작성한 키워드의 배치를 분석해서 순서를 매긴 것이다. 예를 들어 MP3라는 단어로 검색을 했다면 MP3라는 단어가 ‘잘’ (많이, 좋은 위치에) 자리잡고 있는 문서를 좋은 문서로 취급해서 먼저 보여주는 것이다. 하지만 이런 방식은 페이지를 만든 사람의 일방적인 주장에 좌우 될 수 밖에 없었다.
구글의 페이지랭크 역시 기본적으로 동일하다. 웹의 링크를 학술분야에서의 인용(citation)처럼 본 것이다. 그래서 구글 한국어 서비스에서 우리말로 ‘백악관’이라고 검색해도 영어로 된 미국 백악관이 제일 먼저 나오는 것이다. 미국 백악관 홈페이지에는 당연히 ‘백악관’이라는 한글 단어가 없다. 수많은 사람들이 한글로 ‘여기는 백악관‘ 하면서 WhiteHouse.gov로 링크를 해놓았기 때문이다. 웹의 민주주의적인 시스템이 만들어낸 힘이다.
한 사람 한 사람의 링크가 모여서 소위 ‘집단지성’을 이룬 것이다. 웹의 특성에 아주 잘 맞는 방식이다. 물론 구글이 페이지랭크 하나만으로 순위를 매기는 것도 아니고, 지금은 구글 혼자만의 기술도 아니다. 하지만 이 기술은 구글이 검색엔진의 대명사로 자리잡는데 큰 힘이 되었다. 집단지성과 관련해서 구글에게 배울 점이 있다. 시스템 자체에 있는 집단지성적인 속성과 구조를 활용하는 것이다. 웹에서는 링크다. 링크는 웹의 기본 구조이고 홈페이지 운영자들은 아주 일상적으로 링크를 만든다. 개인들은 자기 자신을 위해 노력을 투자하고 그 노력들은 거대한 구조 안에서 자연스럽게 짝을 이루며 의미들을 만든다. ‘참여하지 않은 듯이 참여’하고 있는 것이다. 구글의 창업자인 세르게이 브린과 래리 페이지는 원래 검색엔진을 만들 생각이 없었다. 웹의 링크를 역으로 추적하는 프로젝트를 시도했을 뿐이다. 그러다 링크 구조가 결국 순위로 연결될 수 있다는 것을 발견했던 것이다. 많은 기업들이 사용자들의 참여를 끌어들이려고 온갖 당근을 흔들며 유혹한다. (이벤트, 마일리지, …) 하지만 가장 기본적이고 강력한 것은 시스템 자체의 속성과 사용자들의 기본적인 활동자체를 활용하는 것이다. 웹 2.0에서 이야기 하는 소위 ‘플랫폼으로서의 웹’도 같은 맥락에 있다. 사용자 참여 유도는 그 다음 문제다. 아무리 욕심이 나도 말이다. @
|



하지만 구글은 다른 시도를 했다. 