이야기
네이버 검색이 생각하는 좋은 문서! 나쁜 문서?

naver.JPG

네이버 검색에서는 어떤 글이 잘 노출되고 어떤 글은 그렇지 않는 것일까? 검색 서비스를 운영하면서 저희가 계속 고민하는 부분이기도 하고 이용자 여러분께서 가장 많이 하시는 질문일 것 같습니다. 이에 네이버 블로그검색이 생각하는 좋은 문서와 그렇지 않은 문서에 대해 말씀 드리고자 합니다. 

 

저희는 다양한 변수를 고려해 ‘좋은 문서’를 판단해 검색에 노출시키고 있습니다. 저희의 세부적인 판단 기준은 사실 공개하는 즉시 기준으로서의 가치를 잃어버리기 때문에 명확히 밝히기 어려운 점 양해 부탁 드립니다. 하지만 저희가 이 알고리즘을 만들 때 목표로 삼는 가치를 보신다면 큰 방향은 보실 수 있으리라고 생각합니다. 저희 블로그 검색이 생각하는 좋은 문서의 모습입니다.  

 

좋은 문서

네이버 검색이 생각하는 좋은 문서를 설명합니다. 네이버는 다음과 같은 문서들이 검색결과에 잘 노출되어 사용자는 검색 결과에 유용한 정보를 얻고 콘텐츠 생산자는 노력에 합당한 관심을 받을 수 있도록 하기 위해 노력하고 있습니다.
  

 신뢰할 수 있는 정보를 기반으로 작성한 문서
 물품이나 장소 등에 대해 본인이 직접 경험하여 작성한 후기 문서
 다른 문서를 복사하거나 짜깁기 하지 않고 독자적인 정보로서의 가치를 가진 문서
 해당주제에 대해 도움이 될 만한 충분한 길이의 정보와 분석내용을 포함한 문서
 읽는 사람이 북마크하고 싶고 친구에게 공유/추천하고 싶은 문서
 네이버 랭킹 로직을 생각하며 작성한 것이 아닌 글을 읽는 사람을 생각하며 작성한 문서
 글을 읽는 사용자가 쉽게 읽고 이해할 수 있게 작성한 문서 

 

그렇다면 반대로 네이버 블로그검색이 제어하는 문서는 어떤 게 있을까요? 사실 이런 종류의 문서는 일반적인 이용자들이 생산하는 경우는 많지 않습니다. 하지만 많은 분들이 궁금해하시는 사안인 만큼 비교적 자세히 소개해 드리고자 합니다. 

  

 

유해문서와 스팸•어뷰징문서 

 

 

 유해문서  

법률에 의해 또는 사용자 보호를 위해 네이버 검색서비스를 통해 노출되는 것을 제한하고 있는 문서를 말합니다. 

 
음란성, 반사회성, 자살, 도박 등 법률을 통해 금지하고 있는 불법적인 내용으로 이루어져 있거나 불법적인 사이트로의 접근을 위해 작성된 문서
사생활 침해 방지 또는 개인 정보 보호, 저작권 보호 등을 위해 노출이 제한되어야 하는 문서
피싱(phishing)이나 악성 소프트웨어가 깔리는 등 사용자에게 피해를 줄 수 있는 문서/사이트
  

 스팸•어뷰징문서 


 기계적 생성
검색 노출을 통해 특정 정보를 유통하기 위한 목적으로 기계적 방법으로 생성된 내용으로만 이루어진 문서입니다.
기존 문서를 짜깁기하거나 의도적으로 키워드를 추가하여 생성한 문서
사람의 개입 없이 번역기를 사용하여 생성한 문서
검색결과 등의 동적 문서를 기계적으로 처리하여 생성한 문서  

※기계적으로 만들어진 문서의 유형은 다양하지만 이를 파악해 분석하는 기법도 계속 발전하고 있습니다. 기계적으로 생성되는 문서는 교묘하게 패턴을 바꾸더라도 자연스럽지 않은 흔적들이 발견되기 때문에 이런 흔적들을 축적해 계속 차단하고 있습니다.

 

 클로킹(cloaking): 검색 엔진에서 인식되는 내용과 실제 사용자 방문시의 내용이 전혀 다른 문서/사이트 

※ 액션영화를 보면 종종 CCTV 모니터에 미리 찍은 화면이 보이게 하는 범죄 수법이 나오는데, 클로킹도 이와 유사합니다. 검색엔진에 보내는 url과 실제 이용자들이 방문하는 url이 전혀 다르게 하는 수법이 클로킹입니다. 저희는 클로킹을 발견하는 즉시 제외하고 있습니다.

 숨겨놓은 키워드 : 폰트 크기를 0으로 하거나 매우 작게 하는 것, 바탕색과 같거나 매우 유사한 글자색을 사용하여 보이지 않는 텍스트로 키워드를 채워 넣은 문서,글 접기 기능(네이버블로그 글 작성시 '요약'기능)으로 키워드를 숨겨놓는 등 키워드가 검색 사용자에게 보이지 않도록 숨겨놓은 것.
 강제 리다이렉트(redirect) : 위젯(widget)이나 스크립트(script) 등을 사용하여 질의와 상관없는 목적 사이트로 사용자를 강제로 이동시키는 문서/사이트
 낚시성 : 사용자의 검색 의도와 관계 없는 내용을 검색결과에 노출시키기 위해 의도적으로 특정 키워드들을 포함하여 게시한 문서
 복사 : 뉴스/블로그/게시판/트위터 및 기타 웹 페이지의 내용을 단순히 복사하여 독자적인 정보로서의 가치가 현저히 낮은 문서
 도배성 : 동일한 내용을 단일 블로그 또는 여러 블로그에 걸쳐 중복해서 생성하는 경우
 조작행위 : 여러 ID를 사용하여 댓글을 작성하거나 방문하여 인기가 높은 것처럼 보이도록 하는 등의 조작 행위를 하는 경우
 키워드반복 : 검색 상위 노출만을 위해 제목이나 본문에 의도적으로 키워드를 반복하여 작성한 문서
 신뢰성부족 : 상품이나 서비스에 대한 거짓 경험담으로 사용자를 속이는 문서

 

네이버 검색이 생각하는 좋은 문서와 유해문서/스팸•어뷰징 문서에 대해 궁금증이 조금은 풀리셨나요?이 가이드라인을 참고하셔서 혹시 내 블로그•카페•사이트가 스팸•어뷰징으로 간주될만한 요소를 가진 것은 없는지 체크하시면 도움이 될 것입니다. 앞으로도 좋은 블로그•카페•사이트를 찾아 여러분들이 정성들여 만든 좋은 문서들이 검색결과에 잘 노출될 수 있도록 끊임없이 노력하겠습니다. 
[출처] 네이버 검색이 생각하는 좋은 문서! 나쁜 문서?|작성자 네이버 다이어리

이 게시물을

제목
날짜

SEARCH