1. 개요
동일하거나 거의 동일한 내용 혹은 의미를 가진 복수의 문서가 어떤 데이터베이스에 중복되어 존재하는 경우를 말한다. '유사 문서'라는 표현도 쓰이지만 유사한 문서가 반드시 내용이 중복되거나 무단으로 도용했거나 같은 내용을 도배한 경우는 아니며 단순히 관련성이 많은 콘텐츠일 수도 있다.중복 문서를 걸러내기 위해 소니에서 개발한 WEP 알고리즘 등의 중복 문서 판독 시스템이 존재한다. 그 밖에도 중복 문서를 판독하기 위해 Shingle이나 Unigram 군집화 등의 다양한 기법이 활용된다. 개인 컴퓨터의 중복 파일을 제거하기 위한 Duplicate File Detective 등의 프로그램이 존재하며 삼성 갤럭시 등의 모바일 기기의 파일 관리자 애플리케이션은 저장공간을 확보하기 위해 중복 파일을 제거하는 기능을 탑재하고 있다.
구글 검색 엔진의 알고리즘은 남의 독창적인 콘텐츠를 무단으로 도용하거나 같은 콘텐츠를 도배하는 사람을 제재하는 중복 콘텐츠 생성 방지하기라는 정책이 있다. 그래야 독창적인 콘텐츠를 개발하는 사람들에게 적절한 보상이 이루어져 콘텐츠가 늘어나기 쉬운 환경이 조성되고 궁극적으로 구글의 이익으로 연결되기 때문이다. 다만 도용한 사람이 적반하장으로 신고해 원작자가 피해를 보는 황당한 상황도 가끔 벌어진다.
2. 위키에서
{{{#!wiki style="margin: 0 -10px -5px; min-height: calc(1.5em + 5px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px; word-break: keep-all" |
<colbgcolor=#00a495,#2d2f34><colcolor=#fff>기능 | 대문( FrontPage) · 롤백 · 리다이렉트 · 문서 이동 · 분류 · 최근 변경 · 편집 요약 · 편집 요청 · 하이퍼링크( 역링크 · 인터위키) | |
편집 과정 | <colbgcolor=#00a495,#2d2f34><colcolor=#fff>편집 | 작성( 작성 중) · 윤문 · 서술 폭주 · 저명성 · 출처 필요 · 편집 분쟁 · 동시 수정( 편집 충돌) | |
토론 | 끌올 · 닫힌 토론 · 방기 · 복구 토론 · 삭제 토론 · 프로토로너 | ||
서술 형태와 관점 | 독자연구( 집단연구) · POV · NPOV · MPOV · 삭제주의와 포괄주의 | ||
관리 및 운영 | ACL · 긴급조치 · 다중 계정( 다중 계정 검사 · 오리 실험) · 문서 사유화 · 문서 훼손 · 반달 · 임시조치 · 작성 금지 · 즉결처분 · 차단( IP 차단 · 무기한 차단) · 통신사 IP · 투명성 보고서 · 편집 제한 · 휴지통 | ||
문서 | 종류 | 고립된 문서 · 더미 · 막다른 문서 · 메타 문서 · 빈 문서 · 없는 문서 · 오래된 문서 · 작성이 필요한 문서 · #s-2 · 템플릿 · 토막글 · 특수 문서 · 틀 | |
구조 | 개요 · 각주 · 동음이의어 구분자 · 문단 · 목차 · 상세 · 예시 · 여담( 이야깃거리 · 트리비아) · 요약문 | ||
사용자 | 기여 · 기여자 · 사용자 문서 · 사용자 토론 · 유저박스 · 위키 금단증세 · 위키 사용자( 위키니트 · 위키페어리 · 사관) · 위키질 | ||
기타 | 개인 위키 · 고지달성 · 글상자 · 데스크톱 위키 · 뻘문서( 뻘토론 · 뻘분류) · 소송방지바람 · 암묵의 룰 · 애초에 · 위키프로젝트 · 이전 · 취소선 드립 | ||
관련 틀 | 틀:위키 서술 관점 | }}}}}}}}} |
나무위키를 포함한 대부분의 위키에서는 중복 문서를 존재 의미가 없는 뻘문서로 규정하며 퀄리티가 낮거나 제목이 부적절한 쪽을 삭제하거나 메타 문서, 리다이렉트 문서로 수정한다.