최근 수정 시각 : 2024-10-30 18:23:34

문헌오염

논문오염에서 넘어옴
<colbgcolor=#000> 과학 연구 · 실험
Scientific Research · Experiment
{{{#!wiki style="margin: 0 -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1px -11px"
<colbgcolor=#000><colcolor=#fff><rowcolor=#000,#fff> 배경 과학적 방법
기반 수학( 미적분학 · 선형대수학 · 미분방정식) · 통계학( 수리통계학 · 추론통계학 · 기술통계학)
연구· 탐구 논증( 귀납법 · 연역법 · 유추(내삽법 · 외삽법)) · 이론( 법칙 · 공리 · 증명 · 정의 · 근거이론 · 이론적 조망) · 가설 · 복잡계( 창발) · 모형화(수학적 모형화) · 관측 · 자료 수집 · 교차검증 · 오컴의 면도날 · 일반화
연구방법론 합리주의 · 경험주의 · 환원주의 · 복잡계 연구방법론 · 재현성( 연구노트)
통계적 방법 혼동행렬 · 회귀 분석 · 메타 분석 · 주성분 분석 · 추론통계학(모형( 구조방정식) · 통계적 검정 · 인과관계와 상관관계 · 통계의 함정 · 신뢰도와 타당도)
측정· 물리량 물리량( 물리 상수 · 무차원량) · 차원( 차원분석) · 측도 · 단위(단위계( SI 단위계 · 자연 단위계) · 단위 변환) · 계측기구 · 오차( 불확도 · 유효숫자 · 과학적 기수법)
실험 실험설계 · 정성실험과 정량실험 · 실험군과 대조군 · 변인(독립 변인 · 조작 변인 · 종속 변인 · 변인 통제) · 모의 실험( 수치해석) · 맹검법 · 사고실험 · 인체실험 · 임상시험 · 실험 기구
연구윤리 뉘른베르크 강령 · 헬싱키 선언 · 연구투명성 · 연구 동의서 · 연구부정행위 · 표절( 표절검사서비스) · 편향 · 문헌오염 · 자기교정성 · 연구윤리위원회
논문· 과학 공동체 소논문 · 리포트 · 논문제출자격시험 · 연구계획서 · 형식( 초록 · 인용( 양식 · 참고문헌) · 감사의 글) · 저자 · 학회 · 세미나 · 학술대회 · 동료평가 · 지표 · 학술 데이터베이스 · 게재 철회 · 학제간 연구
철학 관련 정보 · 연구방법론 관련 정보 · 수학 관련 정보 · 자연과학 관련 정보 · 물리학 관련 정보 · 통계 관련 정보 · 사회과학 조사연구방법론 }}}}}}}}}

1. 개요2. 상세
2.1. 예시
3. 그 외4. 관련 문서

1. 개요

" 논문은 그 전에 발표된 논문도 참고로 해서 쓰이지. 과학은 그렇게 발전하는 거야. 만일 조작된 데이터가 들어간다면, 그것을 참고로 한 모든 논문이 물거품이 되고 말아. 말하자면 문헌 오염인 거지. 용서받을 수 있는 일이 아니야."
Q.E.D. 증명종료》, 25편 〈Parallel〉 中
다른 연구자들이 인용하는 논문이 잘못된 데이터를 근거로 저술되어 오염된 상태를 말한다.

'문헌오염'이라는 단어는 학술적 용어가 아니다.[1] 만화 Q.E.D. 증명종료》의 2006년에 연재된 에피소드 〈Parallel〉(일: パラレル)에서 논문조작의 해악을 설명하기 위해 언급된 말이다. 이것이 인터넷 커뮤니티 서브컬처를 중심으로 유행한 뒤 나무위키의 전신인 리그베다 위키 등을 거치며 현실의 문헌 오인용 사례 등이 추가되어 간간이 쓰이게 된 것이다.

실제 문헌오염은 학술 부정(Academic dishonesty) 행위 또는 연구부정행위(Research cheating; Research misconduct), 과학 부정 행위(Scientific misconduct)등으로 풀이된다. 영어권에서는 의료윤리학 전문가 아서 카플란 교수가 논문 조작, 표절, 쓰레기 저널 등을 싸잡아 'Publication-Pollution'으로 부른 사례가 있다.[출처]

2. 상세

어떤 연구가 위조, 변조 등의 조작을 가하거나, 기타 지적으로 정직하지 못한 상태로 진행되었다면 1차적으로 저널 편집자를 비롯하여 많은 동료 연구자들이 동료평가(peer review)라는 과정을 통해서 그것을 깐깐하게 걸러낸다. 유명한 저널일수록 더욱 엄격히 평가한다. 이걸 통과하더라도 다시 과학 공동체를 통하여 다른 연구자들이 의심과 회의의 시선을 보내고, 재현성 실험을 하고, 신뢰성에 이의제기를 할 수도 있다. 일반적으로는 그렇다.

여기서 문제는 이 모든 검증의 절차를 운좋게 통과했을 경우이다. 연구자들은 그것이 틀렸다고는 꿈에도 모른 채로 이제 그것을 열심히 인용하고, 자신의 후속 연구를 위한 밑바탕으로 활용한다. 그 이후에 이어지는 많은 연구들이 잘못된 하나의 연구 위에 올라서서 또 다른 잘못된 연구를 하게 된다. 그러다가 뒤늦게 내부고발자나 다른 사건으로 말미암아 우연히 그 문제성이 발견될 경우, 그를 바탕으로 한 모든 연구들은 물거품이 되어 버리는 것이다!

부실한 지반 위에 지은 집이 멀쩡할 리 없는 것처럼 결함 있는 연구를 바탕으로 했으니 그 후속 연구 역시 결함이 없을 리 없어서 쓰레기통 직행이다. 반박논문 역시 한때의 삽질이 되고 만다. 이 연구를 바탕으로 한 핸드북이나 리뷰 논문들도 죄다 두툼한 폐지 뭉치로 탈바꿈하며 수많은 연구비를 쏟아부었던 대학들과 후원자들은 뒷목을 잡고 저널에는 " 게재 철회"(Retraction) 요구가 빗발친다. 이제 그 연구자가 저자로서 참여했던 모든 논문들은 설령 그것의 연구부정행위가 입증되지 않았다고 하더라도, 다시 한 번 따가운 의심의 눈초리를 받게 된다. 같이 일했던 다른 연구자들도 그들의 연구 진실성을 의심받는 등 상당한 봉변을 당하게 된다. 그 연구의 문제점을 발견하지 못하고 넘어간 저널과 리뷰어들 역시 무사하지는 못한다. 즉, 학계에서 엄청난 인력과 금전의 낭비가 발생하는 것이며, 거대한 퇴행이 일어나는 것이다. 잘못된 연구가 있기 직전으로 돌아가서 다시 새로 연구를 시작해야 한다. 돌아가지 않고 퇴행을 피한다면 그게 더 큰 문제가 되니...

물론 게재 철회를 한다고 하더라도 학술 데이터베이스 상에서 아주 사라지게 되는 것은 아니다. 제목 맨 앞에 게재 철회 표시가 붙을 뿐 여전히 열람은 가능하고[3], 심지어 게재 철회 표시가 뜨지 않는 경우도 있긴 있다. 그 밑에는 피인용수가 고스란히 붙게 되고, 학술DB는 심지어 인용의 추세까지 종합하여 보고서로 뽑아주기 때문에 문제의 논문은 부끄러운 흔적이자 반면교사로 남게 된다. 물론 학계가 발칵 뒤집힌 이상 더 이상 그 논문들을 거들떠 볼 연구자들은 없을 테니 인용의 추세를 보여주는 건 어찌보면 확인사살이라고 봐야 할지도.

유사역사학, 유사과학 등이 문제가 되는 이유 중 하나 역시 바로 문헌오염 때문이다. 특히나 일제강점기 6.25 전쟁 이후 상당부분 잊히고 소실된 한국 신화는 현대에 와선 유사역사학 등에 의해 그 근원과 원전을 찾기가 더욱 힘들어졌다.

2023년부터 화제가 되고 있는 AI를 통한 논문 자동 작성 시 인공지능은 온라인상의 데이터를 쓸어 모으면서 이러한 잘못된 자료까지 구분하지 못하고 집어넣어 버리는 경우가 발생하므로 더욱 문제가 심각하다. 본문 앞에 Retracted라는 단서가 달려 있지 않다면 AI는 알지 못하고 올바른 근거라 여기고 넘어가기 때문이다. 물론 AI가 학습을 거듭하고 데이터베이스가 봉산되며 나아지기는 하지만.

2.1. 예시

해외에서는 유명 학술 출판사인 "Springer"에서 무려 64편의 거짓 논문들이 무더기로 게재 철회되어 소동이 벌어지기도 했다. # 동료평가를 조작해서 억지로 게재 수락을 했다는 건데 이 출판사는 이미 과거에도 《바이오메드 센트럴》에서 43편의 논문들을 똑같이 조작하여 올렸다가 뒤늦게 게재 철회해서 논란을 빚기도 했다고 한다. 심지어 논문 게재철회 문제만 집중적으로 다루는 한 사이트에 따르면 이 사이트가 개설된 2012년 이래로 취소된 논문 수만 무려 1,500건에 달한다고. 단, 모든 게재 철회가 전부 연구부정행위를 의미하는 것은 아니니 주의.

한국에서는 익히 알려졌다시피 황우석 논문 조작 사건이 대표적인 문헌오염의 사례이다. 심지어 그 《사이언스》조차도 좋다고 실어주었으니 더 심각하다.

알츠하이머 치매의 원인으로 찾아낸 아밀로이드 베타 단백질 논문의 조작 가능성이 제기되었다. 조작이 사실이었다면 그동안 이를 치료하기 위해 그동안 진행된 연구의 대부분이 물거품이 될 수 있다.[4] # 이후 추가 조사 결과 조작이 실제로 행해졌다는 사실로 굳어져가는 모양새였고 # 결국 2024년 6월에 저자들이 조작을 인정하면서 철회되었으며 조작된 논문 중 가장 많이 인용된 논문이라는 대기록을 달성하게 되었다. #[5]

전(前) 사회심리학자 디데릭 슈타펠(Diederik A. Stapel)는 심리학계의 황우석(...)이라고 할 수 있는 인물이다. 이 사람이 쓴 총 55편의 논문에서 연구부정행위가 입증되었고, 일부 논문들은 100~170회 인용되었으며, 총 피인용수는 무려 2,000회(!)에 이른다. 이후엔 집단 게재철회 소동이 벌어지게 되었다. 이 양반은 참회하려는 뜻에서였는지 자신이 어떻게 유혹을 느껴서 데이터를 주작했는지에 대한 자서전도 썼다. 구글 스콜라에서 "저자:DA 저자:Stapel" 검색 *

3. 그 외

서브컬처에는 상단의 《 Q.E.D. 증명종료》 25편에서 언급된 바가 있으며 문헌오염이라는 용어 자체가 본작에서 시작된 듯. 구글로 검색해도 위키 문서나 서브컬쳐에서 일부 사용될 뿐 본 단어의 직접적인 사용례는 많지 않다.

위키 문서는 문헌오염의 근원이 될 위험성이 매우 높다. 나무위키/비판 문서 참고. 그나마 정확한 출원을 기대하도록 강제되는 위키백과와 달리 그런 것도 없이 개인연구를 집어넣을 수 있는 나무위키에서는... 애초에 위키 문서는 연구논문의 근거가 될 수 없으니 어디까지나 참고 자료로만 사용하자.

4. 관련 문서



[1] 쉽게 말해 그 자체로 문헌오염된 용어다. [출처] Caplan, Arthur L. "The Problem of Publication-Pollution Denialism." Mayo Clinic Proceedings. Vol. 5. No. 90. 2015. [3] 대표적인 예시로 오보카타 하루코의 박사논문이 있다. 일본 국립국회도서관 데이터 베이스( 해당링크(일본))에서 아직도 조회되고 있으며 학위취소 사실(平成26年(2014년)10月6日学位取消)이 기재되어 있다. [4] 사실 임상실험에서 계속 실패했는데 아직 치매의 원인이 완전히 밝혀지지 않았기 때문이다. 아밀로이드 베타는 치매의 원인으로 알려진 가설 중 하나로 타우 단백질 가설, 아세틸콜린 가설 등도 있다. [5] 하지만 학계에서는 해당 사건에 대해 별 신경을 쓰지 않았다. 많은 연구에 인용되었기는 하지만 이후 연구에서 조작 의혹이 제기된 논문의 특정 아밀로이드 베타(Aβ·52)보다는 단백질 응집에 관여하는 다른 아밀로이드 베타가 더 중요하다고 판단되어 연구가 진행되고 있기 때문에 미디어에서 우려하는 것처럼 아밀로이드 베타를 타깃으로 한 모든 치매 연구가 잘못되었다는 식의 말은 없었다.