최근 수정 시각 : 2024-10-12 03:09:32

*.wav 파일 열화 논란

1. 개요2. 발단3. 내기4. 참고5. 관련 문서

1. 개요

오디오 파일(*.wav)을 여러 번 복사하는 과정에서 음질이 열화된다는 주장으로 벌어졌던 인터넷 상의 논쟁. 그 자체는 어이없는 해프닝일지도 모르지만 500만원이라는 거금이 걸린 내기 제의로 인해 큰 관심을 받았었다.

일단 자세한 내막을 읽기 전에 혹시 모를 '그럴싸한데?' 현상을 피하기 위해 개념은 잡고 가자. 물론 정보 전송 중에 오류가 생길 확률은 0이 아니다. 하지만 컴퓨터와 인터넷이 발전되는 동안 전 세계의 수학자들과 컴퓨터 과학자들은 정보의 오류를 정정하기 위한 알고리즘을 계속 개발해왔으며, 전송이 잘못되면 요청을 다시 한다. 패러티 검사 코드나 해시 같은 것들이 괜히 개발된 것이 아니다.

무엇보다 이 말대로 복사할 때마다 계속 파일이 변형된다면 컴퓨터에서 쓰이는 오디오 파일에만 해당될 리가 없다. 문서 파일이나 그림 파일, 실행 파일 등에도 같은 문제가 발생하게 된다. 복사를 반복하기만 해도 소설의 글자가 바뀌고, 그리던 그림의 색깔이 바뀌며, 프로그램이 깨져서 오류를 발생시키는 일이 수시로 벌어져야 한다. 기업의 재무 같은 주요 자료조차 복사시 숫자가 바뀌어 수치상 오류가 발생하게 되므로 컴퓨터를 믿을 수 없다며 다들 손으로 계산하는 상황이 되었을 것이다.

심지어 인터넷으로 파일을 전송하는 것도 마찬가지로 복사다! 넷플릭스로 영화를 보다보면 자꾸 깨지고 클라우드에 저장된 데이터들이 수시로 박살나는 사태가 벌어졌을 것이다. 현대 컴퓨터과학의 근간을 뒤흔드는 발언이라고 할 수 있다.

비슷한 사례가 없는 것은 아니다. 당연하지만 파일을 담고 있는 하드디스크가 고장나면 내부의 파일이 깨질 수 있고 인터넷으로 파일을 받다가 인터넷이 끊겨서 파일이 오류가 날 수도 있고 SSD는 오래 사용하지 않으면 내부의 정보가 손상된다. 하지만 이런 것들은 전술하였듯 CRC 체크 등으로 기본적인 점검 과정을 거치며, 지속적으로 오류가 발생한다면 음질이 나빠지는 수준이 아니라 파일 자체가 망가지는 상황이 벌어질 것이다. 이 주장대로 이런 일이 수시로 일어난다면 컴퓨터는 몇 달 지나지 않아 중요 파일들이 망가져서 제대로 작동도 못하게 될 것이다.

또한 다른 예시로 음원 추출 사이트는 대부분 광고 수익 또는 사용자 정보 수집을 주 목적으로 삼아 사이트 트래픽을 최소화하는 식으로 작동하기 때문에 음질을 한 차례 열화시킨 뒤 거의 손실 압축 포멧 형태로만 제공하지만, 이것은 애초에 단순 복사 작업이 아니라 그냥 새로운 저용량 파일을 만드는 방식이다. 마찬가지로 그림파일의 경우도 같은 이유에서 디지털 풍화가 발생하기도 하지만, 이 역시 단순 복사가 아니라 파일을 업로드할 때마다 용량을 줄이기 위해 재구성하는 과정에서 화질이 나빠지는 것이다. 혹시라도 음질이 열화된 것을 느꼈다면 십중팔구는 이런 문제이거나, 포멧을 마구 바꾸면서 기본으로 압축하는 것 이외에도 대역을 잘라내는 등 정보를 정리했거나, 이도저도 아니라면 컴퓨터가 심하게 낡아서 오작동하기 때문일 것이다.

2. 발단

일의 발단은 오디오 커뮤니티인 레퍼런스 클럽이라는 사이트에 올라온 '뻥쟁이김이사'라는 닉네임을 사용하는 유저 김윤태의 글이었다. 닉값

WAV 파일의 경우, 우선 리핑 이전에는 CD에 기록되어 있는 디지털 신호( PCM)[1]이며, 이를 리핑하는 과정에서 데이터 에러가 일어나 binary 레벨에서 차이가 발생하지 않는다면 복사 전후의 파일 자체는 같다.

문제는 #이 글에서 뻥쟁이김이사는 다음과 같은 말을 한다.
재미난 건 CD에서 추출한 wav 파일을 이리저리 카피하거나 인터넷 다운로드를 거치면서 음질적인 손상이 일어난다는 점이다.
물론 이러한 사실을 알만한 분들은 이미 다 알고 있을 거다.
뻥쟁이 역시 회사 프로젝트의 일환으로 테스트를 해 보았기 때문에 여러 번 카피를 거친 음원파일에 손상이 일어난다는 걸 알고 있었다.
혹시라도 이런 사실이 믿기지 않는 분들은 직접 테스트를 해 보시라.
30~40번쯤 카피를 거치면, 제아무리 당신이 똥귀고 시스템이 단순해도 구분할 수 있는 수준의 심각한 손실이 일어난다.
수십번의 메일 전송이나 인터넷 다운로드를 반복해도 마찬가지다.
뻥쟁이 레퍼런스 정도의 시스템에 음악 좀 들을 줄 아는 분들이라면, 단 한번의 카피본도 구분이 가능할 정도로 손실이 온다.
SHA, MD5를 가르쳐주자.

이쯤 되면 무슨 소리를 하는가 싶지만, 본인은 진지하게 생각하고 있는 듯하다. 바이너리가 같다면 같은 출력값을 가질 수밖에 없으므로, 파일의 변질이 생겼거나 파일이 조각화함에 따라 버퍼링 로스가 발생하여 음질의 저하가 생할 수도 있다는 나름대로 설득력 있는 의견도 나왔다. 애초에 음원을 복사할 때 음원을 재생하면서 이를 녹음하여 저장하는 것과 같다고 착각하는 것일 수도 있다.

하지만 뻥쟁이김이사는 파일 자체의 변조는 전혀 없고, full file buffering을 사용했기 때문에 버퍼링에 의한 렉의 발생 또한 없었다는 말을 추가적으로 댓글로 달게 된다.

거기에 새롭게 원인으로 들고 나온 것은 EMI나 RF, 즉 전자파였다. 파일의 복사 과정에서 발생한 전자파가 컴퓨터 또는 오디오 장치 자체에 영향을 미쳐서 음질이 나빠졌다고 주장하면서, 심지어 기판 회로에까지 문제를 제기한다.

이에 대해 많은 네티즌들이 반박을 하자 '그렇게 자신이 있다면 모니터 뒤에 숨어말고 내 앞에 나와라' #라는 투의 글을 남기기도 했다.

3. 내기

그 후, 뻥쟁이김이사의 댓글에서 문제가 시작된다.
나참... 웃기지도 않아서...
그냥 간단하게 하지요.
저는 오디오로 재생되는 음악에 관한한 계측기보다 정확합니다.
그걸 당신이 나서서 정밀 계측기를 들고 저와 싸움을 붙이세요.
이건 좀 예민한 사항이니 500만원빵입니다.
자신 있으시면 ██@██.com으로 연락처 주시고, 자신 없으면 꺼지세요
위와 같은 댓글을 달면서 과연 반응을 예측했는지, 아닌지는 알 수 없지만, 역시나 이에 따른 반응이 즉각적으로 나타나면서 최소 3명 이상의 내기 요청자가 등장한다. 그 중 한 명이 공식적으로 내기를 요청했고, 뻥쟁이김이사는 받아들인다. #1 #2 여기에 공증과 내기 비용을 부담하겠다는 예비 UCC 제작 업체(?)까지 가세하면서 이런 글을 남긴다.
상금을 건 블라인드 테스트를 진행하실 예정이라면 "공개테스트" 를 하는 조건으로
저희쪽에서 내기 자금, 촬영기록 및 공증등을 완전 무상으로 제공할 용의가 있습니다.
내기에서 지실 경우라도 저희쪽에서 자금을 "전액" 제공하도록 하겠습니다.
결국 논란이 된 글은 삭제되었으며, 결말은 운영자가 해당 글 및 댓글 삭제, 회원 강제 탈퇴 등의 신공을 사용하면서 흐지부지 끝나버렸다. 하지만 뻥쟁이김이사의 네이버 블로그의 포스팅 #을 보면 애초부터 레퍼런스 클럽 사이트의 최고운영진이 뻥쟁이김이사였다는 것을 알 수 있다. 빠져나갈 길 따윈 애초에 마련되어 있었던 겁니다 호갱님들 참고로 이 사이트는 그누보드 4로 만들었는데, 그누보드 4를 설치하면 기본으로 적용되는 스킨에 로고 이미지만 레퍼런스 클럽 것으로 바꾼 것이었다. 이 사이트 자체가 뻥쟁이김이사의 개인 홈페이지 그 이상도 이하도 아니었다.

2009년 11월 25일 뻥쟁이김이사는, 12월 초쯤 테스트를 요청한 사람들의 입회하에 테스트를 하겠다고 선언한다.

12월 4일 오후 2시 33분, 테스트 결과가 올라왔다. 테스트 결과를 요약하자면 "내가 틀렸다. 하지만 이건 확실히 다른데 어떻게 생각해?"

500만원 내기를 받아들인 '바나나'의 경우 참가 자체도 하지 못 한 것으로 보이며, 뻥쟁이김이사 혼자서 진행한 것으로 보인다. 자신의 처음 주장은 틀렸으나, '메모리나 캐쉬가 비워진 상태에서 플레이를 한 첫 번째 재생은 동일곡의 두 번째 재생과 차이 난다'라는 새로운 주장을 하고 있는 상태. 이 정도면 wav 파일 열화 문제보다 더 심각한 주장이다. 마치 과학은 이론이고 저는 실전입니다 라고 주장하는 교강용을 보는 것 같은 기분이 들지 않을 수 없다. 사이비 과학의 표본인가 싶기도 하고...

여담으로 이 '음질 열화'는 시코에서도 많이 나오는 떡밥 중 하나이다.

2020년 현재, 아직도 뻥쟁이 김이사는 이 사건과 비슷하게 유사과학 수준의 사이비 글들을 자신의 블로그에 올리고 있다. 오디오 장비 안에 나무로 된 통을 넣어 두기만 하면 해상력이 엄청 올라가고 디지털 장비는 확연하게 아날로그화 된다는데...[2] # 믿거나 말거나 댓글을 보면 알겠지만 원리가 무엇이냐고 묻는 질문에, '나를 아는 사람이면 알 것이다.' 라는 투의 대답을 보면 알듯, 신뢰성이 낮다. 그러나 그의 현재진행형인 오디오 이야기를 들어주는 사람들도 있긴 한 것을 보아하니 컨셉이 아니라 자신의 실제 신념인 것이 확실한 듯.

2023년 4월, 이 논쟁을 촉발시켰던 뻥쟁이김이사가 갑작스러운 병환으로 사망했다. #

4. 참고

발상을 전환해, 중심을 '음원'이 아닌 '컴퓨터 파일'이라는 사실에 중점을 두고 생각해 보자. 모든 파일은 0과 1로만 이루어지며, 이 0과 1의 배열이 조금이라도 다른 두 파일은 서로 다르다. 그리고 원래 wav 파일과 열화된 wav 파일은 다르다. 그러니까 wav 파일을 복사할 때마다 컴퓨터가 배열을 살짝 수정한다는 것. 한 글자의 오타로 인해 실행 자체가 불가능할 수 있는 exe 파일에 이를 대입하면, 복사의 정의를 부정하는 무서운 이론이다.

다만 무결성을 보장하는 디지털 전송에서도 오류가 났으나 무결성 검사를 통과할 가능성은 있으며 따라서 이런 일이 완전히 불가능한 것은 아니다. 참고로 플래시 메모리에서 정보를 읽어 컨트롤러를 통하여 컴퓨터로 전달해주는 SSD에서의 이러한 오류율 - 복구 불가능 오류율은 최대 1016 bit 당 1 bit 이다 # 물리적 구동부가 존재하는 HDD는 좀 더 높아서 1014 bit 당 1bit 이다 # 즉 10 TB 정도의 데이터를 하드에서 읽으면 그중 1bit 정도는 원본과 다를 수 있다. 어디까지나 최대 오류율이며 실제 안정성은 그보다 훨씬 높은 것으로 보고된다. 오라클 직원의 경험에서 나온 증언 즉 음원 파일이 100 MB 이고 샘플링 주파수가 44.1kHz 라고 가정할때, 10만번 정도 복사하면 4만 4천분의 1초 단위의 음 변화가 생길 수 있다. 당연히 이런 변화는 아무리 황금귀라고 하더라도 인간이 잡아낼 수 있는 영역이 아니다. 조금 과장해서 만약 이게 가능하다면 인간은 지구의 자전 속도 변화를 '체감'하는 게 가능할 것이다. 또한 이런 변화가 심하게 생겼을 경우, 디지털 파일은 에러 메시지를 띄우고 실행을 중지하게 되어 있다. 아날로그처럼 데이터가 심하게 변경된 상태에서도 작동이 되는 것이 아니라는 이야기이다.

위와 같은 상황을 인위적으로 만드는 방법으로 컴퓨터 안에 저장된 음악을 HxD 등의 바이너리 편집기로 열어서 파일 가운데 쯤에 있는 바이트 하나를 바꾸고 저장하는 수가 있다. FLAC와 AAC 기준 바이트 하나만 바뀌어도 foobar2000에선 해당 위치에서 에러 메시지가 나온다. 다만 바이트 하나 정도 수정으로는 재생에는 문제없고, 몇십 바이트 정도 수정해야 끊기는 등의 문제가 생긴다.

그리고 위의 복구 불가능 오류율(URE)도 오해의 소지가 있는 수치이다. 하드디스크 회사에서 내놓는 이 스펙은 해당 장치를 사용해서 몇 비트(바이트가 아니다)의 정보를 읽을 때 잘못 읽을 수 있는 확률을 뜻하나, 실제로는 마케팅적인 의미가 다분히 담겨있는 수치일 뿐이다. 실제로, 2000년대 초반까지만 해도 그 당시의 URE 수치로 봤을 때 현재의 3TB, 4TB 하드 전체를 읽을 경우 20%나 1bit 의 오류의 발생할 위험이 있다고 여겨 RAID 업계가 변할 것이라는 전망이 있었다. 허나 시간이 지나면서 URE 확률은 더욱 낮아져서 2014년이나 그 당시나 하드 전체를 읽을 시 0.xx% 의 확률로 1bit 가 잘못 읽힐 우려가 있다고 하고 있다. 이에 대한 해외의 실험에서도 하드디스크를 며칠이나 다시 읽는 테스트를 반복하여도 아예 오류가 검출되지 않는 상황이다. 즉, 생각보다 현재 쓰이고 있는 하드나 플래시 메모리에 기반하고 있는 SSD 등의 저장매체는 매우 신뢰할만한 수준의 데이터 리드를 보장하며, 상기와 같은 복구 불가능 오류율은 현실적으로 반영이 안되는 마케팅적인 허수임을 유념해야 한다. 단, 디스켓이나 테이프 백업 장치 등에서는 오류가 잘 발생하기 때문에 해당 스토리지에서는 감안해야 하는 수치이다. 디스켓과 테이프가 가정용에서는 퇴출되어 사라진 현재의 일반 유저들로서는 체감이 불가능하다는 뜻.

이런 것을 주장하는 사람들은 가끔 CD의 염료 성분에 따라서도 음질이 바뀔 수 있으며, 블랙 CD가 가장 좋다고 주장한다. 심지어 CD를 요구르트에 담그면 음질이 좋아진다고 주장하는 사람도 있다. CD-R의 염료 성분에 따라 CD의 수명이 다를 수는 있으며, CD 표면에 긁힌 자국이 있으면 읽기 오류로 그 부분에 노이즈가 생길 수도 있고, 바나나와 치약을 사용하여 이 긁힌 자국을 어느 정도 없앨 수 있기도 하다. 하지만 그런 물리적인 손상이 아니라면 비록 싸구려 CD-R을 사용한다고 해도 음질이 열화될 리는 없다. 더구나 고등학교 물리1 교과서에서는 CD의 일부를 잘라낸 다음에 재생하는 실험이 나오는데, 결론은 재생이 잘 된다이다. 즉, 일부 정보의 손실이 있더라도 음질이나 음악재생에 큰 영향을 끼치진 못한다. 차라리 싸구려를 사용하면 보존성이 낮다거나, 저속으로 레코딩하는 것이 좋다거나 하는 이야기라면 납득은 가겠지만, 아무리 파일의 복사가 많아도 CRC나 MD5 값이 바뀌는 경우는 없다.

단, 음악 재생에 사용되는 CD 규격은 CD 표면 손상 정도와 리더기의 성능 차에 따라 음의 공백이 발생할 수 있다. 일반 CDP의 경우 픽업 성능이 구리거나 오류 수정 기능이 없어서 음이 튀기도 한다. 사실 복구용 패리티는 오디오 CD에도 다 있다. 단 수준이 주민등록번호 마지막 자리 수준이라.. (즉, 단위 데이터 길이 당 안 읽히는 데이터가 하나만 있으면 복구 가능하다.) 당연하지만 CD 표면 아래의 기록 영역이 손상됐으면 그 CD는 망한거고, 보통은 표면이 긁힌 것이기에 컴퓨터용 ODD에서 리핑이 가능하다면 CD-R 등에 재기록해서 부활시킬 수 있다. 물론 여기서 MP3 CDP같이 음악 파일이 담긴 CD를 재생하는 경우는 제외된다. 이건 CD-ROM 규격이므로 손상이나 읽기 오류를 체크할 수 있기 때문이다.

요즘은 CD에 큰 손상이 없다면 웬만하면 문제 없긴 하지만, ODD에 따라 레이저 입사각 문제로 CD 읽는 시작점이 다른 등 해서 듣기엔 문제 없어도 리핑한 파일의 해시가 다른 경우가 있는데, 이런 게 신경쓰인다면 해시 데이터베이스 비교, 오프셋 보정 등 각종 오류 감지 기능이 떡칠된 EAC를 이용하는 방법도 있다.

참고 자료 음악 전용 ODD(= CD 플레이어)의 음질이 전반적으로 PC용 ODD에서 신호를 받아 트는 것보다 낫게 들리는 이유는 DAC와 아날로그 부분인 노이즈 제거 회로, 스피커를 울리기 위한 앰프의 성능 차이, 혹은 별도로 들어간 착색 때문이지, CD에서 신호를 읽어 주는 리더기 부분의 성능 차이는 아니다. 똑바로 리핑했다면 음악 파일은 동일하므로 별도로 외장 DAC 및 앰프를 일정 성능 이상으로, 그리고 자신의 취향에 맞는 착색이 들어간 것으로 사면 해결되는 문제 중 하나이다. 다만 구형 PC에서 3.5mm 내장 단자나 저가 DAC를(특히 USB로 전원 받는 무전원) USB로 사용하는 경우 그라운드 루프 문제로 노이즈가 섞여들어가는 경우가 있긴 했다. 광단자(S/PDIF의 TOSLINK 규격)를 사용하면 이 문제에서 해방되기에 그쪽을 찾는 사람도 많았다. 요즘은 새로 산다면 더 큰 데이터를 다루는 블루레이 ODD가 대세이므로 오디오/비디오 전용 장비라도 에러 복구 능력은 과거 CDP보다 더 좋아졌다.
  • 160만원짜리 음악용 PC(?) # : 사기다. 외장형 USB- DAC[3]나 광출력 사용을 전제로 한 제품으로, PC에서 나오는 디지털 음원은 어느 PC이든 데이터 무결성을 보장하며 음질은 DAC단에서 결정되므로 음질과는 아무 상관도 없다. 당연히 DAC는 따로 사야 된다. 주요 부품들은 저가형 제품[4][5]으로 도배를 했다.[6] 음감을 위해 느린 컴퓨터를[7] 사는 것은 결국 무소음 컴퓨터를 위한 것이지, 음질과의 직접적인 관련이 있어서 사는게 아니다. 케이블이나 USB 단자 등에 과도한 투자를 한 황당한 제품. 본 항목의 내용과 마찬가지로 하드디스크에서 출발한 디지털 음원 데이터가 PC 내부에서 흐르는 동안 의도치 않은 변조를 거쳐 USB나 광출력 단자로 나올 때는 원본 음원과는 달라진다는 황당한 이론으로 기존의 디지털 데이터 무결성 메커니즘을 완전히 부정하는 제품. 심지어 램의 방열판 유무도 영향을 끼친단다. 다만, 적당한 일반 PC를 쓰면서 일부 부품을 고급화하고 음원을 탑재해 판매한 경우는 있으므로, 모든 오디오 전용 (PC-Fi)이라고 내세우는 PC가 사기인 것은 아니다. 보통 정상적인 물건은 팬리스, HDD리스 제품이 많다. PC에서 가장 시끄러운 부품이 쿨링팬, 그 다음은 HDD이기 때문에... 2010년대 후반부터는 굳이 무소음이 목적이 아니더라도 SSD의 발전과 메모리 계층 구조의 단순화를 위해 HDD를 달지 않는 PC도 많아졌다. 다만, CPU의 발열량이 높아져서 쿨링 시스템의 소음은 더 심해졌지만.

5. 관련 문서



[1] 황당하게도 이 논쟁은 논쟁자가 이 문장의 어디에 방점을 찍고 있느냐가 문제가 된다. 그 이전에 이게 논쟁인지는... [2] 당연하지만 이미 스피커로 소리가 나오는 시점에서 DAC를 통해 아날로그로 변환된 소리가 나오는 것이니 말이 안된다는 것을 알 수 있다. 실제로 저러면 원본 소리보다 훨씬 왜곡된 소리가 나오게 하는 것에는 도움을 준다고는 할 수 있을지언정 해상도가 엄청 향상되는 것과 같은 큰 효과를 보기는 어렵다. [3] 디지털 데이터를 아날로그 신호로 바꾸어 주는 장치 [4] 실제라면 저 정도 스펙의 컴퓨터는 기껏해야 20만~30만원 정도다. [5] 다만, 알루미늄으로 된 케이스와 방열판 등은 따로 주문 제작한 것으로 보이며, 그 때문에 가격이 꽤 높아지는 것은 맞다. 일반 PC로 내놓았다면 납득할 사람이 없기 때문에 외형에서라도 차별화를 해야 하기 때문에 그렇게 했을 것이다. 그래도 100만 원 미만이면 되니 너무 비싸다. [6] 컴퓨터가 느릴수록 더 음질이 좋단다. 하지만 실제로 컴퓨터가 느릴 경우 AAC, OGG Vobis, APE같은 포멧을 재생하기 힘겨워하거나 버퍼 언더런의 영향으로 음질이 안 좋아진다. 특히 최신 디코더들은 하드웨어 자원을 적극적으로 활용하도록 설계되었기 때문에 장치의 연산성능이 떨어질수록 품질이 떨어진다. [7] 대부분 느리다기보다는 발열이 적은 쪽에 초점이 맞춰질 것이다.