최근 수정 시각 : 2024-12-11 23:31:43

유령문자

파일:漢.svg 파일:漢_White.svg 한자
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px); word-break:keep-all"
{{{#!folding [ 펼치기 · 닫기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<colbgcolor=#eee,#333> 서체와 자형 갑골문 · 금문 · 전서 · 예서 · 해서 · 행서 · 초서 · 정자( 표준자형) · 간체자( 간체자 논쟁) · 신자체( 목록 · 변화 규칙) · 본자 · 속자 · 약자 · 이체자 · 한중일 한자
성질과 분류 획(필순) · 구조 · 파자 · 육서 · 상형자 목록 · 훈음 · 부수 · 부수(중국) · 부수(설문해자)
표준화 상용한자 ( 한문 교육용 기초 한자 · 통용규범한자표 · 당용한자 · 일본의 상용한자 ( 목록) · 학년별한자배당표) · 한국어문회 한자검정시험 · 어문회 급수 · 대한검정회 한자급수자격시험 · 검정회 급수 · 한자한문지도사시험 · 인명용 한자표 · 광동어 정음 운동
주음·표음화·한자음 반절 · 주음부호 · 병음 ( 한어병음 · 월어병음) · 한글( 동국정운) · 훈독 · 음독 · 속음 · 한국 한자음 · 중국 한자음 ( 문백이독 · 상고음 · 중고음 · 근고음 · 양안 간 독음) · 일본 한자음 · 베트남 한자음 · 다음자
옥편 자전 · 설문해자 · 강희자전 · 옥편 · 이아 · 운서 · 광운 · 절운 · 집운 · 오음편해 · 한어대사전 · 대한화사전 · 중문대사전 · 이체자자전 · 한한대사전
색인 부수별 · 음별 · 획수별
국가별 사용 한자문화권 · 한문 · 백화문 · 한국의 한자 사용 · 한자어( 한국식 한자어 · 중국식 한자어 · 일본식 한자어 · 베트남식 한자어) · 언어간 동형이의 한자어( 고유명사) · 언어간 이형동의 한자어 · 우리말 새김
파생 문자 한글 전 한국어 표기 ( 국자 · 이두 · 향찰 · 구결) · 방언자 · 주음부호 · 가나 ( 히라가나 · 가타카나 · 헨타이가나 · 만요가나) · 측천문자 · 쯔놈 · 고장자 · 거란 문자 · 여진 문자 · 서하 문자
입력 · 검색 한자/입력기 · 창힐수입법 ( 목록) · 오필자형수입법 · 대이수입법 · 사각호마검자법 · 재춘법
전산화 KS X 1001 · KS X 1002 · KPS 9566 · GB 2312 · JIS X 0208 · Big5 / 유니코드: 한중일 통합 한자 · BMP( 통합 한자 · 통합 한자 확장 A · 호환 한자) · SIP(통합 한자 확장 B~F) · TIP(통합 한자 확장 G) · 한자 모양 설명 문자
기타 고사성어 · 천자문 · 한시 · 어조사 · 음역 · 서예 · 올해의 사자성어 · 올해의 한자 · 국한문혼용체( 논쟁) · 국한문병용체 · 한자 교육 ( 한문(교과) ( 2022 개정 교육과정/한문과) · 한자 교육 찬반 논쟁) · 중복 한자 · 벽자 · 통자 · 갖은자 · 한자오자 · 미상 한자 · 유령 문자 · 특이한 한자 · 닮은꼴 한자 · 국호 · 주기율표 · 음률 · 한자문화권 고유명사 표기 · 자주 틀리는 한자어 · 훈을 혼동하기 쉬운 한자 · 부수를 혼동하기 쉬운 한자 · 한자를 혼동하기 쉬운 단어 · 발음이 여럿인 한자어 · 한국의 성씨( 인구분포 · 지역별) · 후리가나 · 창작 한자 }}}}}}}}}


1. 개요2. 역사3. 수와 종류4. 여담

[clearfix]

1. 개요

유령문자([ruby(幽, ruby=ゆう)][ruby(霊, ruby=れい)][ruby(文, ruby=も)][ruby(字, ruby=じ)])는 일본에서 컴퓨터 환경에서 지원하는 한자 가운데 그 정보나 출처, 유래 등을 알 수 없는 미상 한자를 가리키는 이름이다. 니코니코 대백과에서는 말 그대로 유령을 나타내는 한자라고 서술하고 있다. #

2. 역사

일본의 통상산업성(現 경제산업성)은 일본어 표기에 쓰이는 문자들을 컴퓨터에서 표현하기 위해 1978년에 JIS 기본 한자(JIS X 0208, 당시 JIS C 6226)를 규정하였는데 JIS 규격의 한자 집합을 제정하는 과정에서 출처를 알 수 없는 글자들이 등록되었다. 이는 한자에 대한 지식이 부족한 작업자가 착각했거나 미세한 획을 잘못 입력하는 등 전산화 작업에서의 사소한 오류로 인해 발생했다고 여겨진다.

이 문제가 부상하면서 일본 국립국어연구소(国立国語研究所)의 사사하라 히로유키(笹原宏之) 등이 조사를 시작해 이 한자들이 지명으로 사용되거나 자료를 전사하던 중에 발생한 착오라고 여겨진다는 사실을 판명했다. 이 연구 결과는 JIS X 0208:1997의 부록 7에 정리되어 있다.

1997년의 JIS 한자 개정의 일환으로 사사하라 히로유키를 비롯한 연구진이 유령문자에 대한 조사를 벌였지만 이 시기에는 이미 유니코드에 JIS 한자가 수록되었기 때문에 JIS를 섣불리 개정할 수 없었다.[1] 일본은 2000년에 JIS X 0208을 확장한 일본어 문자 집합인 JIS X 0213을 만들었는데 여기서도 JIS X 0208 부분은 건드리지 않고 그대로 뒀기 때문에 최신 일본어 문자 집합 JIS X 0213에도 유령 한자는 그대로 남아 있다. 사실 아래의 연구 결과를 보면 알 수 있듯 착오로 만들어진 진짜 유령문자는 총 8자로(穃, 墸, 壥, 妛, 挧, 暃, 袮, 彁) 문자 집합을 함부로 건드릴 정도로 심각하진 않다.

3. 수와 종류

1997년 당시로서는 이런 글자가 얼마나 되는지 정확히 추산할 수 없었는데 지명·인명용 한자로 국자가 쓰이는 경우는 한국에서도 乭이나 乷 등이 쓰이는 등(예: 이세돌 李世, 살미면 味面) 한자문화권에서는 일반적인 일이었기 때문에 자전에 나오지 않는다고 무작정 없는 한자라고 단정할 수는 없었기 때문이다.[2][3] 최초 연구가 시작될 때는 대개 60자에서 100자 정도로 추산되었다.

이후 연구에서 역시 대부분이 연구 결과 폐번치현 이전 혹은 현재도 쓰이는 지명·인명용 한자임이 밝혀졌고 열두 자를 제외하면 대부분 그 출처가 확인되면서 유령 한자가 아님이 드러났다. 이 과정에서 밝혀진 글자들은 다음과 같다.
과거 혹은 현재에도 지명·인명으로 사용되는 한자로 밝혀진 경우
すくも(스쿠모)라고 읽는 지명용 국자임이 확인되었다. 여전히 히로시마현 아키타카타시에는 [ruby(糘地, ruby=すくもぢ)](스쿠모지)라는 지명이 있고 오카야마현 츠야마시에는 [ruby(糘山, ruby=すくもやま)](스쿠모야마)라는 산이 있다.
ゆき(유키)라고 읽는 지명용 국자임이 확인되었다. 과거 구마모토현 미나마타시에 [ruby(膤割, ruby=ゆきわり)](유키와리)라는 지역이 있었다.[4]
うるち(우루치)라고 읽는 지명용 국자임이 확인되었다. 과거 후쿠시마현 시라카와시에 [ruby(粫田, ruby=うるちだ)](우루치다)라는 지명이 있었다. 현재는 [ruby(糯田, ruby=もちだ)](모치다)로 변경되었다. 한국 옥편에는 '쌀 이름 이' 자로 등록되어 있다.
ほう(호)라고 읽는 지명용 국자임이 확인되었다. 아이치현 토요타시에 [ruby(垉六, ruby=ほうろく)](호로쿠)라는 지역이 있다. 한국 옥편에는 '캘 포' 자로 등록되어 있다.
이 글자는 일본에서 やま(야마)라고 읽는 지명용 한자임이 확인되었다. 교토부 교토시 사쿄구에 [ruby(広岾, ruby=ひろやま)](히로야마)라는 지명이 존재했지만 현재는 [ruby(広帖, ruby=こうちょう)](코쵸)로 변경되었다. 이 글자는 한국에서도 비슷한 의미로 사용되는데 옥편에는 '땅 이름 점[5], 고개 재'[6] 2가지로 등록되어 있다.
だる(다루)라고 읽는 지명용 국자로 확인되었다. 시즈오카현 시즈오카시 아오이구에 [ruby(石橸, ruby=いしだる)](이시다루)라는 지역이 있는 것이 확인되었다.
ぬた(누타)라고 읽는 지명용 국자[7]로 확인되었다. 야마나시현 카이시에 [ruby(大垈, ruby=おおぬた)](오누타), 후에후키시에 [ruby(藤垈, ruby=ふじぬた)](후지누타)라는 지명이 있다. 다만 특이하게도 한국에서는 아주 많이 쓰이는 글자여서[8] 어문회 기준으로 2급 한자라는 급수가 부여되어 있다.
ぬた(누타)라고 읽는 메이지 시대에 지명에 사용되었던 국자였다. 고치현 시만토초의 [ruby(汢の川, ruby=ぬたのかわ)](누타노카와)라는 지명에 사용되었는데 현대에는 삼수변이 이수변으로 바뀐 또 다른 국자를 사용 중이다. 이 冫土는 반대로 JIS에 없으며[9] 심지어 유니코드에도 없다. 결국 이러한 이유로 인해 해당 지명은 2002년 다시 汢の川로 표기가 바뀌었다(...).[10] 한국 옥편에는 '물 이름 토' 자로 등록되어 있다.
せき(세키), ひろ(히로)라고 읽는 인명용 한자로 확인되었다. 碩의 이체자로, 실제로 현대에도 이 한자를 쓰는 사람이 존재함이 확인되었다.[11][12]
ぬか(누카)라고 읽는 지명용 한자로 확인되었다. 아키타현 아키타시에 [ruby(粐蒔沢, ruby=ぬかまきざわ)](누카마키자와)라는 지역이 존재한다.
어디서 나온 오자(誤字)인지 명백하게 밝혀진 경우.
오키나와현 오키나와시의 [ruby(榕原, ruby=ようばる)](요바루)의 榕이 잘못 전사된 것으로 확인되었다. 두 글자의 변을 보면 벼 화(禾)와 나무 목(木)은 딱 한 획 차이라서 다른 한자의 구성 요소로 쓰일 경우 혼동하기 쉽다. 원래 글자 榕의 한국식 훈독은 "벵골보리수 용"이다.
그러나 조사 후에도 열두 자는 한동안 출처가 밝혀지지 않았는데 이러한 글자들은 강희자전 등 주요 자전에 실려 있지 않는 등 출처를 파악할 수 없었으며 어디에서 쓰이는지조차 알려져 있지 않았고 어떻게 읽어야 하는지도 알 수가 없었다.

墸 壥 妛 彁 挧 暃 椢 槞 蟐 袮 閠 駲

추가 연구를 통해 열두 자 중 한 자를 제외한 열한 자도 어디서 발생한 오자인지 혹은 어디서 쓰이는지 밝혀졌는데 연구 결과는 다음과 같았다.
출전은 알 수 없으며 堵또는 躇의 오자(誤字)로 추정된다.
㕓의 부수를 쉽게 찾을 수 없자 土변을 넣은 글자...라고 알려져 있었으나 몽구집주(蒙求集注)[13]라는 책에 밭을 세는 단위를 나타내는 글자로 쓰인 것이 확인되었다. 여기에서 Ctrl+F로 壥을 찾을 수 있다.
𡚴(⿱山女)의 오자로 추정된다. 𡚴(⿱山女)는 あけび(아케비)라고 읽는 일본 국자인데 한 책에서 이를 妛로 잘못 표기한 것이 유래로 확인되었다. 한국 옥편에는 '더러울 치' 자로 등록되어 있는데 보통 '치'자는 위에 山이 아니라 屮의 형태다. 하지만 山으로 나온 문헌도 있긴 하다. #
국토지리협회 국토행정총람지에서 등장한 글자로, 栩의 오자다.
국토지리협회 국토행정총람지에서 皐, 星, 早, 毘, 昆, 犀, 韮, 晃, 昌, 昇 등 매우 많은 한자들의 오자로 사용되었다. 한국 옥편에는 '떠날 비' 자로 등록되어 있다.
토쿠시마현 나루토시에 [ruby(椢原, ruby=くにはら)](쿠니바라), 이바라키현 다이고마치에도 해당 글자를 쓰는 [ruby(椢内, ruby=くぬぎうち)](쿠누기우치)라는 지역이 있다. 따라서 지명용 국자로 확인되었다. 한국 옥편에는 '광주리 밑바닥 귀', '광주리 괴' 자로 등록되어 있다. 옥편에 따라서는 槶를 올린 다음 椢를 槶의 약자로 풀이하였을 것이다.
의 약자로 확인되었다.[14]
인명에 쓰였던 한자로 확인되었다. 음독은 トウ(토), ドウ(도), ジョウ(조), 훈독은 かまきり(카마키리)[15], もみ(모미). 또한, 헤이안 시대의 한자사전인 신찬자경(新撰字鏡)에서는 붉은 개구리[16]를 끓여만든 요리라는 뜻이라고 서술되어있다.
돗토리현 돗토리시의 [ruby(祢宜, ruby=ねぎ)](네기)라는 지명의 示변이 衣변으로 착각된 한자로 확인되었다. 한국 옥편에는 '꿰맬 치' 자로 등록되어 있다.[17]
일본에 전해진 광운상에 통자 관계로 설명되어 있다. 閏의 속자다. 대한민국에서도 같은 용례로 쓰인다. 옥편에도 당연하다는 듯 '윤달 윤'으로 등록되어 있다.[18]
'말꼬리 주'라고 하는 인명용 한자. 강희자전에는 누락되어 있으나 사성음이 존재하며[19] 일본 음독은 シュウ(슈)로 확인되었다.

결국 '최후의 유령한자'라고 불리는 '彁' 한 자만 남게 되었지만 몇십년 후 본 한자가 제목으로 쓰인 곡이 유명해지면서 무엇의 오자인지 밝혀졌다.
아사히 신문의 1923년 2월 23일자 기사 중 사이타마 자강회(埼玉自彊会)의 彊(굳셀 강) 자가 뭉개져 찍혀 彁로 보이게 된 것으로 확인되었다. #[20]


유령문자 자원(字源) 풀이

4. 여담

전 세계의 문자를 담는 것을 목표로 하는 유니코드에서도 비슷한 사례가 있다. 예를 들어 ⍼(U+237C)이라는 기호는 어떤 의미를 지녔는지 불명일 뿐더러 왜 유니코드에 추가되었는지조차 불명이다. 현재까지 가장 오래된 사용례는 1963년에 글꼴 디자인 기업인 모노타입의 카탈로그에 나온 것으로 확인되었다. 영미권에서는 본 기호를 Angzarr라 부른다. 이것과는 관련없다

더불어 선형문자 A의 케이스도 있는데, 몇만개나 되는 사료로 인해 번역된 선형문자 B와 달리 해독되지 않았음에도 불구하고 문자표에 들어가 있다. 문자 섹션 하나가 통째로 유령문자인 것.

이 유령문자를 소재로 한 아날로그 호러도 있다. # 漢字.mp4라는 제목이다. 위에서 소개한 유령문자들이 인신공양을 묘사한 끔찍한 어원을 가졌거나[21] 이름을 말할 수 없는, 조우시 무조건 도망쳐야 하거나 도망치는 것 조차 불가능한[22] 끔찍한 괴물을 묘사한 것이라는 것.


[1] 심지어 한국에서도 이미 유령문자를 한컴 2바이트 코드 시절인 한/글 97 기능강화판부터 입력 가능했다.(대개 변환을 누르면 입력할 수 없고 문자표에서만 쓸 수 있는 문자. 물론 후술하듯이 변환해도 입력할 수 있는 문자도 있다.) 지금도 밑에 있는 유령한자를 아래아 한글에 복붙하여 신명조와 같은 몇몇 아래아 한글 전용 폰트로 바꾸면 글꼴이 바뀌는 것을 볼 수 있다. [2] 한자는 기본적으로 열린 집합이다. 제작 원리만 알면 누구나 당장 새 한자를 만들 수 있다. 실제로 鿫(⿹气奥, 오가네손 오, 파일:Rf-Og_zh-hans.png ) 등의 새로이 만들어진 한자들이 있다. [3] 역사적으로는 측천문자가 대표적인 사례다. [4] 그러나 해당 지명이 정확히 어디를 가리키는 지는 불명으로 보인다. 한편 미나마타학 연구센터에서는 예로부터 미나마타 제2소학교 일대를 일컫는 지명이라고 소개하고 있으며 읽는 방법도 すねわり(스네와리)로 제시하고 있다. [5] 인천광역시 강화군 하점면(河岾面)의 '점'자가 바로 이것이다. [6] 고개를 뜻하는 '재'는 순우리말인데 한자로 표현하기 위해 이 글자를 사용한 듯하다. 재를 뜻하는 다른 한자로는 고개 치, 고개 령(嶺) 등이 있다. [7] 한국에서도 국자로 취급된다. [8] 서울 낙성대(落星垈) 등의 지명에도 쓰이거니와 한국 부동산등기부에서 토지의 사용 목적을 나타낼 때 사용하는 축약어( 지목) 중 주택용지(또는 사무용 건물 필지)를 나타내는 것이 바로 垈(대)이다. 단국대학교 한국한자어사전에 따르면 원래는 代를 집터란 뜻으로 가차하여 사용하였으나, 밑에 土를 덧붙여 의미를 더 확실히 했다고 한다. [9] JIS 한자 코드(JIS漢字コード)는 일본 공업 규격의 한자 등의 문자 코드이다. 쉽게 말해서 옛날에는 삼수변(氵)을 썼는데 현대에 이수변(冫)으로 바뀌어서 쓰이고 있다. 그런데 막상 이수변(冫)과 흙 토(土)로 된 문자(⿰冫土)는 인터넷상의 문자에 없다는 것이다. [10] 바뀐 것에는 컴퓨터로 입력하기 불편하단 이유 외에도 본래 汢 쪽을 사용했고 공신력 있는 사전인 다이칸고린에서도 삼수변이 붙은 한자를 사용했다는 이유도 있었다. [11] 덧붙여 이런 식으로 인명용으로 쓰인 국자는 한국에도 상당히 많은데 각 집안 족보를 들여다보면 제법 찾을 수 있을 정도다. 하지만 후대 연구 등에서 나타날 경우 전공자들의 머리를 쥐어뜯게 만든다. [12] 한국 한자음으로는 어째선지 "석"이 아닌 "정"으로 등록되어 있다.("세키"는 石,碩와 같은 "석"과 상응하는 음) 이체자가 아닌 형성자 원리에 따라 +으로 보아 "정"으로 임의로 붙인 듯하다. [13] 몽구(蒙求)는 중국 당나라 이한(李翰)이 지은 어린이들의 문자 교육을 위한 아동용 교재이고 몽구집주는 사고전서에 수록된 책으로 논어집주와 마찬가지로 후대의 학자가 주석을 달아놓은 책. [14] 이 용 룡()의 약자다. [15] 사마귀라는 뜻인데 같은 뜻의 한자로 사마귀 당(螳)이 있다. 이 글자의 오기로 보인다. [16] 일본산개구리를 뜻하는 듯 [17] 示가 변으로 쓰일 때는 가타카나 ネ(네)와 같은 모양(礻)으로 쓰이기도 하는데 衣가 변으로 쓰인 모양(衤)과 비슷해서 착각하기 쉽다. 祢는 '아비 사당 녜/니' 자로 등록되어 있는데 히라가나 ね의 뿌리이기도 하다. [18] 특히 潤(젖을 윤)이 이름자로 들어간 많은 사람들이 氵閠의 형태로 쓴다. [19] zhou로, 우변의 고을 주에서 파생된 것으로 보인다. [20] 유령문자들 중에서 제일 오랜 기간 동안 그 출처가 밝혀지지 않았던 문자였다. 2011년 아사히 신문 디지털 매거진에서 처음 확인되었는데, 근 10년이라는 기간 동안 이 주장이 묻혔다가 동명의 악곡이 유명해진 다음에야 이 사실이 재발굴되었다. [21] 다만 갑골문이 만들어지던 상은주시대에는 아직 인신공양이 성행하던 시절이고 갑골 또한 이러한 제사를 점치기 위한 용도인지라 실제로도 이러한 어원을 가진 문자들이 다수 있다. 해당 영상에서 나온 𦰩이 실제로 사람을 불태워 제물로 바치는 형상이 맞고, 사람의 눈을 찔러 멀게하는 民이라든가 인간제물을 수직으로 쪼갠 것이 어원인 卯라든가 사람의 목을 나무에 매단 것이 어원인 縣이라든가. [22] 이 문구는 영상 내에서 딱 한번 나오는 문구이다.