최근 수정 시각 : 2023-11-10 16:56:56

PUA

1. Private Use Area
1.1. 널리 알려진 비표준 예시
2. Pick Up Artist3. PUA (Potentially Unwanted Application)

1. Private Use Area

유니코드 문자 집합의 문자 평면
{{{#!wiki style="word-break: keep-all; margin:0 -10px -5px; min-height:calc(1.5em + 5px)"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
<rowcolor=#FFF> 기본 보조
<rowcolor=#FFF> Plane 0
0000~FFFF
Plane 1
10000~1FFFF
Plane 2
20000~2FFFF
Plane 3
30000~3FFFF
Planes 4-13
40000~DFFFF
Plane 14
E0000~EFFFF
Planes 15-16
F0000~10FFFF
기본 다국어 평면
BMP
보조 다국어 평면
SMP
보조 표의문자 평면
SIP
3차 표의문자 평면
TIP
(사용 안 함) 보조 특수 목적 평면
SSP
사용자 자유 영역
PUA
0XXX 8XXX 10XXX 18XXX 20XXX 28XXX 30XXX 38XXX 문자 없음 E0XXX 15: PUA-A
1XXX 9XXX 11XXX 19XXX 21XXX 29XXX 31XXX 39XXX F0000-​FFFFF
2XXX AXXX 12XXX 1AXXX 22XXX 2AXXX 32XXX 3AXXX
3XXX BXXX 13XXX 1BXXX 23XXX 2BXXX 33XXX 3BXXX 16: PUA-B
4XXX CXXX 14XXX 1CXXX 24XXX 2CXXX 34XXX 3CXXX 100000-​10FFFF
5XXX DXXX 15XXX 1DXXX 25XXX 2DXXX 35XXX 3DXXX
6XXX EXXX 16XXX 1EXXX 26XXX 2EXXX 36XXX 3EXXX
7XXX FXXX 17XXX 1FXXX 27XXX 2FXXX 37XXX 3FXXX
}}}}}}}}}


U+E000 ~ U+F8FF, U+F0000 ~ U+10FFFF[1]

유니코드에서 사용자 정의 영역을 부르는 말. 이 영역에는 특정한 문자가 할당되어 있지 않기 때문에 글꼴 제작자의 의도에 따라 원하는 문자를 배당해서 쓸 수 있다. 때문에 글꼴 간의 호환성이 보장되지 않는다. 예를 들어 같은 U+F0000이어도 글꼴에 따라 다른 문자가 나오는 것이다.

사용자 정의 가능한 문자 수는 기본 평면의 6,400자(U+E000 ~ U+F8FF)와 확장 평면인 15번 평면과 16번 평면의 131,068자(U+F0000 ~ U+FFFFD, U+100000 ~ U+10FFFD)를 합쳐 모두 137,468자이다. 각 영역의 마지막 2자리(U+xxFFFE, U+xxFFFF)는 비문자(Non-character) 영역으로 지정되어 문자가 배당되지 않는데, 사용자 정의 평면에도 이 규칙은 예외없이 적용되므로 4자리를 비워야 해서 그렇다.

1.1. 널리 알려진 비표준 예시

대표적으로 아래아한글에서는 이 영역에 키캡 문자, 한글과컴퓨터 로고 등을 배당해놓았다. 아래아한글에서는 2007 버전까지 옛한글 구결을 처리하기 위해 한양 PUA라는 방식을 사용하였다. 여기서 한양은 폰트 개발사인 한양정보통신을 의미한다. 옛한글 글자들을 유니코드의 사용자 정의 영역에 넣어놓았기 때문에 붙여진 이름이다. 하지만 이것은 표준 방식이 아니었고, 이 때문에 2010 버전에서는 유니코드와 호환되는 첫가끝(초성-중성-종성) 방식으로 옛한글 처리 방식을 바꾸었다. 하지만 과거에 한양 PUA로 작성된 문서를 읽어 들일 수 있게 여전히 한양 PUA를 아래아한글에서 존치 중이다.

유니코드 콘소시엄에서 별도의 문자로 인정 안 해주는 구결의 경우 지금도 한양 PUA에 들어간 것을 쓸 수밖에 없다. 유니코드 표준에 실린 구결이 너무나도 적기 때문이다.

텡과르 등 역사적 가치가 전혀 없어 유니코드 표준으로 등재가 거부당하는 인공 문자들을 이 공간에 매핑해서 쓰기도 한다. 대표적인 프로젝트로 PUA 영역에 각종 인공 문자를 배당하기 위한 ConScript Unicode Registry라는 프로젝트가 존재한다.

애플의 기기에서만 보이는 애플 로고 문자는 애플이 이 영역의 끝자락인 U+F8FF에 독자적으로 할당해 놓은 문자이다.

쿠키런 글꼴에서는 이 영역에 각종 쿠키런 모양 딩벳이 포함되어 있다. 원래 상업용 무료 글꼴이지만, 이 딩벳만은 비상업적 목적에 한정하여 사용할 수 있다.

이외에도 유니코드에 배당되지 않은 중세 라틴 문자를 표현하기 위한 MUFI(Medieval Unicode Font Initiative)와 같은 프로젝트가 존재한다.

일부 북한제 폰트에서는 김일성, 김정일, 김정은 전용 글리프를 이 영역에 배당해 놓기도 한다. (U+F11A~U+F122) 김씨 3대의 이름이 보통 글씨보다 굵게 표현된다. PDF로 구현한 북한 폰트의 '김정은' 샘플 김정은 돼지새끼 국내 인터넷에서 찾을 수 있는 북한 폰트 중 이 글리프가 있는 것도 있고 없는 것도 있다. 이는 저 3명의 이름 석 자가 줄 끝에 걸려 이름이 다음 줄로 짤려 나가는 현상을 방지하기 위해 이름 석 자 자체를 하나의 코드로 만들고 이에 해당하는 하나의 글자처럼 처리하기 위함이다. 따라서 북한에서 쓰는 키보드 프로그램들은 저 이름 석 자를 따로 입력하면 자동 감지하여 하나의 PUA 코드로 치환해두고, 자동으로 이름 짤릴 염려를 덜게 된다. 현대판 피휘

2. Pick Up Artist

파일:상세 내용 아이콘.svg   자세한 내용은 픽업 아티스트 문서
번 문단을
부분을
참고하십시오.

3. PUA (Potentially Unwanted Application)

사용자가 원하지 않는 사이에 설치되는 프로그램.
파일:상세 내용 아이콘.svg   자세한 내용은 애드웨어 문서
3번 문단을
부분을
참고하십시오.

[1] 왜 하필 10FFFF까지냐면 UTF-16의 한계점이기 때문.