나무모에 미러 (일반/어두운 화면)
최근 수정 시각 : 2024-03-21 16:59:47

한자 모양 설명 문자

1. 개요2. 명칭3. 종류4. 방식5. 한자 외의 문자에서6. 다른 조합 방법7. 여담8. 외부 링크

1. 개요

Ideographic Description Character, IDC

한자 모양 설명 문자란 한자의 조합 방식(합자)을 표시해주는 글자이다. ⿰, ⿱, ⿲, ⿳, ⿴, ⿵, ⿶, ⿷, ⿸, ⿹, ⿺, ⿻, ⿼, ⿽, ⿾, ⿿, ㇯로 17개 종류가 있다.

유니코드에는 되도록 문헌의 한자들을 최대한 실으려고 하고 있지만,[1] 그래도 모든 한자를 싣는다는 것은 어렵고 실제로도 누락된 것이 많다. 이럴 때 한자의 조합을 통해 한자를 표현할 때 가장 널리 이용되는 표현 방식이 한자 모양 설명 문자열(Ideographic Description Sequences, IDS)이다.

코드는 ⿰(2FF0)부터 ⿿(2FFF)까지 순서대로 배정되어있다. 기본 다국어 평면(Basic multilingual plane, BMP)인 0000~FFFF에 속해 있으며 유니코드/2000~2FFF의 맨 마지막이다.[2] 유니코드 15.1에 5자가 더 추가되었는데 하나는 자리가 모자라서 U+31EF로 들어갔다.

2. 명칭

원문의 ideograph는 표의문자라는 뜻으로, 영어 명칭을 직역하면 "표의문자 기술(記述) 문자"이다. 그러나 표의문자 중 가장 널리 사용되는 것이 한자이기에[3] 유니코드에서 'ideograph'라 되어있는 것은 대체로 다 한자를 다룬다.[4] 또한 '기술'(記述)은 영어 describe-description의 직역 번역어로 자주 쓰이기는 하나[5] 한국어로는 동음이의어기술(技術) 때문에 약간 혼동이 있을 수 있다.[6] 한국어 위키백과에서는 여기에 기술의 대상인 '모양'이라는 말을 추가로 넣어 '한자 모양 설명 문자'라는 번역어를 2017년 문서 생성일 이래로 쭉 사용하고 있으며 본 위키에서도 이를 따르기로 한다.

일본어 위키백과는 한자구성기술문자(漢字構成記述文字)#, 중국어 위키백과(중국)은 표의문자묘술자부(表意文字描述字符), 중국어 위키백과(대만/홍콩)은 표의문자묘술자원(表意文字描述字元)#으로 번역했다.

3. 종류


[오른쪽 감쌈]은 ⿵, ⿶, ⿷와 쌍을 이루고 [우하 감쌈]은 ⿸, ⿹, ⿺와 쌍을 이룬다. 기하학적으로 4개 중 3개만 있는 게 오히려 이상했는데 기존에는 해당 모양의 한자가 별로 없다고 판단해서 구현하지 않았던 듯하다.

그 밖에도 변형 문자를 나타내는 〾(IDEOGRAPHIC VARIATION INDICATOR, U+303E)도 있다. 이는 기존 문자와 모양은 비슷하나 완전히 같지는 않을 때(예: 𡈼 = 〾壬), 혹은 모양은 같지만 다른 문자(예: 朣 = 〾膧)를 나타낼 때 사용한다. 이 링크는 한국어 위키문헌의 역어유해 복원본 페이지 중 하나로, 복원문을 보면 〾裡라는 표기가 보일 터인데, 원본 이미지와 대조해 보면 해당 부분이 𥚃(⿰示里)로 되어 있음을 볼 수 있을 것이다.[7] 이것이 裡(⿰衤里)를 잘못 쓴 것인지 아니면 원래 𥚃였는지 확실하지 않아서 〾裡로 표기한 것으로 보인다.

4. 방식

IDS란 부건(部件)[8]의 배열 구조를 나타내는 한자 모양 설명 문자를 앞에 배치하고 부건을 뒤에 배치하는 중위 표기법(infix notation) 방식의 표기 체계이다.[9] 예를 들어 (밝을 명) 자는 (날 일) 자와 자가 좌우로 배열되어 있으므로, 좌우배열을 나타내는 ⿰ 뒤에 日과 月을 순서대로 배치하여 ⿰日月처럼 표기한다. 순서는 한자의 일반적인 필순 방향에 따라 좌→우, 상→하, 바깥→안쪽 식이다.[10]

이 표기법은 중첩도 가능하다. (무리 류) 자의 경우, 우선 类와 (머리 혈) 자로 나뉘므로 ⿰类頁로 표기할 수 있고, 类는 (쌀 미) 자와 (개 견) 자가 상하로 배열되어 있으므로, 다시 ⿰⿱米犬頁처럼 표기할 수 있다. 예를 들어 뱡뱡면에 쓰이는 글자 𰻞(U+30EDE)은 ⿺辶⿳穴⿲月⿱⿲幺言幺⿲長馬長刂心처럼 표기할 수 있다.

⿲나 ⿳은 부건을 3개 쓴다. 輿처럼 𦥑 사이에 車가 들어간 것은 결합 모양은 ⿲에 가깝지만 사방을 다 감싸는 것으로 보고 ⿴𦥑車 식으로 표기한다. 을 부수로 한 것에 이런 모양들이 많은데, 衡은 ⿴行𩵋이라고 할 수도 있고 行(다닐 행)을 彳와 亍로 쪼개서 "⿲彳𩵋亍"라고도 적을 수 있다.

다른 것은 다 글자 모양대로 쓰면 되지만 ⿻는 딱 대각선으로 겹쳐야 할 필요는 없고 그냥 적당히 끼어들어가거나 융합한 경우라면 다 쓸 수 있다. 가령 巫는 ⿻工从라고 쓸 수 있다. 𣏃 역시 ⿻木⿻コ一 식으로 쓸 수 있다.

나누려고 한다면 획 하나 단위로 나눌 수도 있겠지만 보통은 코드에 실려있는 문자로 표현할 수 있는 정도에서 그친다. 즉, 穴은 ⿱宀八로 표기할 수 있지만 穴이 정상적으로 출력되지 않는 환경이 매우 드물어 그렇게 잘 적지 않는다. 애당초 그런 환경이면 ⿱ 같은 모양 설명 문자조차도 제대로 뜨지 않을 가능성이 높다.[11] 위 𰻞은 웹페이지의 표현 예를 보면 穴까지 ⿱宀八로 표기한 페이지가 몇 개 있으며, 반대로 ⿲長馬長 부분을 ⿰長𮪉로 표시한 곳도 있다.

임시방편으로 표기하는 방식이라 그런지 2개 이상의 조합이 가능할 경우 어떤 걸 우선한다는 원칙은 따로 없는 것 같다. 가령 (임질 림)은 ⿰沐木, ⿰氵林, ⿰氵⿰木木, ⿲氵木木으로 모두 표기 가능하다. 출력하기 어려운 문자를 출력 가능한 문자로 표현할 수만 있으면 어떤 방식이든 괜찮은 듯하다. 여러 한자 사전의 용례를 보면 부수에 가까운 것을 먼저 분리하고 나머지 부분은 굳이 분리할 필요가 없으면 분리하지 않는 ⿰氵林와 같은 식이 더 일반적이다.

각 문자에 따라 예를 하나씩 들어보면 다음과 같다.

옛 한자들을 보면 피휘 차원에서 기존 한자의 일부 획을 생략한 한자들이 발견되는데, 이런 경우들을 표현하기 위해 추가 예정 글자인 뺄셈 글자를 활용할 수 있다. 가령 강희제의 이름으로 쓰인 玄과 燁의 마지막 획을 생략해서 피휘한 𤣥과 𤍞의 경우, 𤣥은 ⿳亠𠃋𠃋 식으로 표현할 수 있겠으나 𤍞은 ⿰火⿱艹⿻一⿱艹二 식으로 복잡하게 표현되는데 뺄셈을 활용하면 [뺄셈]燁丨 식으로 간략화할 수 있다. 다만 위 언급한 대로 전자는 𢆰(⿱一幺)를 가리킬 수도 있다는 문제가 있다.

5. 한자 외의 문자에서

주로 한자만을 위한 전용 표기법이지만 이차원 방식의 합자, 즉 필기 방향 외의 합자 방식을 사용하는 문자에 두루 적용해볼 수 있다. 단, 아래의 예는 가정이며 실제로 본격적으로 쓰이는 것은 아니다.

한글 음절자도 이 문자를 통해 표현할 수 있다. 가령 'ꥸᅦퟗ' 같은 것은 ⿱⿰⿲ㅈㅈㅎㅔ⿲ㄹㄹㅋ 식으로 적을 수 있다. 한글은 한자보다 조합 방식이 더 간단하므로 ⿰, ⿱만 있으면 되고 나머지 10개는 필요 없다.[12] 다만 이론상 그렇다는 것이고 한글은 음성의 선형적인 흐름에 따라[13] 글자 쌍들의 좌→우, 상→하 배치 순서가 엄격히 정해져있으므로[14] 굳이 이 표기를 써야 할 필요성은 크지 않다. 현대 한글의 범위를 넘어선 옛한글에서 이 규칙에서 벗어난 조합형이 발견되었을 때 글자의 모양을 임시로 이 문자로 나타낼 수는 있겠다.

파일:khitan14.jpg
한글과 유사한 음소 합자 양상을 보이는 거란 소자도 이 방식을 적용해볼 수 있겠다. 가령 위 이미지의 첫 문자 𘭔(?)은 ⿱土⿰土七로 표현할 수 있을 것이다. 거란 문자는 유니코드에 실려있긴 하지만 상당수 환경에서 제대로 출력되지 않으므로 이미지를 띄워서 보여줄 수 없는 상황이라면 이러한 표기법이 유용할 수 있다. 그런데 거란 문자 자체가 워낙 마이너해서 부분 글자들조차도 자형을 찾기가 힘들다.

로마자키릴문자에 결합하는 다이어크리틱도 이 방식으로 표현할 수 있을 것이다. 거의 대부분은 상단에 붙어[15] 문자 모양에까지 '◌́'로 상단에 붙음을 표시하고 있으니 정말로 쓴다고 하면 ⿱ 정도나 쓰일 것이다.

아직까지 유니코드 등재가 되지 않은 구결에도 적용할 수 있다. 구결은 모양이 간단하고 한자로부터 기원했기에 (한자로 실려있는) 조합 요소를 쉽게 찾을 수 있는 편이다. 특히 획을 생략한 글자들이 많기 때문에 향후 추가될 [뺄셈] 기호를 요긴하게 쓸 수 있을 듯하다.

6. 다른 조합 방법

7. 여담

이 표기법을 쓰면 웹에서 해당 조합의 한자를 빠르게 검색할 수 있다. 가령 '𩵵'(U+29D75, ⿰魚中)은 의 조합인데, "魚中"이라고 치면 둘 다 쉬운 한자여서 일반 문장에서 '魚'와 '中'와 같이 쓰인 것만 잔뜩 나와서[17] '𩵵'를 찾기 어렵다. 이때 구글에 큰따옴표와 모양 설명 문자까지 함께 넣어 "⿰魚中"라고 검색하면 '魚'와 '中'이 그냥 문장에 각각 들어간 결과를 제외하고 '𩵵'가 쓰인 페이지를 바로 찾을 수 있다. 또, 특정 조합의 한자가 유니코드에 실려있는지 여부를 빠르게 확인할 수 있다. 이런 한자들은 많은 환경에서 잘 보이지 않아 그런 환경을 배려하여 한자 모양 설명 문자로 설명을 달아두기 때문이다. 이렇게 검색해서 나온다고 유니코드에 없는 글자라고 단정할 순 없지만 대체로는 안 실린 게 맞다.

일상에는 잘 알려져 있지 않은 편이다. 보통 유니코드에 없거나 특정 국가에서 사용하기 어려운 글자는 구성 요소를 +로 합쳐서 표기하곤 한다. 𫙬 (⿰魚盎)는 魚+盎라고 쓰는 식이다. 대다수 형성자는 좌우 조합(⿰)이기에 저렇게만 써도 얼추 좌우로 합쳐졌겠거니 짐작할 수 있기 때문이다. 한자 모양 설명 문자는 바로 입력할 수 없고 복사-붙여넣기를 쓸 수밖에 없어 접근성이 낮은 것도 문제이다.

⿰AB 식으로 겹친 글자는 아래아한글에서 글자 겹치기 기능을 이용하면 마치 합쳐진 것과 비슷하게 표현할 수 있다.

파일:ui.png[18]
이 문자와 유사하게 점선으로 표현되는 문자로는 결합 문자의 표현에 쓰이는 점선 동그라미가 있다. 결합 문자는 앞에 나온 문자의 주변에 결합하여 화면에 나타나지만, 앞의 문자가 없거나 결합에 실패한 경우 위와 같은 동그라미가 보이게 된다.

나무위키에서도 표기가 어려운 한자에 대하여 한자 모양 설명 문자를 사용하는 경우가 점차 늘고 있다. 2022년 12월 16일 토론에서는 SIP, TIP에 배정된 한자에 대해서 한자 모양 설명 문자를 활용해 자형을 설명하도록 하는 부분이 템플릿에 추가되었다.

8. 외부 링크



[1] 보조 표의문자 평면(SIP), 3차 표의문자 평면(TIP)에 이르는 20000~3FFFF에 이르는 평면은 거의 대부분 한자를 위한 공간이다. 20000~2FFFF에 이르는 65,536자에 대다수 벽자가 들어가며 TIP에는 2020년부터 갑골 문자 등 한자 이전에 중국에서 쓰이던 글자들이 들어갈 예정이라고 한다.#[2] 이 다음 3000부터는 한중일 기호 및 구두점(CJK Symbols and Punctuation)이 약 60개 정도 나온 뒤 히라가나로 이어진다.[3] 사실 표의문자에도 나와있는 얘기지만 한자는 뜻뿐만 아니라 소리까지 담고 있기에 '단어를 가리킨다'는 뜻의 표어문자(logograph)라고 해야 좀 더 정확하다. 다만 유니코드 명칭은 한 번 정해지면 바꾸기가 어려우므로 그냥 유지되고 있다. 또한 사실 꼭 표의문자에만 적용할 수 있는 방식인 것은 아니다.[4] 가령 보조 표의문자 평면(Supplementary Ideographic Plane, SIP)에는 한자만 실려있다.[5] 문학에서는 describe를 주로 '묘사'(描寫)라고 번역하는 편이다. 이 경우에는 문학의 서술 기법 중 하나로 다루어지는 경향이 크다.[6] 중국어로도 jìshù로 발음이 같다. 일본어는 記述(きじゅつ), 技術(ぎじゅつ)로 발음이 다르다.[7] 衤와 礻(示)는 점 1개만 차이가 나는 닮은꼴 한자이다.[8] 중국어로 '부품'을 뜻하는 말이다. 한자 분야에서는 한자 각각을 이루는 구성 글자를 의미한다. 네이버 한자사전에서는 같은 의미로 '모양자'라는 말을 쓴다.[9] 수식을 쓸 때 연산 기호를 앞에 쓰는 폴란드식 표기법(Polish notation)과 유사하다.# 정보처리 자격 필기 시험에 등장하는 전위 표기법(prefix notation. 예: 3 + 4를 + 3 4로 표기)이 바로 이것이다. 이 방식은 중위 표기법과는 달리 괄호 없이도 연산의 순서를 확정할 수 있다는 장점이 있다. 가령 중위 표기법으로는 (1 + 2) * 3 과 1 + 2 * 3을 괄호로 구별할 수밖에 없지만, 전위 표기법으로는 * + 1 2 3, + 1 * 2 3 로 괄호 없이도 구별이 된다.[10] 단, 책받침/민책받침 부건이 있는 경우 실제 필순은 책받침을 나중에 쓰지만 이 방식으로 나열할 때는 일관성을 위해 다른 감쌈 부호와 마찬가지로 감싸는 부분인 책받침을 먼저 나열한다. 예를 들어 의 경우 실제 필순은 首辶이지만 이 방식을 적용할 때는 ⿺辶首 식으로 나열한다.[11] 의 경우 한중일 모두 이 한자를 이 모양대로 사용한다.[12] 아래에서 다루듯 ⿲, ⿳는 ⿰, ⿱로 표현 가능하므로 사실 꼭 필요는 없다. 한글도 ⿲, ⿳가 있으면 더 간단하게 표현은 가능하다.[13] 다만 음성의 흐름을 좌→우(세로로 긴 모음)와 상→하(가로로 긴 모음, 종성 자음)로 2원화하여 표기하고 있기에 완전히 선형적이지는 않다.[14] 가령 자음 ㄱ와 세로로 긴 모음 ㅔ가 있으면 항상 '⿰ㄱㅔ'이지 '⿰ㅔㄱ'가 되지는 않는다. 간혹 한글을 처음 배우는 사람이나 모음을 왼쪽에 쓰는 실수를 하는 정도이다. 이 규칙은 《훈민정음》 합자해에서 명시되고 있다.[15] 후크처럼 사방에 다 결합하는 것이 드물게 있기는 하다. 그래서 점은 dot above(◌̇)와 dot below(◌̣)가 따로 존재한다.[16] 세 글자가 합쳐지는 방법에는 4가지가 있는데 각각은 다음과 같다.
△ 꼴: ⿱木⿰木木
▽ 꼴: ⿱⿰木木木
▷ 꼴: ⿰⿱木木木
◁ 꼴: ⿰木⿱木木
그러나 △ 꼴 외의 방식으로 세 글자가 합쳐진 실제 한자를 찾기는 어렵다.
[17] "魚中" 검색 결과. 魚中(우오나카)라는 상호를 쓰는 초밥집이 일본에 상당히 많다.[18] 동그라미 옆의 문자는 diacritic 중 하나인 double acute이다.


파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는
문서의 r52
, 3번 문단
에서 가져왔습니다. 이전 역사 보러 가기
파일:CC-white.svg 이 문서의 내용 중 전체 또는 일부는 다른 문서에서 가져왔습니다.
[ 펼치기 · 접기 ]
문서의 r52 (이전 역사)
문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)

문서의 r (이전 역사)