KS X 1001
KS X 1001은 한국 산업 규격으로 지정된 한국어 문자 집합으로서, 정식 규격명은 ‘정보 교환용 부호계 (한글 및 한자)’이며, 옛 이름인 KS C 5601로도 알려져 있다. 1974년에 처음으로 제정되었고, 2004년에 개정된 ‘KS X 1001:2004’가 최신 규격이다.
이 규격은 2바이트 부호계로서, x2121 - x7E7E까지 영역에서 8,836문자의 표현을 규정하는데, 문자는 제어 문자와 도형 문자로 분류하며, 도형 문자는 특수 문자, 괘선 조각, 숫자, 한글 낱자, 한글 글자 마디, 한자, 기본 로마 문자, 확장 로마 문자, 그리스 문자, 가나 문자, 키릴 문자로 구성되어 있다. 한글 부분은 기본적으로 2바이트 완성형 코드이지만, 부속서 3에서 2바이트 조합형 코드도 보조 부호계로서 규정되어 있다.
KS X 1001은 유니코드를 제외하고 대한민국에서 사용되는 거의 유일한 문자 집합이다. KS X 1001 기반의 문자 인코딩으로는 EUC-KR(완성형)과 ISO-2022-KR (과거 인터넷 메일에서 쓰던 문자 인코딩)이 있다. MS 윈도에서 사용하는 CP949은 EUC-KR의 확장으로 2바이트로 표현할 수 없는 한글 글자 마디 8,822자를 추가한 것이다.