我国地域广大,民族众多。随着信息技术的不断发展和应用的开拓,对少数民族文字的处理和交换也提出了要求。为适应各少数民族文字的处理和交换的需求,从上世纪八十年代中期开始,我国先后制定了相应的少数民族文字方面的信息技术标准。
在我国少数民族文字信息技术标准中,绝大多数都是以某个民族文字为基础单独制定标准(见下面的标准目录),也有少数通用的文字收入到更大的通用字符集标准,如国际标准ISO/IE 10646《信息技术 通用多八位编码字符集》(对应的我国国家标准编号为GB 13000)中。同时,这些标准还与许多基础标准,如GB/T 1988-1998《信息技术 信息交换用七位编码字符集》、键盘国家标准等有关。下面主要是介绍单独的少数民族文字信息技术标准。
与汉字的信息处理标准一样,少数民族文字的信息处理所要的标准同样包括以下三类:
a) 字符集及其编码:主要规定该民族文字所用的字符,以及对每个字符分配一个代码;
b) 点阵字模集及数据集:对每个字符给出点字模集和数据集,它用于点阵式印刷设备和显示设备等有关设备;
c) 在键盘上的布局:规定各字符在键盘上的分布。
在上面三类标准中,各民族文字的标准以a) “字符集及其编码”为主,“点阵字模集及数据集”和“在键盘上的布局”标准应是“字符集及其编码”的配套标准。
由于各民族文字的形式不一样,如有的采用拼音,有的是一个符号对应一个字,以至于各民族文字标准中选用的文字或符号的数量各不相同。蒙古文的七位代码为128个位置,八位代码为256个位置,而朝鲜文标准中选用了5300个文字。
我国已发布的少数民族文字信息技术标准包括蒙古文、维吾尔文、朝鲜文、彝文、藏文的文字标准。现在共有16个国家标准,尚无行业标准。标准的目录如下:
GB/T 7422.1-1987 信息交换用蒙古文16×12、16×8、16×4点阵字模集
GB/T 7422.2-1987 信息交换用蒙古文16×12、16×8、16×4点阵数据集
GB 8045-1987 信息处理交换用蒙古文七位和八位编码图形字符集
GB/T 8046-1987 信息处理交换用蒙古文字符集键盘的字母区布局
GB 12050-1989 信息处理 信息交换用维吾尔文编码图形字符集
GB/T 12051-1989 信息交换用蒙古文24点阵字模集及数据集
GB 12052-1989 信息交换用朝鲜文字编码字符集
GB/T 12509-1990 信息交换用维吾尔文16、24点阵字模集及数据集
GB/T 12510-1990 信息交换用维吾尔文字符集键盘的字母区布局
GB 13134-1991 信息交换用彝文编码字符集
GB/T 13135-1991 信息交换用彝文字符15×16点阵字模集及数据集
GB 16959-1997 信息技术 信息交换用藏文编码字符集 基本集
GB/T 16683-1996 信息交换用彝文字符24×24点阵字模集及数据集
GB/T 16960.1-1997 信息技术 藏文编码字符集(基本集)24×48点阵字型 第1部分:白体
GB/T 17543-1998 信息技术 藏文编码字符集(基本集)键盘字母数字区的布局
GB/T 20542-2006 信息技术 藏文编码字符集 扩充集A
除上述正式标准外,正在制定的少数民族文字信息技术标准国家标准的项目有:
信息技术 藏文编码字符集 扩充集B
蒙古文变形显现字符集和控制字符使用规则
信息技术 面向信息处理的蒙古文单词词形标准
信息交换用维、哈、柯文字编码字符集
信息技术 藏文编码字符集(基本集及扩充集A)24×48点阵字型 吾坚琼体