News 2001年9月18日 11:59 PM 更新

新文字コード規格に垣間見る中国の“憂うつ”

中華人民共和国の文字コード規格「GB18030」の説明会が国内で開催された。漢字を使う日本でさえ,この新しい文字規格を知る人は少ない。しかし,中国にとっては国家単位の切実な問題だ。

 昨年7月に中華人民共和国の文字コード規格「GB18030」が中国政府によって制定された。“GB”というのは日本の“JIS”に相当する。つまり,国家規格ということだ。

 この隣国の文字コード規格に関する説明会が都内で開催された。新規格に対する日本国内での理解が不十分という状況を受けて,ダイナコムウエアがJfonts協議会,中国電子技術標準化研究所,全国情報標準化委員会との共催で行ったもの。

 中国はこれまでも,何回か文字コード規格を変えてきた。以前の規格「GB2312」から「GBK」,そして今回GB18030へと変えていった大きな理由は,規格に収録する文字数。GB2312では6763字だった規格収録文字数も,今回の新規格では2万7000字までに増えた。

 なぜ,文字数を増やす必要があったのか。広大な中国にはさまざまな漢字があり,中国語の辞典に掲載されている文字だけでも5万〜6万ある。さらにチベットやモンゴルの少数民族で使われている漢字も含めると,相当な数に及ぶ。コンピュータによる戸籍管理や郵便事業,銀行など金融,地理情報管理には,あらゆる人名や地名用の漢字が必要だ。これは,中国政府にとっても,国民情報をまとめる上で切実なことだった。

 また,GB18030に移行することによって,漢字の研究や古典文献整理の分野にも統一された情報インフラが作られる。

「インターネット文化が広まる上でも,同じ規格の文字コードをもっていないと,コミュニケーションが取れない」(中国電子技術標準化研究所の王立建氏)。

 問題になっているのは,今年の元旦から,中国のあらゆるPCやソフトウェア文字情報処理製品が,このGB18030規格を採用するように義務付けられたことだ。中国に輸出する日本メーカーも,GB18030規格に対応した製品を作らなくてはいけない。そんな理由から,今回のGB18030説明会には,国内のPCハード/ソフトメーカー担当者も数多く訪れた。

 現在,世界の漢字コード規格は,GB18030のほか,国際規格の「ISO10646」,IT企業主導の「Unicode」,台湾の「Big5」がある。この中でGB18030は,1バイト,2バイト,4バイトの可変長コードになっているので,既存の文字規格との上位互換を保ちつつ,拡張漢字を含むUnicodeの文字を包括して,さらに拡張できるような仕組みになっている。「中国がGB18030を制定した背景には,国際規格のISO10646や普及しているUnicodeを取り入れつつも,自国内で必要な少数民族の文字を全て収録したいという意図がある」(関係者)。

 カンボジアの国家規格を作る仕事を行っているJfonts協議会理事長の長村玄氏は「Unicodeではパミール語が入っていたが,現実にはネイティブの実生活で使いものにならなかった。ISO10646やUnicodeというものは,全世界で共通に使えるコード規格を目指しているが,それに全部を託すわけにはいかないのだ。そういった意味で,中国独自のGB18030の動向は,国の中で必要な文字を要素を盛り込んでいるという点で意味深い」と話している。

関連リンク
▼ ダイナコムウェア

[西坂真人, ITmedia]

Copyright © ITmedia, Inc. All Rights Reserved.