約6万の漢字の文字コードが国際規格に

スポンサーリンク

情報処理推進機構(IPA)は12月25日、5万8861文字に及ぶ漢字の文字コードの国際規格化が完了したと発表しました。国際標準化機構(ISO)が22日に発行したISO/IEC 10646の第5版に盛り込まれ、従来は外字作成などで対応せざるを得なかった漢字をコンピュータで扱えるようになる予定です。

 

独立行政法人情報処理推進機構(じょうほうしょりすいしんきこう、英: Information-technology Promotion Agency, Japan、略称:IPA)
日本におけるIT国家戦略を技術面、人材面から支えるために設立された、経済産業省所管の中期目標管理法人たる独立行政法人である。
日本のソフトウェア分野における競争力の総合的な強化を図る。情報処理の促進に関する法律の一部を改正する法律(平成14年法律第144号)により、2004年(平成16年)1月5日に設立され、同法附則第2条第1項の規定により解散した、特別認可法人である情報処理振興事業協会(IPA)の業務等を承継した。
IPAでは、特別認可法人 情報処理振興事業協会の時代からコンピュータウイルスやセキュリティに関係する調査・情報提供を行ってきた。また、中小コンピュータソフトベンダーの債務保証事業などのソフトウェア開発補助事業を行っている。天才的プログラマの発掘のための未踏ソフトウェア創造事業、特に若年の開発者を対象とした未踏ユース制度などの人材育成事業も行っている。なお、情報処理技術者試験を実施している情報処理技術者試験センターは1984年から2003年までは財団法人日本情報処理開発協会で試験事務を行ってきて2004年にIPAの一組織になっている。
また、情報処理の促進に関する法律の規定により経済産業大臣は情報処理推進機構に情報処理技術者試験の試験事務及び情報処理安全確保支援士の試験事務、登録事務(取消事務、命令事務を除く)を行わせることができる旨の規定があり、この規定に基づきこれらの試験の実施に関する事務を行っている。

国際標準化機構工業(ISO)
農業産品の規格の標準化を目的とする国際機関。1947年設立。本部はジュネーブ。

 

漢字の例

漢字の例(出店:IPA)

 

漢字の文字コードの国際規格化は、特に人名や地名などに使われる複雑な漢字の正確な表記をコンピュータで可能にすることを目的に、IPAや内閣官房IT総合戦略室、経済産業省らが2010年9月から推進してきました。実際には、コンピュータで必要な約6万の漢字を洗い出すことを目的とした2002年からの経済産業省の調査事業「汎用電子情報交換環境整備プログラム」がもとになっており、国際規格化には延べ15年を費やしました。

従来の外字による対応では、自治体ごとに登録される外字コードに一貫性がなく、異なる自治体やシステム間で電子文書への使用が難しいなど課題があり、コスト増を招いていました。今回の国際規格化でこうした課題の解決や行政事務の効率化、コストの低減化が期待されます。

IPAでは、戸籍業務などに必要な「変体仮名」の国際規格化も進めているといい、これも2018年3月末までに発行される見込みのISO/IEC 10646の第5版の追補版に盛り込まれる予定です。また、新しい国際規格に合わせた文字フォント(IPAmj明朝フォント)やMJ文字情報一覧表などのバージョンアップも順次進める予定です。

ISO/IEC 10646 (UCS; Universal Coded Character Set)
符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換であることが特徴である。日本の対応規格はJIS X 0221(国際符号化文字集合)。
UCSの文字空間は0 – 10FFFFである。古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeに対して上位互換であったが、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ下位互換を持つことになった。2011年の改訂では明確に0 – 10FFFFと定義された。
符号化方式は、Unicodeと同じUTF-8やUTF-16が使われることが多い。ただし、Unicodeの『UTF』が『Unicode Transformation Format』を意味するのに対して、ISO/IEC 10646の『UTF』は『UCS Transformation Format』を意味する点が違う。
面 (plane)、区 (row)、点 (cell) として分けられ、Unicodeと同じ第0面の基本多言語面 (BMP; Basic Multilingual Plane) と追加面の第1 – 16面までの範囲で文字が定義されている。古い規格では群 (group) という分類もあったが2011年の改訂で廃止された。

IPAmj明朝フォント
IPAmj明朝フォントは、人名の表記等で、細かな字形の差異を特別に使い分ける必要のある業務等での活用を想定したフォントです。また、同フォントを十分に活用するためには、対応したアプリケーションソフトが必要となります。

お時間のある方に

関連記事

この記事が気に入ったら
いいね ! してね

Twitter でzooを

スポンサーリンク

コメントを残す

*