UNICODEメモ

| コメント(0) | トラックバック(0)

UNICODEのエンコーディングモデルに関する考え。

詳細はUnicode Technical Report #17を参照(※誰か邦訳して。)

何回かに分ける予定。

UNICODEに於いて、「キャラクターエンコーディングモデル」を4つの階層に分けて考える。

1. ACR: 抽象化済み文字対称集合
抽象化済みの文字のレパートリー※1(Abstract Character Repertoire)
2. CCS: 符号化文字集合(Coded Character Set)
3. CEF: 文字符号化形式(Character Encoding Form)
4. CES: 文字符号化方式(Character Encoding Scheme)

各階層について順次詳細を記述する。

......ACRの説明の前にノーマライゼーションの方が必要かなぁ。

※1勝手訳が気に入らないので訂正。

トラックバック(0)

トラックバックURL: http://www.intheforest.jp/mtadmin/mt-tb.cgi/7

コメントする

ウェブページ