2008年1月アーカイブ

UNICODEメモ3

| コメント(0) | トラックバック(0)

UNICODE続き

ACR

Characters vs. Glyphs

キャラクターは文字をあらわす図形の抽象概念でグリフは複数の目に見える具体的な字体の事。

Compatibility Characters

キャラクターにおいては歴史的な理由により複数の図形を許可している。

また後日追記予定......。

UNICODEメモ2

| コメント(0) | トラックバック(0)

引き続きUNICODEのメモ

ACR

抽象化済みの文字のレパートリー (Abstract Character Repertoire)
※訳しようが無いのですが勝手に無理やり訳してみました。

文字のレパートリーとは抽象化された不規則な文字セットとして定義されています。

ポイントは次の一文です。
The word abstract means that these objects are defined by convention.

abstract という単語はそれらの物体が慣習で定義されていることを意味します。
つまりは定義が曖昧だという事ですね。

後日追記予定。

以下追記

日本語の例としてはJIS X 0208があげられている。

注意!

個人的なメモなので突っ込みは歓迎ですが鵜呑みにしないでください。

UNICODEメモ

| コメント(0) | トラックバック(0)

UNICODEのエンコーディングモデルに関する考え。

詳細はUnicode Technical Report #17を参照(※誰か邦訳して。)

何回かに分ける予定。

UNICODEに於いて、「キャラクターエンコーディングモデル」を4つの階層に分けて考える。

1. ACR: 抽象化済み文字対称集合
抽象化済みの文字のレパートリー※1(Abstract Character Repertoire)
2. CCS: 符号化文字集合(Coded Character Set)
3. CEF: 文字符号化形式(Character Encoding Form)
4. CES: 文字符号化方式(Character Encoding Scheme)

各階層について順次詳細を記述する。

......ACRの説明の前にノーマライゼーションの方が必要かなぁ。

※1勝手訳が気に入らないので訂正。

ウェブページ