アカウント名:
パスワード:
それよりも、数ある文字コードのひとつにすぎない UTF-8 を特別扱いすることへの批判が大きかったような。
つまりは、いつもの Unicode 派と CSI (Code Set Independent) 派の論争っ
というのは、Unicode 派は、CSI でいう Unicode サブモジュール部分だけを実装すれば いいからです。逆に言えば、Unicode hardcode 手法だったら完成品ができてしまうくらいの手間を かけて、ようやくサブモジュールがひとつ完成します。
もちろん、それだけの手間をかけるだけの価値が あればいいわけですが、CSI のほうが絶対的に有利に なる場面って、漢字の扱いしかないんですよね。 もちろん、われわれ東アジア人にとってはそれは 非常に大きなことで
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
192.168.0.1は、私が使っている IPアドレスですので勝手に使わないでください --- ある通りすがり
Xutf8 (スコア:2, 参考になる)
コミュニティとしてやばいなぁと思ったので、あまり驚きはないです(^^;)
あの時も分裂の話があったと思いますが、結局Xutf8ってどうなったんでしょう?
当時はまともに日本語が使えないという話もあったようですが、
今は特に問題ないようなので…。
Re:Xutf8 (スコア:2, 参考になる)
それよりも、数ある文字コードのひとつにすぎない UTF-8 を特別扱いすることへの批判が大きかったような。
つまりは、いつもの Unicode 派と CSI (Code Set Independent) 派の論争っ
Re:Xutf8 (スコア:2, 参考になる)
これって実装が簡単だったからですか?
ちょっと前に多言語化に興味を持って色々調べたことがあるんですが
Code Set Independent 用のライブラリってあるんだろうか…。
(当時)Code Set Independent
This cookie has a scrap of paper inside. It reads:
If you can't learn to do it well, learn to enjoy.
Unicode vs CSI (スコア:3, 参考になる)
いまだにモノが出てこないというのは、
仕方がない部分もあります。
というのは、Unicode 派は、CSI でいう
Unicode サブモジュール部分だけを実装すれば
いいからです。逆に言えば、Unicode hardcode
手法だったら完成品ができてしまうくらいの手間を
かけて、ようやくサブモジュールがひとつ完成します。
もちろん、それだけの手間をかけるだけの価値が
あればいいわけですが、CSI のほうが絶対的に有利に
なる場面って、漢字の扱いしかないんですよね。
もちろん、われわれ東アジア人にとってはそれは
非常に大きなことで
Re:Unicode vs CSI (スコア:1, 参考になる)
> いまだにモノが出てこないというのは、
> 仕方がない部分もあります。
X の locale model は昔から CSI ですけど。
Solaris は CSI モデルの上でうまく Unicode を扱ってますけど。
実際のところ、ISO C locale の実装に限れば、
CSI でも UCS Normalization でも手間は大して変わらないか、
CSI のほうが楽でしょう。ISO C locale 以上となると話は別ですが。
あの時 Xutf8 に反対した一人として言うと、Xutf8 の駄目な
ところというのは、現状の Xmb* でできるようなことしかできず、
また全く拡張性もない中途半端な AP
Re:Unicode vs CSI (スコア:0)
多言語環境と CSI って別なレイヤーだと思うのですが…
他の部分は全面的に同意です。
Re:Unicode vs CSI (スコア:0)
CSI とか UCS Normalization とかそういうのは意識しなくてもいい。
ただ一方で、多言語系の複雑さとか範囲の大きさを考えたら、
向こう 10 年とかそういうスパンでは、それなりに実用的な唯一の存在として
Unicode ベースの系が君臨するんじゃないかという気がするので、
ほかの系のことはすっぱり忘れて、よーするに手っ取り早くその辺に
落っこちてる ICU でも使って当面はお手軽に済ますのがいいかなと。
ちょっと暴論ぎみですけど。
個人的見解としては、現在はまだまだ M17N に関しては暗中模索な状況で、
そんな状況で作ったものは CSI だろうが UCS Normalization だろうが
どうせ同程度のスパンで陳腐化すると思ってるので、
究極的にはどっちでもいいんじゃないか、というのが本音です。
だから、とりあえず Unicode にハードコードされたシステムでも
一つ作ってみてそこであがいていると、そのうちにフレームワークが
抽象化されてくると思うので、そのあとで美しい世界が
見えてくるんじゃないかと。それはそれで一つの道だと思います。
# その結果出てくるのは CHISE みたいな方向なのかもしれんけど。
# あれはもはや Unicode である必然性がない。
Re:Unicode vs CSI (スコア:0)
> CSI とか UCS Normalization とかそういうのは意識しなくてもいい。
うーん、X と libc の wchar とかの抽象化じゃダメということですか?
まぁ、確かに足りない部分ありますけど。
でも、ある特定の codeset の コードポイントを直接見るよりは、
API でも一個作った方が嬉しいなぁ。
いずれ、ほぼスベテ UTF-8 になるとは思いますが、
私の不安は、ハードコードで UTF-8 で 2 byte までしか
処理しないようなプログラ