変換形式の迷いどころ
携帯の絵文字をDBに保存する際の形式としては、現在のところ(オープンソース界隈での)主流っぽいのは、Unicodeの私的領域にマッピングした形での保存形式っぽいんだよね。
だけど自分が作ったやつは、内部処理用の「内部絵文字」的なものに置き換えるような仕様にしてあって、その辺の過去の遺産を流量をするのがちょっと微妙(できないわけじゃないけど)な感じ。
いかんせん、自分がライブラリを作りだした時には携帯のkの字も知らない状態からやりだして、世間の潮流を知らぬままエンコード・デコード部分だけ一気に実装しちゃったという素人ぺちぱーにありがちな事をやったからこんな事になってるんだけど、あれこれやってるうちにいろいろ学んできて、あー、公開するならUnicodeマッピング形式に合わせるべきなのかなとか思っている。
でも、U+Eなんたらかんたらとか脳内デコードできない俺とかからすると、可読性の高い形式にできた方が良かったりするし、もう内部文字形式で組んじゃったしどうしようかなみたいな。
ぶっちゃけて言うと、Unicodeマッピングが主流みたいな風潮が、運用性等の利便性もしくは内部文字置き換えの場合の不便性からくるものなのか、単に最初にそうしたからっていう歴史的経緯なのか、そういうところがわからない。
いかんせんUnicodeに関して俺がきちんと理解できていないのもあるしなぁ。
だれか、頭の悪いおいらにその辺の話を説明してあげてもいいよというこころやさしい人いませんか(他力本願
まぁ、最終的にはコンパチブルにしてしまうつもりだけど、とにかく一回内部文字形式で出してしまうかなぁ。
ってもまだ未完成なんだから、こんなことうだうだ書いてるより、いいから黙ってコード書けってかんじだね><