アカウント名:
パスワード:
いちばん住所に携わっている郵便や宅配便配達の人たちには関係無いことかも。
正規化したいのは、いい気分になりたいからと、住所で検索するとき用、ぐらいだと思うけど、検索するときは正規化された文字列検索じゃなくて、都道府県市町村区までは表記の搖れが無くて、その後も明確な区切り文字がある全角半角アラビア漢数字の揺れなんだから、表記揺れに対応させるのは難しくない。
むしろ「東京都千代田区永田町一丁目10番1号」なら、内部では「東京都千代田区永田町1-10-1」に正規化したほうが便利そう。
「大宮区吉敷町一丁目124番地1」は固有文字列としてて、これ意外に表記しちゃ駄目(例えば「鈴木1郎」みたく)ならいいけど、現実は「大宮区吉敷町一の124の1」とかも許されてて、
僕が住所情報を保持する部分の設計するなら、
国番号,郵便番号,都道府県,市町村,それ以降1,それ以降2
で、都道府県は選択式(気が向いたら市町村も)で、それ以降1とそれ以降2は自由。全角半角気にせず、ユーザが入力したまま。よみがなも要らない。とするかな。
#普段使いの住所表記は運転免許証のが楽かな
> 正規化したいのは、いい気分になりたいからと、住所で検索するとき用、> ぐらいだと思うけど、
まあ、仕事で住所を扱ったことがないと、そのくらいの認識だろうね。わざわざコストかけて正規化するのには色んな理由があるし、だから高い売り物の正規化ツールが商売になってたの。ぱっと思い出せるだけでも、
- 顧客情報の名寄せ- 地図上へのプロットの際のエラー削減- 市町村合併や地名変更による住所変更処理のエラー削減- 不正な住所を発見して郵便不達の未然防止
とかね。
検索するときは正規化された文字列検索じゃなくて、明確な区切り文字がある全角半角アラビア漢数字の揺れなんだから表記揺れに対応させるのは難しくない。
対応が簡単なのか難しいのかは知りませんが、住所検索の処理のたびに(DBに入っている値の含めて)それを考慮しなくちゃいけないよりは、DBの中身は(一定のルールで)整形済み(例えば、区切り文字は半角ハイフン、半角数字)で、入力パラメータのみ整形すれば、SQLでも文字列の単純比較でも検索できるのほうが楽では?
検索用の(整形済み)住所情報と、発送用の(ユーザー入力ママの)住所情報の両方をDBに入力しちゃいけないわけでもないですし
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
開いた括弧は必ず閉じる -- あるプログラマー
経産省やIT屋が頑張って正規化しても (スコア:2)
いちばん住所に携わっている郵便や宅配便配達の人たちには関係無いことかも。
正規化したいのは、いい気分になりたいからと、住所で検索するとき用、
ぐらいだと思うけど、検索するときは正規化された文字列検索じゃなくて、
都道府県市町村区までは表記の搖れが無くて、
その後も明確な区切り文字がある全角半角アラビア漢数字の揺れなんだから、
表記揺れに対応させるのは難しくない。
むしろ「東京都千代田区永田町一丁目10番1号」なら、
内部では「東京都千代田区永田町1-10-1」に正規化したほうが便利そう。
「大宮区吉敷町一丁目124番地1」は固有文字列としてて、
これ意外に表記しちゃ駄目(例えば「鈴木1郎」みたく)ならいいけど、
現実は「大宮区吉敷町一の124の1」とかも許されてて、
僕が住所情報を保持する部分の設計するなら、
国番号,郵便番号,都道府県,市町村,それ以降1,それ以降2
で、都道府県は選択式(気が向いたら市町村も)で、
それ以降1とそれ以降2は自由。全角半角気にせず、
ユーザが入力したまま。よみがなも要らない。とするかな。
#普段使いの住所表記は運転免許証のが楽かな
Re: (スコア:0)
> 正規化したいのは、いい気分になりたいからと、住所で検索するとき用、
> ぐらいだと思うけど、
まあ、仕事で住所を扱ったことがないと、そのくらいの認識だろうね。
わざわざコストかけて正規化するのには色んな理由があるし、だから高い売り物の正規化ツールが商売になってたの。
ぱっと思い出せるだけでも、
- 顧客情報の名寄せ
- 地図上へのプロットの際のエラー削減
- 市町村合併や地名変更による住所変更処理のエラー削減
- 不正な住所を発見して郵便不達の未然防止
とかね。
Re: (スコア:0)
対応が簡単なのか難しいのかは知りませんが、住所検索の処理のたびに(DBに入っている値の含めて)
それを考慮しなくちゃいけないよりは、DBの中身は(一定のルールで)整形済み
(例えば、区切り文字は半角ハイフン、半角数字)で、
入力パラメータのみ整形すれば、SQLでも文字列の単純比較でも検索できるのほうが楽では?
検索用の(整形済み)住所情報と、発送用の(ユーザー入力ママの)住所情報の両方を
DBに入力しちゃいけないわけでもないですし