アカウント名:
パスワード:
不動産関係の仕事をしている私からすると、誤った方法で住所を勝手に正規化するシステムがあって腹が立ちます。
内部的にその会社で都合の良い方法で正規化するのは仕方無いとしても、顧客が入力した住所を勝手に誤った方法で改変して、それを宛名として郵便物を送り付けることは大変失礼にあたるので止めていただきたいです。
日本の住所表記を大きく分けると、住居表示の地域と、住居表示が実施されていない地域の2つがあるので、正規化するならそれを混同しないようにしましょう。
・住居表示の地域正)東京都千代田区永田町一丁目10番1号誤)東京都千代田区永田町1丁目10番1
とりあえず、郵便番号が重宝される理由がわかりました。
漢数字とハイフンの組み合わせが凶悪縦書きでもハイフンを横書き同様横に書く人がいる
縦書きの場合に漢数字+縦のハイフンは解りやすい方と思うのだけど
じゃぁ縦書きでアラビア数字を使う場合ってなるとアラビア数字+横のハイフンってのは見かけたことないな
#3826174では無いけど3-2-1を三ー二ー一こういう書き方する人ですよ。#マジ殺意
でも何故か判別可能なんだよねー
他に市区町村の記載があってこれは住所の番地なんだなという外挿情報と、地域がわかってとりうる番地の範囲が限られてやっと漢数字とハイフンの判別がつくようになるのは、「文字を判別」できているうちに入るのだろうか。
区分機は今の機械ではありませんよ?
縦書きに算用数字とハイフンも忘れないで。算用数字使うならせめて二桁の場合は横に並べて書いてくれればいいのに、縦に1を二つ並べる人がいる。
ワープロとかでも1-11-1を縦書きで印字したとき解読困難になることがある。フォント選びはとっても大事。
昔は日本郵政がネット配布していた郵便番号データにも変な番地表記が混じっていたけど、修正されただろうか
ま、住所「データ」としては使えないと言っていいですからね。ただのテキスト羅列。チェックのしようがない。
国土地理院のコード体系で管理すりゃあ良いのにと思った事はありますね〜。合併やらで地名変わってもコード値変化しなくて時間軸で地名出せたハズ。
郵便番号も「ハイフンなしの7桁で」なんて指定されることがあるから、完全に正規化されているとは言えないような。
郵便番号7桁化の際、郵便番号で特定できる部分までは省略可能だ、便利だろう、と広告していました。でも、例えばNHK大阪放送局は大阪府大阪市中央区大手前四丁目1-20ですが、これを郵便番号 540-0008 四丁目1-20 と書いて送ってくるのは見たことがありません。
ただ、1968年に5桁の郵便番号が導入されたことにより、都道府県を省略するようになったのは確か。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:5, 参考になる)
不動産関係の仕事をしている私からすると、誤った方法で住所を勝手に正規化するシステムがあって腹が立ちます。
内部的にその会社で都合の良い方法で正規化するのは仕方無いとしても、顧客が入力した住所を勝手に誤った方法で改変して、それを宛名として郵便物を送り付けることは大変失礼にあたるので止めていただきたいです。
日本の住所表記を大きく分けると、住居表示の地域と、住居表示が実施されていない地域の2つがあるので、正規化するならそれを混同しないようにしましょう。
・住居表示の地域
正)東京都千代田区永田町一丁目10番1号
誤)東京都千代田区永田町1丁目10番1
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
とりあえず、郵便番号が重宝される理由がわかりました。
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
漢数字とハイフンの組み合わせが凶悪
縦書きでもハイフンを横書き同様横に書く人がいる
Re: (スコア:0)
縦書きの場合に漢数字+縦のハイフンは解りやすい方と思うのだけど
じゃぁ縦書きでアラビア数字を使う場合ってなると
アラビア数字+横のハイフン
ってのは見かけたことないな
Re: (スコア:0)
#3826174では無いけど3-2-1を
三
ー
二
ー
一
こういう書き方する人ですよ。
#マジ殺意
Re: (スコア:0)
でも何故か判別可能なんだよねー
Re: (スコア:0)
他に市区町村の記載があってこれは住所の番地なんだなという外挿情報と、地域がわかってとりうる番地の範囲が限られてやっと漢数字とハイフンの判別がつくようになるのは、「文字を判別」できているうちに入るのだろうか。
Re: (スコア:0)
君が自動読み取り機なら同情しなくもないけど、今の機械は割と読み取ってくれるはず。
Re: (スコア:0)
区分機は今の機械ではありませんよ?
Re: (スコア:0)
番地の数字もOCRして複数パターン候補がある場合は実在する住所と比較して選ぶくらいの機能があるわけで
Re: (スコア:0)
縦書きに算用数字とハイフンも忘れないで。
算用数字使うならせめて二桁の場合は横に並べて書いてくれればいいのに、縦に1を二つ並べる人がいる。
ワープロとかでも1-11-1を縦書きで印字したとき解読困難になることがある。
フォント選びはとっても大事。
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
昔は日本郵政がネット配布していた郵便番号データにも変な番地表記が混じっていたけど、修正されただろうか
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
Re: (スコア:0)
ま、住所「データ」としては使えないと言っていいですからね。
ただのテキスト羅列。チェックのしようがない。
国土地理院のコード体系で管理すりゃあ良いのにと思った事はありますね〜。
合併やらで地名変わってもコード値変化しなくて時間軸で地名出せたハズ。
Re: (スコア:0)
郵便番号も「ハイフンなしの7桁で」なんて指定されることがあるから、完全に正規化されているとは言えないような。
Re: (スコア:0)
郵便番号7桁化の際、郵便番号で特定できる部分までは省略可能だ、便利だろう、と広告していました。
でも、例えばNHK大阪放送局は大阪府大阪市中央区大手前四丁目1-20ですが、これを
郵便番号 540-0008 四丁目1-20 と書いて送ってくるのは見たことがありません。
ただ、1968年に5桁の郵便番号が導入されたことにより、都道府県を省略するようになったのは確か。