アカウント名:
パスワード:
不動産関係の仕事をしている私からすると、誤った方法で住所を勝手に正規化するシステムがあって腹が立ちます。
内部的にその会社で都合の良い方法で正規化するのは仕方無いとしても、顧客が入力した住所を勝手に誤った方法で改変して、それを宛名として郵便物を送り付けることは大変失礼にあたるので止めていただきたいです。
日本の住所表記を大きく分けると、住居表示の地域と、住居表示が実施されていない地域の2つがあるので、正規化するならそれを混同しないようにしましょう。
・住居表示の地域正)東京都千代田区永田町一丁目10番1号誤)東京都千代田区永田町1丁目10番1号 … 「永田町一丁目」という地名なので算用数字にしてはならない誤)東京都千代田区永田町一丁目10番地1 … 住居表示の地域では「番地」ではなく「番」を使う
・地番管理の地域正)大宮区吉敷町一丁目124番地1誤)大宮区吉敷町一丁目124番地1号 … 最後の「号」は地番管理の地域では使用しない誤)大宮区吉敷町一丁目124番1号 … 地番管理の地域では「A番B号」ではなく「A番地B」としなければならない
また、エンジニアの中には全角数字を異常にまで嫌う人が居ますが、戸籍や住民基本台帳などの電算化に関する法令や規則等では住所の数字は「全角数字」で統一することとされています。正規化するなら、勝手に半角にしたりせず、全角に正規化しましょう。半角にしたら、マイナンバーカードから取得した電子データや住民票等と完全一致しなくなります。
なお、運転免許証に表記されている住所は券面スペースの関係上省略表示される場合があり、必ずしも正しいとは限りません。
あと、勝手に「大宮区吉敷町1-124-1」のようにハイフン表記するシステムもありますが、・住居表示なのか地番管理なのかというその場所に辿り着く上で重要な情報を削除している・部屋番号なのか番地なのか等が分かりにくくなる・それによるスペースの節約は僅か(世の中には長すぎる地名・住所というものが存在するので、それに対応する空間を用意していたならばハイフン表記で節約できるスペースなんて誤差)という観点からデメリットが多いので止めていただきたいです。
余談ですが、就活マナー本が間違いだらけで、履歴書で「大宮区吉敷町1丁目124番地1号」のような誤表記(地番管理なら最後の「号」が不要なので「A番地B号」とはしてはならない)をする人が大変多いです(正確に書いている人の方が稀)。不動産業界でそんな履歴書を出すと、住居表示と地番管理の区別すらできていないというマイナスのアピールにしかなりません。普段は「大宮区吉敷町1-124-1」のような省略表記をしていて正確に書こうとして間違えているのだと思いますが、それならハイフンで省略した表記の方がまだマシです。
正規化(normalization)は一定の規則に則ってデータを変形することです.それと規範的な正しさとは別の問題です.元コメ氏の主張は「住居表示台帳」上の住所規則が,住民基本台帳上の住所にも完全に適応されているという前提に立っていることが問題です.
住民基本台帳は自治体によって登録ルールを設けているところもありますが,ルールがないところもあります.登録時のルールを厳密に運用している自治体は,街区符号や住居番号,さらにマンション名の表記方法や部屋番号の位置などを登録時に住居表示台帳をもとに正規化します(住所に含めるか,マンション名の後にするか,「室」をつけるかなど).しかし,ルールがない自治体は同じ土地であっても町名(町丁)以下は,申請者の表記のまま登録します.おそろしいことに,これまで経験した中で地番までしか台帳に登録していない自治体も日本にはあるのです(なのに行政からの郵便物が届く不思議).
したがって,個人にとっての住民票上の「正しい」住所は住民基本台帳に登録された住所となります.まぁ,履歴書程度なら勝手に「正しい」表記に書き換えても良いですね.
ですね。
東京都某A区で、転入時に「一丁目」と書いたものは、発行された住民票では「1丁目」となっていて、同区内の戸籍では「一丁目」となっていました。部屋番号を「101号」と書いたものはそのままで、また、同室に別住民票で入居した人は「101」と書き、これもそのまま住民票に反映された。
他方、某B区で、転入時に「1-2-3-456」と書いたものは、住民票では「一丁目2番3-456号」となっていました。
どちらも漢数字が正式な町名のところ。正規化とは正式化ではないし、公的文書が正式に準拠しているとは限らないし、全ての公的機関が同じ基準でもないし、組織内で統一しているとも限らない。なかなか難しいですね。
オフトピ(-1)だけど、国際郵便の宛名/差出元をローマ字・アラビア数字で表記する場合はどうなってんでしょうね?名刺の英文表記などでは 1-chome 云々タイプに強制キャストされている印象だけど下記施行規則では当該強制キャストに言及していない感じ。万国郵便条約の施行規則 [soumu.go.jp](PDF; 二千十七年三月三十一日にベルンで作成した。)
// 既出でなくオフトピと確認するために全コメントを斜め読みした
郵便局の英語ページで、日本郵便自体の所在地はhttps://www.post.japanpost.jp/about/profile_en.html [japanpost.jp]大手町二丁目3番1号↓2-3-1 Otemachi
一方で、国際郵便マイページサービスでの記入例ではhttps://www.int-mypage.post.japanpost.jp/ [japanpost.jp]霞が関一丁目3番2号↓3-2 Kasumigaseki 1-Chome
となっています。これも統一基準とかない感じですかね。
>これも統一基準とかない感じ
やっぱりそうか。30年くらい前に勤務していた職場の取引先では
>2-3-1 Otemachi>3-2 Kasumigaseki 1-Chome
のどちらでもない
No.1 Foo-Bar Building, 1-1, 1-Chome Nishi-Shinbashi, Minato-ku, Tokyo, zzz-zz Japan
みたいなのもSublicensing Agreementの本文に記載されていた記憶。(zは[0123456789]の算用数字のつもり)
> これまで経験した中で地番までしか台帳に登録していない自治体も日本にはある
どうも、住所で使う〇番-△号の「番」とoo番地の「番地」は違うものらしいです。番地もとい地番は土地を識別するものらしく、古くはその番号をとって住所を「△△1丁目oo番地」としていたのが、
後の住居表示に関する法律により表示を変えたものが、よく見る△△1丁目〇番-△号だそうです。
なので、「地番までしか台帳に登録されていない」ではなく、住居表示の実施がされていない番地方式(?)の住所が残っているというのが実態ではないかと
とりあえず、郵便番号が重宝される理由がわかりました。
漢数字とハイフンの組み合わせが凶悪縦書きでもハイフンを横書き同様横に書く人がいる
縦書きの場合に漢数字+縦のハイフンは解りやすい方と思うのだけど
じゃぁ縦書きでアラビア数字を使う場合ってなるとアラビア数字+横のハイフンってのは見かけたことないな
#3826174では無いけど3-2-1を三ー二ー一こういう書き方する人ですよ。#マジ殺意
でも何故か判別可能なんだよねー
他に市区町村の記載があってこれは住所の番地なんだなという外挿情報と、地域がわかってとりうる番地の範囲が限られてやっと漢数字とハイフンの判別がつくようになるのは、「文字を判別」できているうちに入るのだろうか。
縦書きに算用数字とハイフンも忘れないで。算用数字使うならせめて二桁の場合は横に並べて書いてくれればいいのに、縦に1を二つ並べる人がいる。
ワープロとかでも1-11-1を縦書きで印字したとき解読困難になることがある。フォント選びはとっても大事。
昔は日本郵政がネット配布していた郵便番号データにも変な番地表記が混じっていたけど、修正されただろうか
ま、住所「データ」としては使えないと言っていいですからね。ただのテキスト羅列。チェックのしようがない。
国土地理院のコード体系で管理すりゃあ良いのにと思った事はありますね〜。合併やらで地名変わってもコード値変化しなくて時間軸で地名出せたハズ。
郵便番号も「ハイフンなしの7桁で」なんて指定されることがあるから、完全に正規化されているとは言えないような。
書いてる本人が「大宮区吉敷町1-124-1」みたく書いてたら、正規化して正しくなる方がマシじゃないのかな
# ところで住所正規化システムって、そんなに種類あるの?
その正しいやり方がクソだと思うのです。だれがやっても同じにならないと。
仕方ないから半角カナ数字でマッチングになるんですよ。
- 半角全角の問題と- 住居表示の問題をごっちゃにしちゃいかん。後段の地番や街区符号の話は最もな話なのです。
DBの設計として考えると、ユーザー入力と正規化した表現と両方持って、検索などは正規化した方を使うって流れなので、重要なのは一貫性のある正規化ルールなのであって、正しい方法ではない。このWeb APIがどっちなのかは知らない。
以前に地図データベースの実験プロジェクトにいた時に、地図データと各施設の住所データのマッチング用に住所の正規化モジュールを(だいぶ雑なのでしたが)作ったことがあります。モジュールを作った時点では、検索用(つまり内部データ)ということで、正規化後はかなり見てくれの悪い状態だったのですが、地図データ内の住所を正規化しちゃった後で画面上に表示することになって「しまった!」となりました。その時はあくまで実験プロジェクトなんですみません!って感じでそのままで許してもらったんですが、表示用には元データをきっちり残しておくべきだったと反省しました。
#「正しい書き方」がある場合も、お客様の入力したデータを(表示上だけでも)尊重することも大事ですしね。
GISですよね?赤の他人の住所書く人いるんでそれを尊重なんて有り得ん!でしたが?自分やった実験と自治体で使った時は「表記ルールに合わせて修正し、データとして使えるようにする」でしたね。
DB設計的にはメタデータは0〜nレコードで好きに扱えるんで別に取っとくことは可能だけど、存在自体が「どっちだ?」と作業滞らせるからと。
> 誤)東京都千代田区永田町1丁目10番1号 … 「永田町一丁目」という地名なので算用数字にしてはならない
住民票もマイナンバーカードも「永田町1丁目」だべやそんな書き方されたら、半角数字と同じく完全一致しないべ
ん?貴方が「永田町」に住んでいて「永田町1丁目」と住民票に表記されているの?それとも、別の市区町村の「〇丁目」の話?
Wikipediaより [wikipedia.org]
漢数字またはアラビア数字のいずれが丁目の数字の表記として正式であるかは、市町村により異なる(「#横浜市」の節で後述するように、同一の市町村内でも異なることがある)。地方自治法第260条では、町名・字名の新設や変更は、市町村長の告示により効力を生ずるとされている(かつては都道府県知事の告示により効力を生ずるとされていた)。よって、告示の表記が町名・字名の正式な表記であり、丁目の数字の表記についても、告示の表記により正式な表記が決まる。漢数字表記を正式とする市町村では、丁目は町名の一部または小字の名称であるので、丁目の数字は固有名詞の一部であるとされる。そして、固有名詞中の漢数字はアラビア数字に改めないのが原則であるので(「六本木」は「6本木」とは書かない)、この原則を丁目の表記にも厳格に適用して、横書きで地番や住居番号をアラビア数字で書くときも丁目の数字は漢数字で書くという立場もある(「六本木一丁目」を「六本木1丁目」と書かない)。
「永田町」については漢数字を使用するのが正式。証拠: 「東京都千代田区永田町二丁目9番6号」https://pbs.twimg.com/media/DuQxfP8UcAAp_jz?format=jpg&name=large [twimg.com]
元コメは 『「永田町一丁目」という地名なので~』という主張をしており、全ての「〇丁目」に対してそうしろとは言ってない。
住民票(横書き)でアラビア数字を使うか漢数字を使うかも、市区町村が決めている。
うん、ルールがクソ!
自分ちがあるマンションを住居表示するときは、東京都千代田区永田町二丁目9番6-201号と表記して建物名は別に欄があればそこに。 市区町村で住民票を取ると二丁目が2丁目になってるなら、2丁目の表記。書類に証明書として添付するのであれば、証明書に記載されている通りに書類を書くのが基本。10万円の申請書とか、予め印刷されてるなら問題になりませんが、自分で記入するときは大量の申請を審査しないといけない側の中の人の気持ちもちょっと察してあげてね。
えっ、マイナンバーカードは一丁目10番になってるんだけど・・・どっちかが偽物?出力する自治体や担当者によって変わるとかあるのかな?
マイナンバーカードや通知カードは、物的な作成は全国統一で地方公共団体情報システム機構が行っているものの、記載される個人情報の部分は市区町村から提供された情報に従うしかないはずです。各々の市区町村が、「一丁目」だと言えば「一丁目」、「1丁目」だと言えば「1丁目」、だと。
さらに、横書きの場合はアラビア数字で書いても差し支えない [kumagaya.lg.jp]らしいので、ますます解らないことに
Wikipediaの「小字」によると「○丁目」が小字なケースは稀だそうで。そもそも永田町一丁目は大字でも字でもなく町ですね。ちなみに私の住所は○○1丁目ですが、アラビア数字の丁目まで含めて町です。
つまり2子玉川とか3島とか4日市とは書かないのと同じこと?
10000000000000000都府10000000000000000都市とか書いたら怒られるだろうなー
1000葉県1000葉市
10日市100合丘1000歳10000世橋
1.0E+32の口0.0001魚川
imi-enrichment-address-2.0.0.src.tgzのREADME.mdをみると、
霞が関2-1-10を入力すると、
都道府県: 東京都町名 : 霞が関丁目 : 2番地 : 1号 : 10
と出力されるらしいのですが、これは「最後の「号」は地番管理の地域では使用しない」に反するのですか?
> 「最後の「号」は地番管理の地域では使用しない」に反するのですか?
いいえ。
住居表示実施地区と未実施地区一覧 https://www.city.chiyoda.lg.jp/koho/machizukuri/tochi/jukyohyoji/jisshi.html [chiyoda.lg.jp]
によると、「霞が関一丁目~三丁目」は住居表示実施地区です。従って、「東京都千代田区霞が関二丁目1番10号」が正しい表記です。「号」は必要で、「番地」ではなく「番」を使用します。
(
> 正規化するなら、勝手に半角にしたりせず、全角に正規化しましょう
勝手に全角にしてくれるならいいよ。勝手に変換すればいいものを、ユーザーに全角で入力させるから嫌ってるだけ。
> ユーザーに全角で入力させるから嫌ってるだけ。
んー?ユーザーに全角で入力させるから「何が」嫌いって?このスレッドは別に「○○を嫌わないでおくれよ」とか言ってるようではない気がするが。。。
建物の名前が入る場合の住民票の独特の表記順序には、非常に違和感がある。
地域を表す表記、例に挙げただけですでに2つある。用途に合わない「正しい表記」は他にも山ほどあるだろう。大事なのはデータベースの中で一貫しているかどうかだ。
市区町村名ひとつとっても総務省と国交省でゆらぎがあるのにそれを経産省が正規化したらどうなるのかは知らないが、「正規化」は「正規化」であって正しいも間違いも無い。
データベースでっていうより、要は正規化の方法が一貫しているかどうかでしょ。正規化ってそういうもんだよ。
親コメの例で考えると、「永田町1丁目」でデータを持っておいて、マイナンバーカードから得た「永田町一丁目」っていう文字列を正規化した時に「永田町1丁目」になれば何の問題もない。strcmpが通りさえすればいいんだから。データベース内で一貫したデータを持ってても、正規化方法を忘れちゃったら何にもならない。
「永田町1丁目」と「永田町一丁目」や「永田町1丁目」が地理的に違う場所だった時のみ、この正規化が許されない。そうじゃないんだったら、数字を全角に揃えろって意見の方がおかしい。
全角数字はどんな理由があっても許されてはならない駆逐すべきだ根絶すべきだ擁護する奴も皆殺しにすべきだ皆殺しを批判する者まで殺し尽くしてしまってもいい
このツールは住所の比較に使うためのものであって、DB保存用の文字列を生成したり、宛名ラベルを印刷するためのものではないと思います。AとBの住所を比較するときにAもBも正規化したうえで比較するわけです。
設計ミスを運用でカバーしろというのが無理。
> 「永田町一丁目」という地名なので算用数字にしてはならない
これですが、「漢数字が正式でも算用数字にしてもいいよ」という自治省の古い通達があって、今も生きてます。公務員でも「漢数字が正式だからそれしか使ってはいけない」と間違えて覚えている人がいるので、要注意です。
以下、『東京都住民基本台帳事務質疑応答集』から引用
住民登録法のもとでの先例である「住居表示に関する法律の施行に伴う住民登録の取扱い」(昭和37年5月29日民事甲第1448号通達)による住民票上の横書の場合の記載例は,アラビア数字となっている。これは,横書の場合は,そうした表記が慣習であり,能率的であることから取られた措置であると考えられる。したがって,固有名詞という概念からすれば,漢数字による表記をすることが適当と考えるが,便宜上アラビア数字による表記をしても差し支えない(昭和38年7月9日民事甲第1947号回答)。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:5, 参考になる)
不動産関係の仕事をしている私からすると、誤った方法で住所を勝手に正規化するシステムがあって腹が立ちます。
内部的にその会社で都合の良い方法で正規化するのは仕方無いとしても、顧客が入力した住所を勝手に誤った方法で改変して、それを宛名として郵便物を送り付けることは大変失礼にあたるので止めていただきたいです。
日本の住所表記を大きく分けると、住居表示の地域と、住居表示が実施されていない地域の2つがあるので、正規化するならそれを混同しないようにしましょう。
・住居表示の地域
正)東京都千代田区永田町一丁目10番1号
誤)東京都千代田区永田町1丁目10番1号 … 「永田町一丁目」という地名なので算用数字にしてはならない
誤)東京都千代田区永田町一丁目10番地1 … 住居表示の地域では「番地」ではなく「番」を使う
・地番管理の地域
正)大宮区吉敷町一丁目124番地1
誤)大宮区吉敷町一丁目124番地1号 … 最後の「号」は地番管理の地域では使用しない
誤)大宮区吉敷町一丁目124番1号 … 地番管理の地域では「A番B号」ではなく「A番地B」としなければならない
また、エンジニアの中には全角数字を異常にまで嫌う人が居ますが、戸籍や住民基本台帳などの電算化に関する法令や規則等では住所の数字は「全角数字」で統一することとされています。
正規化するなら、勝手に半角にしたりせず、全角に正規化しましょう。半角にしたら、マイナンバーカードから取得した電子データや住民票等と完全一致しなくなります。
なお、運転免許証に表記されている住所は券面スペースの関係上省略表示される場合があり、必ずしも正しいとは限りません。
あと、勝手に「大宮区吉敷町1-124-1」のようにハイフン表記するシステムもありますが、
・住居表示なのか地番管理なのかというその場所に辿り着く上で重要な情報を削除している
・部屋番号なのか番地なのか等が分かりにくくなる
・それによるスペースの節約は僅か(世の中には長すぎる地名・住所というものが存在するので、それに対応する空間を用意していたならばハイフン表記で節約できるスペースなんて誤差)
という観点からデメリットが多いので止めていただきたいです。
余談ですが、就活マナー本が間違いだらけで、履歴書で「大宮区吉敷町1丁目124番地1号」のような誤表記(地番管理なら最後の「号」が不要なので「A番地B号」とはしてはならない)をする人が大変多いです(正確に書いている人の方が稀)。
不動産業界でそんな履歴書を出すと、住居表示と地番管理の区別すらできていないというマイナスのアピールにしかなりません。
普段は「大宮区吉敷町1-124-1」のような省略表記をしていて正確に書こうとして間違えているのだと思いますが、それならハイフンで省略した表記の方がまだマシです。
正規化と「正しさ」は別問題 (スコア:2, すばらしい洞察)
正規化(normalization)は一定の規則に則ってデータを変形することです.それと規範的な正しさとは別の問題です.
元コメ氏の主張は「住居表示台帳」上の住所規則が,住民基本台帳上の住所にも完全に適応されているという前提に立っていることが問題です.
住民基本台帳は自治体によって登録ルールを設けているところもありますが,ルールがないところもあります.
登録時のルールを厳密に運用している自治体は,街区符号や住居番号,さらにマンション名の表記方法や部屋番号の位置などを登録時に住居表示台帳をもとに正規化します(住所に含めるか,マンション名の後にするか,「室」をつけるかなど).
しかし,ルールがない自治体は同じ土地であっても町名(町丁)以下は,申請者の表記のまま登録します.おそろしいことに,これまで経験した中で地番までしか台帳に登録していない自治体も日本にはあるのです(なのに行政からの郵便物が届く不思議).
したがって,個人にとっての住民票上の「正しい」住所は住民基本台帳に登録された住所となります.
まぁ,履歴書程度なら勝手に「正しい」表記に書き換えても良いですね.
Re:正規化と「正しさ」は別問題 (スコア:2)
ですね。
東京都某A区で、転入時に「一丁目」と書いたものは、発行された住民票では「1丁目」となっていて、同区内の戸籍では「一丁目」となっていました。
部屋番号を「101号」と書いたものはそのままで、また、同室に別住民票で入居した人は「101」と書き、これもそのまま住民票に反映された。
他方、某B区で、転入時に「1-2-3-456」と書いたものは、住民票では「一丁目2番3-456号」となっていました。
どちらも漢数字が正式な町名のところ。
正規化とは正式化ではないし、公的文書が正式に準拠しているとは限らないし、全ての公的機関が同じ基準でもないし、組織内で統一しているとも限らない。
なかなか難しいですね。
Re:正規化と「正しさ」は別問題 (スコア:1)
オフトピ(-1)だけど、国際郵便の宛名/差出元をローマ字・アラビア数字で
表記する場合はどうなってんでしょうね?
名刺の英文表記などでは 1-chome 云々タイプに強制キャストされている印象
だけど下記施行規則では当該強制キャストに言及していない感じ。
万国郵便条約の施行規則 [soumu.go.jp](PDF; 二千十七年三月三十一日にベルンで作成した。)
// 既出でなくオフトピと確認するために全コメントを斜め読みした
Re:正規化と「正しさ」は別問題 (スコア:2)
郵便局の英語ページで、日本郵便自体の所在地は
https://www.post.japanpost.jp/about/profile_en.html [japanpost.jp]
大手町二丁目3番1号
↓
2-3-1 Otemachi
一方で、国際郵便マイページサービスでの記入例では
https://www.int-mypage.post.japanpost.jp/ [japanpost.jp]
霞が関一丁目3番2号
↓
3-2 Kasumigaseki 1-Chome
となっています。
これも統一基準とかない感じですかね。
Re:正規化と「正しさ」は別問題 (スコア:1)
>これも統一基準とかない感じ
やっぱりそうか。30年くらい前に勤務していた職場の取引先では
>2-3-1 Otemachi
>3-2 Kasumigaseki 1-Chome
のどちらでもない
No.1 Foo-Bar Building, 1-1, 1-Chome Nishi-Shinbashi, Minato-ku, Tokyo, zzz-zz Japan
みたいなのもSublicensing Agreementの本文に記載されていた記憶。
(zは[0123456789]の算用数字のつもり)
Re: (スコア:0)
> これまで経験した中で地番までしか台帳に登録していない自治体も日本にはある
どうも、住所で使う〇番-△号の「番」とoo番地の「番地」は違うものらしいです。
番地もとい地番は土地を識別するものらしく、古くはその番号をとって
住所を「△△1丁目oo番地」としていたのが、
後の住居表示に関する法律により表示を変えたものが、よく見る△△1丁目〇番-△号だそうです。
なので、「地番までしか台帳に登録されていない」ではなく、
住居表示の実施がされていない番地方式(?)の住所が残っているというのが実態ではないかと
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
とりあえず、郵便番号が重宝される理由がわかりました。
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
漢数字とハイフンの組み合わせが凶悪
縦書きでもハイフンを横書き同様横に書く人がいる
Re: (スコア:0)
縦書きの場合に漢数字+縦のハイフンは解りやすい方と思うのだけど
じゃぁ縦書きでアラビア数字を使う場合ってなると
アラビア数字+横のハイフン
ってのは見かけたことないな
Re: (スコア:0)
#3826174では無いけど3-2-1を
三
ー
二
ー
一
こういう書き方する人ですよ。
#マジ殺意
Re: (スコア:0)
でも何故か判別可能なんだよねー
Re: (スコア:0)
他に市区町村の記載があってこれは住所の番地なんだなという外挿情報と、地域がわかってとりうる番地の範囲が限られてやっと漢数字とハイフンの判別がつくようになるのは、「文字を判別」できているうちに入るのだろうか。
Re: (スコア:0)
君が自動読み取り機なら同情しなくもないけど、今の機械は割と読み取ってくれるはず。
Re: (スコア:0)
縦書きに算用数字とハイフンも忘れないで。
算用数字使うならせめて二桁の場合は横に並べて書いてくれればいいのに、縦に1を二つ並べる人がいる。
ワープロとかでも1-11-1を縦書きで印字したとき解読困難になることがある。
フォント選びはとっても大事。
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
昔は日本郵政がネット配布していた郵便番号データにも変な番地表記が混じっていたけど、修正されただろうか
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
Re: (スコア:0)
ま、住所「データ」としては使えないと言っていいですからね。
ただのテキスト羅列。チェックのしようがない。
国土地理院のコード体系で管理すりゃあ良いのにと思った事はありますね〜。
合併やらで地名変わってもコード値変化しなくて時間軸で地名出せたハズ。
Re: (スコア:0)
郵便番号も「ハイフンなしの7桁で」なんて指定されることがあるから、完全に正規化されているとは言えないような。
Re: (スコア:0)
書いてる本人が「大宮区吉敷町1-124-1」みたく書いてたら、正規化して正しくなる方がマシじゃないのかな
# ところで住所正規化システムって、そんなに種類あるの?
Re: (スコア:0)
その正しいやり方がクソだと思うのです。
だれがやっても同じにならないと。
仕方ないから半角カナ数字でマッチングになるんですよ。
Re: (スコア:0)
- 半角全角の問題
と
- 住居表示の問題
をごっちゃにしちゃいかん。
後段の地番や街区符号の話は最もな話なのです。
Re: (スコア:0)
DBの設計として考えると、ユーザー入力と正規化した表現と両方持って、検索などは正規化した方を使うって流れなので、
重要なのは一貫性のある正規化ルールなのであって、正しい方法ではない。
このWeb APIがどっちなのかは知らない。
Re: (スコア:0)
以前に地図データベースの実験プロジェクトにいた時に、地図データと各施設の住所データのマッチング用に
住所の正規化モジュールを(だいぶ雑なのでしたが)作ったことがあります。
モジュールを作った時点では、検索用(つまり内部データ)ということで、正規化後はかなり
見てくれの悪い状態だったのですが、地図データ内の住所を正規化しちゃった後で
画面上に表示することになって「しまった!」となりました。
その時はあくまで実験プロジェクトなんですみません!って感じでそのままで許してもらったんですが、
表示用には元データをきっちり残しておくべきだったと反省しました。
#「正しい書き方」がある場合も、お客様の入力したデータを(表示上だけでも)尊重することも大事ですしね。
Re: (スコア:0)
GISですよね?
赤の他人の住所書く人いるんでそれを尊重なんて有り得ん!でしたが?
自分やった実験と自治体で使った時は「表記ルールに合わせて修正し、データとして使えるようにする」でしたね。
DB設計的にはメタデータは0〜nレコードで好きに扱えるんで別に取っとくことは可能だけど、存在自体が「どっちだ?」と作業滞らせるからと。
Re: (スコア:0)
> 誤)東京都千代田区永田町1丁目10番1号 … 「永田町一丁目」という地名なので算用数字にしてはならない
住民票もマイナンバーカードも「永田町1丁目」だべや
そんな書き方されたら、半角数字と同じく完全一致しないべ
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
ん?
貴方が「永田町」に住んでいて「永田町1丁目」と住民票に表記されているの?
それとも、別の市区町村の「〇丁目」の話?
Wikipediaより [wikipedia.org]
漢数字またはアラビア数字のいずれが丁目の数字の表記として正式であるかは、市町村により異なる(「#横浜市」の節で後述するように、同一の市町村内でも異なることがある)。地方自治法第260条では、町名・字名の新設や変更は、市町村長の告示により効力を生ずるとされている(かつては都道府県知事の告示により効力を生ずるとされていた)。よって、告示の表記が町名・字名の正式な表記であり、丁目の数字の表記についても、告示の表記により正式な表記が決まる。
漢数字表記を正式とする市町村では、丁目は町名の一部または小字の名称であるので、丁目の数字は固有名詞の一部であるとされる。そして、固有名詞中の漢数字はアラビア数字に改めないのが原則であるので(「六本木」は「6本木」とは書かない)、この原則を丁目の表記にも厳格に適用して、横書きで地番や住居番号をアラビア数字で書くときも丁目の数字は漢数字で書くという立場もある(「六本木一丁目」を「六本木1丁目」と書かない)。
「永田町」については漢数字を使用するのが正式。
証拠: 「東京都千代田区永田町二丁目9番6号」
https://pbs.twimg.com/media/DuQxfP8UcAAp_jz?format=jpg&name=large [twimg.com]
元コメは 『「永田町一丁目」という地名なので~』という主張をしており、全ての「〇丁目」に対してそうしろとは言ってない。
住民票(横書き)でアラビア数字を使うか漢数字を使うかも、市区町村が決めている。
Re: (スコア:0)
うん、ルールがクソ!
Re: (スコア:0)
自分ちがあるマンションを住居表示するときは、東京都千代田区永田町二丁目9番6-201号と表記して
建物名は別に欄があればそこに。 市区町村で住民票を取ると二丁目が2丁目になってるなら、2丁目の表記。
書類に証明書として添付するのであれば、証明書に記載されている通りに書類を書くのが基本。
10万円の申請書とか、予め印刷されてるなら問題になりませんが、自分で記入するときは大量の申請を審査しな
いといけない側の中の人の気持ちもちょっと察してあげてね。
Re: (スコア:0)
えっ、マイナンバーカードは一丁目10番になってるんだけど・・・
どっちかが偽物?
出力する自治体や担当者によって変わるとかあるのかな?
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:2)
マイナンバーカードや通知カードは、物的な作成は全国統一で地方公共団体情報システム機構が行っているものの、記載される個人情報の部分は市区町村から提供された情報に従うしかないはずです。
各々の市区町村が、「一丁目」だと言えば「一丁目」、「1丁目」だと言えば「1丁目」、だと。
Re: (スコア:0)
Re: (スコア:0)
さらに、横書きの場合はアラビア数字で書いても差し支えない [kumagaya.lg.jp]らしいので、
ますます解らないことに
Re: (スコア:0)
Wikipediaの「小字」によると「○丁目」が小字なケースは稀だそうで。
そもそも永田町一丁目は大字でも字でもなく町ですね。
ちなみに私の住所は○○1丁目ですが、アラビア数字の丁目まで含めて町です。
Re: (スコア:0)
つまり2子玉川とか3島とか4日市とは書かないのと同じこと?
Re: (スコア:0)
10000000000000000都府10000000000000000都市とか書いたら怒られるだろうなー
Re: (スコア:0)
1000葉県1000葉市
Re: (スコア:0)
10日市
100合丘
1000歳
10000世橋
Re:正規化するなら正しい方法でやって欲しい(勝手に半角数字にするとかもやめて) (スコア:1)
1.0E+32の口
0.0001魚川
経産省のリドミ (スコア:0)
imi-enrichment-address-2.0.0.src.tgzのREADME.mdをみると、
霞が関2-1-10を入力すると、
都道府県: 東京都
町名 : 霞が関
丁目 : 2
番地 : 1
号 : 10
と出力されるらしいのですが、これは
「最後の「号」は地番管理の地域では使用しない」
に反するのですか?
Re: (スコア:0)
> 「最後の「号」は地番管理の地域では使用しない」に反するのですか?
いいえ。
住居表示実施地区と未実施地区一覧
https://www.city.chiyoda.lg.jp/koho/machizukuri/tochi/jukyohyoji/jisshi.html [chiyoda.lg.jp]
によると、「霞が関一丁目~三丁目」は住居表示実施地区です。
従って、「東京都千代田区霞が関二丁目1番10号」が正しい表記です。「号」は必要で、「番地」ではなく「番」を使用します。
(
Re: (スコア:0)
> 正規化するなら、勝手に半角にしたりせず、全角に正規化しましょう
勝手に全角にしてくれるならいいよ。勝手に変換すればいいものを、ユーザーに全角で入力させるから嫌ってるだけ。
Re: (スコア:0)
> ユーザーに全角で入力させるから嫌ってるだけ。
んー?
ユーザーに全角で入力させるから「何が」嫌いって?
このスレッドは別に「○○を嫌わないでおくれよ」とか言ってるようではない気がするが。。。
Re: (スコア:0)
建物の名前が入る場合の住民票の独特の表記順序には、非常に違和感がある。
正しい方法はひとつではない (スコア:0)
地域を表す表記、例に挙げただけですでに2つある。
用途に合わない「正しい表記」は他にも山ほどあるだろう。
大事なのはデータベースの中で一貫しているかどうかだ。
市区町村名ひとつとっても総務省と国交省でゆらぎがあるのに
それを経産省が正規化したらどうなるのかは知らないが、
「正規化」は「正規化」であって正しいも間違いも無い。
Re: (スコア:0)
データベースでっていうより、要は正規化の方法が一貫しているかどうかでしょ。正規化ってそういうもんだよ。
親コメの例で考えると、「永田町1丁目」でデータを持っておいて、マイナンバーカードから得た「永田町一丁目」っていう文字列を正規化した時に「永田町1丁目」になれば何の問題もない。strcmpが通りさえすればいいんだから。データベース内で一貫したデータを持ってても、正規化方法を忘れちゃったら何にもならない。
「永田町1丁目」と「永田町一丁目」や「永田町1丁目」が地理的に違う場所だった時のみ、この正規化が許されない。そうじゃないんだったら、数字を全角に揃えろって意見の方がおかしい。
Re: (スコア:0)
全角数字はどんな理由があっても許されてはならない
駆逐すべきだ
根絶すべきだ
擁護する奴も皆殺しにすべきだ
皆殺しを批判する者まで殺し尽くしてしまってもいい
Re: (スコア:0)
このツールは住所の比較に使うためのものであって、DB保存用の文字列を生成したり、宛名ラベルを印刷するためのものではないと思います。AとBの住所を比較するときにAもBも正規化したうえで比較するわけです。
Re: (スコア:0)
設計ミスを運用でカバーしろというのが無理。
Re: (スコア:0)
> 「永田町一丁目」という地名なので算用数字にしてはならない
これですが、「漢数字が正式でも算用数字にしてもいいよ」という自治省の古い通達があって、今も生きてます。
公務員でも「漢数字が正式だからそれしか使ってはいけない」と間違えて覚えている人がいるので、要注意です。
以下、『東京都住民基本台帳事務質疑応答集』から引用
住民登録法のもとでの先例である「住居表示に関する法律の施行に伴う住民登録の取扱い」(昭和37年5月29日民事甲第1448号通達)による住民票上の横書の場合の記載例は,アラビア数字となっている。これは,横書の場合は,そうした表記が慣習であり,能率的であることから取られた措置であると考えられる。したがって,固有名詞という概念からすれば,漢数字による表記をすることが適当と考えるが,便宜上アラビア数字による表記をしても差し支えない(昭和38年7月9日民事甲第1947号回答)。