ロケレポート-新宿御苑-

最近少しずつ暖かくなってきたので、新宿御苑に行ってきました。
ここは、新宿駅から程近くにある有料施設で、広大な敷地の中に庭園や広場があります。
広場
実はココ、酒類の持込やペット同伴での入場不可など、色々な制限があるせいか、晴れた日でも空いています。
しかも駐車場も空いていて、車で行っても待たずに入れます。
去年も桜の開花している4月くらいに行きましたが、待たずに入れました。
また、敷地内には売店や休憩所などもあり、弁当を食べる事も出来ます。

入場料金も大人200円と、以前行った横浜三渓円に比べてリーズナブルで、都心で子供を自由に遊ばせられる穴場のスポットなのです。
池の周りも柵が張ってあり、子供が池に落ちる心配も減ります。
自然も豊富なので、写真撮影のネタがたくさんあります。

中でも個人的に新宿御苑ならではの撮影が出来るのが、新宿の高層ビル群と、新宿御苑の自然とのコラボ写真です。
自然と新宿高層ビル
郊外ではなかなかこういう写真は撮れません。

しかも3月上旬にも関わらず、ラッキーな事に桜が咲いていました。
池の近くに桜が咲いていたので、水面に反射する太陽の光と、桜を写してみました。
桜
※今回撮った写真の中で一番のお気に入りです。

他にもこんな感じの写真も撮りました。
鏡

こんな感じで写真を撮るにも充分楽しめます。
一眼レフを持ってる子供連れのパパさんにはおススメの場所です。
出費も入場料大人2人:400円、駐車場4時間駐車:700円で合計1,100円の出費で済んだので、おサイフにも易しいです。

日本郵便の郵便番号データを解析してみる 第2回~括弧の意味編~

my-hobby : 日本郵便の郵便番号データを解析してみる 第1回~住所のマージ編~でとりあえず、データを繋げるところまでは出来ました。
第2回目以降は、繋げたデータを更に解析してみたいと思います。

今回紹介するのは町域名に存在する「()」括弧についてです。
例えば以下の様な郵便番号データがそれに該当します。※赤字の部分。

01224,”066 “,”0660005″,”ホッカイドウ”,”チトセシ”,”キョウワ(88-2、271-10、343-2、404-1、427-3、431-12、443-6、608-2、641-8、814、842-5、1137-3、1392、1657、1752バンチ)”,”北海道”,”千歳市”,”協和(88-2、271-10、343-2、404-1、427-3、431-12、443-6、608-2、641-8、814、842-5、1137-3、1392、1657、1752番地)“,1,0,0,0,0,0

※2010/2/26日更新分のデータより抜粋

こちらのデータは、都道府県、市区町村、町域毎にまとめると以下の様な内容になります。※カナは除く
都道府県:北海道
市区町村:千歳市
町域:協和(88-2、271-10、343-2、404-1、427-3、431-12、443-6、608-2、641-8、814、842-5、1137-3、1392、1657、1752番地)

ここで問題になるのは、町域にある「()」括弧です。
もちろん「協和(88-2、・・・中略・・・1752番地)」という名前の住所は存在しません。
郵便番号データの説明 – 日本郵便を見ても、括弧に関する記述はありません。

これは前回と同様、独自の解析で括弧の意味を解読するしかないようです。
小学校の得意教科が算数だった自分がこの内容を見ると、以下の複数の住所に分割できるのではないかと考えました。
協和88-2
協和271-10
協和343-2
協和404-1
協和427-3
協和431-12
協和443-6
協和608-2
協和641-8
協和814
協和842-5
協和1137-3
協和1392
協和1657
協和1752番地

では本当にそうなのか?
郵便番号データからでは判断が出来ないので、上記の住所が実在するのか調べてみました。
調査の方法としては、住所情報を提供している全国の場所検索トップ – 地図-ルート検索|いつもNAVIから該当の住所を調べて、住所が実在すればOKという方法です。
日本郵便の郵便番号データだけでは判断が出来ないので、住所データを扱う別の企業に頼ろうという作戦です。。。
かなり原始的な方法ですが、現時点ではこれしか思いつきませんでした。

全てを調べるのは大変なので、とりあえず北海道千歳市の協和88-2、協和443-6、協和1752番地の3つが実在するか調べた結果、いづれの住所も実在していました。
北海道千歳市協和88-2の場所検索 – 地図-ルート検索|いつもNAVI
北海道千歳市協和443-6の場所検索 – 地図-ルート検索|いつもNAVI
北海道千歳市協和1752の場所検索 – 地図-ルート検索|いつもNAVI

という事は上記の例での括弧の意味は、以下の内容であると推察出来ます。
括弧内のカンマで区切られたそれぞれの文字と、括弧の前に付いた文字を結合すれば、住所(町域名)として成立する。
簡単に(数学の式っぽく)書くとA(B、C、D)=AB、AC、ADって事ですね。

これなら「北海道千歳市協和88-2」という住所に対して、正しい郵便番号を検索させる事が可能になりますね。

上記のケースを考慮した結果は、郵便番号検索 -zipnavi-にて実際に確認できます。

日本郵便の郵便番号データを解析してみる 第1回~住所のマージ編~

郵便番号検索 – 日本郵便が提供している郵便番号データ(住所データ)は、郵便番号検索系のさまざまなサイトで利用されていますが、クセがある事でも知られています。
今回は、zipnaviの開発を行った中で見つけた「クセ」を何回かに渡って紹介していきたいと思います。

とりあえず第1回という事で、住所データのマージについて紹介したいと思います。
ご存知の方もいるかと思いますが、 日本郵便から提供されている郵便番号データは、同じ郵便番号で複数のレコードが存在するケースがあります。
また以下の様に複数のレコードの「町域名」、及び「町域名カナ」を繋げる事によって始めて1つの情報になる場合があります。※赤字の部分が町域名です。
町域名カナも同様ですが、基本的に町域名と同じなので、黒字のままにしています。

01224,”066 “,”0660005″,”ホッカイドウ”,”チトセシ”,”キョウワ(88-2、271-10、343-2、404-1、427-“,”北海道”,”千歳市”,”協和(88-2、271-10、343-2、404-1、427-“,1,0,0,0,0,0
01224,”066 “,”0660005″,”ホッカイドウ”,”チトセシ”,”3、431-12、443-6、608-2、641-8、814、842-“,”北海道”,”千歳市”,”3、431-12、443-6、608-2、641-8、814、842-“,1,0,0,0,0,0
01224,”066 “,”0660005″,”ホッカイドウ”,”チトセシ”,”5、1137-3、1392、1657、1752バンチ)”,”北海道”,”千歳市”,”5、1137-3、1392、1657、1752番地)“,1,0,0,0,0,0

※2010/2/26日更新分のデータより抜粋

上記の様なデータは町域名の文字を繋げないと、郵便番号検索エンジン用のデータとして扱うには無理があります。
同じ郵便番号で複数あるレコードの「町域名カナ」と「町域名」それぞれを繋げて1レコードにすると、以下の様な感じになります。

01224,”066 “,”0660005″,”ホッカイドウ”,”チトセシ”,”キョウワ(88-2、271-10、343-2、404-1、427-3、431-12、443-6、608-2、641-8、814、842-5、1137-3、1392、1657、1752バンチ)”,”北海道”,”千歳市”,”協和(88-2、271-10、343-2、404-1、427-3、431-12、443-6、608-2、641-8、814、842-5、1137-3、1392、1657、1752番地)“,1,0,0,0,0,0

では、どのような(判断)条件で複数レコードを1件にまとめたらよいのか?
郵便番号データの説明 – 日本郵便にはそれを断定するような情報は書かれていません。

という事は自力で何らかの法則を見つけ出す必要があるのですが、郵便番号データの落とし穴 | YU-TANG’s MS-Access Discoveryのサイトに詳しい情報が書かれています。

フラグ4(一つの郵便番号で二以上の町域を表す場合の表示)が 0(つまり一つの郵便番号で一つの町域を表す)で、尚かつ同一郵便番号のレコードが 2 レコード以上の場合、マージする必要がある

※ちなみにこちらのサイトは以前から何度か参考にさせてもらっています。

また以下の様な意見も同サイトに寄せられています。

「引用」2009/7の時点では、フラグ4を参照するのではなく開き括弧と閉じ括弧の対応をとっていけば確実にマージが可能です。

※2005/11/24の記事より
後者の内容について具体例を挙げると以下の様な感じです。
同一郵便番号で複数存在するレコードには、「町域名」が「」で始まるレコードと、「」で終わるレコードと、「(」と「)」のどちらもないレコードがあります。
」で始まるレコードを連続するデータの始まりとして、「」で終わるレコードを連続するデータの終わりとして、「(」と「)」のどちらもないレコードを挟めば、1件のデータとして繋げる事が出来るという事です。
(下記のケースを参照)

01224,”066 “,”0660005″,”ホッカイドウ”,”チトセシ”,”キョウワ(88-2、271-10、343-2、404-1、427-“,”北海道”,”千歳市”,”協和88-2、271-10、343-2、404-1、427-”,1,0,0,0,0,0
01224,”066 “,”0660005″,”ホッカイドウ”,”チトセシ”,”3、431-12、443-6、608-2、641-8、814、842-“,”北海道”,”千歳市”,”3、431-12、443-6、608-2、641-8、814、842-”,1,0,0,0,0,0
01224,”066 “,”0660005″,”ホッカイドウ”,”チトセシ”,”5、1137-3、1392、1657、1752バンチ)”,”北海道”,”千歳市”,”5、1137-3、1392、1657、1752番地“,1,0,0,0,0,0

両者2点について、簡単ですが自分なりに考察してみました。
先ず前者の方法ですが、2010/2/26現在の郵便番号データでは例外が2ケースほどあります。
※以下のデータです。

27142,”59001″,”5900111″,”オオサカフ”,”サカイシナカク”,”ミハラダイ(2チョウ11-7・9-17・21、3チョウ59-2-18・21-25、”,”大阪府”,”堺市中区”,”三原台(2丁11-7・9~17・21、3丁59-2~18・21~25、”,0,0,1,1,0,0
27142,”59001″,”5900111″,”オオサカフ”,”サカイシナカク”,”4チョウ60-1・107-3-12・16-21)”,”大阪府”,”堺市中区”,”4丁60-1・107-3~12・16~21)”,0,0,1,1,0,0

44203,”871 “,”8710046″,”オオイタケン”,”ナカツシ”,”カナヤ(ウエノチョウ、ナカノチョウ、ニシノチョウ、ホンマチ、ミナミノチョウ、”,”大分県”,”中津市”,”金谷(上ノ丁、中ノ丁、西ノ丁、本町、南ノ丁、”,0,0,0,1,0,0
44203,”871 “,”8710046″,”オオイタケン”,”ナカツシ”,”モリノチョウ、ヤマノカミ)”,”大分県”,”中津市”,”森ノ丁、山ノ神)”,0,0,0,1,0,0

上記2つのデータは、フラグ4(赤字部分)が1であるにも関わらず、複数のデータに分割されています。

また、後者については2009年7月現在は例外は無いようです。

上記の内容からすると、前者においては、この様な例外が発生している事から、フラグ4についての信頼性は現時点では低いと言えます。
※記事が書かれた2005/11/24時点では例外が無かったのかも知れませんが、その後例外が発生した可能性があります。
 当時のデータが無いので断定はできませんが・・・

とすると、現時点では後者の方が信頼性が高いと言えます。
ただ、これを示す明確な根拠が日本郵便より出ていないので、いつの日か例外が発生するかもしれません。

結果として郵便番号データをマージする際には、上記の様なクセに気につける必要があるという事です。
現実的には後者の方法がベストと言えますが、人の目で日々例外が発生しないかチェックする必要もありそうな感じでした。

上記のケースを考慮した結果は、郵便番号検索 -zipnavi-にて実際に確認できます。