郵便番号検索サービス構想~検索エンジン作成~

郵便番号検索エンジンの作成を始めて早3ヶ月。
完璧ではありませんが、検索エンジンとしてはまずまずの精度が出ました。
※とりあえず検索エンジンのみ作成して、Windowsアプリケーションとして動作確認中。

ただ今回作ってみて、一概に郵便番号検索といっても、日本郵便が提供している
住所データで検索を行なうには、多くの考慮するパターンが必要である事に気付きました。
その一部の例を紹介します。

●日本郵便の住所データ(以下の例は、「郵便番号」 : 「対応する住所」を
示す)
1.住所が範囲指定になっているケース
【例】060-0905 : 北海道札幌市東区北五条東(4~7丁目)
これは、以下の4つの住所を含むという意味のようです。
北海道札幌市東区北五条東4丁目
北海道札幌市東区北五条東5丁目
北海道札幌市東区北五条東6丁目
北海道札幌市東区北五条東7丁目

2.町域以下の名称がカンマで区切られているケース
【例】010-0101 : 秋田県潟上市天王(追分、追分西、上北野、長沼)
これは、以下の4つの住所を含むという意味のようです。
秋田県潟上市天王追分
秋田県潟上市天王追分西
秋田県潟上市天王上北野
秋田県潟上市天王長沼
秋田県潟上市 地図(住所一覧から検索) :マピオンで実際の住所を確認したところ、上記4つの住所が実在した為、その様な意味だと思いました。
※ちなみに「秋田県潟上市天王(追分、追分西、上北野、長沼)」という住所は存在しませんでした。

また、検索条件を入力する側も、必ずしも正しい住所を入力してくるとは限りません。
例えば以下の様な例が挙げられます。
●検索条件を入力する側
1.検索条件として入力する住所が曖昧であるケース。
同じ「よつや」と言う地名でも、入力する人によっては「四ッ谷」だったり、
「四ツ谷」だったり、更には「四つ谷」という文字を入れてくる場合もあったり・・・

2.検索条件として入力する住所の情報が一部欠けているケース。
港区芝公園4-2-8、東京都港区芝公園
※都道府県が抜けている。丁目以下が抜けている。

検索エンジンを作成するに当たり、上記パターンをどこまでを考慮して、更には日本郵便が提供している住所データと、どの様に付き合わせるか?
恐らくこの対応には完璧な仕様は無く、作り手の目的や工夫によって、どの様にも作る事が出来るのでは無いかと思いました。

郵便番号検索のサイトはいくつも存在しますが、色々調べていく中で、同じ住所で検索を行っても結果が違う場合があるのは、この様な理由があっての事だと思いました。

逆に言えば、目的を明確にし、更に工夫して作る事で、その目的に応じた精度の高い検索エンジンが作れるという事も意味します。
今まで紹介した郵便番号検索のページはどちらかと言うと、住所の一部(キーワード的なもの)を入力して、ヒットした住所の一覧の中から該当する郵便番号を探すというタイプのものが多かったですが、

自分が作ろうとしているのは、あくまで入力された検索条件に対して該当する住所を1つに絞り込む事。

もちろん絞り込めないものは複数件になってしまうのは仕方がありませんが・・・

試しに前の記事でベンチマーク対象とした、郵便番号を検索 – goo郵便番号で、同じ検索条件による検索結果を比較してみました。

【例1】
北海道札幌市東区北五条東5-99-テスト11
※番地、及び号は実在しません
●goo 郵便番号の場合

060-0905 北海道札幌市東区北五条東(4~7丁目)
065-0005 北海道札幌市東区北五条東(8~17丁目)

2件ヒットします。
実際の結果はこちらで確認できます。

●今回作成した郵便番号検索の場合

⇒1件に絞り込まれてヒットする。

上記の結果からgoo 郵便番号は「丁目」までは見ていないと思われるが、今回作成した検索エンジンは「丁目」までを意識して作りこんでいる為、1件に絞り込めています。
ただこれには欠点があって、検索結果を1つ絞り込むように作り込んでいる分、該当しない住所(間違って指定した住所なども含む)を入力されると、検索結果が0件になってしまう可能性が高いのです。

【例2】
北海道札幌市東区北五条東1-99-テスト11
※「1丁目」は日本郵便の住所データには存在しない丁目
●goo 郵便番号の場合

060-0905 北海道札幌市東区北五条東(4~7丁目)
065-0005 北海道札幌市東区北五条東(8~17丁目)

2件ヒットします。

結果はこちらで確認できます。

●今回作成した郵便番号検索の場合

⇒0件になってしまう。

これはある意味当然の結果と言えますが、使い手の立場に立って見れば、間違っていた場合は「それに近い住所」を提示してあげるのも、利便性の向上になるという見方もあります。

この辺は今後考慮すべき課題かと思います。
というか現在対応方法を検討中。。。

とりあえず、現時点ではこんな感じに仕上がっているので、そろそろweb公開の準備に入ります。
検索エンジンの方はまだ中途半端な状態ですが、web化した際に、若干手が入る可能性があるので、その辺は徐々に直しながらweb化を進めていく事にします。

カテゴリー: flashcast, zipnavi, 郵便番号検索 パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です