« 2005年08月 | メイン | 2005年10月 »

2005年09月23日

|append.gif このエントリーを含むはてなブックマーク | delicious.gif | この記事をクリップ!

大久野島

9月の頭に、夏休みをとって広島県にある瀬戸内海の島「大久野島」に行ってまいりました。
34/18/18.872,132/59/48.884
大久野島は、瀬戸内海の国定公園内周囲4キロ程度の島ですが、戦前に陸軍の毒ガス工場があったため現在は無人島になっています。
 島内に国民休暇村があるため定期船が就航しており、休暇村の滞在者以外にも、キャンプや海水浴、釣り目的の人も来ているようです。

 この島は、毒ガスの島として廃墟マニアにもそこそこ有名な場所なのですが、それ以上に島内にいる大量のウサギが有名で、バニーラバーズのプロミストランドとしてその名を馳せています。もちろん、大のウサギ好きで廃墟も嫌いではない私にとっても行きたかった場所のひとつです。

というわけで、ウサギ写真。

at bunny island 9
カメラチェック

at bunny island 10
何か食べ物クレー


at bunny island 8
ズボンもよじ登る。

at bunny island 5
ウサギインフレ

at bunny island 4
集合かけたら、集まります。

at bunny island 6
もちろん立ちます。

この島に2泊しましたが、散歩しているだけで大量のウサギが近寄ってくるは、道路わきで立ち止まっていると山からウサギが脱兎の如く下山してくるわ、もう堪らないシチュエーションの連続で悶え死ぬかと思いましたよ。
まさにウサギ好きの聖地。また行きたくて行きたくて、夢でうなされてます。

投稿者 nishioka : 11:32 | コメント (0) | トラックバック

2005年09月14日

|append.gif このエントリーを含むはてなブックマーク | delicious.gif | この記事をクリップ!

インチキGeocoderプレビュー

先ほどBLOGにアドレスマッチングのSOAP版があるというタレコミ情報を頂きました。
http://www.geoap.jp/service/trial/trial_adrmatch.htm
日本にもついにSOAPのGeocoder誕生ですね。

実は私もひそかにMySQLを使ってGeocoderを作っておりまして、予定では10月くらいまでにテスト版RESTを公開してみたいと思っていたのですが、いつのまにか日本語GeoCoderのWebサービスがいろいろ出てきているようなので、私もちょっぴり頑張っていることをアピールすべくちょっことだけ公開。

http://ws.podzone.net/share/test.cgi
http://ws.podzone.net/share/geocoder.cgi( 改良版 追記参照)
(自宅サーバなので落ちている可能性あり)

住所を入力していただき、データベースに問い合わせて、住所の位置がわかった場合に、GoogleMap API上に表示します。(つまり出来の悪いGooge Mapsの住所検索ですな)
GoogleMap上に吹きだしとして、その住所が正しいかどうかの確認画面がでますので、正しい場合Yes,違う場合はNoをクリックすると返却した住所データが正しいかどうかの情報をサーバに蓄積します。このデータは今後の修正時の参考にします。
※測地系の問題で、GoogleMaps上のアイコンを表示する際に新座標の位置データから旧座標に一律平行移動させていますので数メートル程度の誤差があります。

Google Localや他の商用サービスそして、東大のアドレスマッチングサービスの精度に比べるとまだまだ使い物にならない(今のところ精度が6割強くらい)とは思いますが、プレビューということで弄って頂いてフィードバックしていただけると幸いです。


このGeoCoderの実装について
MySQL+Python+Mecabを利用しています。入力した住所を分かち書きし、それをMySQLの全文検索を使い、一番マッチした住所の緯度経度を返す方式です。この方法は、検索速度が速く文章の揺らぎには強いものの100%の精度を出すことは出来ませんが、Mecabが利用している辞書(ipadic)を住所専用にチューニングしていくことにより徐々に精度を上げていくことができると踏んでいます。(あと、マッチング処理をDBとMecabにやらせるのでプログラムが短いためメンテナンス性も良いと思われる)
問題点・課題も多くありそうですが、その辺をこれから洗い出していき、使えるレベルになりそうでしたら、Webサービス化します。


対応する予定のバグ(直す予定)


  • 県から入力しないとダメな場合がある

  • 郡部の実装がダメダメ

  • 市町村合併への対応。

  • 丁目を省いた表記


対応方法が未定の問題(無理かな?)

  • 略字の対応(竜・龍などの)


9/20 追記

先ほど気づいたのですが、
Geocoding.jpさんも動き出していますね。精度が全く違います。商用データを使っているようなのでかなり精度が高いです。完敗ですなorz...
(Google先生とほぼ同じような動きをしているような???)

完敗していますが、まああきらめずに、ちょこっとだけ精度を上げたバージョンを提供してみます。
私の作ったテストでは、市レベルでは9割以上の精度が出ていると思います、これ以上の精度向上は、とても泥臭い作業になりそう...
あと、hogemanさんのコメントのとおり、郡レベルでは思いっきり使い物にならん悪寒。役場の住所の街区情報ですら全国の半分も入っていないんじゃないでしょうか?


  • 郡・町村に対応

  • 9月前半までの合併に対応

  • 1-1-1を1丁目1-1に置き換え

投稿者 nishioka : 12:21 | コメント (3) | トラックバック