Ich habe hunger

あふりかエンジニア、アフリカ向けのB2BのSaaSを開発する

スクレイピング-その1-

とりあえず、スクレイピングの学習開始。
mechanizeとかseleniumとか色々あるんだけど、まずはopen-uriから。

open-uriはhttp/ftp に簡単にアクセスするためのクラス。
Kernel のモジュール関数(組み込み関数) open を再定義する。らしい。

# -*- encoding: utf-8 -*-
require 'rubygems'
require 'open-uri'

id = '074'

url = "http://www2.anzen.mofa.go.jp/info/pcinfectionspothazardinfo.asp?id=#{id}"
# url = "http://www.google.com"

# urlを開く
open(url, "r:utf-8") do |f|
  text = Array.new
  f.each_line do |line|
    if(/selected>.*<\/option>/ =~ line)
      p line
    end
    if(/現在、危険情報は出ておりませんが、/ =~ line)
      p "危険情報は出ていません"
    end
  end
  p "詳細は#{url}を見てください。"
end

ここでやってることは、外務省の海外の安全情報を取ってきて
危険情報が出ているかを出力するだけ。

    if(/selected>.*<\/option>/ =~ line)
      p line
    end

の部分は、選択ボックスで selectedとなっているところを判別して
ただただ表示させてるだけです。

で、これをidを固定じゃなくて、.timesで回せば
色んな国の危険情報を獲得出来ます。