open-uriを使ってみる。

http経由でファイルを取得し、HTTPステータス、ファイル内のURIを抜き出す。

require 'open-uri'
require 'uri'

open("http://localhost/hoge.html") do |file|
  p file.base_uri
  p file.status
  p file.meta
  p file.charset
  p file.last_modified
  p file.content_encoding
  file.each do |line|
    URI.extract(line, "http") do |ext_uri|
      p ext_uri
    end
  end
end

「オー、何て簡単なんだ、信じられるかいジョン」と深夜のテレビショッピングの外人司会者が出現しました。それくらい簡単です。