Ruby

情報

ここで使っているデータ

ここで使っているのはWeb解析、Webのアクセス、UserAgent設定の3つ。

関連リンク

コード

class String
 def _getUrl
   url = URI.encode(self)
   s = []
   useragent = getAgent
   open(url,
     "User-Agent" => "#{useragent}",
     "Accept-Language" => "ja;ja-JP;en;en_US;de").each{|d|
     s.push(d)
   }
   s.join("")
 end
 def getAgent
	  "Illyasviel/0.1a; von Einzbern (2004/01/30)"
 end
end

#########

begin
 doc = Nokogiri.HTML("https://ja.wikipedia.org/wiki/流星人間ゾーン"._getUrl)
 r = []
 doc.xpath("//p").each{|d|
	  r.push(d.inner_text.gsub(/\[\d+\]/,''))
 }
 print r.join("\n")
rescue => ex
 p ex
end

出力例

illyasviel@ruby20190507:~$ ruby test.rb

『流星人間ゾーン』(りゅうせいにんげんゾーン)は、1973年(昭和48年)4月2日から同年9月24日まで日本テレビ系で毎週月曜日19:00 - 19:30に全26話が放送された、東宝映像制作の特撮テレビドラマ、およびそれに登場する架空のヒーロー。

:

(以下略)

illyasviel@ruby20190507:~$


トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-10-07 (月) 14:44:45