ここで使っているのはWeb解析、Webのアクセス、UserAgent設定の3つ。
class String def _getUrl url = URI.encode(self) s = [] useragent = getAgent open(url, "User-Agent" => "#{useragent}", "Accept-Language" => "ja;ja-JP;en;en_US;de").each{|d| s.push(d) } s.join("") end def getAgent "Illyasviel/0.1a; von Einzbern (2004/01/30)" end end ######### begin doc = Nokogiri.HTML("https://ja.wikipedia.org/wiki/流星人間ゾーン"._getUrl) r = [] doc.xpath("//p").each{|d| r.push(d.inner_text.gsub(/\[\d+\]/,'')) } print r.join("\n") rescue => ex p ex end
illyasviel@ruby20190507:~$ ruby test.rb
『流星人間ゾーン』(りゅうせいにんげんゾーン)は、1973年(昭和48年)4月2日から同年9月24日まで日本テレビ系で毎週月曜日19:00 - 19:30に全26話が放送された、東宝映像制作の特撮テレビドラマ、およびそれに登場する架空のヒーロー。
:
(以下略)
illyasviel@ruby20190507:~$