#author("2023-11-16T11:33:33+09:00","default:yakumo_murakami","yakumo_murakami") #author("2023-11-16T11:33:58+09:00","default:yakumo_murakami","yakumo_murakami") [[今さらPython]] Pythonでもやりたいよね。~ とりあえずハローワールドしてみよう。 * 簡易サンプルコード [#z14460f8] #!/usr/bin/env python from bs4 import BeautifulSoup import urllib.request url = 'https://www.kantei.go.jp/' req = urllib.request.Request(url) with urllib.request.urlopen(req) as res: body = res.read() soup = BeautifulSoup(body.decode('utf-8'), "html.parser") print(soup.select("h1")) print(soup.select("title")) for x in soup.select("p"): print(x) 採取したものはリストで来るみたいね。 * 実行結果 [#l9907960] $ req.py [] [<title>首相官邸ホームページ</title>] <p>当サイトではJavaScriptを使用しております。ご利用のブラウザ環境によっては、機能が一部限定される場合があります。<br/>ブラウザの設定でJavaScriptを有効にしていただくことにより、より快適にご利用いただけます。</p> <p class="top-lead">#を押すことにより、関連するものに絞り込みます。</p> : (中略) : <p>首相が執務を行う首相官邸は、切り出したままの自然石、そして、強くしなやかにすっくと伸びた青い竹がシンボル。「和風」の 建築構想を大切に設計された、素材を生かした簡素で気品のある美しさがあります。</p> $