mayutan's blog

日常の!おもいのたけを!

なんて美しいスープ!

所用でスクレイピングしようかなーというときにちょっと調べたら
これがいいらしい。 BeautifulSoup

さっそく試してみますた。まずインストールですよねー

pip install beautifulsoup4

これだけ。
ウェッブさいとからデータほしいわよねーってことで file_get_contents みたいなの探したら
これ?これでいいの? urllib
標準関数がたくさんあって phper にも優しいですね。ぱいそん。
って思ったけどこれ deprecated なのね。

さっそくここを見ながら適当に urllib.urlopen(url) したやつを BeautifulSoup にわたしてやる。

 soup = BeautifulSoup(urllib.urlopen(url))

すると soup にはぺろんと html が入ってる。凄い簡単。じゃーん☆