なんて美しいスープ!
所用でスクレイピングしようかなーというときにちょっと調べたら
これがいいらしい。 BeautifulSoup
さっそく試してみますた。まずインストールですよねー
pip install beautifulsoup4
これだけ。
ウェッブさいとからデータほしいわよねーってことで file_get_contents みたいなの探したら
これ?これでいいの? urllib
標準関数がたくさんあって phper にも優しいですね。ぱいそん。
って思ったけどこれ deprecated なのね。
さっそくここを見ながら適当に urllib.urlopen(url) したやつを BeautifulSoup にわたしてやる。
soup = BeautifulSoup(urllib.urlopen(url))
すると soup にはぺろんと html が入ってる。凄い簡単。じゃーん☆