それマグで!

知識はカップより、マグでゆっくり頂きます。 takuya_1stのブログ

習慣に早くから配慮した者は、 おそらく人生の実りも大きい。

URLにアクセス & ファイルを保存する(http get)

Python でURLにアクセスしてファイルを保存するには urlib2 を使うのが手っ取り早い

import os
import urllib2

file_name = "yahoo.co.jp.html"
url  = "http://www.yahoo.co.jp"

if os.path.exists( file_name ) :
  try :
    body = urllib2.urlopen( url ).read()
    f = open( file_name,  "w" )
    f.write(body)
    f.close()
  except URLError, e:
    print e
    exit()

print "end"

pythonwget を起動してもいいんだけど、ここは敢えて urllib2 を使ってまみした。

python でシェル・コマンド呼び出しは、ちょっとだけ面倒なので、ここはurllib2を使いました。

ファイルに保存するには

f = open( file_name,  "w" )
f.write(body)
f.close()

これだけですね。簡単。

bashwget でやる場合

file_name="yahoo.co.jp.html"
url="http://www.yahoo.co.jp"

if [ ! -f $file_name ]; then
  wget -q -O $file_name $url

こうやってみると、wgetbashシェルスクリプトで呼び出すのはとっても手軽ですね。