web.archive.org のURLはどうなってるのかを見てみる
web.archive.org のインターネットアーカイブがとても便利。
著作権云々だとかで魚拓サービスはとても使いにくいので、アーカイブから取るのが良い。
基本的なURL
基本的はURLは日付+取得したいURLになってる
たとえばヤフオクの 20170225084900 のデータを見たい場合
http://web.archive.org/web/20170225084900/http://auctions.yahoo.co.jp/
日付の指定を省略して、どの日付のアーカイブがあるか調べる
http://web.archive.org/web/*/http://auctions.yahoo.co.jp/ http://web.archive.org/web/http://auctions.yahoo.co.jp/ # または
特定月の最新版を取りたい
日付を省略すれば、その月の最新版の付近が取れる。
http://web.archive.org/web/201303/http://auctions.yahoo.co.jp/
特定年の最新版を取りたい
月日を省略すれば、その年の最新版の付近が取れる。
http://web.archive.org/web/2013/http://auctions.yahoo.co.jp/
取り敢えずこの辺ください
存在しなくてもその前後の日付で、アーカイブが存在する一番近い日付にリダイレクトしてくれる。
## あるかないか知らないけど、20130315 のデータくださいってリクエスト http://web.archive.org/web/20130315/http://auctions.yahoo.co.jp/
画像があるの?
画像も同じようにURLを指定すれば取れると思う。
http://web.archive.org/web/20040610050213/http://example.com/sample.jpg
ただし、ページに埋まってる画像は次のようなURLで取得されることになる。
## 20040610050213のhttp://example.comが存在する場合で、その中に埋まってる画像のURL http://web.archive.org/web/20040610050213_im/http://example.com/sample.jpg
なんなら、FLVとかもあったりする。
InternetArchive は大切にしたいプロジェクト。
InternetArchiveのwayback machine はいざという時に貴重。
WebArchiveプロジェクトは、ストレージや転送量が大変なプロジェクトだとおもう。でもとても救われることが多い。
なので少しばかり応援してさせていただいた。