スーパーのWEBチラシ更新をスクレイピングで確認した


こんにちは。主夫になりたい @nullpopopo です。先日、近所のスーパーのページ取得がうまくいかず、特売情弱になりかけていましたが、CHIRASHIGETTERを作って近所のスーパーのサイト更新を検知してチラシの収集ができるようになってから、食生活のコスパが改善するわ健康的になるわモテまくりでリア充ライフを満喫するわでもう大変ですよ。まぁ、最後はウソなんですけどね。

で、うちから歩いて行くのが苦にならない範囲のスーパーは東急ストア、ライフ、フジマート、まいばすけっと、オオゼキ(最近できた)、サミットなんですが、東急ストアとライフとフジマートのチラシはどこかのASPを使っているようで、チラシのPDFへのリンクがFlashだったんですよね。これだと解析できないのでちょっと諦めて、まいばすけっとはそもそもチラシがWEBに公開されてなかったので、今のところ解析できたのはオオゼキとサミットです。で、解析に使ったコードはこちら

オオゼキとサミットは店ごとのページにチラシのPDFファイルがリンクされているのですが、表と裏で別ファイルになっているので、HTMLソースからファイル名を抜き出してリンクを生成してダウンロードし、表裏のPDFを1つのファイルにまとめてDropboxへ保存するようにしました。こうすることで、スマホの上下スクロールだけでチラシを見ることができてなかなか便利です。スマホ片手にチラシ見ながら買い物できるっていいですねー。

20150507_chirashigetter-dropbox-ios

 

20150507_chirashigetter-dropbox

あと、ページの更新を検知したときだけメールを飛ばしてフラグファイルを生成するようにしたので、GmailのラベルやDropboxの更新検知とIFTTTあたりを組み合わせれば面白いことできそうですね。

20150507_chirashigetter-mail

それでは、また!

[amazonjs asin="4785504846" locale="JP" title="コトPOPを書いたら あっ、売れちゃった!"]