a hrefが置き換えられていないので実際のリンクはfc2に張られている問題。
http://blog-imgs-63.fc2.com/d/o/t/dothiko/desktop.jpg ← 本当の画像のURLhttp://blog-imgs-63.fc2.com/d/o/t/dothiko/desktops.jpg ← サムネイルのURL
もしかしてthumbnailの日本語読みでのsamneilな感じでsなんだろうか?スモールのs?
しかしsがつく画像はどうなるのだろう…って普通にssにすればいいだけかw
そして、
a href="" においては、
a href="http://blog-imgs-63.fc2.com/d/o/t/dothiko/desktop.jpg/"
というようにされている。
されていない。
スラッシュ付きのはアルバム表示で、しかもblog-imgsでは始まらずブログid(dothiko-)で始まる。
はいはいはい、だいたいわかったぞ、と。
つまりこうだ。
まずblog-imgs-\d+.fc2.com/d/o/t/dothiko/は変わらないようだ。
数字は変わりうるっぽい。
で、それでマッチしたらfc2の画像と判定する。
そして、
- img srcがa hrefにsを付けたものであった場合は、「デカイ画像とサムネイル」のパターン。
- img srcとa hrefが同じ場合は、「小さい一つの画像」のパターン。
- a hrefがblog-imgsで始まらない(ブログidで始まる)、末尾にスラッシュの時はアルバム表示
1の時はその2つを処理し、2の時はひとつだけとする。
正規表現パターンは
blog-imgs-(\d+)\.fc2\.com/d/o/t/dothiko/(\S+)
みたいな感じ?これをベースに詰めていくか。正規表現は苦手や…
3の時はまさかスクレイピング?と思ったが、よく考えたら別にそこまでする必要はない。aの配下のimgのsrcを見てfc2であれば(それがサムネイルであればsを取り除くなどして)、単にデカイイメージを推測してダウンロード(失敗したら諦めて次へ行く)、アップロード、はてなフォトライフにリンクという事をするだけだ。
しかし、先は長いなこれは…