Pages

March 06, 2010

Tumbler Photoバックアップスクリプトを作ったのだが…

DL→Ziped→配布までするスクリプト書いたんだけど、I/Oがネックで時間かかりすぎた。
なので、キューリスト作成だけでいいかと、コード書き直して実行したのですが、拡張子判定のために頻繁にI/Oでやっぱり時間喰う。 
700位Photo投稿数あると10分くらいかかるw(最適化できるところはしたのだが
ただ、URLだけで良いというのであればAPIにアクセスするだけなのでそんなに時間はかからなかった。
でも、拡張子判定されていないので各自で行って貰わなければいけないのだけれど。
といううことで、クローラー作れば、いいんじゃね?って展開になったのだが。
クローラー作る知識なくて\(^o^)/状態w
幸いなことにPythonには数多くのモジュール&情報が流れているので何とかなりそうなんだけど。
一から作ることになったら、ついったーの皆さんに聞きまくりながらどうにかしたいところw(人頼み
URLリストだけで良いよってかたがいたら、CGIにして公開しようと思います。

0 コメント:

Post a Comment