なので、キューリスト作成だけでいいかと、コード書き直して実行したのですが、拡張子判定のために頻繁にI/Oでやっぱり時間喰う。
700位Photo投稿数あると10分くらいかかるw(
ただ、URLだけで良いというのであればAPIにアクセスするだけなのでそんなに時間はかからなかった。
でも、拡張子判定されていないので各自で行って貰わなければいけないのだけれど。
といううことで、クローラー作れば、いいんじゃね?って展開になったのだが。
クローラー作る知識なくて\(^o^)/状態w
幸いなことにPythonには数多くのモジュール&情報が流れているので何とかなりそうなんだけど。
URLリストだけで良いよってかたがいたら、CGIにして公開しようと思います。
0 コメント:
Post a Comment