|
| ||||||||
|
巻き戻し中。
|
|
2012-10-21(日) バックアップとか [長年日記]
_ サイトマップ
久しぶりに更新した。
サイトマップ作成ツールを色々探したのだけど、ブログのページも入れたら2,000ページを越えているので、
フリーでページ数制限有りの物は使えないのが多い。
結局GSiteCrawlerを使ってみた。
除外リストで、cgiやrubyのページを除いて行くのだけど、それだけじゃ上手くない。
コイツのバグで、cgiの引数があると他のサイトのURLと合体してクロールしたりしちゃう。
「aborted URLs」を見て、除外を追加しながらエラー無しまで持って行く。
今回、tdiaryで週間や月間、カテゴリ別と言った「引数を持った」表示は全部排除。
それでも合計は2,618URLまで増えていた。
googleさんに喰わせて完了。
_ ツール
サイトマップジェネレータのエラーを見ながら、過去のブログの不正なリンクを削除したり修正したり。
実データのファイルを修正しても、ブログの静的htmlを再生成しないとだめ。
で、そのツールも叩くと7年分やるので、とんでもない時間かかるから改良。
期間を「本日−初日」じゃなくて「指定日−初日」に出来るようにした。
「date -j -vHogehoge」で手抜きするにはちょっと悩む必要があったり。
もちろん、「指定日1−指定日2」ってのも出来るけど、いいや、滅多に使わないしw
Tweets by RC31E | |||||||||
| |||||||||
| |||||||||
|