Log of ROYGB

はてなダイアリーが廃止されるので、引っ越しました。

Googleキャッシュの不思議

何らかの理由でインターネット上から消えてしまったものを見るのにGoogleのキャッシュを使う方法があります。Googleで検索した場合に「キャッシュ」というリンクがあるのでクリックすればGoogleが保存したページを見ることができます。
このキャッシュが無い場合もあるのですが、これはそのページがキャッシュされないような対応をしているからのようです。だからキャッシュが無い場合は、何らかの意図があるものだと思っていました。
しかし、特に意図しないでもキャッシュが無い場合というのもあることがわかりました。それはごく最近のページの場合です。Googleがクロールしたのが最近だと、何時間前とか場合によっては何分前とか時間が表示されています。
時間が表示されていてもキャッシュがある場合もあるのですが、現在に近い場合はキャッシュが無いこともあるようです。だからある時点でキャッシュが無くても、しばらく後に同じ物を検索するとキャッシュがあったりします。


(16日追記)
上で書いた現象に気が付いたのは、はてな匿名ダイアリーがきっかけ。
http://anond.hatelabo.jp/20080415192120
http://anond.hatelabo.jp/20080415220921


ブックマーク経由で上のアドレスに行ったら、すでに消えていました。そしてGoogleのキャッシュにあるかと検索したところ、検索結果にキャッシュがありませんでした。そのあとで、同じ内容と思われるものが新しくアップされていました。

これと良く似た現象が少し前にもありました。
http://anond.hatelabo.jp/20080406021437
http://anond.hatelabo.jp/20080406230043


これはhttp://d.hatena.ne.jp/finalvent/20080406/1207438094の「増田的 - finalventの日記」経由で知ったのですが、最初に紹介されていた上のアドレスを見に行ったときもすでに消えていました。そしてGoogleで検索してキャッシュがなかったのも同じです。このときは、なんらかの理由で消されたのかもと思っていました。消されたエントリーの右下に赤で表示されている被ブックマーク数が多かったのも、何かあるのではということを思わせました。今確認したら334usersとなっていました。ただこれは、トップページのhttp://anond.hatelabo.jp/へのブックマーク数を表示しているようなので、大量のブックマークが影響を与えたのではないことがわかりました。
そしてキャッシュがなかった上のアドレスを、しばらくしてから検索するとキャッシュが存在していました。その件と、今回の件を合わせて現在に近い検索結果にはキャッシュが無いのではという推測が生じたわけです。

もう一つわかったのは、はてな匿名ダイアリーに書いたものは消した後でもGoogleキャッシュに残っている場合があるということです。残る場合と残らない場合の違いの理由についてはよくわかりません。


(18日追記)
http://d.hatena.ne.jp/kossetsu/20080417/1208403335の「はてな匿名ダイアリーは書いてる人がバレバレ! - かむかむごっくん」に、はてな匿名ダイアリーに関する興味深いことが書かれていたので一部引用します。

はてな匿名ダイアリーはログインすると右上に「***(id名)の日記」というものが出て、クリックすると今まで投稿した記事の一覧が出てきます。urlは「http://anond.hatelabo.jp/***/」となりますが、もちろん本人以外が閲覧することはできません。しかし、どれか記事で誰か顕名の日記にトラックバックしていたとします。そのページでリンク先をクリックしたとします。するとこんな風に相手にバッチリわかってしまいます。

http://d.hatena.ne.jp/kossetsu/20080417/1208403335