砂の声

はてなという無名都市を彷徨う旅人の記録。・・・・・・という厨二設定で行う、はてなサービスの不平不満ネタアイデア等書き連ねるブログです。

微妙な所が・・・・・・

はてなIDがクッキーで約50サイトに送られていた話 - こせきの技術日記」を見て。 なかなか微妙な話だなあと思った。 あまりCookieの問題ではない。それはわざわざセットしているだけだし。他のサイトのCookieにアクセス出来るわけではなく、はてながIDをRefererで出しているのが問題なだけだ。

ここは、例えばhttpsにしてしまったりしたら出なくなるがそれははてなとしては「はてなブックマークからのアクセスですよ」という情報をサイトに配ることができなくなる。それは多分商売上困るんではなかろうか。存在感を示すという意味で。 自分は、自分のブラウザからはGoogleAnalyticsには情報を流していない。が、Refererは流していて、Refを殺してはいない。

「参照先であるサイトでは、はてなIDを類推で取得可能である」のは確かだ。 が、普通は「はてなIDと認識して」データとして蓄積している訳ではないだろう。

Gunosyのは、問題が分かりやすいレベルで「TwitterのIDと紐付けられているので、TwitterとGunosyで収集した嗜好の情報が紐付いている」んだけど、一応設定で非公開に出来る。 デフォルト非公開にしろよ、とは思うが、ダダ漏れ発想で構築する人は多い。

さて。

ここからが本題なんだけど、 RefererのURLのページの内容(マイホッテントリ?とか?自分の場合だと「お気に入り」なんだけどね)を統計に使うことは多いだろう。 となると、自然、自分好みの記事のサマリが入ってきたりコメントが入ってきたり最低でもタイトルが収集されてしまっているという事になる。 「貴方の趣味嗜好自体は十二分に取得される」。貴方がどんな人であるか、を、はてなIDを意識せずにかなり収集され統計に使われてしまうということである。 それ自体は実に真っ当なこと。ただ、はてなIDと認識されないがページに組み込まれている単語としてキーワードとして扱われる可能性はなきにしもあらず。ただし、今の所そこまでページ解析してカテゴライズして判断するにはマシンパワーもたんないしやってられないとは思う。

ただ、ここに、「はてな村」という分類が成立している可能性は・・・・・・ あると思います。 現実には背景の分類は決め打ちだろうけどねー。