5号館を出て

shinka3.exblog.jp
ブログトップ | ログイン

読者の性別・年齢構成解析

 情報通のマルセルさんが、大西さんのブログ経由ということで Microsoft の Demographic Prediction という利用者の年齢・性別を解析するソフトの公開版で遊んでいます。

 私のサイトもマルセルさんに解析されて遊ばれていたので、私もちょっといじくってみました。

 使い方は極めて簡単で、解析したいサイトのURLを入れて下にあるURLラジオボタンを押してGoするだけです。マルセルさんの記事によると、おおむね男性優位のブログ読者の中で私のところとマルセルさんのところは意外にバランスの良い性比を示していたのも、私の心をくすぐったのかもしれません。

 とりあえず、このサイトを解析してみました。
読者の性別・年齢構成解析_c0025115_22451898.jpg
 読者のうち、男性が58%で女性が42%、青の棒グラフで示されている一般的ウェブ利用者と比べると18歳以下の割合が倍以上と多いことを除くと、だいたいウェブの平均的利用者と同じようなプロファイルであることがわかります。年齢構成も18-24歳が最大の割合です。

 次に、同じく私が中心となって作っている、春にやったサイエンスカフェのサポートブログを見てみましょう。
読者の性別・年齢構成解析_c0025115_22484253.jpg
 男女比はそれほど変わらないのですが、年齢構成が大きく違います。5号館のつぶやきの読者の中心が18~24歳なのに対して、こちらは35~49歳とかなり年上なのです。確かに、サイエンスカフェにいらっしゃっていた方々を思い浮かべると、年齢構成が高いということはうなずけます。

 次に、私の研究室のホームページです。
読者の性別・年齢構成解析_c0025115_22513712.jpg
 これまた非常に興味深い結果が出ました。年齢は18歳以下が主になり、男女比も男性が圧倒的に多いのです。確かに、研究室のホームページを見るのは大学受験生がかなり多いことは感じておりました。しかし、男性が女性の倍もいるというのはどういうことでしょう。研究室訪問や体験入学をする高校生はどちらかというと女性が多いのですが、ひそかにネット検索で研究室のリサーチをしている男性が多いということなのでしょうか。あるいは、研究室のホームページがアフリカツメガエルの飼育サイトとして有名であることで、両生類マニアのアクセスが反映されているのかもしれません。

 というわけで、遊びのつもりでやってみた「解析」なのですが、これはひょっとするとマイクロソフトはかなり正確にネットユーザーの動向をつかんでいるのかもしれないという恐怖も感じました。

 ここでは年齢と性別しか公開されていませんが、もちろんそうしたユーザーがどんな本を読んでいるかとか、どんな音楽を聴いているかとか、どんな趣味を持っているのかということも解析されていることは間違いありません。そして、データの数が大量になってくると、意外なほど正確にネットユーザーの動向がわかってしまうでしょう。ということは、マイクロソフトが(もちろんグーグルはもっと)たくさんの情報を手にしていることを示しています。

 さて、この状況を手をこまねいて見ていて良いものかどうか、またひとつ問題を発見してしまった気分です。う~ん。

【追記】
 riverparadeさんも、早速ご自分のサイトを解析してくれました。若い男性とシニアの男性に人気のようで、さすがです(^^;)。
Commented by のりこ at 2006-08-17 07:06 x
はじめまして のりこです。 なかなか面白いデータですね。
Commented by 大西宏 at 2006-08-17 11:14 x
いろいろなサイトでやってみましたが、女性比率がかなり高いほうだと感じます。あまいアクセス数の多くないブログでも統計がでてきて、ほんとうにかなり正確に動向をとらえているのじゃないかという感じがします。
なにか不気味さを感じるとともに、ニールセンやニールセンと組んでいるネットレイティングなどにとっては脅威じゃないかとも感じています。
Commented by のりこ at 2006-08-17 11:54 x
ちょっと不気味かも。ブログ使用がなぜ無料なのかわかるような気がしてきました。もぅ遅いって!?。
Commented by さなえ at 2006-08-17 12:06 x
私は特定されるのを避けるため、生年月日も趣味もすべてでたらめを登録してデータを攪乱しています(^^;)。警戒心が強すぎるくらいがちょうどいいかもしれない。
Commented by stochinai at 2006-08-17 17:31
 その気になれば、個々人を特定していろいろなデータを集めることもできるのでしょうが、おそらくマーケティングでそこまでやる暇な人はいないでしょうから、オタクなSEでもいない限り個人に被害が及ぶということはめったにないと思います。しかし、誰かが「その気」になった時には恐ろしいことになりそうな気はします。一般のネットでなら、さなえさんのような注意もできるでしょうが、身元情報を知らせて入るソーシャル・ネットワーキングなどのデータが、オタクやストーカーに狙われたらかなり危なそうですね。

 それにしても、どうやって調べているかわかりませんが、大西さんのおっしゃるとおり、かなり正確な値を出してきているような気はしますね。恐るべしネットの力です。
Commented by マルセル at 2006-08-17 20:04 x
企業が自社のサイトにタダで登録させることの意味が皆さん掴めたのではないかと思います、そういう情報を握っていると明らかにすることでカネが入ってくるワケなんですね、企業の倫理が要求されるトコですが、一番怖いのはそこに官憲が絡んでくることですね、まあお隣はその権化でございますが...
Commented by stochinai at 2006-08-18 02:02
 その通りですね。世の中にタダのものなどなく、必ずなんらかの形で対価を徴収されているということが良くわかります。それを前提にした上で、データを不正に使われないように監視することを続けていかないと、そのうちにとんでもない事件が必ず起こるということですね。(監視していても、起こりそうですが、、、。)
Commented by riverparade at 2006-08-18 08:14 x
おはようございます。
TBしたんですけど、うまくいきませんでした・・・
またあとで試してみます。
by stochinai | 2006-08-16 23:11 | コンピューター・ネット | Comments(8)

日の光今朝や鰯のかしらより            蕪村


by stochinai