2017年08月07日

クリスチャン・ラダー(2016.8)『ハーバード数学科のデータサイエンティストが明かす ビッグデータの残酷な現実』ダイヤモンド社

 オーツが読んだ本です。「ネットの密かな行動から、私たちの何がわかってしまったのか?」という副題が付いています。
 著者のラダー氏は、アメリカにある「Okキューピッド」という出会いサイトの創始者です。出会いサイトですから、若い人を中心にたくさんの人が登録し、アクセスしています。その出会いサイトのデータを基に、どんな人がどんな人にメッセージを送るのか、その分析を書いています。
 いわゆるビッグデータの分析といっていいでしょう。
 結果は驚くべきものです。
 いくつものおもしろい分析結果が載っていますが、その中からほんのいくつかを紹介しましょう。
 pp.35-46 には「ウッダーソンの法則」が多数の図とともに説明されています。各年代の女性が「最も魅力的」と思う男性の年齢を調べると、だいたい同年齢を挙げる傾向にあります。20代の若い女性は少し年齢が上の男性を魅力的と思い、40歳くらいから上の世代の女性は少し年齢が下の男性を魅力的だと思っています。一方、男性から見ると、どの年齢層の男性も20代前半の若い女性を魅力的と考えています。ただし、実際に男性が女性を検索したデータから見ると、男性はほぼ自分の年齢と同じ女性を検索しているというわけです。男性が実際にメッセージを送った女性の年齢を見ても、同世代の(あるいはやや若い)女性となっています。オーツは、こんなデータを見たことがありませんでした。まさに「残酷な現実」です。
 pp.61-77 では、ツイッターと OEC (Oxford English Corpus) でどんな言葉が使われるのかを調べています。OEC を標準と考えると、ツイッターの特徴(どんな単語がツイッターでよく使われるのか)がわかります。pp.62-63 によれば、rt, love, more, today, twitter, ……だそうです。納得です。さらに、Okキューピッドのデータを基に、キーを押した回数と送信メッセージの長さの分析もしています。こうしてコピペの実態がわかってきます。コピペして異性にメッセージを送ることは意味があるのでしょうか。そんな分析もされています。
 pp.92-100 では、一時的に(7時間だけ)プロフィールから写真を削除する「実験」をしています。すると、新しい相手と会話を始める頻度がその時間だけぐっと下がったということです。外見の重要さがうかがい知れます。
 p.102 から人種の話が出てきます。アメリカでは絶対に口にされない(できない)話題です。人種を、アジア人、黒人、ラテン系、白人の4種類に分けると、Okキューピッドで男性が女性を評価する際、どの人種の男性からも黒人女性が低く評価されていることがわかります。まさに衝撃的事実です。Okキューピッドの人種構成を見ると、p.109 によれば、アジア人 6%、黒人 7%、ラテン系 8%、白人 80%です。白人が圧倒的に多いわけですが、各人種がたった数%しかいなくても、実数にすれば相当な数になるわけで、こんな分析が可能になるということです。一方、p.114 では、女性が男性を評価するときは、同じ人種を高く評価し、また白人を高く評価するという結果が出ています。
 p.122 からは、美しい人がトクをする傾向は、加速しているとのことです。
 p.162 からは、自己紹介の文章の中で、人種ごとにどんな単語を多く使うかという集計結果が出てきます。全体としてはジップの法則に従うことを確認したあと、人種ごとの集計結果が示されますが、はっきりと人種間の違いが認められます。
 まだまだありますが、このくらいにしておきましょう。本書は多数のグラフや表を示しながら、データに基づいて議論を進める態度で一貫しています。大変おもしろい本でした。
 いろいろな人に読んでもらいたいと思いました。



参考記事:
http://www.tachibana-akira.com/2017/07/7658
posted by オーツ at 04:22| Comment(0) | | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。