2013年05月21日
友達には秘密にしておきたい『ビッグデータの正体』
ビッグデータの正体 情報の産業革命が世界のすべてを変える
【本の概要】
◆今日ご紹介するのは、先日の「未読本・気になる本」の記事でも注目されていた1冊。下記に挙げられていた面白そうな事例に釣られて読み始めたところ、300ページ超を一気に読破してしまいました!
アマゾンの内容紹介から一部引用。
我々の未来の生活、仕事、意識、すべてが「ビッグデータ」によって大きく変わる。
■なぜグーグルは複数の検索語と数式を組み合わせてインフルエンザの流行を予測できるのか■なぜアマゾンは社内の編集者や書評家をすべてお払い箱にして、データによる「お勧め本」システムを採用したのか■なぜ日本の研究者が集める「一人一人のお尻の形」のデータが「金の成る木」に変身するのか■なぜ「オレンジ色に塗られた中古車は故障が少ない」と判明したのか■なぜ電子書籍が発達すると「本」「読書」の概念が根本から変わってしまうのか?■なぜ今日の映画産業は、クランクインの前から「ヒット作」や「具体的な黒字・赤字」を予想できるのか?■なぜ「これからもっともセクシーで金を稼げる職業」は「データ・サイエンティスト」なのか
「ビッグデータ」ネタの本としては、ピカイチな予感!?
そして少々アレなタイトルは、「ホッテントリメーカー」作でございます。
いつも応援ありがとうございます!
【ポイント】
■1.因果関係より相関関係Pop Tarts / poolie
2004年、ウォルマートは過去の取引が蓄積されて巨大化したデータべースをじっくり分析し、1人ひとりの客がどの商品を購入し、いくら使ったのかだけでなく、買い物力ゴに一緒に入っていたものは何か、来店したのは何時か、さらにはその日の天気まで徹底的に調べ上げた。その結果、ハリケーンの到来が近づくと、懐中電灯の売上げが伸びただけでなく、「ポップターツ」(タルト生地に甘いクリームなどを塗った菓子で、米国の家庭では朝食などによく食べる)の売上げも増加しているという事実が判明した。そこで嵐が近づいた際には、店頭のハリケーン対策用品コーナーにポップターツも大量に陳列した。緊急時に客が短時間で必需品をそろえられるとあって、売上げ増大にもつながった。
■2.データを再利用する「リキャプチャ」
Thank you, reCAPTCHA / iriskh
リキャプチャでは、2つの単語を入力させる。1つめは従来のキャプチャと同じで、本当に人間が利用しているかどうかを確かめるための単語だが、2つめの文字列にちょっとした細工が仕掛けてある。この単語、コンピュータによる文書読み取り(OCR)業務で、うまく読み取れなかった文字列なのだ。OCRでは、原稿の文字にかすれがあったり、滲んでいたりすると、読み取リミスが発生する。コンピュータでお手上げだった単語を拾ってきて、リキャプチャで人間に読み取り作業をさせれば、正しい読み取りが可能なうえに、人間かどうかの認証もできるとあって一石二鳥。おまけに作業報酬もタダと来ている。
■3.開発費がかかっていないグーグルのスペルチェッカー
Did you mean "Complete Utter Bollocks"? / dullhunk
どういうことかというと、巧みなフィードバックの仕組みが用意されていて、ミススぺルしても「ユーザーが本来入力したかった単語は何か」をシステムに教え込む仕組みができている。ご丁寧にもユーザー自身が正しい答えをグーグルに「指導」することさえある。それは、検索結果の表示画面の上部に現れる「もしかして○○○?」の質問だ(○○○は正しいと思われる語句)。ここで正しい候補をクリックすると、その語句で再検索される。仮にクリックしてもらえなくても、その後ユーザーが実際に移動した先のサイトがわかれば、正しいスぺルを確認できる。そのサイトについて、正しいスペルとミススぺルのそれぞれの相関を取れば、どちらが正しいか一発でわかるからだ。
■4.新興サービスが既存サイトに勝てない理由
2010_01_08_amazon_1 / dsearls
現在、物販系ならアマゾン、ソーシャルサービス系ならフェイスブック、検索エンジンならグーグルのサイトがトップの座にあるが、ある日、創業まもない企業がこうした既存サイトをはるかに凌駕するサイトを立ち上げたとする。それでも、この新興企業は競争で相当苦労するはずだ。スケールメリットやネットワーク効果、ブランドの弱さだけが理由ではない。現時点での有力企業が強いのは、顧客の動きから収集したデジタル排出物があり、その成果をサービスに反映させているからだ。
■5.フェイスブックの本当の資産とは?
Facebook / Franco Bouly
株式公開の前日、フェイスブックの引受証券会社は公開価格を38ドルと決定、時価総額にして1040億ドル(10兆4000億円)になる。それだけでボーイングとゼネラルモーターズとデルコンピュータを合わせた額に匹敵する大型案件だった。実際の価値はどのくらいなのか。2011年の財務諸表によれば、帳簿上の純資産額は63億ドル(6300億円)。これはハードウェアやオフィス備品などの価値だ。同社が大切に保管している膨大な情報の純資産額はといえば、基本的にゼロ査定だ。フェイスブックの資産らしい資産はデータくらいしかないが、それでも帳簿上は対象外なのである。
■6.アップルが携帯電話に新規参入したのもデータのため
iphone 4 / Sean MacEntee
べンチャーも古株も新しいビジネス領域では大量のデータを取得できるポジションをめざしている。アップルが携帯電話に新規参入したのも、まさにこれが理由だ。iPhone登場前の携帯電話会社は、大きな価値を秘めた携帯電話利用データを加入者から集めておきながら、ビジネスに活用できなかった。一方、アップルは、携帯電話会社との契約時に、このデータの大部分を受け取ることを条件にしている。今やアップルは世界中の携帯電話会社数十社からデータを集めている。携帯電話会社1社では太刀打ちできないほどの膨大な携帯電話利用データがアップルに流れ込んでいるのだ。
【感想】
◆個々のポイントの引用量が多いのでこの辺で。いや、それにしても冒頭の内容紹介で、大ネタばかり拾われて困りました。
あのように「疑問形式」で取り上げられた場合、ここでその答え部分を明らかにしてしまうと、完全な「ネタバレ」ですから、必然的に「それ以外の部分」から引用せざるを得ません。
逆にそれらの答えを知りたくて、本エントリーを読まれた方には申し訳ないのですが、そういう方はやはり本書にてご確認を。
もっとも、「どれ」とは申しませんが、必ずしも明快な回答がないケースもあるのですが……。
◆というのも、ビッグデータの大きな特徴の1つが、上記ポイントの1番目にある「因果関係より相関関係」だから。
本書で例として挙げられていたのが『「オレンジジュースとアスピリンの組み合せで癌が治る」ことが言えるなら、正確な理由はどうあれ。この組み合わせが癌に効くという事実のほうがはるかに重要となる』というもの。
ポイントの1番目の「ポップターツ」の売上げ増加も、もっともらしい理由をつけることはできるかもしれませんが、それよりも「実際に相関関係がある」ことのほうが重要です。
もちろん、この「正確な理由がわからない」という問題は、ある種の「リスク」にはなるものの、結局それ以上の「リターン」が望めるということかと。
ちなみに、こうしたビッグデータのマイナス面については、本書の第8章で掘り下げられていますので、詳しくはそちらにて。
◆また、上記ポイントの2,3番目は、いずれも日頃から目にするモノですが、そんな「ウラ」があるとは思いもよりませんでした。
特に「リキャプチャ」の方は、まさに「一石二鳥」。
同じOCRの読み取り作業に人を雇った場合のコストは、本書によると年間で1000億円超なのだとか。
同様にスペルチェッカーも、ユーザーの検索行動のデータを用いているのがミソでしょう。
今まで何度も「もしかして○○○?」をクリックしていましたが、こうして活かされていたとはw
◆また、上記ポイントの5番目の「フェイスブックの株価」に関しては、簿価(純資産額)と時価との差は、てっきり「資産増加期待部分」かと思っていました。
つまり、今現在は何もないものの、いずれ利益がもっと出てキャッシュが入り、実際に簿価となるであろう、ということなのかと。
しかし、本書で指摘されているように、すでにフェイスブックは「データ」という膨大な「簿外資産」を持っていました。
もちろん、こうしたデータを「宝の山」として活用できれば、という話ではあるのですが、今後こうした「簿外資産」が帳簿上に載せられてくるのかもしれません。
◆本書は興味深い事例が多く、冒頭で申しあげたように、読みだしたら止まりませんでしたw
最近「統計学」がブーム(?)のようですが、その手の「数字」「データ」ネタがお好きな方なら、本書もツボかも。
また、上記の「リキャプチャ」のような、目からウロコの「アイデア」を生み出したい方にも参考になりそう。
諸事情により画像は貼りませんけど、付箋も貼りまくり!
これはオススメせざるを得ません!
ビッグデータの正体 情報の産業革命が世界のすべてを変える
第1章 世界を変えるビッグデータ
第2章 第1の変化「すべてのデータを扱う」
第3章 第2の変化「精度は重要ではない」
第4章 第3の変化「因果から相関の世界へ」
第5章 データフィケーション
第6章 ただのデータに新たな価値が宿る
第7章 データを上手に利用する企業
第8章 リスク ビッグデータのマイナス面
第9章 情報洪水時代のルール
第10章 ビッグデータの未来
【関連記事】
【データ分析】『データ・サイエンティストに学ぶ「分析力」』ディミトリ・マークス,ポール・ブラウン(2013年04月04日)【データ分析】『統計学が最強の学問である』西内 啓(2013年01月27日)
【オススメ】『競争優位で勝つ統計学---わずかな差を大きな勝利に変える方法』ジェフリー・マー(2012年05月04日)
すぐに使える『ヤバい統計学』テクニック7選(2011年03月05日)
【オススメ!】『オタクの行動経済学者、スポーツの裏側を読み解く』トビアス・J・モスコウィッツ,L・ジョン・ワーサイム(2012年07月03日)
【スゴ本】「予想どおりに不合理」ダン・アリエリー(2008年12月15日)
【編集後記】
◆「大全シリーズ」(?)に勉強本が登場!できる大人の勉強法大全
お馴染み和田秀樹先生が、ご自身の勉強ネタを1冊に凝縮されているようです。
「勉強本オタク」としては、これはチェックしないと……。
ご声援ありがとうございました!
この記事のカテゴリー:「ビジネススキル」へ
「マインドマップ的読書感想文」のトップへ
スポンサーリンク
この記事へのトラックバックURL
●スパム防止のため、個別記事へのリンクのないトラックバックは受け付けておりません。
●トラックバックは承認後反映されます。
当ブログの一番人気!
12月16日まで
Kindle月替わりセール
年間売上ランキング
月別アーカイブ
最近のオススメ
最近の記事
このブログはリンクフリーです