2006年06月07日
「数式を使わないデータマイニング入門」岡嶋裕史(著)
「数式を使わないデータマイニング入門 隠れた法則を発見する」岡嶋裕史(著)
旅行中でも休まず投稿!
7日まで旅行に出ておりますので、コメント・トラバ頂いてもお返しできません。
何とぞご了承願います。
【今日のsmooth(の予定)】
<グアム最終日>
◆お土産などを買ったりしてから帰国するラシイ(笑)。
さすが3時間で帰れるだけあって、帰国日も予定が入れられます。
これがハワイだと、最終日はフツウ帰るだけで何もできないんですが(汗)。
◆さて。
今日ご紹介するのは、またもや新書です。
本の帯や新聞広告に「グーグル、アマゾン ― Web2.0時代に必須の技術を本質から理解する」とあって、気になっていたんです。
果たしてその内容は(汗)!!!
【目次】
第1章 隠れた法則を見つける技法
第2章 ビジネスで使われるデータマイニング
第3章 データマイニングの手順
第4章 落としどころを探る―回帰分析
第5章 効率的に判断する―決定木
第6章 分けることは分かること―クラスタ分析
第7章 複雑な分類―自己組織化マップ
第8章 買い物かごの中身は?―連関規則
第9章 神経をまねしてみる―ニューラルネット
第10章 データマイニングと情報管理
第11章 監視社会とデータマイニング
【気になった点など】
★「データマイニング」って何?
◆実は、私も知らずにこの本買いました(笑)。
一応こういう説明をどうぞ。つ データマイニング 【data mining】(『IT用語辞典 e-Words』さんより引用)
要は「大量に蓄積されるデータを解析し、その中に潜む項目間の相関関係やパターンなどを探し出す技術」ってことで。
◆ちなみに、「データマイニング」という分析手法があるのではなくて、下記の分析手法(目的により選択される)の総称だそうです。
「回帰分析」「決定木分析」「クラスタ分析」「ニュートラルネットワーク」・・・って一つもわからないんですが(笑)。
◆ただ、例としてあげられている「ビールを買う客は一緒に紙オムツを買うことが多い」って言うのは、気になりますよね(笑)。
これにはいったい、どういう理由が・・・(汗)。
★なぜ今データマイニングなの?
◆データ分析はとりあえず(笑)、ある程度データ量が多くないと、結果が使いものになりません。
そこで以前は、コストとのかねあいで、その対象を定める必要がありました。
例えば、2000年問題について
サラリーマン時代に、これで残業200時間とかやった日々が思い出されます(遠い目)。現在のコスト感覚からすれば、問題が発生するのが目に見えているのに、西暦を変数に収める際に下2桁のみを抽出した仕様は理解できない。わずか数バイト節約するために、気の遠くなるような対策コストと工数(のべ作業時間)を後に背負わなければならないからだ。だが、当時はそれを許容してでも、情報量を抑制する必要があったのである。
◆ところが今は、情報機器の爆発的な普及と低コスト化によって、「すぐに役立つかわからない情報」が蓄積されつつあります。
しかも、分析メリットと比較して無視可能なほど、情報の利用コスト、収集コストが低下しており、一見無関係、無価値に思えるデータを用いて分析処理を行う、という贅沢が許される環境が整ってきたわけです。
ロングテール現象以外に、ここにもIT普及の恩恵が(汗)!
★データマイニングの事例色々
◆ここからが、この本の本領発揮なわけで、実際の事例です。
事例といっても、架空の目的に対して、タイトル通り数式を使わないでアプローチしています。
ただ、これが結構笑える!
「禁欲の誓いを立てた仲間のなかで、異性交遊している裏切り者を探す」
「デートに誘って成功した場所・方法とその結果」
「ガンダムのモビルスーツのクラスタ分析」
・・・って柔らかいテーマに真面目に取り組むという一種の「お笑いの定石」みたいですが、なるほど、理解しやすかったです(笑)。
特に最後のモビルスーツの分析はゲキワライました。
モビルスーツの「装甲が厚いか薄いか」「コストが大きいか小さいか」で4つに分類した上で、
で章が終わってます。このような分類が得られると
「自分の乗っているモビルスーツはザクIIFだ」
MG 1/100 ザクII MS-06F/J
「やられキャラのクラスタに属している!」
「自分は上司に捨て駒として認識されていたのか・・・」
といった分析を行うことが可能になります(って、誰も分析しねーよ(笑)!←smoothのツッコミ)し、営業マンであれば、例えばクラスタ1(ザクなどが主に属する、コストが小さく装甲が薄い、やられキャラのクラスタ)に属しているモビルスーツのパイロットに対して、「今の機体に乗り続けていると、死んでしまう可能性が非常に高いですよ。今のうちにゲルググを購入してはいかがですか」
HG UNIVERSAL CENTURY 1/144 ゲルググJ
といったアプローチをすることができる(って、勝手に乗り換えられるのかよ(笑)!←同じくsmoothのツッコミ)。
かなり真面目に取り上げているモヨウ(笑)。
◆念のために書きますと、本書内では、普通のビジネスで行われている「商圏を調べる」ですとか、「販売促進のための広告にはどの媒体がいいか」というお話もありますので、誤解なきよう(笑)。
・・・誤解招くような部分しか書かないのはワタクシですけど(笑)。
【読後の感想など】
◆えー、かなりおふざけ部分中心(?)でご紹介してしまいましたが、いかがだったでしょうか?
本書は、あくまで「データマイニング」の入り口であり、読んだからといって、すぐ「データマイニング」が使える、という内容ではありません。
そもそも、ある程度の情報と、その分析ツールがないと、いかんともしがたいわけで。
◆ただ、考えかたというか、その手法については、この本を読めば、何となくでも理解できます。
私の場合は、書店で手にとって、上記のガンダムのところを見て即買いしてしまったワケですが(笑)。
いや、こういうアホっぽいの好きなんですよ(笑)。
手法としては、この本に近いと言えない事もないですし。
ヤバい経済学 ─悪ガキ教授が世の裏側を探検する
◆なお、冒頭の「ビールを買う客は一緒に紙オムツを買うことが多い」というのは、「家事で手の放せない母親に言いつけられて紙おむつを買いにきた父親が、自分へのご褒美にビールを買っていくため」と分析されているとか(笑)。
真面目におふざけしたいアナタに!
数式を使わないデータマイニング入門 隠れた法則を発見する光文社新書
【追記(2007/9/25)】
密かにリンクを貼っているたつをさんのところでも紹介されていました。
数式を使わないデータマイニング入門
【編集後記】
◆一応、本日夜に帰宅します。
当日はもちろん、翌日もコメントお返しできるか微妙(ヨメにはブログのこと内緒なので)なんですが、出来る限り(汗)。
少なくとも、ランキング参加されている方のところへはお伺いして、クリック連打しておきます(笑)。
・・・というか、ホントに旅行中の記事はアップされてたんでしょうか(汗)???
ご声援ありがとうございました!
この記事のカテゴリー:「ビジネススキル」へ
このブログのトップへ
スポンサーリンク
この記事へのトラックバックURL
●スパム防止のため、個別記事へのリンクのないトラックバックは受け付けておりません。
●トラックバックは承認後反映されます。
投稿パーフェクトですね。
おめでとうございます。
ガンダムのネタは楽しいですね。
私の愛車、オデッセイは、運転席がガンダムチックで、ガンダム世代を狙い撃ちした車と言われていました。
なんと、カーナビが音声認識です。嬉しいのは、最初だけでしたが(笑)。
おもしろいお土産話楽しみにしております。
「数式を使わない〜」の本はおもしろそうですね。
計算嫌いの私には、そそられる・・・。
帰宅してからもグアムネタもお願いします。
ハワイは行ったことあるんですが、グアムはないもんでよけい聞きたいです。
お休み中にもかかわらず、大量投稿、ご苦労様でした。
気をつけて帰ってきてください。
応援!
お休み中にもかかわらず、大量投稿、ご苦労様でした。
気をつけて帰ってきてください。
応援!
グアムネタ楽しみにしています!
グアムネタも期待しています。
それはそうと、ガンダム世代は私より年下であることが、
明確に表れるので、ガンダムネタをされるとちょっと辛い、マジンガーZ世代です。
ゆえに、「自分の乗っているモビルスーツはザクIIFだ」って、まったくわかりません。
グアム最終日なんですね。
楽しいお話期待してます。ぽちっ