『ビッグデータの衝撃』を読みました

この本も、「なぜもっと早く読まなかったのだオレは」本ですね。

自団体の支援者データに対して、もっと分析をして効果的な広報や支援者対応ができるのではないか、そのためには「支援者には多分こういう人が多いはず」といった思い込みでなく、きちんとデータ分析をした上で取り組みたい、という考えから手に取りました。もちろん、このレベルよりももっと基礎的な統計的基礎を踏まえてでないと、ということはわかってますワカッテマス。

ちまたで聞くようになった「ビッグデータ」というものについて、わかりやすく書いてくれています。いくつかキーとなる考え方をメモしておきます。

ビッグデータの特徴

データを取り扱う仕組みはこれまでにもあった。それとビッグデータは何が違うのか。

  • Volume:データ量が極端に多い
  • Variety:多様なデータ、正規化されていない(既存のRDBに入れにくい)データ
  • Velocity:発生頻度や更新頻度が極端に速い

ビッグデータの活用パターン分類

個別最適・バッチ型
・購買履歴を元にした個別クーポン配信
・コピー機の故障予測
個別最適・リアルタイム型
・オンラインストアでの商品リコメンド
全体最適・バッチ型
・SaaSの機能改善
・ウェブサイトの導線改善
全体最適・リアルタイム型
・飛行機便の遅れ予測

ビッグデータの活用レベル

以下の順で一歩ずつ進めていく必要がある、と。

過去/現在の把握
 ↓
パターンの発見
 ↓
予測
 ↓
最適化

活用のための戦略フレームワーク

コア・社内
自社独自のデータで、他者にとっても価値のあるデータ
・POSデータ、会員の購買履歴など
コア・社外
他者独自のデータで、自社にとって利用価値の高いデータ
・他社サービスの会員情報など
コンテキスト・自社
自社独自のデータであるが、差別化にはつながらないデータ
・財務データや社員の個人情報など
コンテキスト・他者
外部から比較的容易に入手可能なデータ
・地図データ、政府公開データ、Facebookのプロフィールなど

これらを活かすために

読むほどになるほどなるほど、という感じでした。なんとなく出来そうだなとイメージできたのは、【1】個別最適・バッチ型(コア・社内としての支援者データに対して、支援者への個別アプローチ、そのための過去の把握〜パターンの発見)、【2】全体最適・バッチ型(サイト改善)、の2つでしょうか。

次は、統計の基礎の本を読むのと同時に、前に読んだ『集合知プログラミング』もちょっと読みなおしてみようと思います。

広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中