今さら聞けない、「ビッグデータ」って何?ビッグデータの定義をカンタン解説!

      2016/03/18

ビッグデータ アイキャッチ画像

ビジネスやマーケティングのトレンドワードだった「ビッグデータ」が、最近かなり世間一般にも浸透してきたようです。
とはいえビッグデータっていまだにどうもピンとこない、説明できない…という方もいらっしゃるのではないでしょうか。
これからの時代に誰もが知っておくべきビッグデータの基本として、定義をわかりやすく解説し、さらに2015年の年末における世間一般のビッグデータのイメージを探っていこうと思います。

ビッグデータとは?ふんわりした定義を学ぼう!

そもそも、ビッグデータの定義ってなんだか曖昧だな…と感じている方が多いかと思います。
それも当然のことで、ビッグデータは「ビッグデータ1コ下さい」といって買えるものではありません。
企業ごとにカスタマイズされるソリューション(課題解決型)サービスや研究分野において活用されるデータのことですから、企業やプロジェクトの目的によって扱うデータそのものや技術が変わります。
総務省のWebサイト(平成24年版情報通信白書より)にも書いてあるように、ビッグデータは「事業に役立つ知見を導出するためのデータ」というのが、目的から見たひとつの定義づけです。

そんな前提の上で、ビッグデータの一般的な定義といえる3つの特徴を紐解いてみましょう。

【1】膨大な量のデータである

IT技術の進化で、私達の社会は大量のデータを収集・蓄積し、運用や分析ができるようになってきました。
例えばFacebookのデイリーアクティブ利用者は10億1000万人(2015年9月)です。Facebookはテラバイト、ペタバイトといわれる膨大な量のデータを処理していることになります。従来型のデータベースソフトウェアではできなかったサイズのデータ処理や解析を可能にする技術、基盤システムが開発されてきたからこそ、サービスも成立しています。

…といった点は、「ビッグなデータ」なんだからそのくらいわかるよ!と思われる方も多いことかと思います。
しかし、単に量が多いだけのデータはビッグデータと言われない場合もあるのです。
あと2つ、一般的に定義づけられている特徴をあげていきます。

【2】データに多様性がある

ビッグデータは単純な文字や数字だけでなく、文章、音声、画像、動画など、多くの種類のデータが使われます。また、データのありか(出所、データ源)も、社内で管理されている販売データ・サーバーのアクセスログデータ・社外のWebデータ・SNSのデータ…など様々です。
タイプや出所が多様で複雑なデータを、プラットフォーム上で紐付けて連携できるのもビッグデータの特徴です。

【3】変化スピードの速いデータである

ビッグデータの3つめの特徴は、常に変動している、動的であるということです。
しょっちゅう更新される、変化スピードの速いデータもすばやく取り扱える技術が進展してきました。今、瞬間的に呟いている人々の話題や、交差点における交通量などをリアルタイムでデータとして把握できるようになったということですね。

更新頻度の高い動的なデータということは、総量、全体の形も常に変化しています。ビッグデータとはきっちり決まったフレームではなく、ふんわり、もこもことうごめいているデータというわけなので、ビッグデータ=「ふんわりしている」という認識はある意味正しいイメージとも言えます。
動的データの収集という入力の面だけでなく、解析や対応といった出力もスピーディであるという点も押さえておきましょう。

ビッグデータの定義:3Vとは?

まとめると、ビッグデータの3つの特徴とはデータの・データの多様性・データの更新頻度や入出力の速さと言えます。
3つすべて揃っていなくても、量の膨大さに加えて、データの多様性があるか、あるいは動的なデータなのか、このあたりがビッグデータと言われるかどうかの線引きのポイントになっています。
この3つの特徴は、英語の頭文字をとって「3V」と呼ばれています。(米国ガートナー社が提唱したので、ガートナーの定義とも言われています。)

  • Volume:量
  • Variety:多様性
  • Velocity:速さ

この3つの特徴から考えると、ビッグデータとは、単に集計して傾向を見るためのデータではありません、といいますか、それだけの利用ではもったいないです。
ビッグデータとは、よりきめ細かい状況把握理解をする、特徴や相関関係を分析する、特徴や法則を読み取って予測をする、さらにはスピーディにきめ細かく対応するためのデータと言えます。

ビッグデータについて、世間はどう認識しているのか?

さて、ビッグデータは今の世の中でどのように認識されているのでしょうか。
専門家や研究者の中では以前から使われていたビッグデータという言葉ですが、本格的に一般に広まったのは2010年代です。Amazonの躍進やオバマ大統領の選挙にビッグデータが利用されているといった話題が、人々の注目を集めるようになりました。
Googleトレンドを見ると、2011年頃から検索されるようになっていますね。2013年に検索量がピークとなり、一段落しながらも注目が続く状態です。

ビッグデータ トレンド

さて、マーケティングのいまがわかるSeeSもまた、Web上のビッグデータを活用した定性調査サービスです。
データマイニング(データの深掘り)の中でも、テキストマイニングという文章を解析する技術で、キーワードに対しての重要なトピックを調べていきます。
今回は2015年12月14日時点での「ビッグデータ」に関するWeb上のトピックを調べてみました。(ビッグデータをビッグデータで調査したということですね。)

世間の話題として、「ビッグデータ」に直接紐付く重要なキーワードは「活用」「分析」「ビジネス」「サービス」です。
ビッグデータという存在が、定義づけや技術解説の段階から、実用段階に進んだことを示していると捉えられます。

ビッグデータ テキストマイニング

  • 活用:いかに活用するか、導入するか
  • 分析:データから読み取れることは何なのか
  • ビジネス:ビッグデータはビジネスとしてどうなのか?使えるのか?
  • サービス:ビッグデータを使ってどんなサービスが提供できるのか/あるのか

さらに出現した話題からは、より一般的な興味関心が高まりつつある兆しにも注目です。
データの読み解きは次回詳しく行います!

まとめ

  1. ビッグデータの定義はふんわりしている
  2. ビッグデータの3VとはVolume(量)・Variety(多様性)・Velocity(速さ)
  3. ビッグデータは「活用」「分析」「ビジネス」「サービス」に取り組む段階に

次回はSeeSマーケティングレポートのデータを読み解き、「ビッグデータ」の話題やキーワードを考察します。
さらに、マイニングで出現した謎の話題から、一般消費者にとってのビッグデータ意識を探ります!芸能人のつまずきとビッグデータの関係とは…?どうぞお楽しみに!

→この記事の続きはビッグデータマーケティングの第一歩!ビッグデータをビッグデータで解析する。でお読みいただけます。

他にもこんな記事が読まれています

 - マーケティング ,