ビックデータと統計学

ビックデータと統計学

それいゆ通信054号

関与先の皆さま

 今回のそれいゆ通信は、最近のメディアで注目されている2つのキーワード「ビッグデータ」及び「統計学」を考えてみたいと思います。この二つはデータを扱うという意味で同じような分野のはずですが、その手法は大きく異なるように思えます。

 アベノミクスを担う成長戦略の1つに、「国籍を超えたイノベーションを日本で起こす」というものがありますが、今月の初めに安倍首相の講演の中で「ビッグデータの活用」が目玉の一つとして語られました。ビッグデータとは、電子メールやツイッター、フェイスブック、YouTubeなどのソーシャルメディアでやりとりされる画像や映像、文字などの情報、またオンラインショッピングやコンビニのレジデータ、デパートの顧客カードや家電量販店のポイントカードなどなど、気が遠くなるほど膨大なデータの集積のことです。これらのデータという宝の山をITを通じてより細かく解析し、ビジネスに活用するのがビッグデータ・ビジネスといわれるものです。
 
 一方、統計学が最強の学問であるというタイトルの書籍がブームとなり書店では平積みになっているのをご覧になった方も多いと思います。同じように膨大なデータを扱い、分析する手法ですが、そのアプローチはずいぶん斬新で、異なります。統計学というのは、帰納的な推論の方法を精緻な数字やデータで組み上げる学問ですが、「帰納」という言葉は、「部分から全体を推論する」という意味です。部分を知っても全体は理解できないという理屈もありますが、身近なこの例ではいかがでしょうか。お味噌汁を作る場面を想像してください。味を確かめるために、鍋のお味噌汁を全部飲み干してはしませんね。1匙分の汁を味見することで全体の味を類推します。よくかき混ぜた鍋のお味噌汁の一匙には、全体が反映されていると考えるからです。統計学とはまさにこの理論を一般化したものに過ぎません。とすると、先ほどのビッグデータが、1つ1つの部分を分析して積み上げるのに対し、統計学が真逆のアプローチのように思えないでしょうか。実は統計学には他にも関係性から類推する回帰分析や類似性を考慮するクラスタ分析というアプローチもあるので、一概にはいえませんが。
 
 いずれのアプローチにしても、IT技術が発展した現代の解析スキルであり、これからの経済やビジネスに必要とされていくことは間違いなさそうです。DMや新しい商品がどのように売上に貢献するか、株相場がどのように動くかなど誰もが知りたいことを簡単に分析できるツールです。ぜひこれからの武器としてご興味を持ってみてはいかがでしょうか。