Evangelist 読んで知る、証券システムの今と未来。

TOP連載特集「The Evangelist」第二回 / 2019.04.04 掲載
Pixabayからの画像

21世紀は“データの世紀”とも言われています。
また、ビジネスや公共サービスに活用することが可能な大量な情報を「ビッグデータ」という形で収集し、様々な価値を引き出し、ビジネスやサービスをよりよいものに高め、人々の暮らしをさらに便利なものに変えていく――。

そんな力を秘めた中核技術の1つとして、ビッグデータのビジネス活用について近年注目が高まっています。
第二回目となる今回は、ビッグデータの由来やその活用例、それを支えるデータサイエンス等についてご紹介します。

Pixabayからの画像
(Gerd AltmannによるPixabayからの画像)

◆”ビッグデータ”という用語の由来

ビッグデータという用語がマスコミやメディア等で注目されるようになったのは2010年頃と言われています。

「ビッグデータ(英: big data)」とは、「典型的なデータベースソフトウェアが把握し、蓄積し、運用し、分析できる能力を超えたサイズのデータを指す。この定義は意図的に主観的な定義であり、ビッグデータとされるためにどの程度大きいデータベースである必要があるかについて流動的な定義に立脚している。・・・中略・・・ビッグデータは、多くの部門において、数十テラバイトから数ペタバイト(a few dozen terabytes to multiple petabytes)の範囲に及ぶだろう」*1との見方があります。

また、ビッグデータの標準的な特性として、Variety(データの多様性)、Volume(データ量)、Velocity(データ生成速度・頻度)の「3つのV」が挙げられます。*2

一説には、2010年2月25日付の英国誌『エコノミスト』がその用語の登場について有力なエポックの一つといわれ、この号の特集記事「Data, data everywhere」の中で、次のように報告されています。*3

*****************************

大手スーパーのウォルマートは、1時間に100万人以上の利用客の購買記録をデータベースに記録する。その結果、取り扱う全データ量は2.5ペタバイトに達している。

(中略)

ソーシャルネットワークサービスのフェイスブックのサイトには400億枚の写真が保存されている。
30億対のヒトゲノムを解読するためには、2003年のスタート当初は10年かかったが、今は同じことが1週間で可能だ。

こうした事例は、すべてが一つのことを物語る――。

この世界には、想像を絶するほど膨大なデジタル情報が存在し、私達はその情報をより素早く、より多くつかまえることができるようになってきた。
おかげで、かつては不可能だった多くのことが可能になってきている。
ビジネスの動向をタイミングよくつかみ、病気や犯罪を未然に防ぐことができる。うまくマネジメントされたデータは、新しい経済価値を解き放し、科学への斬新な洞察を提供し、政府を益することもできるのだ

(中略)

この革命からの影響は、ビジネスから科学、政治から芸術まで、いたるところで感じられる。科学者たちとコンピューター技術者たちは、こうした革命的現象のために、新しい言葉を造った。すなわち”ビッグデータ”である。*4

Pixabayからの画像
(xreschによるPixabayからの画像)

◆ビッグデータの活用例 ~デジタル・オプティマイゼーション(最適制御)~

それでは、ビッグデータの活用例にはどのようなものがあるのでしょうか?

ビッグデータ研究の第一人者である情報通信研究機構(NICT)の徳田英幸氏は、ビッグデータの活用により、渋滞を減らす仕組みについて、次のように説明しています。

*****************************

身近な例で説明してみましょう。自動車の数が増えると交通渋滞が起きやすくなります。といっても、道路を走る自動車の数は一定ではなく、朝なら住宅街からオフィス街に向かう上り線の車が増え、逆に夕方にはオフィス街から住宅街に向かう下り線の車が増えるでしょう。信号機の変わり方が一定だと、朝は上り線で、夕方は下り線で渋滞が起きやすくなります。

そこで道路に設置したセンサーなどで自動車の交通量を調査、得られたデータを解析することで、交通量に合わせた最適な信号機の切り替え方を見つけ出すことができれば、渋滞を解消させることができるでしょう。こうした利用法は「デジタル・オプティマイゼーション(最適制御)」と呼ばれ、ビッグデータの活用法の代表例といわれています。

(中略)

信号機の変え方を変更したら、渋滞の発生がどのように変化したかを調べます。その調査の解析結果を反映させて、より渋滞が発生しにくい信号機の変え方を見いだしていきます。

こうした調査(センシング=S)、解析(プロセッシング=P)、制御(アクチュエーション=A)という『SPAモデル』を繰り替えて、データをより多く集めることで、最適な信号機の制御に近づき、渋滞が発生しにくくなります。*5

(intographicsによるPixabayからの画像)

◆ビッグデータの活用を支えるデータサイエンス

ビッグデータが生み出す価値を一言で表現するならば、「テクノロジーを通じ、人間行動の総和や社会活動といった、従来は巨大すぎて見ることができなかった事象・振る舞い・関係性等を見える化し、新たなビジネスチャンスやサービスを生み出す源泉としてデータを活用できるようになる」という点にあります。
そしてまた、インターネットやIoTなどの新たなテクノロジーの進化とその普及により、テキストや音声、画像データ、センサーデータといったデータが爆発的に増加し、近年のビッグデータ化をもたらしているという側面があります。その為、これまでのデータ解析や統計解析といった手法に加え、ビッグデータの利活用に適した新たな手法に注目が集まっています。

この新たな手法の一つがデータサイエンスです。
データサイエンスとは、科学的手法やプロセス、アルゴリズム、システム等を用い、構造化されたデータのみならず、構造化されていないデータからも有用な知識や知見を得るための学際的な学問を指すものと言われています。*6

例えば、代表的な非構造化データであるフリーテキストについて、ツイッター上でのコメントなどのデータを利用したブランドの評価分析や要約生成技術による議事録・日報の自動作成などが行われています。
また、最近では、工場内の振動計やウェアラブルの心拍計などのセンサーデータを3秒周期の波形等に処理してから分析したり、一度グラフ化してから画像として利用するなどにより異常検知に活用されたりしています。

◆おわりに

新たな要素技術の登場・浸透により、多くの利用者個々のニーズに即したサービスの提供、業務運営の効率化や新産業の創出等に向けて、それを支える技術の進展とともに、ビッグデータの活用は今後ますます進んでいくことでしょう。

—————————————————————-
*1 出所:McKinsey Global Institute “Big data: The next frontier for innovation, competition, and productivity”(平成23年5月)

*2 出所:Deja VVVu: Others Claiming Gartner’s Construct for Big Data[Gartner | Doug Laney (2001)]

*3 その他の潮流として、1997 John R. Mashey, Cheif Scientist, SGI、 2008 Natureが挙げられることも多い。

*4 出所:アスキーメディアワークス「ビッグデータ革命」

*5 出所:誠文堂新光社「子供の科学2018年10月号」

*6 参考:Wikipedia(英語サイト)

TwitterFaceBook