2019年4月16日

注目すべきビッグデータと分析の5つのトレンド

ビッグデータと分析は今やビジネスにとって欠かせない要素となっています。今後、このテクノロジーはさらに成長し成熟していくのでしょうか? それともビジネスの形を再び変えていくのでしょうか? ここでは、2019年の動向を予測します。

ビッグデータがビジネスで圧倒的に優位に立てる最先端のテクノロジーであったのは、それほど前の話ではありません。今や、データと分析はビジネスにとって不可欠であり、確固とした地位を確立しています。問題は、このテクノロジーが2019年に成長し成熟していくのか、他のテクノロジーで置き換えられるのか、あるいは新たな興味深い方法でビジネスの形を変えていくのかという点です。

結局のところ、それぞれの動きが並行して起こるというのが答えになるでしょう。この記事では、2019年に起こると考えられる主な事柄について見ていきます。

 

ビッグデータは死に、データとして生き残る

2017年に、ガートナーのアナリストであるMark Beyer氏は 「安らかに眠れ。自身が使われている他のすべてのテクノロジーの中で」というビッグデータの死亡記事を書いています。ガートナーの別のアナリストであるSvetlana Sicular氏は、このBeyer氏の意見を自らのブログ記事で重ねて強調しており、このIT界の巨獣、少なくとも「ビッグ」という名称は事実上死んだと述べています。「いまだにビッグデータの運命についての意見をガートナーに聞いてくる人がいますが、ビッグデータは新たな標準となったので、今やただのデータにすぎません」。

しかし、どのような呼び名であっても、ビッグデータは相変わらずインフラストラクチャとデータを扱う部門にとって大きな負担となっています。大量のデータセットは今なお、取得、保管、ソート、分析されており、ソフトウェア、機械学習、その他の革新的なテクノロジーから、CEOの日常的な意思決定や株主向けのレポートに至るまで、あらゆるものに情報を提供しています。現在、ビッグデータは広く普及し、目立たない場所で静かに動いているというだけであり、そのサイズが小さくなったり、勢いが衰えたりしているわけではありません。

データは至る所にあります。ネットワークの速度低下やストレージ要件の増加の原因となっており、マルチクラウドやハイブリッド環境の境界を越えてやりとりされ、さまざまなインフラストラクチャ、ネットワーク、ツールに対して膨大な要求を突き付けています。

しかし、ビッグデータは死んだのです。今後は単なるデータとして生き残っていくでしょう。

2019年も引き続き、ビッグデータは魅力的な分野となるでしょう。それを「ビッグ」と呼ぶかどうかは別として、データは信じられないほど巨大で、日々増え続けているからです。一方で、実際の課題やビジネスチャンスは変わっていきます。それらに対処する手段がビッグデータとなるためです。

 

これまでに予測されたことを実現するのに十分なコンピューティング性能が得られる

先の予測によると、クラウド (とその帯域幅) はモノのインターネットによって使い果たされると言われていましたが。そのようなクラウドカニバリズムは2019年に問題とはならないでしょう。代わりに、クラウドとエッジコンピューティングの双方はビッグデータの飛躍的な成長により今後も急成長を続けると考えられます。

「データがインフラストラクチャのエッジからクラウドに届くまでの時間は、週単位、月単位、あるいは年単位となることがあるため、クラウドとデバイスの間に、このギャップを埋めるものを用意することが重要です。また、データがクラウドに届かなかった場合には、データのプライバシーと規制に関する問題に対処する必要があります」とDuncan Pauly氏は説明します。彼はエッジコンピューティングの分析プロバイダーであるEdge Intelligence社のCTOです。

一方で、エッジコンピューティングは、扱いにくい大量のデータを組織で管理するためにも役立ちます。

「鍵となるのはインフラストラクチャのエッジです。そこでは、コスト効率の高い方法でデータを格納および管理できるようにして、どのようなデータをトリミングして容量を減らし、最終的にクラウドに届けるかを決定します」とPauly氏は言います。

このような仕組みは、「エッジはクラウドを浸食する」という主張 (Tom Bittman氏による2017年の投稿) からはほど遠いものです。彼の主張は、エッジコンピューティング、つまりIoTデバイスやIoTゲートウェイのすぐ近くでのコンピューティングの使用率は、近いうちにクラウドコンピューティングを追い越すだろうというものでした。

Bittman氏の懸念には注目すべき点もありました。ビッグデータに関するすべての事柄をクラウドに集約すると問題が起こります。そもそも、混雑しがちな既存のネットワークで大量のデータを光速 (または、少なくとも自動運転車が事故を起こさないために十分な速度) で転送することは、物理法則に沿ったものではないからです。一方で、エッジコンピューティングの側にも問題があります。

「エッジコンピューティングには大量の処理能力とストレージが欠かせません。それだけでなく、データ分析ツール、ソフトウェアやデータをエッジにプッシュするツール、エッジ全体をまとめて中央のクラウドに統合するツール、エッジ自体での機械学習も求められます」とBittman氏は書いています。「エッジではかなりの能力が必要になるのです」。

現在、エッジコンピューティングにはそのような能力があります。コネクテッドカーや自動運転車から自動化された顧客サービスに至るまでのすべてを駆動し、アクティブ化から復旧に至るまで、さらにその間にあるすべての物事をデバイス上で処理できます。

エッジコンピューティングに大きく依存するのは、自動運転車のような新しいテクノロジーにとどまりません。現代のあらゆる自動車など、日常の物事にもエッジコンピューティングが活用されています。

「たとえば、現在の燃料噴射システムでは、パワーと燃料の効率を最適化するために車の運転パターンを監視します。このようなデータはリアルタイムで推移するため、エッジ以外の場所で処理するのは不可能です」とJohnathan Vee Cree博士はPC Magazineの記事で述べています。Vee Cree氏は、米国エネルギー省パシフィックノースウエスト国立研究所の組み込みシステムと無線システムの科学者兼エンジニアです。

モノのインターネットの特徴と成長、さらに、分析の高速化を強く求める動きから、エッジコンピューティングの普及率が高まることが予測できます。そのため、データと分析は一元管理されたモデルよりも分散モデルに一層依存するようになります。

それでも、実際にはクラウドの利用率が下がることはないでしょう。リアルタイム性の少ないデータの分析と保存では、クラウドの付加価値サービスとスケールメリットは今後も大きな魅力となります。

さらに、分析はクラウドやエッジに移行し、データセンターに依存しなくなるでしょう。従来型のハイパフォーマンスコンピューティングセンターは現在、機械学習のトレーニングや集中型コンピューティングで一人勝ちの状況にありますが、これらの処理も同様にクラウドやエッジに移行していくことが予想されます。

「エッジコンピューティングやフォグコンピューティングはクラウドと共存し、異なるタイプの分析処理に使用されます」とPauly氏は説明します。

Pauly氏によれば、以下の領域で、個別の分析処理が必要になります。

  • デバイスやゲートウェイの内部では、複雑なリアルタイムのイベント処理
  • インフラストラクチャエッジでは、大量のデータの集約および分散分析
  • クラウドでは、データ削減、ディープラーニング、他のオンデマンドのクラウドサービスとの統合

「実際には、エッジは、既存のクラウドの領域を脅かす存在ではなく、クラウドの物理的な末端の延長線上にあると考えるべきです」とPauly氏は付け加えます。

 

機械学習と分析における変化は、予想したほどには進まない

機械学習は今のところ、何でも飲み込んでしまう万能の存在ではありません。

「機械学習と従来型の分析は融合しつつあります」とPauly氏は言います。「しかし、従来型の分析には今後もニーズがあります。機械学習のアルゴリズムは、特定のユースケースや予測には最適ですが、従来型の分析は、時系列分析、アドホック分析、フォレンジック分析、ビジネスダッシュボードなどで引き続き役立ちます」。

知識は力であることは明らかですが、これはつまり、分析を取り込み知識を吸収したマシンは世界を支配するようになるということでしょうか?

その心配は不要です。機械学習は非常にうまく機能していますが、自己認識に至ることはありませんし、データのシンギュラリティを利用して人生の意味を学ぶこともありません。機械学習は学習と特定のタスクの実行に特化しており、世界を支配するような存在ではないのです。

この問題については、異論がある方がいるかもしれません。

 

CIO (最高情報責任者) とCDO (最高データ責任者) の対決

この動きは、おそらく穏やかに進むことはないでしょうが、最終的には避けられません。

「CIOの「I」が「Information (情報)」を指すことを思い出すときが来ました」とJames Markarian氏は主張します。彼は統合型Platform as a ServiceツールおよびコネクターのプロバイダーであるSnapLogic社のCTOです。

Markarian氏によれば、CIOの役割は、インフラストラクチャやセキュリティではなく会社のデータや情報に関する戦略を導くことになっていくでしょう。

「デジタル化とデータのトレンドがCMO (最高マーケティング責任者) の役割を変えたように、今後数年のうちに、CIOの役割は現在の形態からは予想できないものになります。このプロセスは2019年に勢いを増すと考えられます」と彼は付け加えます。

役割は常に発展していきますが、知識は力であるということは今後も重要なポイントです。情報から知識を最大限に引き出せる者が勝者となるのです。肩書きにあまり意味はありません。

最終的には、知識を蓄積して使いこなすことが何より重要になるでしょう。2019年にはあらゆる日常的な作業が自動化されていくからです。

 

データ保持ポリシーの進歩

「データはしばらくの間、バックアップ用に保存する必要がありますが、永遠に保存する必要はありません」とCarlos M. Meléndez氏は言います。彼はAIコンサルティング企業であるWovenware社の最高執行責任者です。

機械学習では、保存されたデータから無駄な要素を排除し、その完全性を保護するように教えるだけでなく、古いデータや不要になったデータを破棄するように教えることもできます。このプロセスは、自動化された正常なデータフラッシュだと考えることができます。

心配は不要です。消去された情報は永遠に失われるわけではありません。「アルゴリズム自体がバックアップとして機能するため、必要に応じて、そのアルゴリズムを使って一部のデータを再生成できるのです」とMeléndez氏は説明します。

2019年のデータと分析についての展望は以上です。興味深い年になるでしょう。

この記事/コンテンツは、記載されている個人の著者が執筆したものであり、必ずしもヒューレット・パッカード エンタープライズの見解を反映しているわけではありません。

誰でもわかるディープラーニングを読む

enterprise.nxt

ITプロフェッショナルの皆様へ価値あるインサイトをご提供する Enterprise.nxt へようこそ。

ハイブリッド IT、エッジコンピューティング、データセンター変革、新しいコンピューティングパラダイムに関する分析、リサーチ、実践的アドバイスを業界の第一人者からご提供します。