予測分析とは

予測分析とは

予測分析は、アルゴリズム、静的データ、および機械学習を組み合わせて活用し、最適化された分析モデルで将来のニーズや成果を明らかにすることにより、企業がリソースや有益な情報を有効活用できるようサポートするものです。

予測分析のメリット

 ビッグデータやデータマイニングのようなトピックを網羅する予測分析により、企業などの組織はより的確に将来の動向を把握して機会を特定できます。履歴データにディープラーニングや機械学習、データモデリングなどの各種の手法を組み合わせて使用することで予測分析モデルと予測分析手法は非常に有益なものとなり、データサイエンティストは相関関係を明らかにしたうえで、強力な内部プロセスを構築してより的確にITインフラストラクチャを自動化することが可能になります。

関連するHPEのソリューション、製品、サービス

予測分析のユースケース

予測分析アルゴリズムは、エンターテインメントや医療からサイバーセキュリティや気象予報まで、あらゆる業界で使用されています。たとえば小売業界では、バイヤーの行動を解釈して予測したり、店舗の在庫管理を改善したり、バイヤーに合わせて商品を薦めたりといったことに予測分析が役立てられており、製造などの領域の企業は、機器やメンテナンスのパターンをプロアクティブに監視してダウンタイムを最小限に抑えることができます。さらにスポーツの分野では、予測分析モデルで統計情報などのデータを使用して長期間にわたるプレーヤーの価値を的確に予測することが可能です。

新たな問題や既存の問題の解決に関して、予測分析やそれに関連する機械学習などのデータの情報は、ほぼすべての業界で多大な価値をもたらす可能性があります。データサイエンティストとデータサイエンティストが働く企業や組織は、人員、プロセス、損益、そしてさまざまな将来の動向を把握できます。

 

予測分析の歴史

予測分析は数十年にわたって使用されてきましたが、予測分析が持つ本当の潜在能力は、より低コストで処理が速く強力なコンピューターが登場して初めて発揮されます。

1940年代の初めには、今日のコンピューティングの先駆けとなる機能や線形プログラミング、計算論的モデルなどの成果が予測分析の可能性に対する政府機関の関心を高めました。その中で最も有名なのは、第二次世界大戦の終結につながった核兵器技術が開発されたマンハッタン計画ですが、この計画では、核反応において原子がどのような動きをするのかを予測する、モンテカルロシミュレーションと呼ばれる手分析が用いられました。

1950年代にもコンピューターの開発は続けられ、非線形プログラミングやコンピューターベースのヒューリスティックが開発されたり、フロッピーディスクやデータベース管理システム (DBMS) などのその他のイノベーションの基礎となった、ハードディスクドライブ (HDD) が発明されたりしました。

1970年代から1980年代までには、株価を予想するために予測分析が使用されるようになる一方、E.F. Codd氏などの科学者が、アプリケーションプログラミングインターフェイス (API) や構造化クエリ言語 (SQL) などのリレーショナルデータベースとリレーショナルデータベース管理システムの論理的基礎を確立しました。

そして1990年代から2000年代までには、機械学習とクラウドコンピューティングテクノロジーが登場したことにより、デジタルエクスペリエンスやマーケティングエクスペリエンスをパーソナライズしたり最適化したりするために膨大な情報のデータベースが使用されるようになりました。

予測分析のタイプと それぞれの仕組み

予測分析は1つの独立した手法ではなく、それぞれが独自の目的と機能を持ち、さまざまなユースケースでメリットをもたらす、いくつかのモデルに分けることができます。全体として、これらのモデルで明らかにされるデータは、履歴データポイントに対する理解を深めたり、多くのデータセットの中から異常なインスタンスを特定したり、将来の動向を予測したりするのに使用できます。

分類モデル

このモデルは、履歴データを調達することでデータを収集し、それらのデータをカテゴリに分類します。多くの業界の企業が複雑な問題を解決したり、新たな機会を見出したりするためにこのモデルを使用しています。その用途の広さから一般的となったこのモデルは、申請承認や支払い不履行の可能性の判断、不正取引の識別などに用いられています。

 

異常値モデル

その名前が示すように、異常値モデルは単一のデータセット、または複数のデータセットの基準から外れているデータを特定し、それらの異常なデータポイントから結論を導き出せるようにするものです。他のモデルと同じように、価格や場所から支払い履歴に至るまでの複数の要因を考慮できます。そしてそのような理由から、異常値モデルは、潜在的な不正行為を特定したり、機器の非効率的な部分や故障を示したりするのに役立つ、金融や製造の分野で特に有用です。 

 

 

クラスタリングモデル

このバージョンの予測分析では、共通の基準に基づいてデータを特定のグループに分けます。そうしたデータはハードクラスターかソフトクラスターに分類できますが、ハードクラスタリングが単純な分類である一方、ソフトクラスタリングではクラスター化のタイミングでデータに確率が割り当てられます。クラスタリングモデルは、一般的にマーケティングの分野で展開されることが多く、マーケティング担当者が特定の対象者のための戦略を策定するうえで大きな効果を発揮します。

 

 

時系列モデル

他のモデルとは異なり、時系列モデルでは、履歴データではなく異常データを用い、時間を主要な入力として使用して将来の期間に関する有益な情報を取得します。このモデルの最大のメリットは、気象や過去のセールスといった特定の変数 (と多くの場合に複数の予測) に基づいて特定の期間に特定の評価基準がどのように変化するのかを判断でき、企業が成長のための計画を立てたり、より的確に次のステップの戦略を策定したりするのに役立てられる点にあります。

 

 

予測モデル

予測モデルでは、過去の数値データに基づいてオブジェクトの定量化できる将来の価値を予測します。予測モデリングが幅広く使用されている主な理由の1つとしては、気象事象や局所的事象などの複数の入力パラメーターを使用できるため、多くの業界で汎用性があるという点が挙げられます。たとえば、小売店舗では過去のトラフィックに基づいて特定の週の顧客数やセールスを予測し、それに応じて対応のスケジュールを立てることができます。

 

企業における予測分析の活用方法

最新の予測分析は直線回帰やロジスティック回帰を超える進化を遂げ、中堅・中小企業や大企業は競争力を得られるデータに基づくソリューションを探し求めています。今日の予測分析は、企業が膨大なデジタルデータを分類し、機械学習やディープラーニングを活用して新たに見つかった有益な情報に目を向けたり、顧客の行動を分析して、市場の変化や次に大きな進歩が見られそうな部分を予測したりするのに役立ちます。さらに、あらゆる分野のデータサイエンティストがこれまでになくリアルタイムで連携し、新たなワークフローアプリケーションやハイブリッドのマルチクラウドインフラストラクチャを使用してデータ分析を促進できるようになります。

そして多くの業界が実にさまざまな形でデータとインテリジェントなインフラストラクチャを使用していますが、最終的に得られるメリットはほとんど変わりません。

小売業界では、予測分析で顧客データを集約してセールスの動向を明らかにし、クロスセル、アップセル、再販キャンペーンを強化するといった、よりパーソナライズされたマーケティングを展開していますが、この種のデータは、在庫管理や将来の商品開発に活用することも可能です。

同じように、エネルギー業界では、データを使用して大規模なプラントシステムなどの資産の管理と接続をサポートするだけでなく、季節的な要因や悪天候に伴うユーティリティの生産高と需要を予測してその計画を立てたり、障害を未然に予測したりもしています。

製造業者は、予測分析を使用して資産の監視も行っています。ただし製造業者に関しては、メンテナンスやパフォーマンス監視で得られるメリットの方が大きく、効率が低下している部分を特定したり、障害が起きそうなタイミングを予測してコストのかかるダウンタイムや修理を減らしたりできます。

保険業界では、追加の安全対策として予測分析が役立てられており、履歴データとの比較で潜在的な不正請求を検出しています。また、それぞれの申請者に関連するリスクを組み込み、その基準に基づいて申請を承認または却下することにより、保険の見積もりや保険料をパーソナライズする目的で人工知能も使用されています。

政府機関もデータを有効活用することにより、有意義な形で日常生活に変化をもたらす可能性がある新しい政策や公的な取り組みに関する情報を伝えることができます。

HPEと予測分析

HPEは、多くの組織、中堅・中小企業、および大企業と連携して予測分析をサポートするソリューションを実現し、需要を満たすのに必要とされるインテリジェントなインフラストラクチャと専門知識を提供しています。HPEは、HPE InfoSightHPE GreenLakeHPE Nimble StorageHPE Pointnextなどのソリューションを利用し、パートナーと緊密に連携して多くの業界に固有のニーズに対応しています。

ノルウェーのITサービスプロバイダーであるBasefarm社のケースでは、HPEが顧客ベースを大規模に拡大している同社のストレージのニーズへの対応と事業継続性の維持をサポートしました。カスタマイズされたインフラストラクチャと機能セットを追加することにより、同社は新しいストレージで仮想マシン (VM) の問題を解決するまでの時間を80%短縮し、1秒あたり平均22TBの帯域幅を維持できるようになりました。

その他にも、パデュー大学のAgronomy Center for Research and Education (ACRE) では、HPEがデジタルファーミングプロジェクトの活性化を支援し、HPEとACREは、植物の水分レベルを測定、分析、調整するモノのインターネット (IoT) のようなテクノロジーとリアルタイムフィールドデータ自動化機能で農業研究に革命をもたらしています

またパデュー大学では、Center of Global Soundscapesの研究者が、エッジコンピューティングとデータ分析を組み合わせて使用することで世界中の環境保護に関連する有益な情報を迅速に取得できるよう、生物学データの記録と分析を支援しています。その結果、研究者は野生生物のコミュニティが特定の環境要因からどのような影響を受けているのかについてさらに深い知識を得られるようになりました。