企業におけるディープラーニングの導入をサポートする方法

ディープラーニングは、私たちの生活の多くの側面に革命をもたらすとともに、カスタマー・エクスペリエンスの向上から運用やインフラストラクチャの管理に至るまで、企業の環境にも影響を与えています。しかし、その概念は明確である一方、詳細に関しては曖昧な部分もあります。この記事では、ディープラーニングの導入に必要な情報をお届けします。

人工知能 (AI) はコンシューマーテクノロジーの世界を席巻しており、デジタルアシスタントや音声インターフェイスといった、さまざまなAI駆動型のアプリケーションがユーザーのデジタルライフを方向付けています。とは言え、企業のテクノロジー環境は今もなおAIを中心とした未来を形成しようとしている段階であり、ディープラーニングはそうした企業の環境に早い段階から導入されてきたAI手法の1つです。ディープラーニングは、マシンをタスク指向型の機能からデータ表現機能へと高度かつ複雑に変化させるもので、最近のForbes誌の記事において、Forrester社は「Hadoopは分析に革命をもたらしたかもしれないが、最近ではディープラーニングが革命を巻き起こしている」と述べています。

AIが真のコグニティブコンピューティングの状態に達しなかったとしても、ディープラーニングはビッグデータのように多大なビジネスメリットをもたらす可能性があります。ディープラーニングを駆使するには、迅速でアジリティと効率に優れたインフラストラクチャ、大規模データストアへのアクセス、そして (マシンが人間と同じように学習するには時間と経験が必要なため) 多くの忍耐が必要となりますが、投資回収が完了する前に導入に着手すべきです。

 

どの段階でディープラーニングの導入に着手するのか

企業におけるビッグデータとディープラーニングの導入は密接な関係にあります。

これについて、Hewlett Packard EnterpriseのAIビジネス担当バイスプレジデントであるPankaj Goyalは次のように述べています。「膨大なデータにアクセスして分析を行うことで問題を解決できる企業において、早い段階からディープラーニングが導入されてきたのは驚くことではありません。このようなデータはテキスト、画像、音声、または動画の形式になっていると思われ、解決できる問題としては、自動化、新たなカスタマー・エクスペリエンス、新しい製品のイノベーションなどが挙げられます。」

つまり、膨大なデータセットにアクセスしなければならない場合にディープラーニングを活用すれば、効率が向上し、人間が探し求めようと考えたこともないような有益な情報を得ることができます。

驚くことではないと思いますが、より多くの有益な情報を得るために最も必要とされるデータを特定することから開始するのが、最も自然かつ論理的です。

また、自然言語認識やデジタルアシスタントといった、現在自社の内外でディープラーニングが活用されている領域に注目し、それらを参考にすることも可能です。

これについて、HPEのバイスプレジデント兼ゼネラルマネージャーであるBill Mannelは次のようにアドバイスしています。「『実現不可能なことをしようとする』のではなく、比較的制限のある小規模なプロジェクトから開始し、早い段階で成果を得るか失敗するのが最善です。また、プロジェクトの目標と成功の測定尺度にすべきと考えるものを明確にし、少額の投資から開始してあまり大きな期待を持たないようにすることが重要です。」

まずは、すべてのデータから一度に有益な情報を得ようとするのではなく、熟知しているうえに簡単に測定でき、迅速に成果が得られることを期待していない特定のプロジェクトから開始することが重要となりますが、その理由は、導入したばかりのディープラーニングテクノロジーがとてつもなく無知なものであり、学習して多くのメリットをもたらすようになるまでに時間がかかるためです。

プロジェクトの成功は、カスタマー・エクスペリエンスの管理、マーケティングのパーソナライズ、地域別の価格設定や価格のパーソナライズ、またさらには産業用ロボットのパフォーマンスなどと関係があると思われます。ただし、ディープラーニングを導入して可能性を最大限に引き出せるレベルにまで成長させることができる十分なデータと時間があるのであれば、ほぼすべてのプロジェクトを開始点にすることが可能です。

また、マシンが学習を進めるための時間が必要になるため、最初にパフォーマンスが発揮されるようになるまでには時間がかかることが予想されるという点について説明することも重要で、そのような説明を行わなければ、データストリーミングやリアルタイム分析によって即座に成果を得られることを期待するビジネスエグゼクティブが、スタート地点に立つ前にプロジェクトを終了させてしまうかもしれません。早い段階での成功は期待外れ、または不十分と思われる可能性があるため、過剰な期待を持たせないことが重要であり、Mannelは「今日の市場には誇大広告が多く、この状況は数年前のビッグデータ市場と非常に似ている」と警告しています。

覚えておくべき最も重要なポイントは、ディープラーニングが目まぐるしく変化する未成熟な産業であるということです。ただし、テクノロジーと産業が急速に進化しているため、企業はディープラーニングを導入するタイミングを待つわけにはいきません。

Forrester社のアナリストであるMike Gualtieri氏は、すでに驚異的なペースで成長と進化を続けているディープラーニングのライブラリやアルゴリズムが存在すると指摘し、自身のブログの中で、「最も有名なものとしては、画像および音声認識に最適なバックプロパゲーションを使用する多層構造の畳み込みネットワークや自然言語処理に最適な再帰型ニューラルネットワークが挙げられる」と述べています。

このような状況から、待つという選択肢はありません。

それでもなお、ディープラーニングプロジェクトを開始するにあたっての選択肢が多すぎると思う場合は、複雑性を軽減すること目指して絞り込みを行います。つまり、ディープラーニングの部分が課題となる、その他すべての構成要素を熟知しているプロジェクトを選択します。

これについて、(かつてIDC社のHPCチームであった) Hyperion Research社のハイパフォーマンスコンピューティング調査担当シニアバイスプレジデントであるSteve Conway氏は次のように述べています。「ディープラーニングソリューションにはドメインや問題に固有の知識が必要とされることが多いため、企業はまず、最も熟知している垂直市場のユースケースのためのディープラーニングソリューションを開発すべきです。たとえば、医療市場では毎秒の入出力操作ではなく、毎秒のがん検出数に重点を置くといったことが考えられます。」

ディープラーニングを強化する過程では、必須となる数学的なベクトル演算で得た数十億の計算結果が必要になることが多いため、技術スタッフやベンダーの会話が、そうした処理を行うのに必要な手頃な価格のスーパーコンピューターとそれに関連するIOPSや仕様に戻るケースが少なくありません。

企業においては、プロセスに手動で行う反復的なタスクが非常に多く含まれているといった問題や、データセットが大きすぎて人が効率的に分類および分析できないといった問題を解決することを念頭にディープラーニングプロジェクトを選択するのが賢明です。

最近のGrand View Research社のレポートによると、ディープラーニングのユースケースには以下のようなものがあります。

  • 航空宇宙/防衛業界のリモートセンシング、物体の検出と位置の特定、スペクトログラム解析、ネットワークの異常の特定、マルウェア検出。ディープラーニングは、コックピットでの手動のタスクやパイロットの操作、さらには兵士が使用するウェアラブルコンピューティングにも応用されています。
  • 自動運転車やコネクテッドカーのシステム。このレポートでは、「Audi社がカメラをベースとするテクノロジーでディープラーニングアルゴリズムを使用して、特徴や形で信号を認識している」という例が挙げられています。

 

内部のデータセットが進むべき方向を決定できるほど大きくない場合の開始点

Grand View Research社のレポートによると、「ニューラルネットワーク (ディープラーニング) を強化するのに必要となる膨大なデータが業界の成長を妨げる課題をもたらすと予想されています」が、あらゆる場所でデータが急激に増加していることを考えると、こうした課題は早急に克服される可能性があります。またこのレポートでは、「(米国) 政府によるサポートが充実して業界の成長にプラスの効果がもたらされるとの予想がなされており、連邦政府内にAIと機械学習の小委員会が設置されたことで業界の成長が促されている」と述べられています。

Google社のTensorFlow、Facebook社のオープンソースのAIハードウェア、非営利団体のOpenAIなど、ディープラーニング分野の主要な組織は、さらに開発を促進するためにフレームワークやライブラリをオープンソース化しており、Forrester社のGualtieri氏は、Caffe、Deeplearning4j (DL4J)、MXNet、TensorFlow、Theanoといった、オープンソースのディープラーニングライブラリの人気が最も高いと述べています。

一方、現時点で大規模データストアにアクセスできない企業にとっては、Deep Learning as a Serviceが有力な選択肢となる可能性があります。つまり、自社のデータセットが小さすぎてディープラーニングプロジェクトの方向性を示せなかったとしても、進められる、または進めるべきプロジェクトがないという結論を出してはなりません。確かに、ディープラーニングは妥当な結論を導き出すために膨大なデータに大きく依存しますが、ビッグデータへのアクセスだけが必要であり、データを所有する必要はありません。また、社外のデータを活用するか他社とデータを共有して大規模なデータセットを作成することも可能です。

これについて、Hyperion Research社のConway氏は次のように述べています。「ソーシャルメディアやインターネットの巨大企業とは異なり、多くの主要市場の企業はまだ、本番モードでディープラーニングを効果的に使用するのに必要となる膨大なデータを所有していませんが、場合によっては主要な競合企業とともに誰でも使用できるようにしたデータをプールすることにより、十分な量のデータを蓄積しようとしています。」

企業はなぜ競合企業とともにデータをプールするのでしょうか。Conway氏によると、「競合企業や他社と連携してデータをプールすることに前向きな企業は、生き残るために数年後にディープラーニングを導入しなければならなくなることをわかっており」、今すぐその出発点に立つためのデータを必要としています。

では、どの程度の規模のデータストアが必要なのでしょうか。オープンソースのディープラーニングプロジェクトであるDL4Jによると、「問題の複雑性によって最小値は異なるものの、すべてのカテゴリの合計で10万インスタンスを開始点とするのが適切です」。(パートナー企業や競合企業などの他のエンティティとともにデータをプールするといった) データ収集作業は今後増えていくものと思われますが、データをプールすれば、多くの場合にディープラーニングを活用して取り組みを開始するプロジェクトを特定できます。企業が1つのデータプールを利用する理由は、見込みのあるプロジェクトかデータをプールすることに同意したすべての当事者に共通の問題を明らかにすることにあります。

 

堅牢なインフラストラクチャを実現するための技術面の留意事項

ビッグデータとディープラーニングを活用するには、特殊なテクノロジーと拡張したインフラストラクチャが必要です。

これについて、Conway氏は次のように述べています。「企業はまだあまり知らないのであれば、ハイパフォーマンスコンピューティング (HPC) について理解を深めるべきです。ディープラーニングの研究開発においてHPCは重要な役割を果たすようになりましたが、その主な理由は、HPCベンダーがディープラーニングソリューションをほぼリアルタイムで動作させるのに必要な大容量のメモリと超高速のデータ転送速度を備えたコンピューターを構築する方法を知っていることにあります。自動運転車の研究や精密医療などの経済的に最も重要なディープラーニングのユースケースがすでにHPCに依存しているのは偶然ではありません。」

最初に登場したビッグデータのメリットの1つは、それがいくつかのテクノロジーの誕生と成熟を後押ししたという点にあります。また同様に、ビッグデータは効率の向上とコストの削減にも貢献しましたが、Conway氏はその例として、現在のHPCシステムの最低価格が5万ドルを下回っていることを挙げています。

関連するすべてのテクノロジーが成熟したというわけではなく、HPEのAI/HPC/データ分析グローバルマーケティング担当バイスプレジデントであるVineeth Ramは、次のように述べています。「ディープラーニングは新たな領域で、現在もさまざまなフレームワークからミドルウェア、そしてごく少数のアプリケーションに至るまでのスタック全体でかなり未熟な状態であるうえ、実際に使用されているアプリケーションはカスタムアプリケーションです。その一方で、データベースや分析などの他の領域は成熟しています。」

企業がディープラーニングプロジェクトやディープラーニングの実験を諦めている理由は、このような新しいテクノロジーと成熟したテクノロジーの不一致にあります。多くの企業は、プロジェクト自体が困難なものであるということに気付き、サードパーティに推論エンジンやインフラストラクチャの最適化、およびその他のテクノロジーの問題の解決の支援を求めています。

 

導入を進めるための3つのステップ

Goyalは次のように述べています。「ディープラーニングは魅力的ですが、簡単に導入できるものではありません。また、いくつもの成功事例を聞いてはいますが、その背景にある長年の努力を忘れ去らなくてはなりません。ディープラーニングの導入は非常に難しいため、3ステップの段階的なプロセスに従うのが最善です。」 そのプロセスは、以下のとおりです。

  1. ディープラーニングの手法を適用するために、ビジネスニーズに基づいて十分なデータがある1つ、または2つのユースケースを検証します。
  2. 限られた規模でディープラーニングの実験を行います。概念実証を実施してインフラストラクチャとパフォーマンスを把握し、データインフラストラクチャとデータモデルについての理解を深めます。
  3. 実験で良い結果が得られたら、ディープラーニングを拡張して最適化します。インフラストラクチャ、ビジネスプロセス、およびデータ管理の範囲を広げます。

 

またGoyalは次のように述べています。「ディープラーニングは科学であると同時に芸術でもあります。ディープラーニングからメリットを得るには、それ相応の期待を持たなければなりません。」

この記事/コンテンツは、記載されている特定の著者によって書かれたものであり、必ずしもHewlett Packard Enterpriseの見解を反映しているとは限りません。

enterprise.nxt

ITプロフェッショナルの皆様へ価値あるインサイトをご提供する Enterprise.nxt へようこそ。

ハイブリッド IT、エッジコンピューティング、データセンター変革、新しいコンピューティングパラダイムに関する分析、リサーチ、実践的アドバイスを業界の第一人者からご提供します。