2020年1月24日

スウォームラーニングと人工知能エッジ

使うセンサーが増えれば増えるほど、それらを独立して運用する必要性も高まります。そうしなければ、データが増えすぎて収拾がつかなくなってしまうでしょう。

野原のそばを車で走っている時に、何万匹というムクドリの大群が空をうごめくように飛び回っているのを見たことがあるかもしれません。特にヨーロッパでは比較的よくある光景です。また、海で泳いでいて、魚の大群が同じことを水の中でしているのを見たことがあるかもしません。さまざまな動物が、通常は身を守るために、群れの「リーダー」の動きとは関係のないある種の分散型の行動を取ります。

スケールフリー相関、マーミュレーション、スウォーミングなどと呼ばれるこの行動は、エッジで収集されるデータの爆発的な増加に対応する方法を見つける手がかりとなるかもしれません。

 

これまでの経緯


データは激増しています。その要因の一部は、センサーが明らかに激増していて、組み立てライン、スマートフォン、人間、医療機器、車両などあらゆるところから情報を収集しているためです。

IDCの予測によれば、世界全体のデータ量は2018年の33ゼタバイトから2025年には175ゼタバイトに増加し、そのうちの大部分がエッジで収集されます。

現在は、エッジで収集したデータを中央のポイントに送信することで人工知能モデルが作られます。データはモデルを「トレーニング」するために使用され、その後モデルはエッジのすべてのデバイスに送り返されます。ユーザーがスマートフォンにレストランを見つけてほしいと頼んだ場合、スマートフォンはAIモデルを使用して、マイクで収集されたデータから、何を頼まれているのかを「推察」します。

しかし、エッジで収集されたすべてのデータをコンピューティングのために中央サーバーに送信することは、現実的でないことがほとんどです。レイテンシ、熱とエネルギーの要求、コンプライアンスの問題、跳ね上がる転送コストと機会コストなどがその要因です。

これは結局、現実的でないばかりか、不可能だと言ったほうがいい場合も出てきます。しかし、研究者たちは自然界にヒントを得て、答えを見つけ出しました。

代替案は、スウォーミング現象の観測に基づいて、Krishnaprasad Shastryと彼のチームによって発見されました。Krishnaprasadは、ヒューレット・パッカード エンタープライズのバンガロールの研究所の優秀なテクノロジストです。その答えとは、鳥、蜂、コウモリ、蟻、魚が、環境への直接的な反応として知的に動くことができるとすれば、自動運転の車やその他のエッジのコンピューティングデバイスも同じことができるのではないか、というものです。

「スウォームラーニング」とう用語は、HPEの高パフォーマンスコンピューティングおよび人工知能部門のバイスプレジデント兼チーフテクノロジーオフィサーであるEng Lim Goh博士が考案しました。

Googleには、フェデレーテッドラーニングと呼ばれる類似の分散学習プロジェクトがあります。しかし、スウォームラーニングは、中央のリーダーが必要ないという点でさらに進んでいます。AIのモデリングは、エッジのデバイスのみによって行われます。AI、エッジコンピューティング、ブロックチェーンの使用を組み合わせたプラクティスです。簡単に言えば、エッジにおけるAIです。

「これらのフレームワークの一般的な利点は、分散学習によるものです。つまり、多数のクライアントから発生するデータを使用して集中型のモデルを学習します」。Googleの学習理論チームの責任者であり、ニューヨーク大学コーラン・インスティテュート・オブ・マテマチカル・サイエンシズの教授であるMehryar Mohri氏はそう説明します。「フェデレーテッドラーニングの際立った特徴は、データをクライアント全体に分散させたまま中央のモデルをトレーニングできることです。そのため、クライアントデータは決してサーバーには送信されません」。

言い換えれば、フェデレーテッドラーニングモデルでは、データと学習プロセスがクライアント全体に分散されています。これらのモデルは中央のコーディネーターによって1つのモデルに結合され、それから個々のクライアントに戻されます。
このタイプの学習の利点は、境界線をどのように定義する場合でも、データを境界線を越えて移動させることなく、無制限に大きなデータプールからモデルを抽出できることです。Goh博士はこれを「ローカルトレーニング、グローバルインサイト」と呼んでいます。

ただし、課題もあります。

「中央サーバーとクライアントが頻繁に相互通信するために、ネットワーキングと通信のボトルネックが、フェデレーテッドラーニングの主要な問題のひとつとなり続けています」。Mohri教授はそう指摘します。

スウォームラーニングのAIトレーニングは、クライアントで利用可能なコンピューティングを使用してエッジで行われるため、中央コントロールとのやり取りが排除されます。その代わりにブロックチェーンが使用されます。ブロックチェーンによってあらゆるスウォーム (群) 内のやり取りが追跡され、スウォームはよりセキュアになります。

 

エッジ、AI、ブロックチェーン


スウォームラーニングの3つの主要な要素は、エッジコンピューティング、AI、ブロックチェーンです。

『Wired』誌の記事「センサーベースの経済」で紹介されたアメリカ国立科学財団の研究では、2017年には接続されたセンサーが64億個 (2015年から30%増) となり、2020年には208億個、そして近い将来には、接続されたセンサーが1兆個運用されると予測されています。

デバイスの急激な増加は、「データグラビティ」につながります。これは、データが増えれば増えるほど、データをコンピューティングに送ると言うより、コンピューティングがデータに引き寄せられる傾向が強まることを意味します。このような需要に対応するために、プロバイダーは、より小型でより多くのメモリとコンピューティング能力を備えたエッジデバイスを実装しています。これらのデバイスは効率的に実行でき、より独立性が高く、データセンターから離れた気温が調整されていない場所でも問題がないように物理的に頑丈に作られています。人間とエッジが出会う場所であるインテリジェントエッジは、スウォームラーニングに不可欠な要素です。

スウォームラーニングのもう1つの要素はAIです。AIの激増は現実のものとなり、反応型/指導型AIから機械学習、深層学習まであらゆる領域に広がり、さらに連想記憶装置のような変わり種にまで及んでいます。

スウォームラーニングでは、コンピューティングを多用する機械学習のトレーニングが、エッジデバイスを連結することでそのままの場所で実行できます。

最後に、エッジコンピューティングやスウォームベースのAIと同様に、ブロックチェーンも分散されます。ブロックチェーンは単なる分散型台帳であり、各ページで異なる数字またはハッシュが作成されます。入力が変更されればハッシュも変更されます。つまり、ブロックチェーンは透過的でハッキングが困難なコンテンツと変更の法廷記録、あるいは、HPE PointnextのワールドワイドデジタルアドバイザーであるChristian Reichenbachが言うところの指紋を提供します。

「トランザクションを処理する中央サーバーまたは中央インスタンスはありません」とReichenbachは説明します。「多数のピアにかけて分散されているため、そのままでも変更することは困難なのです」。

また、スウォームラーニングでは、エッジにおける共有学習の結果が確実に分散され、交換され、保護されるようにするためにもブロックチェーンを活用しています。不正でない限り、各メンバーがデータを追加できます。

 

スウォームラーニングの実用性


日常生活において、バイアスは単に不正確であるだけでなく、精神に対する損害でもあります。医療においては、バイアスは死につながることさえあります。いくつかのスウォームラーニングアプリケーションの共同開発者であるGoh博士は、2つの病院の例を挙げています。1つの病院は多くの結核患者を診ていますが、肺炎患者は多くありません。もう1つの病院は多くの肺炎患者を診ていますが、結核患者は多くありません。それぞれの病院がX線写真の分析の精度を上げるためにAIを使用するとしたら、最も一般的な病気に関してバイアスが発生するはずです。個人の医療データは、世界で最も厳しく保護されているデータの1つであり、そのような情報を交換するには法的な障害もあります。スウォームラーニングは、この問題にソリューションを提供します。

ブロックチェーンによって各AIのニューラルネットワークのウェイトを共有、平均化、分散できるため、2つの病院が治療を行うエリアにおける、肺の病気に対するより正確な情報を把握できます。セキュアで、プライベートで、反復的な情報交換によって、両方の病院が同じように結核と肺炎を適切に発見できます。 

このプロセスによって、ユーザーは、基盤となるデータを渡さなくても情報を販売または交換できます。エッジで処理される情報の収益化は、スウォームラーニングのようなテクノロジーから得られる利点の1つです。

具体的な事例としては、世界最大手の自動車パーツ製造業者の1つが、ブロックチェーンの安全性とプライバシー性を活用して個々の車両情報を交換する、データ収益化プラットフォームをまもなく開始します。このプラットフォームは、スウォームラーニングとは別ですが、データ市場でのブロックチェーンの有効性を実証するものとなるはずです。

「安全性を高め、自動運転車を促進し、より効率的に運転して環境汚染を軽減するために、この情報は自動車製造業者だけでなく、都市、ドライバー、保険会社の間でも交換されるべきです」とReichenbachは言います。

 

スウォームラーニングの未来


スウォームラーニングはまだ研究プロジェクトの段階です。しかし、現在このテクノロジーを開発するということは、新しい物の考え方が不可欠となる一連のトレンドを認識することでもあります。

まず、データは分散されています。列を成してうなりをあげる機械とともに、核爆発にも耐えられるドームの下で仕事に打ち込んでいた時代は終わりました。センサーとデバイスはあらゆる場所にあるので、データもあらゆる場所にあります。2つ目に、これらのデバイスはゼンマイ仕掛けのように世界中を動き回っているため、私たちは、いつデータの洪水に飲み込まれてしまうかわかりません。このデータの洪水は、コストを発生させるものの、より困難な仕事を達成する助けとなります。私たちは、洪水を食い止めるためにエッジデバイスにコンピューティングを追加しました。しかし、エッジにはAIも必要です。最後に、お互いに学んだことを安全でプライベートな方法で交換する仕組みが必要です。

エッジコンピューティング、AI、ブロックチェーンが作るプロセスによって、データの洪水を、いわば水力発電によるエネルギーに変えることができます。これなら、大量のデータを制御して働かせ、私たちの人生を貧しくするのではなく豊かにし、データによってできることを増やすことができます。

 

スウォームインテリジェンス: リーダーのためのアドバイス
 

  • 問題に対するあらゆる技術的なソリューションは、それ自体が新しい問題を生みます。スウォームラーニングは、AIの主要な問題の1つである、プライバシー喪失の可能性を排除します。データを移動するのではなく、ウェイトを移動します。 
  • 世界にセンサーが増えれば増えるほど、データも増えます。データが増えれば増えるほど、それを処理するためのAIが必要になります。 
  • ブロックチェーンを活用したエッジにおけるAIは、企業が、所有する技術や競争力のあるデータを渡すことなく、インサイトを共有することを可能にします。


この記事/コンテンツは、記載されている個人の著者が執筆したものであり、必ずしもヒューレット・パッカード エンタープライズの見解を反映しているわけではありません。

enterprise.nxt

ITプロフェッショナルの皆様へ価値あるインサイトをご提供する Enterprise.nxt へようこそ。

ハイブリッド IT、エッジコンピューティング、データセンター変革、新しいコンピューティングパラダイムに関する分析、リサーチ、実践的アドバイスを業界の第一人者からご提供します。

enterprise.nxt
ニュースレターのご登録

enterprise.nxtから最新のニュースをメールで配信します。