画像をタップして拡大する

2019年7月19日

物体検出テクノロジー: 次なる変革

物体検出は、単調なタスクを自動化したり、生産環境の安全性を向上させたり、製造上の欠陥から駐車スペースに至るまでのあらゆるものを見つけたりするのに役立ちます。より細かなタスクがサポートされるようになるまでには、まだかなりの時間がかかりそうですが、このテクノロジーには明るい展望が見込めます。

Seagate Technology社は、コンピューターのストレージドライブのメディア、ヘッド、基板、複雑なアセンブリ、外殻といった膨大な数の部品を毎日検査しています。

同社はこれまで、このような検査のプロセスに膨大な時間とコストを費やしており、グローバル企業である自社の顧客が求める品質を実現するため、最後に人が電子顕微鏡での部品の徹底的な確認を含む逐次検査と呼ばれる作業を行うまでに、ハードディスクやソリッドステートドライブのテストを1回から2回、また場合によっては3回行ってきました。
しかし、AIに対応した物体検出テクノロジーの進化に伴って、同社は生産プロセスの非効率的な部分を自動化し、高速で一貫性のあるプロセスを実現しつつあります。そして同社は現在、スループットを向上させるために生産現場の近くに高性能のエッジサーバーを配置し、機械学習モデルを実行するとともに世界中の工場の組立ラインに第4次産業革命をサポートするテクノロジーを展開しています。

Seagate Technology社のデータサイエンス技術者であるBruce King氏は、次のように述べています。「当社の品質システムでは、画像をベースとするさまざまな種類の測定尺度を多数使用しています。エンジニアがプログラミングを行うルールベースのシステムではありますが、AIを活用することでマシンにすべてのルールを学習させることができるため、ルールをプログラミングする必要がなく、エンジニアの時間と労力がかなり節約されます。また、機械学習ツールは非常に柔軟性が高く、ルールベースのシステムとまったく同じ情報を検出できます。このツールは、いわば自己学習するのです。そしてその精度は、私たちがこれまで行ってきたすべての分析と同程度かそれを上回っています」。

Seagate Technology社は、人間の脳にならって作られたアルゴリズムであるディープニューラルネットワークで実際のビジネス課題を解決する機械学習のプランニング、パイロット運用、または導入のいずれかを進めている数百(もしかすると数千)の企業の1つですが、こうした企業では、ディープラーニングのようなテクノロジー手法と公開されている数多くのフレームワークやライブラリにより、高度な分析を商業的に実現するとともに拡張することが可能になりました。今のところ、それぞれのテクノロジーや考え方に違いはあるかもしれませんが、すべての新しいテクノロジーや標準と同じように、プラットフォームとアプローチに関して、今後明確な意見の一致が見られるようになると思われます。そしてSeagate Technology社のような早期導入企業は、競合他社より優位な立場を確立しつつあります。

現在では、何を検知するのか、どの高解像度カメラを使用するのか、どのアグリゲーションソフトウェアとデータ転送ソフトウェアを使用するのか、エッジのデバイスをどのように管理して保護するのかといったことが一般に議論されていますが、組織は、自社の大部分のユースケースに最適なエッジプラットフォームや複雑性と無秩序な拡大を最小限に抑える方法だけでなく、物体検出の知識を持つ数少ない人材に対する需要が高まる中で、物体検出において成果を得るためにきわめて優秀なデータサイエンティストを雇用する必要があるのか、またはそうした人材と契約を締結すべきなのかといったことを検討しなければなりません。

どのようなケースであれ、物体検出テクノロジーの勢いが増しているのは明らかであり、それをベースとしたプロジェクトを推進するメーカー、地方自治体、交通局、港湾局、学校、病院などの垂直業界が増えつつあります。

エッジのイノベーションは、製造や公共の安全などに変革をもたらしています。デバイスからデータセンターに至るまでのデータを最大限に活用してデジタルビジネスを加速させるために何が必要なのかをご覧ください。

 

次世代の工場

たとえば製造業界では、台湾の電子機器受託製造企業であるFoxconn社が、ヨーロッパ向けに生産しているヒューレット・パッカード エンタープライズのすべてのサーバーとコンポーネントを検査する物体検出プログラムを開始しようとしており、実際、チェコ共和国にある同社のクトナー・ホラー工場は、組立ラインを流れる複数の製品を検査できる設計となっています。またそれと同時に、順序に関係なくさまざまな構成を検証できるようになっており、このシステムでは、今後物体を検証して同社のデータベースに保存されている画像と比較し、動画解析やAIを活用して欠陥があると思われる部分を特定する予定です。つまりこのシステムにより、同社は潜在的な欠陥をリアルタイムで特定できるようになるわけですが、生産した製品のすべてで常に高い品質を保つと同時に、できる限り迅速にHPEなどの顧客に注文品を発送しようとしている同社の取り組みを考えると、これはきわめて重要です。


これについて、Foxconn CZ社のオペレーションマネージャーであるJohn Gallagher氏は、次のように述べています。「このシステムは、組み立てが完了した製品とこのように組み立てられるべきであるとする製品を比較し、プロセッサーは正しい位置に取り付けられているのか、ケーブルは正しいソケットに差し込まれているのか、ドライブは正しく挿入されているのかなど、すべての部品が正しい位置にあるのかどうかを確認します。さらに、私たちが確認するよう指示した全体の構成をくまなく調べます。これらはいずれも、受注から24時間以内に注文品の50%を発送しようと努めている私たちにメリットをもたらすものであり、この物体検出テクノロジーを活用すれば、お客様に関する予測をより正確に行えるようになるだけでなく、製品の製造に必要な時間も短縮できます。またこのテクノロジーは、プロセスにおける障害の削減に貢献します」。

同氏は、Foxconn CZ社が3月下旬に開始されたパイロットプロジェクトに大きな期待を寄せていると述べており、すべてが順調に進めば、このテクノロジーを他の大陸にも展開できると考えています。

 

スマート輸送

物体検出テクノロジーには、輸送の世界からも大きな期待が寄せられており、その中で最も注目すべきユースケースとして、駐車や船の係留が挙げられます。

車で通勤している人の場合、毎日のように市道やガレージの駐車スペースを探すのに時間がかかることを心配しているかもしれませんが、スマート駐車ソリューションにより、近い将来それがさほど難しいことではなくなる可能性があります。

将来は、駐車スペースを探して10分から15分、また場合によっては30分も車を走らせるのではなく、駐車場を見つけてくれるモバイルアプリケーションを立ち上げるだけで済むようになります。バックエンドでは、IoTパーキングメーター、センサー、ビデオカメラ、レーダー、分析ソフトウェア、DNNプログラム、エッジサーバー、モバイル決済システムなどが連携して5th and Marketの街角にある唯一の駐車場を見つけ出し、予約まで行ってくれるかもしれません。そして実際のところ、最終的にはドライバーが通勤するとき、近くのバーに立ち寄ったとき、家に帰るときなどの典型的な運転の習慣を把握し、ドライバーが行おうとする前にすべてをセッティングするAI主導のサービスにサインアップできるようになる可能性があります。

もちろん、これらはどれもかなり未来的な話ではありますが、テクノロジーは急速に進化しているため、こうした可能性がないわけではありません。そして近い将来に何らかの成果を実現すべく、すでに新興企業と地方自治体や交通局が連携して取り組みを進めています。
実際のところ、ある調査企業によると、スマートパーキングテクノロジーの市場は年平均成長率19%で成長し、2024年までに55.1億ドルを上回る規模になると予想されています。

これについて、IDC社のスマートシティ/輸送担当調査ディレクターであるMark Zannoni氏は、次のように指摘しています。「都市が機能して繁栄するには、街の中に駐車スペースを確保してそれを管理することがきわめて重要です。駐車スペースは、企業やイベントへのアクセスを提供して交通に影響を与え、地方自治体にかなりの収益をもたらすため、都市の経済とクオリティ・オブ・ライフを左右します。こうした理由から、スマートシティへと進化を遂げる中でサービスとしてスマートパーキングを導入しようと考える都市が全世界で増えつつあります」。

このようなスマートシティの1つであると考えることができるロサンゼルス市では、2012年からLA Express Parkプログラムを活用して通勤者に駐車スペースを探すためのいくつかの手段を提供し、4.5平方マイルの街の中心部で利用してもらえる駐車場を増やそうとしてきました。これは、中心部におけるピーク時の交通渋滞の大部分が駐車場を探すドライバーによって引き起こされていると考えられる同市にとって、常に大きな問題でした。

ロサンゼルス市は、LA Expressとサンフランシスコ・ベイエリアのStreetline社という新興企業との事業を通じて、スマートパーキングメーター、駐車スペースの車両センサー、リアルタイムパーキングガイダンスシステム、および統合パーキング管理システムを少しずつ他の地区に拡大していきました。またStreetline社は、(同社のWebサイトによると)サンカルロスやサンマテオといった他のカリフォルニア州の都市と提携し、走行時間で約71万3,000時間、走行距離で約300万マイル、ガソリン消費量で約17万8,000ガロンを削減してきました。

これについて、同社のCTOであるMark Noworolski氏は次のように述べています。「駐車場に関する情報をリアルタイムで提供するには、今でも確かな実データが必要ですが、物体検出機能を搭載するネットワークに接続されたバックエンドのカメラは、路上のセンサーほど邪魔にはならず、幅広い環境に導入できるため、こうしたデータを入手するのに最適です」。

このような路上での時間の節約に貢献するテクノロジーは、船を正確に係留するのにも役立つ可能性があり、最近ドイツで開催されたDusseldorf Boat Showでは、オレゴン州のウィルソンビルに拠点を置くイメージング/監視システム企業であるFLIR Systems社が、おそらく船舶業界初となるインテリジェントな物体認識と動作検知で「係留を支援するソリューション」を発表しました。Raymarine DocSenseと呼ばれる同社のビジョンカメラテクノロジーと動画解析機能は、周辺画像から収集したインテリジェンスを船舶の推進および操舵装置に統合し、旋回が難しい場所での船舶操縦者の係留操作を支援します。

 

校内のセキュリティ

より重要で有意義な物体検出テクノロジーの活用方法としては、それを子供の保護に役立てることが挙げられます。

ワシントン・ポストの調査によると、1999年にコロンバイン高校銃乱射事件が起きて以降、18万7,000人を超える学生が銃による暴力にさらされています。そして今もなお、悲劇が増え続ける一方で優れた解決策はほとんど見出されておらず、学校に武装した警備員を配置したり、防犯ゲートを設置したりすることを提言する人もいますが、どちらのアプローチもそれほど支持を得てはいません。


しかし、ほとんど誰にもわからないような方法で(隠し持って、または目に見える形で)学校に銃やナイフなどの武器が持ち込まれているのかどうかを明らかにできたならどうでしょうか。プライバシー権を侵害することなくそのようなことができればいいと思いませんか。また空港、バス乗り場、ホテル、カジノ、映画館、ショッピングモールといった、その他の脅威にさらされる場所にこうしたテクノロジーを展開することについて話し合う価値はあると思いませんか。


こうしたテクノロジーを展開することが可能というだけでなく、そうすることが使命であると考えている新興企業は非常に多く存在します。

これについて、コグニティブテクノロジーを取り入れたマイクロ波レーダーデバイスとカスタムのAIソフトウェアをベースとする、隠し持っている武器を検出するためのシステムを提供するカナダのPatriot One Technologies社でCEOを務めるMartin Cronin氏は、次のように述べています。「これは比較的新しい分野ですが、(銃乱射の)問題の緊急性から、多くの企業が課題を解決する方法を検討しています。公共の安全を守るために、今後AIを搭載した人目に付かない内蔵型のセンサーが普及するのは間違いありません」。

同氏は、人を監視して(たとえそれが銃であったとしても)何を持っているのかを確認することについての議論は、常に意見が分かれるということを認識したうえで、セキュリティ対策に関する決定には、必ず一般の人々を関与させなければならないと述べています。

そして同氏は、次のように語っています。「人々がいつの間にか監視社会になってしまうことに不安を感じるのは無理もありませんが、当社のテクノロジーは、(銃、ナイフ、爆弾などの)危険な物体に重点を置いたものとなっており、危険なものを持っていなければ、その人物はシステムの対象にはなりません。これは、一般市民の信頼を維持するとともに、差別が生まれないようにするうえで重要なポイントです。また当社では、レーダーベースのシステムを使用することにより、武器をスキャンする過程で身体画像が生成されないようにしていますが、これもプライバシーを守るために重要であり、こうしたアプローチによって重要とされる一般の合意を維持できるのではないかと感じています。人々は安心感を得たいと考えているものの、そのために犠牲にできる市民の自由の範囲には限りがあるのが実情です」。

 

段階的な進歩

物体認識テクノロジーはまだ初期段階にあり、システムが既知の物体と連携することで製造現場に変革がもたらされつつありますが、このテクノロジーの長期的なビジョンは、物体について推測し、そこで得た経験から学習することにあります。多層のディープニューラルネットワークを応用したAIや機械学習の手法により、最終的には膨大なものの中からほぼすべての物体を捕捉することが可能になると思われますが、今はまだそのような段階に達していません。カリフォルニア大学ロサンゼルス校の認知心理学者のチームは、世界最高レベルのディープラーニングネットワークのいくつかに一部を変更した動物や物体のカラー画像(たとえば、ティーポットにゴルフボールの表面を表示したり、ラクダを縞模様にしたり、象に青と赤のアーガイル柄の靴下のパターンを表示したりした画像)を見せる実験を行いましたが、それらのラーニングネットワークが選択肢を絞り込んで最初に正しい画像を選択できたのは、40個中5個にすぎませんでした。

これについて、UCLAの著名な教授であり、この研究論文の最終著者であるPhilip Kellman氏は、次のように指摘しています。「ディープラーニングシステムは、人間とは大きく異なる方法で情報を処理しますが、最大の誤解は、AIデバイスが私たちのやり方を「見ている」ということであり、意識を持っているということではありません。ディープネットワークに写真を見せて「馬」と言った場合、ディープネットワークはその物体の形を描写することはなく、またその物体と背景部分を分離できるとは認識しません。一方、人間は机の上にあるガラスの飾りを見た場合、その形を確認するため、それをすぐにガチョウであると認識します。このように、ディープラーニングシステムは物体の形をまったく見ていないのです。また形は、見落とされる唯一の抽象的性質ではありませんが、最も重要なものの1つであると言えます。興味深い事実として、人間は物体を見て学習する過程において、形のような抽象的な描写を取得したときに、それをより強力な方法で一般化するため、ネットワークに学習させる必要がある物体のありとあらゆる画像やバージョンを余すことなく示さなくて済むのです」。

 

その事実が重要な理由

UCLAの心理学の教授であり、別の研究論文を執筆したHongjing Lu氏は、次のように述べています。「私たちは、これらのシステムの信頼性を高める必要があります。落書きがあることにより、自動運転車に使用されているビジュアルシステムが一時停止の標識を認識できなければ、深刻な安全性の問題が生じかねません。また、AIシステムが偽の画像や動画に簡単にだまされてしまうと、サイバーセキュリティも大きな懸念となります」。

ただし、テクノロジーが時間とともにより人間に近いものになるであろう兆しは見られます。

UCLAの電気/計算機工学の教授であるVwani Roychowdhury氏は、現在のディープラーニングシステムを効率的な記憶エンジンであると形容しています。

これについて同氏は、次のように述べています。「その根拠は、十分な量のデータセットを使用してこれらのディープラーニングネットワークのトレーニングを行えば、想定外の事態が起きにくくなるという点にあります。つまり、車や人間の新しい画像を示したときに必ず、ディープラーニングネットワークがトレーニングや記憶の段階で確認した何かに形、テクスチャー、またはその他の視覚属性が非常に近いものが存在することになるのです。ただし実際には、ほとんどの状況や物体に関して、このような徹底的なトレーニングを行うことはできず、記憶できないほど多くの組み合わせがあります」。

このような課題に動機付けられたRoychowdhury氏は、UCLAとスタンフォード大学のエンジニアとともに、人間と同じ視覚学習の手法をベースとするコンピューターシステムで「目に見える」実際の物体を検出して特定できることを実証しました。そしてこのアプローチにより、システムをインターネット上に複製した人間の日常的な環境に入り込ませ、人間と同じように「学習」させることが可能になりました。これらのシステムは、人間と同じように、さまざまな状況の物体をさまざまな観点から描写した豊富な画像や動画から、各物体の形や構成要素に基づくモデルを自動的に作り上げます。そのため、膨大な情報を記憶する必要がなくなるだけでなく、これもまた人間と同じように、今まで見たことのない画像の物体を認識します。

物体検出テクノロジーはまだ実証の過程にありますが、最初の産業革命と同じように、少なくともマシンによってより効率的かつ効果的に処理される単調なジョブから人々を解放する可能性を秘めています。また、研究と運用の新たな道を切り開いてさらなるメリットをもたらすものと思われます。
より細かなタスクに物体検出を応用するには、まだ多くの課題が残されていますが、物体検出はそれを可能にするデバイスや手法とともに進化を続けており、近いうちに次なる変革をもたらす可能性があります。

 

物体検出: リーダーのためのアドバイス

  • 製造業界の物体検出は、既存の自動化テクノロジーをベースとしています。
  • このテクノロジーを活用すれば、駐車や交通の管理といった日常的なアクティビティを効率化できます。
  • 信頼性が導入を成功させるうえでの重要なポイントとなります。
     

この記事/コンテンツは、記載されている個人の著者が執筆したものであり、必ずしもヒューレット・パッカード エンタープライズの見解を反映しているわけではありません。

enterprise.nxt

ITプロフェッショナルの皆様へ価値あるインサイトをご提供する Enterprise.nxt へようこそ。

ハイブリッド IT、エッジコンピューティング、データセンター変革、新しいコンピューティングパラダイムに関する分析、リサーチ、実践的アドバイスを業界の第一人者からご提供します。