ニューロモーフィックコンピューティングと人工認知の未来

2008年に、米国の国防高等研究計画庁 (DARPA) は、数十億のトランジスタを内蔵し、約3ポンドの重量で、現在のコンピューターに比べてわずかなエネルギーで動作する洗練された靴箱サイズのシステムを構築することを研究者への課題として掲げました。これは基本的に、箱の内の脳と言えるものです。

 

コンピューターは、数十年に及ぶ進歩にもかかわらず、人々が日々直面している現実の課題を解決することができないでいるとDARPAは述べています。同じアプローチで継続的な改善が進んでも、大きな変革をもたらすことはないと考えられるため、DARPAは、「有用なインテリジェントマシンを作成する新しい道筋」が必要だと結論付けました。

人間の脳は理想的なモデルです。小型で効率的であり、多くのタイプの入力をほぼ即座に処理できます。コンピューターは、コンピューターサイエンスの黎明期から脳と比較されてきました。最近では、研究者は脳の働きをモデル化したコンピューターを設計し始めており、この分野は現在、ニューロモーフィックコンピューティングとして知られています。

研究者は、脳に似たシステムであれば、現在特別に訓練されたコンピューターで数時間かかる作業を迅速に処理できると予想しています。これは、ビデオに登場する人数をカウントするような、人間にとっては些細な作業です。

ニューロモーフィックの原理に従い、社会的な仕草を読み取ったり画像から意味を抽出したりするコンピューターは、ニュースイベントにリアルタイムの解説を加えることができるでしょう。また、見つけにくい病状を早期に診断するのを助けたり、巧妙なコンピューターセキュリティへの攻撃を数秒で検出したりすることも可能になると考えられます。習うより慣れよという言葉のとおり、このようなコンピューターは、タスクを頻繁に行うほど、より速く正確に行えるようになります。人間の介入は必要ありません。

 

ブラックボックス

近年、神経科学は重要な進歩を遂げていますが、脳内の働きは未だに大部分が謎に包まれています。「脳のハードウェア、つまり、ニューロンとその相互接続や、ニューロン上で機能しているアルゴリズムについては、実際にはほとんど解明されていません。今日、「脳のようなコンピューター」を開発したと主張する人がいても笑われるだけです」と、Hewlett Packard Labsの特別研究員であるStan Williams氏は言います。

 

「プログラムには人間の論理が反映されていますが、直感的な考えは反映されていません」

Hewlett Packard Labs、Rich Friedrich氏

それでもなお、Labsの研究者はDARPAの課題について検討し、利用可能な時間とリソースでは、箱の中の脳は実現できないと結論付けました。しかし同時に、彼らは、近い将来に実現でき、その発展を予見できるコンピューティングの可能性が大幅に向上していることに気付きました。これには、現在よりはるかに脳に似た方法で問題を解決するソフトウェアや、脳の構造のうち既知の機能の一部に適合したコンピューターアーキテクチャーなどがあります。

過去70年間にわたり使用されてきた標準的なコンピューターの設計は永遠に拡張できるわけではないため、このような取り組みはますます重要になっています。

トランジスタの密度、つまりコンピューティングパワーがおよそ2年ごとに2倍になるというムーアの法則が有効である期間は終わりに近づいており、トランジスタは、今日の材料で微細化できるレベルにほぼ到達しています。最近のコンピューティングパワーの向上は、より多くのプロセッサーコアをチップに追加して並列動作させることに大きく依存しており、これまで以上に多くの電力と冷却能力が必要になります。

「今後の課題は、単位面積あたりのトランジスタ数を増やすことではなく、エネルギー単位あたりの演算力を増やすことです」とWilliams氏は言います。

 

心と物質

算術演算に関しては、脳はコンピューターと競い合うことはできません。プログラマは時間をかけて、画像のアニメーションやチェスのプレイといった脳に負荷がかかる作業を一連の数学的計算に変換してきました。

しかし、コンピューターは依然として、人にとっては容易な多くの認知機能を扱うのに苦労しています。たとえば、コンピューターは、いくらかトレーニングすれば、猫や椅子を認識して正確にラベル付けすることができます。しかし、猫が椅子を飛び越えているビデオのナレーションを行うのは困難です。

「ビデオのナレーションを行うマシンを開発するのは、ロケット科学よりも難しいことのように思えます」と視覚認知のニューラルネットワークモデルを研究しているノースイースタン大学のEnnio Mingolla教授は言います。

この難題は、認識と知覚の違い、つまり、ニューロモーフィックコンピューティングのアプローチで対処しようとしている違いを示しています。

認識は比較的単純な認知タスクであり、プログラマはコンピューターでそのタスクを再現する方法について大部分を把握しています。アルゴリズムといくつかのトレーニングにより、コンピューターは猫と椅子を区別したり、製造ラインで製品を検査して欠陥や異常を見つけたりすることができます。

知覚を模倣するのはより困難です。変化の激しい視野での視点移動や対話操作が必要になります。何かに衝突せずに混雑した部屋を歩き回ったり、ビデオのナレーションを行ったりするようなタスクでは、認識に加えて知覚が必要になります。知覚アルゴリズムをテストするプロジェクトでLabsの研究者と共同作業しているMingolla氏は、「脳は一種のトリアージ作業を行って、これらのデータすべてから興味を引く部分を見つけ出す必要があります」と説明します。

このような知覚の瞬間は「グループ化とソートのアクティビティに関係しており、「何かを見つけた」という認識の瞬間とは別物です」とMingolla氏は付け加えます。

プログラマは、コンピューターが物事を容易に知覚できるようにするアルゴリズムの記述に苦労していますが、この理由の一部は、知覚の背後にある神経学的プロセスが完全に明らかになっていないことにあります。脳にはニューロンと呼ばれる推定で860億の細胞があり、それらは、シナプスと呼ばれる経路の網によって相互接続されています。研究者は、計算を実行するのと同じグループのニューロンとシナプスが、記憶を保持する役割も果たしていることを突き止めました。さらに、そのようなグループは、多くの異なるタスクを並行して処理することができます。

コンピューターが動く仕組みは、ニューロンやシナプスの働きと同じではありません。コンピューターとアプリケーションは通常、問題の解決やタスクの実行を逐次的な方法で行い、ステップごとにプロセッサーとメモリの間で情報をやり取りするように設計されています。

「プログラムには人間の論理が反映されていますが、直感的な考えは反映されていません」 と、Hewlett Packard Labsのシステムソフトウェア部門の元責任者であるRich Friedrich氏は言います。「脳の働きは本質的に、大規模並列型で確率論的です」。ほんのわずかな情報から合理的な推論を行い結論を導くことができます。

ニューロモーフィックコンピューティングを定義する単一の特性やテクノロジーはありません。研究者は、脳の働きについて学ぶにつれて、それらのアイデアをハードウェアとソフトウェアに実装する方法を試します。

ニューロモーフィックコンピューティングにおける新しい考え方の1つは、並列処理、つまり、大きな問題を同時に実行できる小さなタスクに分割することです。これは、脳内でニューロンの層が同時に発火する仕組みに似ています。

並列処理は数十年にわたって行われてきた技術ですが、主に特殊なハイパフォーマンスコンピューティングのタスクに使用されてきました。ニューロモーフィックの研究では、並列処理を日常のコンピューティングにもたらし、大規模なコンピューティングタスクを高速に処理することを目指しています。

 

マシンからの認知

Friedrich氏は、カリフォルニア州パロアルトにあるLabsのオフィスの会議室に座って、スマートフォンを取り出し、ロゴを手で覆いました。「あなたと私にとって、これがiPhoneであるのは明らかです」と彼は言います。「しかし、部分的な見方しかできないコンピューターにとって、このような判断は簡単ではありません」。

これは、Friedrich氏のグループが数年にわたり取り組んできた問題の一種です。

Synapseと呼ばれるDARPAの挑戦は、Labsの研究者が神経科学のブレークスルーの助けを借りてコンピューティングを考え直すきっかけとなりました。早い段階で、Labsのチームは、既存のアプリケーションが箱の中の脳と互換性がないことに気付きました。主な理由として、ほとんどのソフトウェアは並列処理を活用するように記述されていないことが挙げられます。

Labsの研究者の一部は、シナプスとニューロンをエミュレートするハードウェアの開発に集中しました。また、他の研究者は、ニューロモーフィックシステムのソフトウェアシミュレーションを作成する作業に取り組みました。このシミュレーターは、エンジニアリングの概念をチェックし、新しく作成されたソフトウェアが新しいシステムで動作することを確認するために使用されます。

最終的にLabsでは、Synapseで課題となっているハードウェア要素を開発するには、その時点で不可能ではないにしても、実現不可能なほど費用がかかることに気付きました (たとえば、半導体メーカーが脳のシナプスをエミュレートする回路を製造できないことが明らかになりました)。

Labsは2011年にSynapseへの関与を段階的に縮小しましたが、研究者は開発したソフトウェアシミュレーターとコンパイラを、CogXと呼ばれるソフトウェア開発プラットフォームのために使用し続けました。この名前は、疑似ラテン語のcog ex machina、つまり「マシンからの認知」に由来しています。

CogXを使用すると、専門家以外の開発者が並列処理を活用したソフトウェアを作成できるようになり、脳が多数のニューロンを使用して問題の複数の側面を同時に解決する方法を模倣することができます。CogXは、現在構築できる手頃な価格のハードウェア上で動作します。

HPEは4月に、Cognitive Computing Toolkitと呼ばれるオープンソース版の公開プラットフォームを発表しました。このツールキットは、ほとんどのコンピューターを駆動している従来のCPUを利用するのではなく、ビデオゲームのアプリケーション向けに設計された安価なチップであるグラフィックス処理ユニット (GPU) で動作します。

「私の息子はHaloをプレイしています」と、Labsの元研究者であるDick Carter氏は言います。「GPUは、このようなゲームの爆発、煙、四散する破片といった種類のビジュアルを処理するために開発されました」。

GPUの重要な特性は、複数のビジュアルを同時に処理できることです。画面の1つの端でのイメージのレンダリングは、他の端での最初の処理に影響されません。GPUは徐々に汎用的になっており、プログラム可能な部分が増えているため、非線形コンピューティングの問題を個別の同時タスクに分割するような場合にも最適です。

HPEは12月に、複数のビデオストリームからリアルタイムで会社のロゴを抽出するソフトウェアのデモを行いました。ある会社がスポーツイベント中のテレビ広告を購入した場合、その会社は購入したすべての広告枠で実際にすべての広告が表示されたことを確認する必要があります。CogXアプリケーションは25のビデオストリームを同時に監視し、広告主のロゴの各表示を確認して、契約が履行されているかどうかを即座に会社に知らせます。アプリケーションは学習により1,000種類のロゴを認識するようになりましたが、プログラマは1行のコードも書く必要がありませんでした。

視覚に加えて、このプロジェクトではニューロモーフィックの第2の原理、すなわちディープラーニングのデモを展示しました。ディープラーニングとは、システムが一連のデータの関係を反復作業でより正確に把握できるようにするコンピューティング手法です。

 

フォン・ノイマンのボトルネックを取り除く

2つの数値の平均を取るなど、2ステップの数学関数を実行しているとします。最初のステップは合計を求めることです。従来のコンピューターでは、この合計をメモリに書き込み、その後、2つ目のステップである除算を実行します。

同じシナリオで何十万もの計算を実行している状況を考えてみましょう。コンピューターはメモリと処理との間でデータをやり取りしなければならず、システムの全体的な動作速度は低下します。これは有名な「フォン・ノイマンのボトルネック」で、ジョン・フォン・ノイマンの名前が付けられています。彼は、コンピューターが今日も使用している基本的なアーキテクチャーを1945年に記述した人物です。

「脳では、同じ細胞が記憶の保持と演算の実行を処理します」とWilliams氏は言います。そのため、私たちの脳は、ある状態から別の状態に情報を移動するために時間を無駄にせずエネルギーも消費しません。このように時間やエネルギーを損失する問題はレイテンシとして知られています。

CogXでは脳の機能を模倣する手法でレイテンシを短縮しています。たとえば、カーネルの統合により、システムがコンピューターのメモリに情報を書き込む回数が最小限に抑えられます。上記の2ステップの式を解くために、CogXで開発されたプログラムでは、レジスタファイル、つまりプロセッサー上に直接配置された小さなメモリビットを使用して中間の合計値を保存できます。システムメモリに書き込まれるのは、最終の平均値のみです。

Labsでは、脳のようなアーキテクチャーを異なる方法で探究しており、たとえば、Memristorと呼ばれるナノスケールの電子部品を開発しています。Memristorの動作はシナプスに似ており、エネルギーを使用せずに情報を保持できるようになっています。今日のDRAMメモリテクノロジーの代わりにMemristorを使用するシステムは、人間の脳と同じように非常に少ない電力で動作します。

 

「プログラムには人間の論理が反映されていますが、直感的な考えは反映されていません」

Hewlett Packard Labs、Rich Friedrich氏

Labsでは最終的に、MemristorをThe Machineのメモリの主要な形式として組み込む予定です。The Machineとは、アーキテクチャーの中心に大きな共有メモリプールを配置した新しいタイプのコンピューターです。

また、Memristorは、ニューロモーフィック計算を実行するためにも使用できます。Labsでは最近、Dot Product Engineと呼ばれる、行列ベクトル乗算という複雑なタイプの計算を実行するMemristorのアレイを作成しました。従来のコンピューターでは、このような計算に多くの時間とエネルギーが必要ですが、Dot Product Engineではほとんど即座に計算を完了することができます。

行列ベクトル乗算を頻繁に使用するディープラーニングなどのアプリケーションでは、マルチコアチップ上のDot Product Engineがアクセラレータとして機能し、回答を得るために必要な時間とエネルギーを1桁削減できます。

1つのタイプの計算タスクに特化したこのようなアクセラレータは、異なる神経構造が異なる神経タスクを処理する方法を模倣しています。同様のアクセラレータを搭載したマルチコアチップは、The Machineのアーキテクチャーに直接組み込むことができます。

また、Labsはニューロモーフィックコンピューティングに興味がある政府機関や業界のパートナーと連携しています。2015年10月に、米国の科学技術政策局 (OSTP) は、変革をもたらすコンピューティング機能の開発を目的としたナノテクノロジー研究の「グランドチャレンジ」を発表しました。この挑戦に取り入れられている多くのアイデアは、Stan Williams氏が共著者の「感覚能力を備えたマシン」に関する2015年の論文に概説されているものです。

このような動きは、将来のブレークスルーを予感させます。いつの日か、ニューロモーフィックマシンは計算力において人間を凌ぐだけでなく、感覚情報や常識に基づく知覚といった複雑なタスクも行えるようになるでしょう。

「ムーアの法則の終焉は、今後の発展を脅かす大きな障害になり得ます」とWilliams氏は言います。「しかし、変革の最中には大きなチャンスもあります。最終的にはジョン・フォン・ノイマンの時代に立ち返って、「脳の働きはどのようなものか? その働きはどのような仕組みになっているのか?」と問うことになります」。

enterprise.nxt

ITプロフェッショナルの皆様へ価値あるインサイトをご提供する Enterprise.nxt へようこそ。

ハイブリッド IT、エッジコンピューティング、データセンター変革、新しいコンピューティングパラダイムに関する分析、リサーチ、実践的アドバイスを業界の第一人者からご提供します。